데이터 모델링의 중요성
데이터 모델링이란?
모델링이란 복잡한 현실 세계에 존재하는 데이터를 단순화 시켜 표현해 컴퓨터 세계의 데이터베이스로 옮기는 변환 과정입니다.
현실의 개념들을 체계적으로 수집하여 정보모델링을 통해 사용자의 정보요구사항을 조사하고 이를 개체, 관계, 속성을 중심으로 명확하게 체계적으로 표현하고 문서화하는 기법을 데이터 모델링이라고 합니다.
- 중복 : 같은 시간 데이터 제공
- 비유연성 : 사소한 업무변화에 데이터 모델이 수시로 변경되면 안됨. 데이터 정의를 사용 프로세스하고 분리해야한다.
- 비일관성 : 데이터 간 상호 연관 관계에 대해 명확히 정의해야 함.
데이터 모델링
개념전 , 논리적 , 물리적 데이터 모델링
데이터 독립성 요소
스키마란? 데이터베이스의 구조와 제약 조건에 관한 전반적인 명세를 기술한 메타데이터의 집합.
외부 스키마 : 개개 사용자가 보는 개인적 DB 스키마
개념 스키마 : 모든 사용자 관점을 통합한 전체 DB
내부 스키마 : 물리적 장치에서 데이터가 실제적 저장
데이터 독립성
논리적 독립성 : 개념스키마 변경, 외부 스키마에 영향이 없다
물리적 독립성 : 내부 스키마 변경 , 외부/개념스키마에 영향이 없음
데이터 모델링의 3요소
어떤 것(Things) , 성격(Attributes) , 관계(Realitonships)
모델링의 특징
(현실세계) -> 추상화, 단순화, 정확화 -> (모델)
ERD 작업순서
1. 엔티티 그림
2. 엔티티 배치
3. 엔티티 관계설정
4. 관계명 기술
5. 관계의 참여도 기술
6. 관계필수여부
틀린 이유
데이터 모델링이 필요한 주요 이유
3. 데이터베이스를 구축하기 위한 용도를 위해 데이터모델링을 수행하고 업무에 대한 설명은 별도의 표기법이라 했는데
-> 데이터 모델링 자체로서 업무를 설명하고 분석하는 부분에서 매우 의미가 있음.
6. 모든 사용자 관점을 통합한 조직 전체 관점의 통합적 표현 외부 스키마라고 생각을 했는데
-> 개념스키마 통합관점의 스키마구조를 표현함
-> 데이터 모델링은 통합관점의 뷰를 가지고 있는 개념 스키마를 만들어가는 과정으로 이해할 수 있음.
10. 데이터로서 존재하지만 업무에서 필요로 하지 않으면 해당 업무의 엔터티로 성립될 수 없다.
-> 반드시 해당 업무에서 필요하고 관리되어야 하는 정보
-> 유일한 식별자에 의해 식별이 가능해야함
-> 영속적으로 존재하는 (두개 이상의)인스턴스의 집합이어야함
-> 엔터티는 업무 프로세스에 의해 이용되어야 함
-> 엔터티는 반드시 속성이 있어야 함
-> 엔터티는 다른 엔터티와 최소 한 개 이상의 관계가 있어야 함
내가 고른 답은 객체지향의 디자인 패턴에는 싱글턴 패턴이 있어 하나의 인스턴스를 가지는 클래스가 존재한다.
이와 유사하게 엔터티는 한 개의 인스턴스를 가지는 것만으로 충분한 의미를 부여할 수 있다.
-> 여러개의 인스턴스를 가질 수 있기 때문에 정답이 안된다.
엔터티 = 객체 , 인스턴스 = 행
13. 가능하면 약어를 사용하고 엔터티의 이름을 간결하고 명확하게 표현한다. ( X )
-> 첫 번째는 가능하면 현업업무에서 사용하는 용어를 사용한다.
-> 두 번째는 가능하면 약어를 사용하지 않는다.
-> 세 번째는 단수명사를 사용
-> 네 번째는 모든 엔터티를 통틀어서 유일하게 이름이 부여 함.
-> 다섯 번째는 엔터티 생성의미대로 이름을 부여함.
15. 하나의 인스턴스에서 각각의 속성은 한 개의 속성값을 가져야 함.
16. 일반예금은 코드 엔터티를 별도로 구분하고 값에는 코드값만 포함한다.
-> 이자와 이자율은 파생속성이다.
이자는 계산된 값으로 파생속성이 맞지만, 이자율은 원래 가지고 있어야 하는 속성이므로 기본속성이다.
21. 관계는 존재적 관계와 행위에 의한 관계로 나뉘어지는게 맞다.
-> 관계의 표기법은 관계명, 관계 차수, 선택성의 3가지 개념으로 표현이됨.
26. 지정된 주식별자 값은 자주 변하지 않는 것이어야 한다.
자주 수정이 되면 연쇄 수정이 필요하여 시스템 상에 부하의 원인이 될 수 있어서 주식별자로 적합하지 않다.
27. 나는 주민등록번호가 보여지면 안된다 생각해서 3번을 골랐는데,
-> 사람의 이름을 주식별자로 하면, 동명이인이 될 수 있으므로 적절하지가 안흔ㄴ 것이다.
28. 주식별자를 도출하기 위한 기준은
-> 해당 업무에서 자주 이용되는 속성을 주식별자
-> 명칭 , 내역 등과 같이 이름으로 기술되는 것들을 가능하면 주식별자로 하지 않는다.
-> 복합으로 주식별자로 구성할 경우 너무 많은 속성이 포함되지 않도록 한다.
자주 수정되는 속성이 주식별자가 되면 자식 엔터티에 대한 연쇄 수정이 필요하기 때문에 적합하지 않다.
하나의 테이블에 많은 양의 데이터가 저장되면 인덱스를 추가하고 테이블을 몇 개로 쪼개는 성능이 저하되는 경우가 있다.
이때 논리적으로는 하나의 테이블이지만 물리적으로는 여러 개의 테이블로 분리하여 데이터 액세스 성능도 향상시키고, 데이터 관리방법도 개선할 수 있도록 테이블에 적용하는 기법을 파티셔닝이라고 함.
49. 인덱스는 값의 범위에 따라 일정하게 정렬이 되어 있으므로 상수값으로 EQUAL 조건으로 되는 칼럼이 가장 앞으로 나오고
범위조회 하는 유형의 칼럼이 그 다음에 오도록 하는 것이 인덱스 범위를 좁힐 수 있는 가장 좋은 방법
1. 2 O
2. 2 X
3. 3 O
4. 2 O
5. 1 O
6. 1 X
7. 4 O
8. 4 O
9. 2 O
10. 4 X
11. 1 O
12. 1 O
13. 4 X
14. 컬럼? -> 속성 O
칼럼(column)이란 관계형 데이터베이스 테이블에서 특정한 단순 자료형의 일련의 데이터값과 테이블에서의 각 열을 말한다. 칼럼은 열이 어떻게 구성되어야 할 지에 대한 구조를 제공한다. 관계형 데이터베이스 용어에서 칼럼과 같은 의미로 사용되는 것은 속성(attribute)이다.
15. 4 X
16. 1 값에는 코드 엔터티가 필요하지 않나.. X
17. 1 O
18. 4 O
19. 3 O
20. 3,4 O
UML이란 요구분석, 시스템 설계, 시스템 구현 등의 시스템 개발 과정에서 개발자간의 의사소통을 원활하게 이루어지게 하기 위하여 표준화한 모델링 언어.
21. 1 X
22. 2 O
23. 3 O
24. 4 O
25. 4 O
26. 2 X
27. 3 X
28. 1 X
29. 비식별자의 관계? 4 O
30. 2 O
31. 1 O
32. 반정규화 ( 왜 정규화가 아닌지 ? )
정규화는 중복을 최소화 반정규화(비정규화)는 읽는 시간을 최적화 O
33. 4 O
34. 1 O
35. 4 X
36. 2 X
37. 4 O
38. 2 X
39. 2 ? X
40. 1 O
41. 4 O
42. 1 X
43. 4 X
44. 1 O
45. 2 X
46. 조인? X
47. 2 O
48. 2 X
49. 1 X
50. 3 X
51. 2,4 O
52. 2 X
'컴퓨터 지식' 카테고리의 다른 글
[인터넷 네트워크] (0) | 2022.02.22 |
---|---|
[SQLD] ROLLUP (0) | 2022.02.12 |
[스프링] 디버깅 사용법 ! 사용해야 되는 이유 ! (0) | 2021.12.28 |
MySQL : 고급 (테이블, 인덱스 , 뷰) (0) | 2021.11.03 |
MySQL : 기본적인 것들 내장함수 등등 (0) | 2021.11.03 |