- HOME
- [종료]구루비 DB 스터디
- 2013년 하반기 - 오라클 트러블슈팅 스터디
- 1_2장 요약
제1절 성능 데이터 모델링의 개요
- 성능데이터 모델링 : 설계단계의 데이터 모델링 때부터, 정규화, 반정규화, 테이블통합, 테이블분할, 조인구조 등의 여러가지 성능과 관련된 사항을 데이터 모델링에 반영하는 것
제2절 정규화와 성능
- 정규화는 중복을 제거하고, 데이터처리를 관심사별(업무별)로 처리하게 해주어 일반적으로 성능이 향상됨
- 그러므로 조회 성능을 위해 무조건적인 반정규화를 시행해서는 안됨
제3절 반정규화와 성능
- 정규화 과정을 거쳤으나 디스크의 I/O 증가, 원격 조인 등의 이유로 성능이 저하가 예상될 때 반정규화를 적용
- 반정규화 기법으로 크게 테이블 반정규화, 컬럼 반정규화, 관계 반정규화가 존재
제4절 대량의 데이터에 따른 성능
- 잘 설계된 모델이라고 할지라도 한 테이블에 많은 컬럼을 가지고 있거나, 대량의 데이터가 한 테이블에 집약되어 있어 I/O가 증가하면 성능이 저하될 수 있음
- 대량의 데이터를 컬럼단위로 수직분할하거나, 로우(row) 단위로 수평분할하여 I/O량을 줄임으로써 성능을 향상 시킬 수 있음
제5절 데이터베이스 구조와 성능
- 논리 모델링 단계의 슈퍼/서브타입의 논리모델을 물리 데이터 모델로 변환하는 방법으로 1:1, 슈퍼+서브타입, All in one 형태가 있음
- 인덱스의 컬럼 순서에 따라 데이터 처리성능에 영향을 줄 수 있으니 인덱스 생성 시 주의
- 물리적인 테이블에도 관계를 적용하는 것이 좋으며, 미적용시 FK에 인덱스를 생성해야 성능저하를 막을 수 있음
제6절 분산 데이터베이스와 성능
- 분산 데이터베이스의 정의 : 빠른 네트워크를 이용하여 데이터베이스를 여러지역(여러노드)에 위치시켜 사용성 및 성능 등을 극대회시킨 데이터베이스
- 분산데이터의 투명성 : 분할 투명성, 위치 투명성, 지역사상 투명성, 중복 투명성, 장애 투명성, 병행 투명성이 있음
- 분산 데이터베이스의 장/단점
- 데이터의 가용성과 신뢰성 증가, 빠른 응답 속도와 통신비용 등
- 소프트웨어 개발비용 증가, 처리 비용의 증가 등
- 예전에는 위치 중심의 분산설계를 하였다면, 현재는 분산 데이터베이스는 업무필요에 의한 분산설계를 하고 있음
- 분산 데이터베이스 적용방법 : 테이블 위치 분산, 테이블 분할 분산, 테이블 복제 분산, 테이블 요약 분산이 있음
문서에 대하여
- HOME
- [종료]구루비 DB 스터디
- 2013년 하반기 - 오라클 트러블슈팅 스터디
- 1_2장 요약