A. 인덱스 종류
1. B-Tree
구조
- Root - Branch - Leaf
- Root/Branch
- 하위 노드의 Data 범위 키 값
- 하위 노드의 Block 주소
- Leaf
- 인덱스 키 값
- Table Block 주소
- 앞/뒤 Index Block 주소
특징
- 인덱스 키 순서로 정렬되어 있어 범위 스캔(Range Scan) 가능
- 앞/뒤 Block 주소로 정방향, 역방향 스캔 가능
- Oracle B-Tree Index 는 널 저장 하지 않음
- SQL Server 는 Null 저장, 가장 앞순위로 정렬
활용
Index Fragmentation
- a.Unbalanced Index
- 발생하지 않음(B-Tree 의 B 는 Balanced)
- b. Index Skew
- Index 정렬 순으로 특정 방향의 데이터가 대량 Delete 되어 Leaf block 이 빈 상태
- Leaf Block 은 Freelist 로 반환되지만 구조는 그대로 유지
- 상위 Branch 범위에 해당하는 값 입력 시, 다른 노드에 인덱스 분할 발생 시 재 사용 가능
- 재 사용 전까지 Scan 효율이 낮은 상태로 유지
- SQL Server 에서는 Empty Leaf 를 주기적으로 정리(Ghost mark 처리 후 별도 정리)
- c. Index Sparse
- 전반적인 Leaf nod 의 밀도 저하
- 완전한 Empty 상태가 아니므로 상위 Branch 범위의 데이터 입력 전까지 블록 재 사용 불가
- 레코드 건수가 일정해도 Index Size 만 증가 가능
Index 재 생성
- a. Rebuild 로 빈 공간 제거 작업은 전략적 선택
- Scan 효율 증가 <--> DML 시 인덱스 분할로 인한 성능 저하
- 빈 공간을 남기면서 재 생성하는 방법도 근본적 해결책은 아님
- 재 생성 시 System 부하, 시간 고려 필요
- * b. Rebuild 필요한 시점*
- 인덱스 분할 경합 높을 때
- 인덱스 깊이(Height) 증가 시
- 자주 사용하는 인덱스 Scan 효율 증가 필요시
- 대량 Delete 후 Data 재 입력시 까지 오랜 시간 소요 시
- 총 Table Rows 수 대비 Index Size 만 계송 증가 시
2. Bitmap
구조
특징
- Null 저장
- 부정형 조건 사용 시에도 Scan 가능
- Random Access 의 Cost 는 B-Tree 와 큰 차이 없음(Index block scan 만 줄어듬)
- 여러 Bitmap Index 를 동시에 사용하기 쉬움(Bitmap Index Merge)
활용 방안
- Distinct value 의 개수가 적은 컬럼일 때 저장 효율 높음
- 대용량 데이터 검색 성능 향상
- 비 정형(ad-hoc) 쿼리 많을 때 적합
- 변경(DML) 작업 시 동일 Bitmap 범위의 모든 레코드에 Lock
- 일반적으로 DW 환경에 적합
3. FB Index(Funcdion Based Index)
구조
- 컬럼 값에 가공 함수(ex round, || ) 적용한 값으로 Index 생성
활용 방안
- 컬럼을 가공한 값을 이용해 데이터 검색 해야하는 요건이 어쩔수 없이 있을 때
- DML 로 인한 인덱스 갱신 시 함수까지 적용하여 갱신하므로 추가적인 부하 고려 필요함
4. Reverse Key Index
구조
- B-Tree 와 유사하나 Leaf 의 Key 값이 글자 역순
- reverse(column) 함수 적용하여 인덱스 생성 한 것과 같음
활용 방안
- Right Growing 현상으로 Insert 시 동일 인덱스 블록에 대한 경합 심할 때 사용 시 효율적
- = 조건 입력시만 사용 가능함 - 데이터의 '의미' 적인 부분이 없어지므로 (hash 함수 적용시와 유사)
5. Cluster Index(Oracle)
구조
!cluster index.JPG!
- Cluster Table
- Cluster Key 가 같은 Row 가 하나의 Block 에 모이도록 저장
- 한 블록에 모두 담을 수 없을 때에는 여러 블록을 Cluster Chain 으로 연결
- 여러 테이블의 Join 된 데이터도 구성 가능
- Cluster Index
- Cluster table 을 탐색하기 위한 인덱스로...
- B-Tree 와 유사
- Leaf Node 의 키 값은 Cluster Key 컬럼의 Unique 한 값을 가지고 있음
- Leaf node 는 해당 키 값을 저장하는 Cluster table의 데이터 블록만 가리키며
- 이로 인해 Index-Table 사이의 Random Access 는 값 하나 당 한번만 발생
- Random Access 후 Cluster table 에서는 Sequential Scan
- Table Data 와 1:M 관계
활용 방안
- Index Key 값 별 Sequential Scan 하기 때문에 넓은 범위 검색 시 유리
- 수정(Cluster 이동), 입력(새 Cluster 할당)이 빈번한 컬럼에는 비추
IOT(Oracle) / Cluster형 Index(SQL Server)
구조
- Table = Index
- Cluster 형 인덱스
- B-Tree Index 와 유사
- Leaf Page 에 Key 값 + 나머지 Data 전부 저장
- Unique 인덱스 아니어도 무관 - 중복 식별 위해 4byte 의 uniquifier 저장
- IOT
- PK Index 로 구성된 Table
- PK 외 나머지 Data 는 Overflow 영역에 저장
특징
- Scan 성능 높음
- Table Data 의 정렬 보장
- 별도의 Table Access 과정 생략 가능
- DML 성능 낮음
- Table 정렬 상태 유지 필요
- SQL Server: Leaf Page 에 모든 데이터가 있으므로 잦은 분할(Split) 발생
활용 방안
- 넓은 범위 검색이 잦은 테이블
- 크기 작고 NL 이 많은 테이블
- 컬럼 수 적고 Row 수 많은 테이블
- 데이터 입력, 조회 패턴이 다른 테이블(일반 Index 와 유사한 듯)
비 클러스터형(Secondary) Index
- Cluster 형 인덱스(IOT PK Index) 외 다른 Index
- 메인 인덱스를 가르키는 키 값을 포함
- SQL Server 비 클러스터형 인덱스 구조
- 비 클러스터형 인덱스가 클러스터형 인덱스의 값(Data) 를 가짐(7.0 이상 버전)
- 클러스터형 인덱스 분할 시
- 갱신 발생 안함
- 주소가 아닌 데이터 내용을 지칭하므로 영향 없음
- \* Oracle Secondary 인덱스 구조
- a. Logical Rowid (PK + physical guess) 이용
- b. physical guess 는 IOT (재)생성 시의 Data Block address(DBA)
- c. PK Index 분할 시
- 갱신 발생 안함
- physical guess 주소 선 탐색 후 없으면 PK 값으로 재 탐색
B. 인덱스 스캔 방식
Range Scan
스캔 방식
- Root \-> Branch \-> Leaf Sequential Scan
활용 Case
- SQL 에 Index 선두 컬럼을 이용한 조건 있을 때
- Sort order by 생략 목적
- Min/Max 값 빠르게 추출 목적
성능 향상 포인트
- Scan 범위 / Table Access 횟수 줄이는 것
실행 계획 예시
- ORACLE : INDEX(RANGE SCAN)
Execution Plan
---------------------------------------------------
o SELECT STATEMENT Optimizer=ALL_ROWS
1 0 TABLE ACCESS (BY INDEX ROWID) OF 'EMP' (TABLE)
2 1 INDEX (RANGE SCAN) OF 'EMP DEPTNO_IDX' (INDEX)
StmtText
---------------------------------------------------------------------
I--Nested Loops(Inner Join, OUTER REFERENCES:([Bmk1000)))
I--Index Seek(OBJECT:(U.ldboJ.[empl[emp_deptnojdx]), SEEK:([deptno]=20) ORDERED FORWARD)
I--RID Lookup(OBJECT:(L .l. [dboJ.[emp]), SEEK:([Bmkl000]=[Bmk1000]) LOOKUP ORDERED FORWARD)
Index Full Scan
스캔방식
- 시작 Leaf Block 찾기 위한 처음 수직적 탐색
- 이후 모든 Leaf Block Sequential 스캔
활용 Case
- Table Full Scan 대체
- SQL 에 Index 선두 컬럼을 이용한 조건이 없고
- Scan 범위 대비 Filtering 되어 추출하는 범위가 작을 때
- (Index 에서 Filtering 이 잘 되어 Table Access 가 적게 발생할 때)
- 정렬된 값의 의 빠른 반환 필요 시
- Table Access 가 많아서 총 비용이 많이 들더라도 정렬된 값의 처음 값 몇 개만 빠르게 반환해야할 때
- --> First_rows(Oracle)/fastfirstrow(SQL Server) 모드 운영 시 선택 가능
- --> 전체 범위 반환시에는 FTS 보다 느릴 수 있음
실행 계획 예시
- ORACLE : Index (FULL SCAN)
Execution Plan
--------------------------------------------------
o SELECT STATEMENT Optimizer=ALL_ROWS
1 0 TABLE ACCESS (BY INDEX ROWID) OF 'EMP' (TABLE)
2 1 INDEX (FULL SCAN) OF 'EMP_IDX' (INDEX)
StmtText
1--Filter(WHERE:(L.l. [dbol. [empl. [sall) (2000.)))
I-- Nested Loops(lnner Join, OUTER REFERENCES' ([BmklOOO]))
I--Index Scan(OBJECT:(L .l. [dboJ.[empJ.[emp_idx]), ORDERED FORWARD)
I--RID Lookup(OBJECT: (L .l. [dboJ.[emp]), SEEK: ([BmklOOOl=[BmklOOO]) LOOKUP ORDERED FORW ARD)
Index Unique Scan
스캔 방식
활용 Case
- Unique Index 를 = 조건으로 검색 시
실행 계획 예시
- ORACLE : INDEX (UNIQUE SCAN)
Execution Plan
-------------------------------------------
o SELECT STATEMENT Optimizer=ALL_ROWS
1 0 TABLE ACCESS (BY INDEX ROWID) OF 'EMP'
2 1 INDEX (UNIQUE SCAN) OF 'PK EMP' (UNIQUE)
- SQL Server : Index Seek -> Range Scan 과 구분 없음
Index Skip Scan
Scan 방식
- Root/Branch 블록 탐색 후 Data 가 있을 가능성 있는 하위 블록만 Access
- 선두 컬럼 데이터 별로 Looping 돌면서 후행 컬럼에 대해 Random Access 하는 개념과 "유사"
- Oracle 전용
활용 Case
- SQL에 선두 컬럼에 대한 조건이 없을 때
- 선두 컬럼의 Distinct value 가 적고 후행 컬럼의 Distinct value 가 많을 때
- SQL 에 명시적으로 선두 컬럼에 대해 In List 를 지정 해 주면 Skip Scan 에 의존하지 않고 돌일 효과 낼 수 있음
실행 계획 예시
- ORACLE : INDEX (SKIP SCAN)
Execution Plan
--------------------------------------------------
o SELECT STATEMENT Optimizer=ALL_ROWS
1 0 T ABLE ACCESS (Bγ INDEX ROWID) OF '사원 (TABLE)
2 1 INDEX (SKIP SCAN) OF '사원 IDX' (INDEX)
Index Fast Full Scan
아마 이런 방식인 듯
Scan 방식
- Index Segment 전체를 Multiblock Scan
- Root \-> Branch \-> Leaf Scan 방식의 인덱스 구조 무시
활용 Case
- Select 절의 컬럼이 인덱스에 모두 포함되어 있을 때만 가능함
- Index Full Scan 과의 비교
항목 | Index Full Scan | Index Fast Full Scan |
---|
스캔방식 | Index 구조를 따라 스캔 | Index 세그먼트 스캔 |
결과집합순서 | 순서 보장 | 순서 보장되지 않음 |
Block I/O | Single block I/O | Multiblock I/O |
병렬 탐색 | 파티션 없이는 불가능 | 가능 |
사용조건 | 선두컬럼 조건 없고 Filtering 데이터가 전체에 비해 적을 때 | 인덱스 포함된 컬럼만 조회 시 |
Index Range Scan Decending
Scan 방식
활용 Case
- 인덱스 컬럼 기준 내림차순 정렬 시
- 인덱스 컬럼의 Max 값 구할 때
실행계획 예시
- ORACLE : INDEX (RANGE SCAN DESCENDING)
Execution Plan
-------------------------------------------------
SELECT STATEMENT Optimizer=ALL_ROWS
1 0 TABLE ACCESS (BY INDEX ROWID) OF 'EMP' (TABLE)
2 1 INDEX (RANGE SCAN DESCENDING) OF 'PK_EMP' (INDEX (UNIQUE))
- SQL Server : Index Scan ... ORDERED BACKWORD
StmtText
I--Nested Loops(Inner Join, OUTER REFERENCES:([Bmk1000]))
I--Index Scan(OBJECT:([ .. l. [dbo]. [emp]. [pk_emp]), ORDERED BACKWARD)
1--RID Lookup(OBJECT: (L .J.[dboJ.[emp]), SEEK: ([Bmk1000]= [Bmk1000]) LOOKUP ORDERED FORWARD)