기본적인 용어들
- Histogram을 이해하는데 알아야 할 용어
* 아래 샘플 테이블 t1 의 컬럼 c1 의 예를 들었을 때
SQL> select c1, count(*) from t1 group by c1;
C COUNT(*)
- ----------
A 500
B 300
용어명 | 용어 정의 | 샘플 예제로 본 의미 |
---|
Value | 값 | t1.c1 의 value 는 A, B | Frequency | 빈도 : 특정 값에 속하는 원소의 개수 | A = 500, B = 300 |
Bucket | 바구니 : 값들이 속하는 범위 | 아래에 별도 설명 |
Bucket
- Bucket 을 이해하기 위한 기본 전재
- Oracle이 Histogram에서 저장할 수 있는 값(value)의 최대 개수 : 254개
- 즉 254개 이상의 값을 가지는 컬럼은 각각의 값 별로 빈도를 저장 할 수 없다.
- Histogram에서의 Bucket
- 254개 이상의 값을 가지고 있는 컬럼의 경우 적절한 범위(Bucket)로 나누어 빈도를 저장할 수 있음
- Bucket Size는 조정 가능. Bucket Size <= 254 (즉 반드시 값이 254개가 넘어야 bucket 에 저장된다.. 는 개념이 아니라는 것임)
ex) 상품매출 테이블에서 매출수량 컬럼의 빈도는 아래와 같이 저장
{(0~100), 100건}, {(101~1000), 150건}, {(1001~1500), 5건}