기본적인 용어들

  • Histogram을 이해하는데 알아야 할 용어


 * 아래 샘플 테이블 t1 의 컬럼 c1 의 예를 들었을 때

SQL> select c1, count(*) from t1 group by c1;

C   COUNT(*)
- ----------
A        500
B        300



용어명용어 정의샘플 예제로 본 의미
Valuet1.c1 의 value 는 A, BFrequency빈도 : 특정 값에 속하는 원소의 개수A = 500, B = 300
Bucket바구니 : 값들이 속하는 범위아래에 별도 설명


Bucket
  • Bucket 을 이해하기 위한 기본 전재
    • Oracle이 Histogram에서 저장할 수 있는 값(value)의 최대 개수 : 254개
    • 즉 254개 이상의 값을 가지는 컬럼은 각각의 값 별로 빈도를 저장 할 수 없다.


  • Histogram에서의 Bucket
    • 254개 이상의 값을 가지고 있는 컬럼의 경우 적절한 범위(Bucket)로 나누어 빈도를 저장할 수 있음
    • Bucket Size는 조정 가능. Bucket Size <= 254 (즉 반드시 값이 254개가 넘어야 bucket 에 저장된다.. 는 개념이 아니라는 것임)
      ex) 상품매출 테이블에서 매출수량 컬럼의 빈도는 아래와 같이 저장
      {(0~100), 100건}, {(101~1000), 150건}, {(1001~1500), 5건}