Histogram을 둘러싼 오해

실행 계획의 변화

Histogram이 실행계획에 뜻하지 않은 변화를 준다.
- Bind Peeking: Histogram이 존재하는 경우에는 최초에 어떤 값이 Bind변수에 사용되느냐에 따라 실행계획이 결정된다. 또한 Hard Parse가 이루어질 때, 어떤 값이 주어졌느냐에 따라 실행계획이 매번 변할 수 있다. 이런 이유로 많은 System에서 Bind Peeking을 비활성화한다.(_OPTIM_PEEK_USER_BINDS를 FALSE로 변경)
- Density의 변화: Height-Balanced Histogram의 경우에는 Non Popular Value나 Bind변수로 이루어진 Predicate에 대해 Density를 사용한다. Density의 변화는 Selectivity의 변화를 초래하고, Cardinality의 변화를 초래한다.
- Join Cardinality의 변화: where절에 Join Predicate를 제외한 아무런 조건이 없는 경우에도 실행계획이 바뀔수 있다.(p.367)

Histogram은 Distinct Count가 낮은 Column에 대해서만 유용한것 아닌가?

Distinct Count는 Histogram과 전혀 무관하며, Histogram의 존재의 의의는 Data의 Skewness에 의해서만 결정된다.

Index가 없는 Column에 대해 Histogram이 도대체 왜 필요한가?

Histogram의 존재의 목적은 Cardinality의 정확성을 높이는 것이다. Index를 경유하느냐 Table Full Scan을 하느냐는 Cardinality에 결정되는 결과일 뿐 목적이 아니다.

Histogram은 Bucket내에 존재하지 않는 값에 대한 Cardinality는 부정확하다.
Bind변수를 사용하면서 Bind Peeking을 비활성화 한경우에도 부정확하다.
Height-Balanced Histogram의 경우에는 특정 값이 Popular Value로 분류되는냐, Non Popular Value로 분류되느냐에 따라 Cardinality에서 큰 차이가 날 수 있다.
=> Histogram은 많은 장점을 제공하나 많은 한계점도 존재하므로, 한계점을 명확히 인지하고 사용해야한다.