h1.병렬 조인
h4.성능 최적화 포인트: 각 병렬 프로세스들이 독립적으로 일 할 수 있도록 데이터 적절하게 분배
h4.조인 방법
1. 양 쪽 모두 Join 컬럼에 대해 Partition 되어 있을 경우
2. 한 쪽 테이블만 Join 컬럼에 대해 Parition 되어 있을 경우
3. 둘 다 Join 컬럼에 대해 Partition 없어서 동적 파티셔닝
4. 둘 다 Join 컬럼에 대해 Partition 없어서 Broadcast
h4.1번 경우(양쪽 모두 Join 컬럼 기준 파티션)
- 순서
1 양쪽 테이블을 각각 같은 파티션으로 나눠 프로세스 분배
2 각 프로세스 내부에서 조인
3 최종 결과 QC 전송
- 플랜에는
PX PARTITION RANGE ALL
PARTITION RANGE ITERATOR
- 특징
하나의 서버집합만 필요(Partition degree * 1 개 Process)
파티션 기반 병렬처리이므로 파티션 갯수 이하로 병렬도 제한
파티션 방식, 조인 방식에 무관하게 동작 가능
양 테이블이 같은 컬럼, 같은 기준으로 파티션 되어 있어야 가능
h4.2번 경우(한 쪽 테이블만 Join 컬럼에 대해 Parition)
- 순서
1 첫 서버 집합이 비 파티션 테이블을 파티션 테이블 기준으로 동적 파티셔닝
2 각 프로세스 내부에서 조인
3 최종 결과 QC 에 전송
- 플랜에는
PARTITION (KEY)
PART (KEY)
- 특징
두 개의 서버집합 필요(Partition degree * 2 개 Process)
각 서버집합 간 데이터 통신 발생
h4.3번 경우(둘 다 Join 컬럼에 대해 Partition 없어서 동적 파티셔닝)
- 순서
1 첫 서버 집합이 outer 테이블 읽어 두 번째 서버 집합에 분배
2 첫 서버 집합이 inner 테이블 읽어 두 번째 서버 집합에 분배
3 두 번째 서버 집합이 각 프로세스 내부에서 조인
4 최종 결과 QC 에 전송
- 플랜에는
PQ Distribute HASH
PX SEND HASH
- 특징
조인 전에 메모리나 TEMP TBS 를 많이 사용
전체범위 처리 필요
조인컬럼 내부 데이터 분포 불균등할 경우 프로세스 간 처리 데이터 차이 발생 가능
둘 다 대용량이고 조인컬럼 데이터 분포 균일할 때 효과적
h4.4번 경우(둘 다 Join 컬럼에 대해 Partition 없어서 broadcast)
- 순서
1 첫 서버 집합이 작은 테이블 전체를 두 번째 집합의 모든 프로세스에 전송
2 첫 서버 집합이 큰 테이블을 두 번째 집합의 각 프로세스에 동적 파티셔닝 해 전송
3 두 번째 서버 집합이 각 프로세스 내부에서 조인
4 최종 결과 QC 에 전송
- 특징
broadcasat 되는 테이블은 비교적 작아서 Serial 하게 읽는것이 일반적
조인 방식에 무관하게 동작 가능
작은 테이블은 전체범위 필요, 큰 테이블은 부분범위 가능