- 제3절 동시성 제어
- 1. 비관적 동시성 제어 vs. 낙관적 동시성 제어
- 2. 다중버전 동시성 제어
제3절 동시성 제어
- DBMS는 다수의 사용자를 가정하며, 동시에 작동하는 다중 트랜잭션의 상호 간섭 작용에서 데이터베이스를 보호 할 수 있어야 하며, 이를 동시성 제어(Concurrency Control)이라 한다.
- 동시성을 제어할 수 있도록 하기 위해 모든 DBMS가 공통적으로 Lock 기능을 제공.
- SET TRANSACTION 명령어를 이용해 트랜잭션 격리성 수준을 조정할 수 있는 기능도 제공.
- SQL Server의 경우, 기본 트랜잭션 격리성 수준인 Read committed 상태에선 레코드를 읽고 다음 레코드로 이동하자 마자 공유 Lock을 해제하지만, Repeatable Read로 올리면 트랜잭션을 커밋될 대까지 공유 Lock을 유지
- 동시성과 일관성의 상관관계
1. 비관적 동시성 제어 vs. 낙관적 동시성 제어
가. 비관적 동시성 제어 (Pessimistic concurrency Control)
- 사용자들이 같은 데이터를 동시에 수정할 것이라고 가정.
- 데이터를 읽는 시점에 Lock을 걸고 트랜잭션이 완료될 때까지 이를 유지
SELECT 적립포인트, 방문횟수, 최근방문일시, 구매실적
FROM 고객
WHERE 고개번호 = :CUST_NUM FOR UPDATE;
-\- 새로운 적립포인트 계산
UPDATE 고객
SET 적립포인트 = :적립포인트
WHERE 고객번호 = :CUST_NUM;
- select 시점에 Lock을 거는 비관적 동시성 제어는 자칫 시스템 동시성을 심각하게 떨어뜨릴 우려가 있음
- 아래와 같이 wait 또는 nowait 옵션을 함께 사용하는 것이 바람직
for update nowait \--> 대기 없이 Exception을 던짐
for update wait 3 \--> 3초 대기 후 Exception을 던짐
나. 낙관적 동시성 제어(Optimistic concurrency control)
- 사용자들이 같은 데이터를 동시에 수정하지 않을 것이라고 가정
- 이런 이유로 데이터를 읽을 대는 Lock을 설정하지 않음
- 대신 수정 시점에, 다른 사용자에 의해 값이 변경됐는지를 반드시 검사해야 함
SELECT 적립포인트, 방문횟수, 최근방문일시, 구매실적
INTO :a, :b, :c, :d
FROM 고객
WHERE 고객번호 = :cust_num;
\--새로운 적립포인트 계산
UPDATE 고객
SET 적립포인트 = :적립포인트
WHERE 고객번호 = :cust_num
AND 적립포인트 = :a
AND 방문횟수 = :b
AND 최근방문일시 = :c
AND 구매실적 = :d;
IF sql%rowcount = 0 then
alert('다른 사용자에 의해 변경되었습니다.');
END IF;
- 최종 일시를 관리하는 컬럼이 존재하면, 좀 더 간단하게 구현
SELECT 적립포인트, 방문횟수, 최근방문일시, 구매실적, 변경일시
INTO :a, :b, :c, :d, :mod_dt
FROM 고객
WHERE 고객번호 = :cust_num;
\--새로운 적립포인트 계산
UPDATE 고객
SET 적립포인트 = :적립포인트, 변경일시 = SYSDATE
WHERE 고객번호 = :cust_num
AND 변경일시 = :mod_dt;
IF sql%rowcount = 0 then
alert('다른 사용자에 의해 변경되었습니다.');
END IF;
2. 다중버전 동시성 제어
가. 일반적인 Locking 매커니즘의 문제점
- 동시성 제어의 목표는 동시에 실행되는 트랜잭션 수를 최대화하면서도 입력, 수정, 삭제, 검색 시 데이터 무결성이 유지하는데 있다.
- 읽기 작업에 공유 Lock을 사용하는 일반적인 Locking 매커니즘에서는 읽기 작업과 쓰기 작업이 서로 방해를 일으키기 때문에 종종 동시성에 문제가 발생.
- 데이터 일관성에 문제가 생기는 경우도 있어 이를 해결하려면 Lock을 더 오랫동안 유지하거나 테이블 레벨 lock을 사용해야 하므로 동시성 저하 발생
계좌번호 | 1 | 2 | 3 | 4 | 5 | 6 | 7 | 8 | 9 | 10 |
---|
잔고 | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 | 1,000 |
| < TX1> | <TX2> |
---|
T1 | select sum(잔고) from 계좌; --> 2번 계좌까지 읽음 현재 잔고는 2,000원 | |
T2 | | update 계좌 set 잔고 = 잔고 + 100 where 계좌번호 = 7; |
T3 | --> 6번 계좌까지 읽음 현재 잔고는 5,000원 | |
T4 | | update 계좌 set 잔고 = 잔고 - 100 where 계좌번호 = 3; |
T5 | | commit; |
T6 | --> 10번 계좌 까지 읽음 | |
- T1 : 2번 계좌까지 읽음. 현재 잔고는 2,000
- T2 : UPDATE를 수행. 7번 계좌 잔고는 1,100원이 되었고,아직 커밋되지 않음
- T3 : 6번 계좌까지 일음. 현재까지의 잔고는 5,000원
- T4 : UPDATE를 실행. 3번 계좌는 900원
- T5 : COMMIT을 수행하였으므로 3번 계좌는 900원, 7번 계좌는 1,100인 상태에서 커밋
- T6 : 10번 계좌까지 읽어 내려 감. 7번 계좌 잔고를 1,100으로 바꾼 TX2 트랜잭션이 커밋되었으므로 총 잔고는 10,100원이 된다.
- 위와 같은 비일관성 읽기 문제를 해결하기 위한 일반적인 해법은 트랜잭션 격리성 수준을 상향. 기본 트랜잭션 격리성 수준(Read comitted)에서는 값을 읽는 순간에만 공유 Lock을 걸었다가 다음 레코드로 이동할 때 Lock을 해제함으로써 위와 같은 현상이 발생.
- 트랜잭션 격리성 수준을 Repeatable Read로 올리면 TX1 쿼리가 진행되는 동안 읽은 레코드는 공유 Lock이 계속 유지되며, 심지어 쿼리가 끝나고 다음 쿼리가 진행되는 동안에도 유지된다.
- 트랜잭션 격리성 수준을 올리면 일관성이 높아지지만, Lock이 더 오래 유지됨으로 인해 동시성을 저하 시키고 교착상태가 발생할 가능성도 커짐.
- TX2가 계좌번호 7번을 배타적 LOCK을 설정
- TX1은 3번 레코드에 공유 Lock을 설정
- TX1이 7번을 읽으려는 순간 Dead Lock이 발생
나. 다중버전 동시성 제어
- ORACLE은 버전 3부터 다중버전 동시성 제어(Multiversion Concurrency Control, MVCC) 매커니즘을 사용
- MS SQL Server 2005, IBM DB2 9.7버전 부터 동시성 매커니즘을 제공하기 시작
- MVCC란?
- 데이터를 변경할 대마다 그 변경사항을 UNDO 영역에 저장
- 데이터를 읽다가 쿼리(또는 트랜잭션)시작 시점 이후에 변경된(변경이 진행중이거나 이미 커밋된)값을 발견하면, UNDO 영역에 저장된 정보를 이용해 쿼리(또는 트랜잭션)시작 시점의 일관성 있는 버전(CR Copy)를 생성하고 읽음
- 쿼리 도중 배타적 Lock이 걸린, 즉 변경이 진행 중인 레코드를 만나더라도 대기하지 않기 때문에 동시성 측면에 유리
- UNDO 블록 I/O, CR Copy 생성, CR 블록 캐싱 같은 부가적인 작업의 오버헤드 발생
- Oracle은 UNDO 데이터를 UNDO 세그먼트에 저장혹, SQL Server는 tempdb에 저장.
- MVCC는 문장수준과 트랜잭션 수준의 읽기 일관성이 존재
다. 문장수준 읽기 일관성
- 문장수준 읽기 일관성(Statement-Level Read Consistency)은, 다른 트랜잭션에 의해 데이터의 추가, 변경, 삭제가 발생하더라도 단일 SQL문 내에서 일관성 있게 값을 읽는것을 말함.
- 일관성 기준 시점은 쿼리 시작 시점이 된다.
- 위의 그림은 10023 시점에 시작된 쿼리가 10023 시점 이후에 변경된 데이터 블록을 만났을 대, Rollback(=UNDO) 세그먼트에 저장된 정보를 이용해 10023 이전 시점으로 되돌리고서 값을 읽는 것을 표현
- SQL Server에서 문장수준 읽기 일관성 모드로 DB를 운영하려면 아래 명령어를 수행.
alter database <데이터베이스 이름> set read_committed_snapshot on;
라. 트랜잭션 수준 읽기 일관성
- 트랜잭션 수준 읽기 일관성은, 다른 트랜잭션에 의해 데이터의 추가, 변경, 삭제가 발생하더라도 트랜잭션 내에서 일관성 있게 값을 읽는 것
- Read committed에서 완벽한 문장수준의 읽기 일관성을 보장하는 MVCC 매커니즘도 트랜잭션 수준의 읽기 일관성은 보장하지 않음
- 일반적인 Locking 매커니즘도 트랜잭션 수준의 읽기 일관성은 보장하지 않음
- 트랜잭션 수준으로 완벽한 읽기 일관성을 보장받으려면 격리성 수준을 Serializable Read로 올려주어야 함.
- Isolation Level을 Serializable Read로 상향조정하면, 일관성 기준 시점은 트랜잭션 시작 시점이 된다. 물론 트랜잭션이 진행되는 동안 자신이 발생시킨 변경사항은 그대로 읽음.
alter database <데이터베이스 이름> set allow_snapshot_isolation on;
-- 트랜잭션 시작하기 전 'snapshot'으로 변경
set tranaction isolation level snapshot
begin tran
select ...;
update....;
commit;
h5.마. Snapshot too old
- UNDO 데이터를 활용함으로써 높은 수준의 동시성과 읽기 일관성을 유지하는 대신, 일반적인 Locking 매커니즘에 없는 SNAPSHOT TOO OLD 에러가 MVCC에서 발생
- UNDO 영역에 저장된 UNDO 정보가 다른 트랜잭션에 의해 재사용돼 필요한 CR Copy을 생성할 수 없을 때 발생
SNAPSHOT TOO OLD 발생 가능성을 줄이는 방법
- UNDO 영역의 크기를 증가
- 불필요한 커밋을 자주 수행하지 않음
- FETCH ACROSS COMMIT 형태의 프로그램 작성을 피해 다른 방식으로 구현
- ANSI 표준에 따르면 커밋 이전에 열려 있던 커서는 더는 FETCH 하면 안됨
- 트랜잭션이 몰리는 시간대에 오래 걸리는 쿼리가 같이 수행되지 않도록 조정
- 큰 테이블을 일정 범위로 나누어 읽고 단게적으로 실행할 수 있도록 코딩.
- SNAPSHOT TOO OLD 발생 가능성을 줄일 뿐 아니라 문제가 발생시 특정 부분부터 다시 시작할 수 있음.--> 읽기 일관성에 문제가 없을때만 적용
- 오랜 시간에 걸쳐 같은 블록을 여러번 방문하는 NL Join 형태의 조인문 또는 인덱스를 경유한 테이블 액세스를 수반하는 프로그램이 있는지 체크하고,
- 이를 회피할 수 있는 방법(조인 메소드 변경, Full Table Scan등)을 찾음
- 소트 부하를 감수하더라도 order by 등을 강제로 삽입해 소트 연산이 발생하도록 함
- 대량 업데이트 후에 곧바로 해당 테이블 또는 인덱스를 Full Scan 하도록 쿼리를 수행하는 것도 하나의 해결 방법