1. 아노말리(Anomaly)

  • 아노말리는 데이터 이상현상으로, 중복된 데이터 때문에 발생함.
  • 어떤 처리를 할 때, 중복된 데이터를 동시에 전부 처리하지 못하고 일부만 처리할 경우 어떤 데이터가 맞는지 모르고 결국 데이터는 이상해짐.
  • 정규형 모델에서는 아노말리가 최소화되며, 중복 데이터를 채택한 모델에는 다음과 같은 아노말리가 발생함.
    • 업데이트 아노말리 : 릴레이션에서 속성의 값을 업데이트할 때 발생하는 데이터 이상 현상
    • 삭제 아노말리 : 릴레이션에서 인스턴스를 삭제할 때 발생하는 데이터 이상 현상
    • 삽입 아노말리 : 릴레이션에 새로운 인스턴스를 삽입할 때 발생하는 데이터 이상 현상


2. 아노말리가 발생할 수 있는 릴레이션 사례-1


1) 업데이트 아노말리

  • '홍길동'이라는 선수의 포지션을 '2루수'로 바꾸면 3개의 인스턴스를 찾아 포지션 속성 값을 '2루수'로 업데이트 해야함.
  • 현재는 인스턴스 개수가 작아 문제가 없지만, 전체 인스턴스 개수가 수천만 건이 되고, 이 중 '홍길동' 데이터가 많을 경우 문제가 될 수 있음.
  • 또한 업데이트 할 속성이 여러 엔터티에 존재할 경우 완벽한 업데이트가 쉽지 않아 아노말리 발생할 수 있음.
  • 정규화를 하여 중복을 제거하면, 중복 데이터가 없어 업데이트를 부분적으로 할 수 없고 하나만 업데이트하면 전체가 업데이트 되므로 관리가 훨씬 수월함.


2) 삭제 아노말리

  • '김길동'의 데이터를 삭제할 경우, '엘리펀츠'와 '타이거즈' 팀의 데이터도 같이 삭제가 되어 문제가 됨.
  • 정규화를 하면 선수 데이터만 삭제할 수 있으므로 팀 데이터는 그대로 유지 가능함.


3) 삽입 아노말리

  • '장길동'이라는 16번의 새로운 선수를 등록해야 하는데, 아직 팀이 정해지지 않을 경우 팀ID를 NULL로 넣어야 하나 주 식별자이므로 등록이 안됨.
  • 선수는 존재하지만 팀이 정해지지 않아 새로운 인스턴스를 넣지 못하는 상황이 발생됨.
  • 정규화를 하면 팀이 정해지지 않아도 선수만 따로 등록할 수 있음.


3. 아노말리가 발생할 수 있는 릴레이션 사례-2

  • 선수 데이터를 관리하는 릴레이션으로 소속팀에 대한 데이터까지 관리하는 잘못 설계된 릴레이션


4. 정규화된 릴레이션

  • '릴레이션 사례-1'의 내용을 정규화한 내용