9.9 속성 검증

  • 속성명은 단어 사전에 존재히는 단어로 구성돼야 하며 도메인이 지정돼야 한디.
  • 중복 추출- 복합- 다가 속성 등을 반드시 시용해야 히는지를 성능 관점 에서 검증
  • 현행 데이터가 존재하면 속성 매핑 정의서를작성하는것이 가장 확실한 검증 방법


속성명이 단어의 조합으로 구성됐는가?

  • 속성명은 단어 사전에 존재하는 단어로 구성돼야 한다.
  • 단어 사전 없이 속성명을 정하는 것은 모델의 품질을 낮추는 결과를 초래 하므로 속성명이 단어의 조합으로 구성 됐는지를 검증해야 한다.


추출 속성이 식별되는가?

  • 일부 추출 속성은 성능 문제를 해결히는 데 도움을 준다.
  • 추출 속성이 식별되고 사유가 정의돼야 하며 원천 데이터를 어떻게 추출했는지 관리돼야 한다.
  • 가능한 사용하지 않는 것이 데이타 정합성 에 도움이 되므로 삭제해도 되는지를 검증해야 한다


복합 속성이 사용되었는가?

  • 복합 속성은 때에 따라 시용해야 하지만 일반적으로 시용해서는 안 되므로 채택 여부를 검증해야 한다.


다가 속성이 사용되었는가?

  • 다가 속성은 대부분 시용해서는 안 되므로 정규화를 해야 한다.
  • 값의 개수가 고정됐다면 비정규형을 채택할 수 있는지를 검증해야 한다.


코드 속성일 경우 코드값이 존재하는가?

  • 코드 속성은 코드값- 코드명이 존재하지 않으면 안 되므로 코드값코드명이 존재하는지를 검증해야한다.


코드 속성의 코드값- 코드명이 통합되었는가?

  • 코드속성명이 동일한데 코드값- 코드명이 다른속성이 존재하지 않는지, 반대로표드값 코드명이 유사한데 코드 속성명이 다른 속성이 존재하지 않는지를 검증한다.
  • 나아가 유사한 코드멍이 서로 통합될 수 없는지를 검증한다.


반복되는 속성이 존재하는가?

  • 반복되는 속성은 정규화의 대%에다. 반복 횟수가 불변일 때는 비정규화를 고려힐 수 있지만 기본
    적으로 정규화가 되었는지를 검증해야 한다.

동일 속성의 도메인이 일치하는가?

  • 같은 속성명은 같은도메인을 사용해야하는 것은 기본적인 원칙이다.
  • 속성명이 같거나 동일한 성격의 속성에 대해서 데이터 타입,길이 등의 도메인이 같은지를 검증해야 한다


동음이의어나 이음동의어가 사용되었는가?

  • 단어나 속성에 동음이의어나 이음동의어를 사용하는 것은 득보다 실이 더 크다.
  • 사실상 실익이 없으므로 가능히면 사용하지 않는 것이 바람직하다.
  • 사용이 금지됐다면 사용되고 있는 동음이의어나 이음동의어가 없는지 검증해야한다.


슈퍼타입과 서브타입의 속성이 제 위치에 존재하는가?

  • 서브타입의 공통 속성이 서브타입에 존재히는지, 서브타입의 고유 속성이 슈퍼타입에 존재히는지를 검증한다.
  • 전략적으로 사용할 때가존재하지만, 원칙적으로 공통속성은 슈퍼타입에 개별 속성은 서브타입에 존재해야 한다.


누락되거나 불필요한 속성은 없는가?

  • 현행 데이터베이스가 존재히면 현행 속성과의 매핑을 통해 누락된 속성이 없는지를 검증한다.
  • 화면 정의서의 항목과의 매핑을통해 누락된 속성과 불팔요한 속성을 검증할수 있다.