유니코드 정규화

1 개요[ | ]

unicode normalization
unicode 正規化
유니코드 정규화

검색이나 프로그래밍을 더 쉽게 하기 위해, OS마다 다르게 나올 수 있는 문자를 하나로 통일하는 과정.

유형 NFC[1] NFD[2] NFKC[3] NFKD[4]
정규형 C 정규형 D 정규형 KC 정규형 KD
정규형 정준 결합 정규형 정준 분해 정규형 호환성 결합 정규형 호환성 분해
설명 정준분해 후, 정준결합 정준분해 호환성 분해 후, 정준결합 호환성 분해

2 예시[ | ]

사례구분 원형 NFC NFD NFKC NFKD
한글음절 각 (AC01) 각 (AC01) 각 (1100 1161 11A8) 각 (AC01) 각 (1100 1161 11A8)
한글자모 ᄀ (1100) ᄀ (1100) ᄀ (1100) ᄀ (1100) ᄀ (1100)
호환자모 ㄱ (3131) ㄱ (3131) ㄱ (3131) ᄀ (1100) ᄀ (1100)
괄호문자 ㈀ (3200) ㈀ (3200) ㈀ (3200) (ㄱ) (0028 1100 0029) (ᄀ) (0028 1100 0029)
㈎ (320E) ㈎ (320E) ㈎ (320E) (가) (0028 AC00 0028) (가) (0028 1100 1161 0029)
㈝ (321D) ㈝ (321D) ㈝ (321D) (오전) (0028 C624 C804 0028) (오전) (0028 110B 1169 110C 1165 11AB 0029)

3 같이 보기[ | ]

4 참고[ | ]

  1. Normalization Form Canonical Composition
  2. Normalization Form Canonical Decomposition
  3. Normalization Form Compatibility Composition
  4. Normalization Form Compatibility Decomposition
문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}