개요
- Unicode
- 유니코드
- 전세계 언어를 통일된 방법으로 표현할 수 있게 제안된 국제적인 문자 코드 규약
- 전세계의 모든 문자를 컴퓨터에서 일관되게 표현하고 다룰 수 있도록 설계된 산업 표준
- UCS(문자집합) + α(인코딩, 알고리즘 등 기타 규약)
- 유니코드 협회(Unicode Consortium)가 제정함
코드 포인트(code point)
- 유니코드의 값을 나타내기 위해서 코드 포인트를 사용함
- 보통은 U+를 붙여 표기해줌 → 'A'의 유니코드 값은 U+0041 혹은 \u0041
유니코드 평면(plane)
- 유니코드는 평면이라는 개념을 이용하여 구획을 나눔
- 평면 개수는 0번 평면인 기본 다국어 평면에서 16번 평면까지 모두 17개 평면
- 대부분의 문자는 U+0000-U+FFFF범위에 있는 기본 다국어 평면에 속함
- 일부 한자는 보조 다국어 평면인 U+10000`U+1FFFF범위에 속함
- 한글은 함U+1100-U+11FF (한글 자모 영역), U+AC00-U+D7AF(한글 소리 마디 영역)에 포함