1 개요[ | ]
- UCS Transformation Format—8-bit; UTF-8; utf8
- 유니코드 문자인코딩 방식 중 하나
- 가변길이 인코딩
- 문자 1개를 나타내기 위해 1~4바이트 사용
Console
Copy
mysql> SELECT * FROM information_schema.CHARACTER_SETS WHERE CHARACTER_SET_NAME='utf8';
+--------------------+----------------------+---------------+--------+
| CHARACTER_SET_NAME | DEFAULT_COLLATE_NAME | DESCRIPTION | MAXLEN |
+--------------------+----------------------+---------------+--------+
| utf8 | utf8_general_ci | UTF-8 Unicode | 3 |
+--------------------+----------------------+---------------+--------+
1 row in set (0.00 sec)
- → UTF-8은 최대 4바이트까지라는데, MySQL에서 MAXLEN은 3이다...??[1]
2 주요 영역[ | ]
![](https://z-images.s3.amazonaws.com/thumb/e/ec/Crystal_Clear_app_xmag.svg/24px-Crystal_Clear_app_xmag.svg.png 1.5x, https://z-images.s3.amazonaws.com/thumb/e/ec/Crystal_Clear_app_xmag.svg/32px-Crystal_Clear_app_xmag.svg.png 2x)
- 한글 자모: 1100 ~11FF
- 한글 (가 ~ 힣): AC00 ~ D7A3
3 예시[ | ]
문자 | Binary code point | 2진수 | 16진수 | |
---|---|---|---|---|
$ | U+0024
|
0100100
|
00100100
|
24
|
¢ | U+00A2
|
00010100010
|
11000010 10100010
|
C2 A2
|
€ | U+20AC
|
0010000010101100
|
11100010 10000010 10101100
|
E2 82 AC
|
𤭢 | U+24B62
|
000100100101101100010
|
11110000 10100100 10101101 10100010
|
F0 A4 AD A2
|
4 같이 보기[ | ]
5 참고[ | ]
- http://en.wikipedia.org/wiki/UTF-8
- http://ko.wikipedia.org/wiki/유니코드_범위_목록
- http://www.utf8-chartable.de/
- ↑ 4바이트 짜리는 거의 수요가 없어서 무시한듯??