한글기계화/토론

# 토론[ | ]

이러한 근본적인 문제는 완성형이 어떻게 바뀌어도 해결해주지 못합니다. 확장 완성형이라는 안이 마련되어 글자 표현력은 많이 늘었지만 근본적인 문제는 여전히 남아있습니다. 문제는 이미 유니코드에 완성형이 포함되었다는 것입니다. 한글 자판 문제는 우리만 해결하면 다 끝나는 문제이지만 한글 코드 문제는 외국과 협상을 통해 맞추어야 하는 것이기 때문에 해결하기가 더욱 어렵습니다. 즉 우리만 제대로 쓴다고 해서 국제적인 문제까지 해소할 수는 없습니다.
그러나 표준이라는 것은 시간이 가면 모자란 부분을 보완하면서 발전합니다. 유니코드가 UTF-7에서 UTF-8로 변한 것을 보아도 그것이 고정된 것은 아님을 알 수 있습니다. 표준은 보수적이며 새로운 표준이 만들어지기까지는 무척 노력하지 않으면 그것에 의지를 관철시킬 수 없지만, 국제적인 문제이기 때문에 오히려 사태를 호전시킬 수 있는 길이 있기도 합니다. 한국, 중국, 일본, 베트남 등은 한자문화권에 속해있으며 각 나라마다 공통된 한자와 다르게 쓰는 한자가 있습니다. 그리고 그것 역시 아직 표준화가 되어있지 않으므로, 유니코드를 만들어나가는 데 우리가 기여를 하면서 가능한 한 한글도 조합형 방식을 채택할 수 있도록 노력한다면 불가능하지는 않다고 할 수 있습니다. -- 거북이 2003-3-8 15:16

조합형 완성형 논쟁은 유니코드에 방대한 한글 영역이 지정되고 첫가끝이 더하여져서 이미 게임 끝난 논쟁입니다. 아래의 내용은 틀린 내용도 많습니다.
  • 유니코드는 자소를 분리할 수 있는 유니크한 알고리즘이 있습니다.
  • 고어처리는 첫가끝으로 해결 되었습니다. 조합형도 고어처리를 하지 못합니다.
  • 글자가 새로 생긴다면 조합형은 이미 조합형이 아니겠지요. 3바이트 4바이트 조합형이 되어야겠지요 ?
  • 유니코드에 완성형이 포함된것이 아닙니다.
조언 고맙습니다만 맥락을 깨는 듯 하여 아래에 모아둡니다. 어떤 분께서 조언하셨는지 모르겠지만 제게 참고할만한 곳을 가르쳐주실 수 있으신지요? 이 부분은 제가 파악을 잘 못해서 틀린 부분이 분명 있습니다. 그 부분을 고쳐볼 수 있도록 도와주시면 고맙겠습니다. -- 거북이 2003-6-22 1:19 am

너무 늦었죠? 봄방학해서 며칠간 놀러갔다 왔거든요. 어제 돌아와서 밀린 숙제 하듯이 허겁지겁 썼습니다. ^ ^

먼저 전자법과 표음법에 관한 저의 의견을 말씀 드리겠습니다. 저는 표음법의 사용에 찬성입니다. 전자법을 사용했을 경우 거북님의 의견처럼 형태소를 밝힐 수 있는 장점은 있겠지만, 단어가 복잡해지고, 읽기가 힘들어집니다. 어차피 영어와 한글과는 어떠한 개연성도 없습니다. 더군다나 한글을 영어로 옮길때 기표외 기의는 약속일 뿐입니다. 영어 단어, 'control'을 '컨트롤' 로 쓰건 '컨츄럴' 로쓰건 '콘트롤'로 쓰건 그건 'control'을 가리키는 말입니다. 그렇다고 우리가 '컨트럴'이라는 말을 듣고 그 말로부터 영어단어 'control'을 유추해 낼 수 있어야 한다고 생각 하지도 않습니다. 만약 그렇게 생각했다면 '콘트롤'로만 써야 옳았겠죠. 그리고 한글로 'r'과'l', 'j'와'z', 'f'와'ph'의 차이를 표시할 수 없기때문에 이러한 발상 자체가 무의해집니다. 제 생각에는 한글을 영어로 썼을때 뜻만 통하면 된다고 생각합니다. 거기에 형태소에 관한 정보까지 담으려 한다면 한국사람 외국사람 다 이해못하는 제 삼의 단어가 탄생될 수도 있습니다. 솔직히 저도 미국에서 5년동안 살았지만 아직도 영어가 기호처럼 보입니다.

컨트롤, 컨츄롤...이렇게 쓰면 검색은 불가능해집니다. --거북이
제말은 어떻게 쓰건 의미는 마찬가지인데 가능하면 알아듣고 기억하고 쓰기 쉬운 말로 정하는게 낫지 않겠냐는 말입니다. 날으는코끼리
예 그건 그래도 검색이 불가능해지면 사는데 엄청난 장애가 생기거든요. --거북이

2000년 한글 표기법이 국어의 표준 발음법에 따라 적는것을 원칙으로 한다고 했는데, 거북님도 지적하셨듯이 완벽한 표음법이 아니고, 너무 많은 예외를 둔것 같습니다. 가장큰 문제중의 하나는 초성과 종성의 자음을 구분하지 않았다는 것 같습니다. 하나의 예가 2000년 로마자 표기법 3장 6항에 있는 '붓꽃'이라는 단어입니다. 표기법에는 '붓꽃'을 ' 'buskkosh'라고 썼는데, 이건 '부스코크'로 발음이 되지 붓꽃으로는 도저히 발음이 될 수 없습니다. 종성의 'ㅅ'과 'ㅊ'은 둘 다 't'로 발음이 되는데 그걸 전자법적인 's'와 'ch'를 사용함으로써 부스코쉬라는 단어을 만들어 냈습니다. '값'도 마찬가지입니다. 로마자 표기법의 'gabs'는 '갑스'이지 '값'이 아닙니다. 'bs'를 써서 'ㅄ'을 나타내 주는게 무슨 의미가 있을까요? 로마자 표기법이 널리 알려지더라도 'gabs'를 보고 이게 갑이아니라 '값'이구나라는것을 알 수 있고 그것을 신경쓰는 사람이 얼마나 있을까요? 그리고 '값'이 어미 '을'을 만났을때 '갑슬'로 발음되는 것을 알고 신경쓸 사람이라면 한글을 얼만큼 하는 사람입니다. 그런 사람들은 왜 값을 'gobs'으로 안쓰고 'gab'으로 썼는지도 알 것입니다. 언중이 쓰기 쉽고 읽기 쉽고 이해하기 쉬운 언어를 써야하지 않을까요?

ButGgot이라고 쓰면 되지 않나요? ^^
제말이 그말이죠 ^^ 날으는코끼리
GabsEul GgakkAtDa는 /갑슬깍깟따/로 충분히 읽히지요. 이게 더 직관적인거 같은데요. --거북이
표음법으로 썼을때도 같은 결과가 나타나죠. 그리고 미국애들은 단어 중간에 대분자가 들어가는게 이상할뿐더러 굳이 발음을 해보라고 하니까 '갑을 각았다' 로 발음하더군요. 각각 다른 음절들로 보고... 날으는코끼리
표음법으로 쓰지 말자고 하는 것은 규칙이 정확하지 않기때문에 여러 사람들이 혼란스럽게 적는다는 이유때문이에요. 전자법으로 읽어도 비슷하다면 당연히 전자법을 쓰는게 옳구요. --거북이

아마 이런 반론이 제기될 수 있을것 같습니다. 그럼 '집'과 '짚'은 어떻게 구분하나? 제 생각에는 구지 두 단어가 구분될 필요가 없다고 봅니다. 우리가 '크' 발음이 나는 'c'와 'k'를 구분하지 않아도 아무 문제 없는것 처럼 말이지요.

언어는 말이 먼저지 글이 먼저가 아니라고 생각합니다. 그리고 언어의 가장 중요한 기능은 의사소통입니다. 결국은 전자법과 표음법중 어느것이 한글 사용자와 영어 사용자 간의 의사소통을 쉽게 해주냐는건데, 제 생각에는 표음법이 그러한 기능에 있어서 탁월하다고 생각합니다. 그리고 우리는 '신림동'이라고 쓰고도 편하게 '실림동'으로 읽으면서 외국인에게는 '신림동'으로 읽으라고 하는건 고문이 아닐까요? 언어는 기본적으로 사용하기 쉬워야한다고 생각합니다.

SinRimDong이라고 써도 /실림동/이라고 자연스럽게 읽을 수 있다고 주장하는거에요. --거북이
아까 Sinrimdong, baekma를 써서 미국애들한테 물어봤는데, 다들 씬림동, 배크마로 읽고, 실림동, 뱅마로 절대 읽힐수 없다고 하더군요. 그건 그들의 음절 구분과도 관계가 있지 않을까요? manhall을 매놀로 발음하지 않고 맨호울로 발음하고, 네트워킹을 네퉈킹으로 발음하지 않고 넷월킹이라고 발음하는... 날으는코끼리
그렇죠. 한국어 발음 읽기는 배워야 합니다. 우리가 영어로 써있다고 해서 아랍어의 로마자, 중국어의 로마자 표기를 봤을 때 못읽는 것과 마찬가지에요. 스와힐리어나 아랍어쯤 되면 아주 더 난리겠지요. 가르치고 배워야...하죠. :) --거북이

마지막으로, 제 생각에는 로마자 표기법에 기반한 한글 영어 표기 사전이 빨리 나와야 한다고 생각을 합니다. 완벽하지 못 한 표기법으로 사전을 만들고 나면 그게 나중에 더 고치기 힘들어져 더 큰 문제가 될 수도 있기때문에, 일단은 공식화 하지말고 임시로 만든후 다시 의견을 수렴하는 거죠. 아무래도 원칙만 갖고 왈가왈부하는것 보다는 실제 단어들을 영어로 표기한 후 하나하나 논의하는것이 더 효과적일 것 같습니다. 먼저 각각의 한글 고유명사들이 영어로 직접 표기될것인지 번역이 되어 표기될 것인지가 정해져야 할 것 같구요. 영어로 직접 표기하기로 했으면 로마자 표기법에 맞추어 표기를 한 후, 시간은 걸리겠지만, 그 안에서 문제가 있는 단어들에 한해서 다시 논의가 이루어 지는게 옳을것 같습니다. 그리고, 로마자 표기법에만 의존하지 말고, 보다 많은 사람들이 공감하는 선에서 예외들도 인정이 되야한다고 생각합니다. -- 날으는코끼리 2003-3-18 1:14 pm

아 지적 고맙습니다. 코끼리님께서 지적하신 부분은 거북이한글로마자표기법의 표기에 따르면 전자법으로도 거의 해결됩니다.
제 생각에 논란의 핵심은 받침 표기를 어떻게 하느냐이지요. 우리말 받침 ㅅ ㅆ ㄷ ㅌ 등은 모두 /t/발음으로 발현되니까요. -- 거북이 2003-3-18 13:28
예. 제 생각에는 한글 로마자 표기법의 문제는 받침에 관한 규정은 거북이님 표기법과 같이 초성과 종성을 구분하되 단순화시키는게 낫지 않을까 싶습니다.. -- 날으는코끼리 2003-3-18 15:05
같이 계속 생각해보지요. 글도 읽구요. 고려바위에서 이런 얘기가 되니 무척 즐겁습니다. -- 거북이 2003-3-18 15:40

표준 내지 규격을 지향하는 경우라면 무조건 표기주의로 가야하고, 그것도 가능하다면이 아니라 무조건 한글 형태소와 알파벳 사이에 1:1 대응이 되도록 만들어야 한다. (이윤기가 희랍어를 아는지 모르는지 내 알바 아니지만, y를 위로 표기함으로 인해 한글 표기만으로 희랍어 표기를 역추적 할 수 있는 최소한의 정보를 전해 주고 있다는 점에서 그는 나와 같은 생각을 하고 있다 볼 수 있지 않을까.)

글쎄...무조건이라...이건 경우를 좀 생각해봐야하겠는데...외국인에게 닭과 삯의 철자를 모두 가르쳐주는 것이 가당한 것인지 생각해 볼 필요는 있네 그려. 하지만 , 다, 데리의 음가가 같다 하더라도 Bat, BadDa, BasDeRi 정도로 쓴다면 마지막의 바스데리 이놈만 빼곤 그런대로 괜찮을테니 거의 1:1 대응을 처절하게 지향한다라는 것에는 찬성이라네. -- 거북이 2003-2-23 22:03

그렇지 않을 경우, 외국인도 한국인도 서로가 소톨할 수가 없는 망할 경우에 직면하게 될 수밖에 없다. 예를 들어, 중국어 지명인 建國門을 한글 표기시에 젠궈먼이라고 표기하는데 이렇게만 알고 중국에 가서 헤메이게 되면, 막상 짱깨 애들도 엽전 놈들이 어딜 가고픈지 감을 잡을 수가 없고 엽전 애들도 간판보고 혼자 헤멜 수도 없다. 차라리 그럴 바에야 아예 건국문이라고 했으면 적어도 간판을 보고 돌아 다니며 찾던지 아님 짱깨 애들과 필담을 통해서라도 찾을 방도가 있기나 하지.

젠궈먼 말고 뭐라고 표현해야하지? 건국문으로 쓰는게 더 나쁜거 아닌감? -.- -- 거북이 2003-2-23 22:03

그리고, 예외란 적으면 적을 수록 좋은 법. 예외 하나가 주는 스트레스가 사람 수명을 얼마나 단축 시킬지는 알 수 없지만, 표음주의가 아니라 표기주의를 따른다 손치더라도 그 시스템에 예외가 많다면 누가 쓸모도 별로 없는 한글을 배우고자 할 것이더냐. 이게 아주 엿같은게, 우리도 지명이 영어로 쓸 때랑 원어도 쓸 때랑 달라지면 아주 열받아 돌아가시겠는데 (예를 들어, 독어로는 쾰른이지만 영어로는 콜로녜), 서로 다른 두 단어(예를 들어, Busan과 Pusan)가 원주민 표기법으로는 사실 완전히 동일한 것이었는지는 도시 우째 알 수 있단 말인가! 닭을 Darg이라고 쓰는 것과 Dag이라고 쓰는 것 가운데 어느 것이 합리적인지는 명약관화인 것이다. 물론 dArg로 쓸 것인지 Darg로 쓸 것인지는 논란의 여지가 있을 수 있겠고, 나는 중성인 모음을 대문자 표기로 해 주는 것이 일반적인 양코쟁이들의 형태소 분석 관습에 더 가깝다고 생각하기는 한다만, 그럴 경우엔 쓸데 없는 분리 기호가 더 필요해지겠지. 닭알은 = dArg'Al'EUn 식으로. 아니면 아예 음가없는 초성 ㅇ을 o로 표기해서 dArgoAloEUn 으로 쓰던지. --SonDon

조선인 관습을 생각해보면 dArg같은 표현은 거의 실효성이 없다고 봐도 좋다. 주체는 우리니까.
푸산은 완전 개그지...-_- -- 거북이 2003-2-23 22:03

한글 로마자 표기법에 관해 미국에 기신 날으는코끼리님과 오야붕님의 의견을 듣고싶네요. 양키들과 대하면서 우리말을 표기해줄 때 어떻게 하는 것이 옳은걸까요. -- 거북이 2003-3-15 11:59 생각해보고 곧 글 올리겠습니다. ^ ^ 링크를 따라가서 조금 읽어보니 쉬운 문제가 아닌것 같군요. -- 날으는코끼리 2003-3-15 17:10

넵 쉬운 문제가 아닙니다. :) -- 거북이 2003-3-16 21:03
저도 몇번 읽었는데요. 우리말을 따르게 하는 것은 좋지만 이미 말씀 드렸던 것처럼 발음문제도 당연히 신경써야 할 것이라고 봐요. 그리고 한글을 로마자로 바꾸는 것은 외국인을 위한 거잖아요. 그런데 거북이님의 글을 읽다보면 외국인의 편리.는 조금 뒤로 간것 같아요. 예를 들어 설악산의 경우요. 전 설악이란 느낌이 좋아서 부러 설.악.이라고 하는 주의지만 우리가 읽을땐 서락.이라고 하는 경우가 더 많지 않나요? 이 취지가 별도의 발음 기호없이 읽을 수 있게하자는 것이라면 현재로선 좀 무리가 따를듯 싶습니다. 지금 약먹고 어지러버서리 요기서 그만, ^^ -- 오야붕 2003-3-16 5:58
아 좋은 지적이었어요. 요 부분을 빼먹었는데 이번에 포함시켰습니다. 발음 문제 당연히 신경을 써야하지요. 제가 물어보고싶었던 것은 SinRaSeolAk이라고 썼을때 외국인들이 어떻게 느낄까에 대한 궁금증입니다.. 제 생각에는 외국어는 외국어라고 인식하게 만드는 것이 옳지 않은가 싶어요. 외국어라고 인식해야 조심해서 읽게될 듯 하니까요. -- 거북이 2003-3-16 21:03
반면에 우리 말은 표음문자이므로 글자 자체를 적어도 연음화에 의해 일상적으로 사용하는 것 처럼 발음이 잘 됩니다. 예를들어 '신라'와 '설악'은 /실라/와 /서락/으로 발음됩니다. SinRaSeolAk이라고 적어도 n과 R이 만나 ll비슷한 발음이 되고 l은 A에 자연스럽게 붙어 /실라/와 /서락/에 가깝게 발음이 되는 것입니다. 따라서 이것은 결코 발음 체계를 무시한 것이라고 볼 수 없습니다. 실제로 우리말의 발음이 연음화나 구개음화 등의 자연스러운 발음법에 의해 만들어진 것이기 때문입니다. 이것이 두번째에 대한 반론입니다.
제 친구들에게 전화로 물어 봤는데요. 미국애들의 대답은 대부분 who care? 였구요. 다른 나라에서 온 애들의 의견은 현재 한국인들이 발음하는 걸 기준으로 표기하고 거기에 한글과 한자를 함께 써줬음 좋겠다고 하네요. 복잡하죠? 우리나라 사람들이나 한자권 사람들 빼곤 발음을 우선시 한단걸 보여주죠. 우리는 외국어를 배워갈때 말하기 기준이 아니고 쓰고 읽는거 먼저 하지만 얘넨 우선 듣고, 말하는걸 먼저 하니까요. 또 필요하신거라두...? ^^-- 오야붕 2003-3-17 13:49
아 별로 없습니다. 지속적인 관심 외엔. ^^
역시 후캐어가 답이겠지요. 즉 우리만 열심히 잘 쓰면 된다는...-_- 발음은 전자법으로 해도 문제되지 않기 때문에 상관없습니다. 원어와 한자를 병기하면 좋겠지만 그건 독어 쓸 때 움라우트까지 적어주면 고맙겠다 그런 것과 비슷한 상황이라고 생각해요. 여튼 땡쓰~ -- 거북이 2003-3-17 13:56

한글기계화에서 주장한 내용은 예전부터 충분히 공감하고 있던 터라 이견은 없음. 단지 5장에서 발음의 규칙과 관련하여 예를 들은 '프랑스어'는 예외가 있긴 하지만 매우 규칙성이 있으므로 영어와 동등한 급으로 분류되어서는 안될 듯함. 몇 가지 눈에 뜨인 띄어쓰기 오류와 모호한 단어 두세 개는 무단으로 손을 댔으니, 변경 비교를 보고 확인해보기 바람.
전체의 논지와는 큰 관련이 없지만 자판 얘기를 잠깐 해보면, '세벌식' 자판으로의 전면 혹은 부분적인 전환은 대부분의 컴퓨터 이용자들이 이미 두벌식 자판에 익숙해져버린 터라 아직까지도 제대로 된 틀이 잡히지 않은 '표기법 표준화' 문제보다 오히려 더 어렵다는 생각이 들더군. 만약 세벌식 사용을 공식적으로 인정하고 활성화하는 쪽으로 방향이 정해진다면, 다소 무리가 있더라도 정부기관, 그리고 특히 교육기관에 납품되는 컴퓨터 자판에 의무 적용 등의 조치가 필요할 것으로 생각되네. 어차피 혼란은 불가피하겠지만 이것도 결국 초기에 바로 잡지 못한 댓가겠지. 그런 면에서 거북이가 제기한 '표기법 표준화' 문제는 시의적절하다는 생각이 든다네.-- LaFolia 2003-3-17 10:14

땡쓰. 그런데 불어가 규칙성이 있소? 라틴계 언어나 우리말, 일본어처럼? -- 거북이 2003-3-17 10:17
물론 불어가 우리말이나 일본어, 이탈리아어보다는 발음이 훨씬 어렵지만, 불어는 발음규칙이 엄격하다고 볼 수 있다. 불어의 특징 중 하나가 '발음 규칙이 명확하다.'라고 할 정도니까.-- LaFolia 2003-3-17 10:47

한글기계화를 읽어보고 자네가 코멘트를 좀 주었으면 하네. 목요일에 모 보좌관 아저씨를 만나 이 글을 허운나 의원 보좌관들을 통해 가능하면 의원님이 읽게해보려는 계략이 있거든. -- 거북이 2003-3-11 23:47

쏘리로군...너무 늦었네 그려...일단 읽기가 너무 힘들었다네...내가 허운나라면 중간 정도 읽다가 그냥 두벌식 자판이 어때써...하고 말았을 지도 모르이...농담이고...암튼, 적어도 나는, 한글 로마자 표기의 절대 원칙은 한글 자모와 로마자 자모간에 가능한 최대의 1-1 대응이 되도록 설계하여, 최종적으로는 관광을 위해 놀러온 외국인들도 시스템-아틱하게 길을 찾을 수 있도록 되어야 한다고 생각하네. 건국문을 建國門이라고 써 놓으면 짱께 아해들 뿐만 아니라 쪽바리와 엽전들도 다 뜻을 알 수 있지만, 젠궈먼이라고 써놓으면 그 누구도 알 수 없다는 사실이 좋은 예가 될 것이야. 근자에 헬라어의 y를 ㅟ로 표기하는 것이 세를 불리고 있다는 것도 한글과 1-1 대응 관계를 만들어 혼자서 사전을 뒤져 볼 수 있는 최소한의 인프라를 만들어 보려는 노력의 일환이라고 할 수 있지. 글구, 어짜피 발음이라는 건 언어학을 전공하지 않은 바에야, 실제 발음을 듣고 익히는 수밖에 없다고 생각한다네. shi를 시로 읽을 지, 쉬로 읽을 지, 쒸로 읽을 지, xㅟ로 읽을 지는 약속이고, 그 약속과 1-1 대응을 이루는 기호가 1개만 존재한다면 아무런 문제도 없이 훌륭한 표기 체계가 되는 것 아닐까? 어짜피 기호와 규약은 중복성과 예외성을 최소화하기만 하면 본질적으로는 제대로 작동하기 마련 아니던감? 요는, 한국에서 몇 년을 굴러 먹은 후에야 shillim-dong과 shin-lim-dong이 같은 동네라는 걸 알게 되는 건 너무 어이없는 일이라 이거지...한글을 사용하는 대부분은 엽전들이지만, 한글을 로마화하는 이유는 엽전들의 편의를 위해서가 아니라 양이와 오랑캐들을 위함이라는 것을 잊지 않는다면 절대로 표음주의를 이야기 할 수 없지...-- SonDon 2003-3-15 17:00
표음주의를 택한 사람들도 자네처럼 양이와 오랑캐를 위해 표음주의를 택했다고 생각한다네.
그럼 자네는 했었다HaessEossDa, 섞다SeoggDa등도 재구성이 되게 써야한다고 생각하나? 았은 Ass가 되는구먼...-.- -- 거북이 2003-3-16 21:08
우리는 소릿글자/ 짱꼴라및 코쟁이들은 뜻글자. 우리는 음소가 모여야 뜻을 갖지만 그양반들은 한단어로도 의미가 있다. 우리의 시를 번역해서 들려주거나 그네들의 시를 번역해서 들얼볼때 100% 호환불가능인 이유가 바로 언어의 기본이 다르기 때문인거죠. 대표적인게 '았 (ass)' . 싸워라, 싸워라! 난 연음화로 발음표기하는것 싫어함.그리고, 미국식 발음도 않됨. 서울은 소울이 아님. -미남 총각FVI-

자판표준 관련 원칙 자체가 타당한지 누가 검증할지 궁금하군요. 이를테면 두벌식이 좋다고 하는 사람은 두벌식이 자판에서 외워야 할 글쇠 수가 작고 손가락이동 거리가 작다는 점은 내세우더군요 --세벌

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}