1 한글 기계화를 위한 제언

1.1 # 들어가며

지금 우리나라는 한국이 현재 세계적 인터넷 강국이라는 환상에 빠져있습니다. 어느 정도 경쟁력있는 나라라는 것은 분명 옳은 말이지만 그것은 기술적으로 강한 지위에 올라서서 그런 것이 아니라 인터넷에 적합한 시장을 가지고 있으며 젊은이들이 새로운 트렌드와 기술에 민첩하게 반응해주었기 때문입니다. 그래서 한국은 테스트 시장으로서는 확실히 세계적인 곳입니다.
하지만 한국은 기술장벽을 갖고 있지 못하다는 문제가 있습니다. 그나마 강력한 무기라고 한다면 CDMA에 관해 성숙하고 포화된 시장구조를 만들었다는 것과 무선인터넷 인프라가 잘 갖춰져 있다는 것 정도입니다. 소프트웨어적으로는 MS나 오라클Oracle 등에 크게 종속되어 있으며 CDMA만 해도 퀄컴Qualcomm 때문에 우리의 입김이 그리 크지 않습니다.
이러한 환경을 개선하기 위해 우리는 정보통신의 기반기술, 원천기술을 확보하려 꾸준히 노력해야 하며 또 그렇게 하고 있습니다. 이것은 대부분 외적인 문제입니다.

내적인 면으로 생각한다면 요즘 화두가 되고있는 인터넷 컨텐츠가 가장 중요해 보입니다. 인터넷 컨텐츠라고 하면 대부분의 경우 핸드폰 벨소리, 게임, 짝지어주기 등의 엔터테인먼트 산업을 말합니다. '산업'에서 진정한 인프라라고 할 수 있는 학술 데이터베이스나 기타 문화적 인프라에 대한 이야기는 거의 나오지 않습니다. 그런건 별로 돈이 안되기 때문이겠지요. 어쨌든 우리의 인터넷 문화에서 문화적 '인프라'라고 할만한 것은 거의 없습니다. 이 문제는 한글기계화와는 별개의 것이고 너무나 근본적인 문제인지라 여기서 더 이상 언급하지 않겠습니다.
인터넷 컨텐츠는 엔터테인먼트에 치우쳐있든 학술적인 정보도 다루든 관계없이 우리말로 되어있다는 공통점을 가지고 있습니다. 앞으로 인터넷 컨텐츠를 만들 때 내용과 언어를 별도로 지원하여 해외 수출에 용이하게 만드는 것도 필요하겠지만, 1차적으로 소비되는 곳은 우리나라이고, 따라서 당연히 우리말로 만들어져서 국내의 검증을 받아야 합니다. 민족과 국가를 운운하지 않더라도 우리말을 잘 사용하는 것이 매우 중요하다는 것은 다시 한번 강조해도 지나치지 않습니다.

하지만 IT에서 한글을 처리하는 것을 보면 문제가 많습니다. 다른 업종도 마찬가지겠지만 IT업계는 프로그래밍 '언어'를 다루는 곳이기 때문에 서로간의 약속(프로토콜, protocol)을 매우 중요시합니다. IT관련 업무 회의중에 가장 많은 시간을 보내는 과정이 서로의 프로토콜을 일치시키는 것입니다. 그런데 우리가 일상적으로 다루는 '기본 프로토콜'이라고 할 수 있는 한글정책이 일관되어있지 않기 때문에 항상 그 문제를 해결하기 위해 많은 프로그래머들이 고생을 합니다. 따라서 여기서는 몇 가지 관점을 통해 한글 사용이 어떻게 이루어져야 하는가에 대해 제안하고자 합니다. 이 문제는 IT업계를 바라보는 눈에서 출발했지만 금방 사회 전반에 걸친 문제의식으로 그 범위가 커졌습니다. 즉 IT쪽에서만 문제되는 것은 아니라는 뜻입니다.

-- 거북이 2003-3-8 15:16

1.2 # 한글 자판 문제 : 해묵은 것, 하지만 고쳐야 할 것

현재 키보드에 인쇄되어나오는 한글 자판은 두벌식이라고 불리는 시스템입니다. 이 두벌식은 80년대 후반, 컴퓨터가 일반인에게 퍼져나갈 무렵에 국가 행정전산망을 구축하면서 만들어진 것입니다. 이것은 인체공학적 측면을 전혀 고려하지 않고 그냥 뚝딱 만들어버린 것이라고 해도 과언이 아닙니다. 자음을 왼쪽에 모음을 오른쪽에 모아두고 ㄱ위에 ㄲ이, ㄷ위에 ㄸ이 위치하게 하는 것이 보기 좋을 것이라고 생각했던 모양입니다. 그 덕분에 도깨비불 현상(한글을 구성함에 있어 불필요한 글자가 눈에 보여 시각적 자연스러움을 해치는 현상)이나 타이핑을 하면서 팔목과 어께에 심한 무리가 가는 직업병 등이 생겨나게 되었습니다.

한글은 훌륭한 조상님들 덕에 표음문자로 만들어진 글자여서 일찌감치 타자기를 만들 수 있었고 컴퓨터에도 쉽게 적용할 수 있었습니다. 따라서 이것에 관한 연구는 꽤 오래전부터 이루어져왔으며 지금은 세벌식이라는 방식이 사람들 사이에서 많은 지지를 받고 있습니다. 그리고 이 세벌식 자판에 대해 연구가 계속 되고 새로운 대안들도 조금씩 나오고 있습니다. 세벌식은 초성, 중성, 종성을 따로 분리하고 손가락이 가기 쉬운 곳에 많이 사용되는 자모가 위치하도록 우리의 문자생활을 충분히 연구해서 만든 방식입니다.

그런데 왜 아직도 우리는 세벌식을 쓰지 않고 있을까요? 그것은 관 주도의 잘못된 드라이브 정책 때문이라고 생각합니다. 당시 정부과 대기업은 보기에 간편하다는 이유만으로 별다른 연구도 없이 두벌식을 사용하였고 그냥 그것을 계속 진행했습니다. 뜻있는 사람들이 계속 건의를 해도 "이미 쓰고 있다", "사람들을 재교육시켜야 한다" 등의 이유를 들어 공론화하지 않았습니다. 그래서 많은 사람들은 세벌식의 존재조차 알지 못합니다. 세벌식에 대해 아는 사람들 중 의지가 강한 몇몇 사람들 만이 세벌식을 사용하고 있습니다.

여기서 우리는 다른 나라의 예를 살펴볼 필요가 있습니다. 지금 우리가 사용하고 있는 영문자판은 왼쪽상단이 QWERTY 순으로 배열되어있는 쿼티Qwerty 자판입니다. 이 자판은 타자기 시절에 만들어진 것으로, 가능한한 타자수가 빨리 치기 어렵도록 고안되어 만들어졌습니다. 왜 노력을 해서 '어렵게' 만든 것일까요? 당시 타자기는 여러 개의 활자가 동시에 종이를 찍을 경우 활자들이 엉켜서 쉽게 고장이 나곤 했기 때문입니다. 하지만 지금은 컴퓨터 시대이기 때문에 그런 문제는 사라졌습니다. 따라서 미국에서는 새로운 표준을 정했는데 그것이 입력하기 좋도록 인체공학적으로 설계된 드보락Dvorak 자판입니다.
또한, 더욱 주목해야 할 것은 그들이 새로운 표준을 적용하는 방식입니다. 그들은 수십년간 사용된 쿼티 자판을 곧바로 폐기시키지 않았습니다. 단지 국가 표준으로 쿼티 자판과 드보락 자판을 함께 정했으며 새로운 사용자들에게 드보락 자판의 우수성을 소개했습니다. 컴퓨터란 교체 주기가 5년 정도밖에 되지 않는 소모품입니다. 따라서 그런 식으로 알려나가도 충분히 알릴 수 있는 것입니다. 물론 쿼티 자판을 계속 사용하고 싶은 사람들은 그것을 쓸 수 있습니다.

그런데 우리는 지금 키보드 자판과 동일한 잘못을 다시 한번 저지르려 하고있습니다. 바로 휴대폰의 키패드 표준화 문제입니다. 한동안 각 휴대폰 업체들이 한글 입력방식을 각자 만들어서 단말기를 공급해왔습니다. 그래서 단말기를 교체할 때마다 사람들은 새로운 자판을 익히느라 고생을 해야했지요. 참다 못한 소비자들이 자판 단일화 요구를 하자 몇몇 업체들이 모여서 표준화를 진행했습니다. 하지만 기득권을 가진 업체들이 다른 업체들과 함께 하려하지 않아, 얼마 전에 그 연합체는 표준화된 안을 찾지 못한 채 해산되었습니다.
이것은 공적 자산에 대한 인식 부족 때문에 벌어진 일입니다. 통신 회사들은 사업을 위해 전파를 획득하려 노력합니다. 전파 사용권은 국가의 소유이므로 국가가 관장해서 그 자원을 나누어주는 것이지요. 통신회사들이 그것을 무시하고 주파수를 자기들 마음대로 정해서 쓴다면 통신이란 이루어질 수 없습니다. 마찬가지로 한글의 사용 또한 그러합니다. 한글이라는 약속(프로토콜)을 사용하는 방식은 공적으로 정해져야 하는데 그렇지 못하고 모두들 자기들만의 규약을 정해 사용하고 있습니다. 그 결과로 사람들은 핸드폰을 바꿀때마다 자판을 새로 익혀야하는 불편에 시달립니다.
무분별한 표준화 시도는 분명 사실상 표준(de facto standard)을 무시하고 시장질서를 교란시키는 일로 끝나기 쉽습니다. 하지만 국민 생활방식에 큰 영향을 미칠 수 있는 사안이 대기업의 횡포로 무산되었다는 사실, 그리고 국민의 언어생활과 관계깊은 이런 사안을 문화부나 학계의 조언없이 업계내부의 경제논리에 의해 진행하다가 결국 포기해버린 상황을 보면서 십여 년 전의 과오에서 아무 것도 배우지 못한 듯 하여 기분이 무척 착잡합니다. -- 거북이 2003-3-8 15:16

1.3 # 한글 코드 문제 : 다 끝난 게임인가

한글 코드 문제도 한글 자판 문제와 매우 흡사합니다. 역시 행정전산망을 구축할 때 단지 코드 숫자가 적다는 이유만으로 당시의 사실상 표준은 조합형이었음에도 불구하고 완성형 한글 코드를 국가 표준으로 삼아버렸습니다. 이러한 문제는 한글이 자모를 조합하여 '음절'을 만드는, 세계에서 거의 유례가 없는 글자이기 때문에 발생했습니다.
한글은 로마자의 두 자에 해당하는 코드에 한글 한 자를 넣습니다. 그 정해진 코드에 한글을 부여하는 방식의 차이가 완성형과 조합형의 차이를 만듭니다. 완성형은 우리가 흔히 쓰는 글자들을 몇 천개 뽑아서 그것에 일련번호를 붙입니다. 반면에 조합형은 한글의 각 자소마다 일정한 코드를 부여하고 자소가 모이면 하나의 음절이 되듯 그 코드가 모여서 한 글자의 코드가 되도록 만들어내는 방식입니다. 따라서 완성형은 기계적으로 처리했지만 경제논리에 따른 표준이고, 조합형은 한글 창제 원리에 정확하게 부합하는 방식입니다.

80년대 말, 한글 카드의 용량을 생각해야 하는 환경에서는 완성형의 경제논리도 어느 정도 일리가 있었습니다. 하지만 그런 용량 문제는 이미 모두 해결되었습니다.
반면에 조합형을 쓰지 않기 때문에 발생하는 폐해는 지금도 꾸준히 나타나고 있습니다.

우리말에 대한 연구를 할 때 형태소 분석은 필수적입니다. 우리말은 음소 하나가 형태소의 일부 역할을 하는 경우가 많기 때문에 조합형으로 하지 않으면 형태소 분석 자체가 불가능합니다. 현재는 완성형을 조합형으로 변환한 다음에 형태소 분석을 하는 번거로운 방식을 사용하고 있습니다.
그리고 고어 처리에 문제가 생깁니다. 조합형에서는 지금은 사어가 되어버린 음소를 코드에 넣어주기만 하면 글자를 조합해낼 수 있지만 완성형에서는 그런 식으로 확장시키는 것이 불가능합니다. 지금은 고어 처리가 거의 되지 않고 있으며 학자들끼리 자체적으로 코드를 부여하거나 심지어 이미지로 만들어 처리하는 변칙적인 방법까지 동원하고 있습니다.
또한, 언어생활이라는 것은 항상 새로운 단어가 생기고 옛 단어는 없어지는 사회적 과정 속이서 이루어집니다. 인터넷 폭발시대를 맞아 신세대들은 새로운 글자를 만들어 쓰곤 합니다. 또 우리말은 의성 의태 표현력이 뛰어나기 때문에 일상에서는 안쓰는 어휘들이 문학에 종종 나타나기도 합니다. 그리고 세계화가 진행됨에 따라 외래어를 한글로 적는 일이 많아집니다. 그런데 이런 일상어에서는 흔히 쓰이지 않았지만 새로이 표현을 해야하는 글자들이 컴퓨터에 표시되지 않는 일이 발생한 것입니다.
결정적으로 한글 정렬이 제대로 될 수 없습니다. 지금은 변칙적으로 한글 정렬문제를 처리하고 있지만 조합형은 음소 단위로 코드가 부여되어 있기 때문에 어떤 글자가 새로 생기더라도 일관성있게 정렬할 수 있습니다.

현재 이런 문제는 UTF-8등의 유니코드가 체계화되면서 조합형과 완성형이 모두 포함되는 형태로 일단은 해결되었습니다. 기존 조합형 역시 김경석 교수님의 첫가끝 조합형으로 개선되면서 고어가 모두 표현 가능하게 되는 등 상황이 훨씬 나아졌습니다. 하지만 김경석 교수님 말씀대로 완성형 코드가 들어있기 때문에 결과적으로 ISO/IEC 10646 UCS-2 내에서 한글코드가 차지하는 비율이 25%에 가깝고, 이것은 사실 부끄러운 일입니다.
그리고 현재 국내의 웹사이트들에서 주로 사용하고 있는 EUC-KR에서는 여전히 고어와 특이한 문자들이 잘 표현되지 않고 있습니다. 어차피 바꾸지 않으면 안되는 것이라면 길게 바라보고 우리의 문자생활이 자연스럽게 이루어질 수 있고 이후의 확장성도 확보할 수 있는 UTF-8로 웹사이트들이 만들어지는 날이 오기를 기대합니다.

1.4 # 한글의 로마자 표기법 : 글자인가 소리인가

사실 한글 로마자 표기법에 관한 문제는 IT에 국한시켜 거론하는 것보다 더 큰 범위의 문제입니다. 하지만 IT환경에서 우리의 경쟁력을 강화하기 위해 반드시 지적해야 하는 문제이기도 하기 때문에 여기 간단하게나마 적어볼까 합니다.

1984년도에 개정된 한글 로마자 표기법은 지나치게 지식인 위주의 표기법이라 일반인들은 거의 사용할 수가 없었습니다. 88올림픽 때도 그것 때문에 애를 먹었다는 이야기를 들은 적이 있습니다. 대한민국 성립 이후 서너 차례의 개정을 했지만 별로 실효가 없었던 것입니다. 월드컵을 대비하여 2000년에 한번 더 개정이 되었는데 그나마 비교적 상식에 부합하는 안이 나왔기 때문에 다행스러웠지만, 결정적인 문제가 아직 남아있습니다. 어쩌면 다행스럽기 때문에 더 위험하다고도 볼 수 있습니다. 84년도 표기법이라면 언제든지 반대여론이 생겨서 제대로 바꿀 수 있었겠지만 2000년의 표기법은 많은 부분이 합리적이기 때문에 크게 틀린 한 가지를 고치기가 쉽지 않기 때문에 그러합니다.

그 문제란 바로 현행 로마자 표기법이 글자 옮겨 적기(전자법)가 아니라 소리 옮겨 적기(전사법)라는 것입니다. 새 표기법은 "국어의 발음을 옮기는 원칙을 유지하여 외국인의 편의를 도모하였다. 내국인들은 국어의 '글자'를 로마자로 옮기는 방식을 선호하지만 로마자 표기는 외국인의 존재를 전제로 하므로 외국인의 편의를 위하여 국어의 '발음'대로 적는 방식을 유지하였다."라는 구절을 세 번째 대전제로 삼고 있습니다. 학계에서도 매우 논란이 많은 문제입니다만 이 대전제는 아주 중요한 것을 잘못 판단하고 있는 것으로 보입니다.
로마자 표기법은 결코 외국인의 편의만을 위한 것이 아닙니다. 분명 가장 큰 목적은 외국인이 읽기 편하게 하기 위한 것이긴 하지만 그것을 주로 사용하는 것은 우리입니다. 한글을 로마자로 표기하는 사람들은 대부분 한국사람이지 외국인이 아니라는 것입니다. 그리고 언어는 사회성이 가장 중요합니다. 사용하는 사람들이 서로 다르게 사용하면 그것이 통하지 않기 때문입니다. 그렇다면 우리가 사용하는 데 혼란이 생겨서는 안된다는 결론이 나오게 됩니다. 위와 같은 대전제는 언어의 주체를 우리가 아닌 외국인에게 두었기 때문에 나온 발상입니다.
사실 글자 옮겨 적기는 59년 당시 문교부에서 채택한 방식이었습니다. 하지만 그것이 외국인들의 발음방식과 다르다고 하여 86아시안게임과 88올림픽을 앞두고 우리도 사용하기 어렵고 일반 외국인도 읽지 못하는 학계의 방식으로서 일반인이 쓰기에는 최악의 방식이라 할만한 맥쿤라이샤워표기법(McCune-Reischauer System)으로 돌아갔다가 다시 월드컵을 앞두고 개정이 이루어진 것입니다. 그 개정 동기부터가 지나치게 외국을 의식한, 비주체적인 것이었다고 할 수 있습니다.

물론 여기에 대한 이의는 많습니다. 그것을 모아보자면 아마도 다음의 두 가지로 좁혀볼 수 있을 것입니다.

첫째, 언어는 쓰고 읽기보다는 말하고 듣기가 우선이라는 것
둘째, 한국인이 사용하는 발음에 가깝게 외국인들이 읽게 하기 위한 것이 로마자 표기법의 가장 큰 목적인데 그것을 무시할 수 없다는 것

일단 지금은 인터넷 시대가 되어 말하고 듣기만큼 쓰고 읽기가 중요해졌습니다. 말하고 듣기에 중점을 둔다면 소리 옮겨 적기에 힘을 실을 수 있겠지만 지금은 그것만을 강조할 수 없다는 것입니다. 인터넷에서의 활용을 생각해본다면 표기의 표준화가 중요해지기 때문에 가능한 한 원 표기에 가까운 것을 사용해야 서로 어긋나지 않아서 쉽게 의사소통이 가능해집니다. 특히 정보화를 할 때 표기방식의 표준화는 필수적입니다. 이것이 첫 번째 이의에 대한 반론입니다.
외국인이 우리 것을 읽고 사용하는 데 있어서는 어떤 형태로 표기법을 만들어도 배워야 합니다. 우리말에는 서구어권의 발음에 없는 모음이 매우 많고 따라서 그들은 그 모음 읽는 법을 배워야하는 것입니다. 즉 아무리 비슷하게 그들의 발음에 맞추어 표기해도 그들은 조금이라도 배우지 않는 한 우리처럼 발음할 수 없습니다. 그리고 외국인 중에는 영어 사용자가 가장 많기는 하겠지만 영어권 사용자만 있는 것이 아니라 독일어, 프랑스어, 이탈리아어, 스페인어 등 수없이 많으며 그렇기 때문에 우리는 영문표기라고 하지 않고 로마자 표기라고 하고 있습니다. 따라서 우리는 서구어권의 제 발음을 최대한 고려하여 표준화된 방식을 만들되 일단 확정하고 나면 그들에게 읽는 법을 가르쳐야 합니다. 그리고 영어 위주의 표음주의적 표기법을 채택한다고 해도 그들은 결코 우리의 의도처럼 읽어주지 못합니다. 왜냐면 영어는 동일한 모음의 발음이 천차만별이기 때문입니다. i가 어디서는 '이'발음이 나고 어디서는 약한 '으'발음이 되며 어디서는 '아이'발음이 납니다. 이래서는 결코 우리 발음을 그들의 표기로 나타낼 수가 없습니다.
반면에 우리 말은 표음문자이므로 글자 자체를 적어도 연음화에 의해 일상적으로 사용하는 것처럼 발음이 잘 됩니다. 예를 들어 '신라'와 '설악'은 /실라/와 /서락/으로 발음됩니다. SinRa와 SeolAk이라고 적어도 n과 R이 만나 ll비슷한 발음이 되고 l은 A에 자연스럽게 붙어 /실라/와 /서락/에 가깝게 발음이 되는 것입니다. 따라서 이것은 결코 발음 체계를 무시한 것이라고 볼 수 없습니다. 실제로 우리말의 발음이 연음화나 구개음화 등의 자연스러운 발음법에 의해 만들어진 것이기 때문입니다. 이것이 두 번째에 대한 반론입니다. 글자 옮겨 적기를 지지하지 않는 학자들은 바로 이 부분, 발음과 표기의 상관관계가 상당히 높다는 사실을 너무도 간과하고 있습니다. 이 사실에 중점을 둔 좋은 예로 최영애김용옥일본어표기법은 한번 참고할 만 합니다.
그리고 하나 더 말한다면 소리 옮겨 적기에는 예외가 너무 많습니다. 예외는 그 사례가 적어야 하기 때문에 예외인 것입니다. 예외가 많으면 그 예외들을 모두 사람들에게 가르쳐주어야 하기때문에 제대로 지켜지기가 어렵습니다. 이래서는 표준이라고 말할 수 없습니다.

표준 표기법은 무엇보다 쉬워야하고 사회성을 가져야 한다는 대전제를 우리는 생각해야 합니다. 그리고 어떻게 표기해도 외국인들이 우리 발음을 금방 따라할 수 없고 그 읽는 방식을 배워야 한다면, 그리고 수많은 나라의 언어를 로마자 표기법에 모두 반영해줄 수는 없다면 한글 로마자 표기법의 주체는 우리가 되어야 합니다. 우리 스스로가 우리식의 로마자 표기법을 숙지하고 사용할 수 있을 때 우리는 외국인들에게도 쉽게 가르쳐 줄 수 있습니다.
비주체적 발상의 문제점을 우리는 숫자표기의 오류에서 배워야 합니다. 우리는 숫자의 자릿점을 지금 세 자리마다 컴마(,)로 끊고 있습니다. 이것은 서구권이 숫자를 천thousand, 백만million 식으로 세 자리마다 끊어읽기 때문에 생긴 방식입니다. 하지만 우리는 만, 억, 조 이렇게 네 자리마다 끊어 읽습니다. 따라서 컴마도 네 자리마다 한 번씩 찍어주는 것이 상식적입니다. 우리는 그 의도도 제대로 이해하지 않고 숫자 표기방식을 사용하고 있기 때문에 온 국민이 숫자 읽을 때마다 첫자리부터 일십백천만...하고 힘들게 세어서 읽는 것입니다.

쉽지 않고 표준이 지켜지지 않아 발생하는 문제점 중에서 IT와 관련된 것을 들자면 바로 검색의 문제라고 할 수 있습니다. 외국인이 거북선에 관한 자료를 찾으려고 해도 그게 Kobukson인지 GeoBukSeon인지, Kubooksun인지 알 수 없기 때문에 제대로 된 검색을 할 수 없습니다. 이것은 무척 심각한 문제로 이미 해외의 한국학계는 이런 문제 때문에 한국을 공부하는 데 큰 어려움을 겪고 있습니다. 그들은 한국이 표준적으로 해결하지 못하기 때문에 아직도 매쿤-라이샤워 방식을 고수하고 있습니다. 인터넷 시대에 들어와서 검색의 중요성은 이전과는 비교할 수 없을만큼 커졌는데 이 문제는 여전히 존재하고 있습니다.
이 문제는 일본어처럼 워낙 표기방식이 다양한 언어에서는 피할 수 없는 혼란입니다. 다음의 '(장사가) 잘 되다', '성황이다'를 나타내는 동사 '모리아가루' 하나를 표현하는 방식이 6가지(もりあがる、盛りあがる、盛り上がる、盛上がる、盛り上る、盛上る)나 되니까요. 그래도 로마자로 표기할 때는 moriagaru라고 적기만 하면 됩니다. 그런데 우리는 '거북선'이라는 하나의 표기를 저렇게 사람들마다 다르게 쓰고 있으니 이것은 정말 최악의 언어생활이라고 밖에 할 수가 없습니다.

이와 같이 소리 옮겨 적기의 한글 로마자 표기법을 고수하는 것은 많은 문제를 안고 있습니다. 이것은 비단 IT뿐 아니라 학계의 중요한 문제이기 때문에 더욱 고민이 필요한 문제이지만 IT에 있어서도 이런 심각한 문제가 걸려있다는 사실을 분명하게 알아주셨으면 합니다. 그리고 중요한 것은 그 표기방식의 사용 주체가 외국인이 아니라 바로 우리라고 하는 사실, 그것이 핵심입니다.
여기서 우리는 중국을 한번 바라볼 필요가 있습니다. 서구인들은 중국어를 로마자로 표기할 때 웨이드식(Teng Hsiao-'ping, Mao Tse-tung)으로 표현하였습니다. 하지만 중국 정부는 중국인들의 방식인 '핑인'(Deng Xiaoping, Mao Zhedong)을 만들어 그것을 철저히 고수하였고 지금은 대부분의 서양인들이 핑인에 따라 중국어를 로마자로 표현합니다. 우리말의 주인은 우리라는 것을 다시한번 말해주는 사례라고 할 수 있겠습니다. -- 거북이 2003-3-10 1:54

1.5 # 외국어의 표준 한글표기 : 사전을 만들어라!

한글 로마자 표기법과 동일한 상황에 처해있어, 동전의 이면에 해당하는 상황이 바로 외국어의 표준 한글 표기가 엉망이라는 사실입니다.

우리는 외국어로 된 책을 번역할 때 거의 번역가 자신의 재량에 따라 발음을 우리말로 표기합니다. 우리 발음을 외국인의 표기방식으로는 결코 정확하게 표현해줄 수 없듯 그들의 발음 역시 우리의 표기로 정확하게 할 수 없습니다. 따라서 번역가들은 자신의 언어감성에 맞는 표기법으로 외국어를 표현해왔으며 그래서 동일한 이름을 서로 다르게 표기하는 일이 흔했습니다.
외래어의 표기는 그동안 나름대로의 지침이 있었습니다만 외국어를 표기하는 것에는 그런 문제의식 자체가 거의 없었습니다. 하지만 학문을 하다보면 외국어를 우리 글로 표현하는 일은 수없이 발생하는 것이며 따라서 우리는 언어의 사회성과 용이성이라는 두 가지 원칙을 지켜야 하기 때문에 쉽고 일관성있는 외국어의 한글표기 체계를 만들어야 하는 것입니다.

여기에는 두 가지 상황이 존재합니다. 하나는 규칙을 만들 수 있는 언어들입니다. 독일어, 스웨덴어를 비롯한 북부 유럽의 언어, 이탈리아, 프랑스, 에스파냐와 중남미가 쓰는 라틴계 언어 그리고 가까운 일본어같은 경우는 표기와 발음에 규칙성이 있어 일관적인 방안을 만들 수 있습니다. 이 경우는 학계가 표준적인 방식을 만들어서 공표하면 됩니다.
또 하나의 경우는 영어처럼 발음에 규칙성이 적은 언어들입니다. 이 경우는 일반적인 표기법을 만들기 어렵습니다. 그렇기때문에 많은 사람들은 자기 편한 방식으로 그 언어들을 표기하곤 합니다. 특히 영어는 세계어가 되었기 때문에 국내에도 영어 잘하는 사람들이 많으며 그들은 모두 자기 마음대로 쓰고 있으므로 가장 폐해가 심각한 경우라고 할 수 있습니다.

이 문제를 총체적으로 해결하는 가장 좋은 방법은 바로 각 언어 사전에 표준 표기를 넣고 새로운 어휘가 나타날 때마다 그것에 관한 새로운 표기를 확정한 다음 인터넷에서 공식적인 경로로 공표하는 것입니다.
일단 현재 우리가 사용하고 있는 모든 외국어와 외래어의 표준 표기를 각 언어학계에서 정리해야 합니다. 그중에는 우리가 고칠 수 있는 것도 있고 고칠 수 없는 것도 있습니다. 이미 사회적으로 많이 쓰이고 있는 단어들은 그 표기가 비록 원어와 거리가 있더라도 쓸 수 밖에 없습니다. 그것이 언어의 사회성이지요. 하지만 그 와중에서도 분명 고칠 수 있는 단어들이 많을 것입니다. 그것들을 일단 일원화하여 각 언어 사전에 분명하게 한글로 표기해둡니다. 물론 그 옆에는 국제 음성기호로 된 발음기호를 병기합니다. 우리말 표기는 그대로 발음하라고 하는 것이 아니라 우리글에서 문자로 사용할 때 그 표기를 쓰라는 권고 표준안입니다.
그리고 새로운 외국어 혹은 외래어가 나타날 경우 그 단어를 사용하는 업계에서 먼저 시안을 제시합니다. 그러면 해당 언어학계가 그것을 받아서 언어학적으로 문제가 없는지 검토한 다음 확정하여 인터넷에 공표합니다. 인터넷에는 각 언어들의 표준 단어 사전이 있어 새로운 단어들을 빨리 반영합니다.

이런 식으로 우리가 일관되게 사용하지 않으면 우리는 계속 답답한 문제에 부딪힐 수 밖에 없습니다. 미셸 푸코(Michel Foucault, 1926-1984)를 마이클 파우쿨트라고 읽는 것과 같은 웃지 못할 일이 수없이 생깁니다. 저건 영미권쪽에서나 벌어질만한 상황이지만 '미셸'인지 '미쉘'인지는 우리가 항상 접하는 문제이지요.
그것 뿐 아니라 한글 로마자 표기법에서 나타난 문제와 같이, 이것이 표준화되지 않으면 정확한 검색을 할 수 없다는 문제를 안고있습니다. 이 경우는 우리에게 직접적으로 피해를 준다는 점에서 한글 로마자 표기법의 혼선보다 치명적일 수 있습니다. 그리고 이러한 문제는 대부분 우리가 너무나 많이 사용하는 영어에서 발생하기 때문에 그 피해가 더욱 심각합니다.

불행중 다행이라면 우리는 로마자를 쓰지 않기 때문에 오히려 이런 문제를 깔끔하게 해결할 수 있다는 점입니다. 일반 미국인들에게 Michel Foucault를 적어주고 미셸 푸코라고 읽어야 한다는 것을 아무리 가르쳐줘도 전달할 수가 없습니다. 그것은 한글로 '밤비'라고 적어놓고 읽을 때는 '바보'로 읽어야 한다고 말하는 것과 똑같기 때문입니다. 하지만 우리는 외래어도 우리식으로 표기만 잘 해두면 얼마든지 원어에 가깝게 읽을 수 있습니다. 그것은 모음이 다양한 우리말 특유의 장점이기도 합니다. -- 거북이 2003-3-10 16:05

1.6 # 통일 시대를 준비한다 : 기회는 단 한번

이상에서 네 가지 측면을 가지고 IT환경에서의 한글 정책이 나아가야 할 길에 대해 논의해보았습니다. 우리의 언어생활 전반에 영향을 끼치는 그러한 문제이기도 하지만 정보화 환경에서 더욱 문제의 심각성을 드러내는 사안입니다.

정보화라는 것은 그 자체만으로도 의미가 있는 것이지만 반도체 이후 우리나라의 새로운 동력으로서 인터넷은 분명 그 역할을 다 하고 있는 상황이라는 점에서 우리에게는 더욱 의미가 있습니다.
그리고 인터넷은 산업 뿐 아니라 사회 전반에 영향을 끼칩니다. 그중 가장 근본적인 영향을 끼치는 것으로 저는 학문 수준의 심화를 들고 싶습니다. 사실 우리나라의 학문(요즘에 학문이라고 하면 거의 서구에서 넘어온 것들이지요)이 세계 학계에 기여한 바는 그리 크지 않습니다. 그것은 기초연구라고 말할수 있는 학문의 인프라가 부족했기 때문입니다. 인터넷 산업이 발달된다고 그 기초가 금방 다져지지는 않습니다. 하지만 우리의 학문적 성과를 집적하여 데이터베이스화하면 그 기초를 조금 더 빨리 다질 수 있습니다. 선진국과의 격차를 일거에 좁힐 수 있는 디딤돌이 될 수 있는 것입니다. 그렇기 때문에 우리말의 정보화는 중요합니다.
그리고 이런 결과를 내기 위해 우리가 해야하는 첫걸음은 바로 그 언어 사용 방식의 통일입니다. 이것이 되지 않으면 계속 학문 발전의 장애가 됩니다. 그 해악이란 이루 말할 수 없는 것입니다.

언어를 전공하지도 않은 제가 왜 이런 일에 관심을 가지게 되었을까요. 저는 음악을 좋아하고 개인적 취미로 음악에 관한 글을 쓰곤 했습니다. 그러다가 가요를 영어로 간단히 소개하는 작업을 시작했구요. 그런데 가수들이 자신들의 영문이름을 제각각 사용하는 것이었습니다. 이래서는 우리를 제대로 전달할 수 없었습니다. 그래서 어떤 것이 표준적인 방식인가를 찾기 시작했고 이러한 결론까지 도달해야 했던 것입니다.

이상의 문제는 지금 당장 해소할 수 없습니다. 그동안 그러한 것을 고쳐보고자 했던 시도와 노력이 수없이 많이 있었지만 번번이 좌절되었습니다. 잘못을 알면서도 고치지 못하고 있다는 면에서 우리가 일제 잔재를 청산하지 못했던 모습을 연상하게 되어 비애감마저 듭니다.
한꺼번에 많은 것을 고치려고 하면 탈이 나게 마련입니다. 따라서 문제점을 먼저 인식하는 것이 필요하고, 그것을 고치는 것은 단계적으로 서서히 해야할 것입니다. 그런데 그것을 제대로 고칠 수 있는 순간이 이제 멀지 않은 것 같습니다. 그것은 바로 통일입니다.
통일이 되면 우리는 그들과 모든 방식, 언어, 프로토콜을 맞추어 나가야 합니다. 그것은 상호 배려가 전제된 상태에서 논리적으로 전개해야 하는 것이며 그것을 위해 우리는 차근차근 무엇이 옳은가를 편견없이 준비해야 하는 것입니다. 우리가 비합리적인 두벌식 자판과 말도 안되는 외래어 표기법을 가지고 그들에게 맞추라고 말할 수 없습니다. 그들을 설득하기 전에 우리조차 설득하지 못하는데 어떻게 그렇게 하겠습니까. 우리 자신에게 부끄럽지 않기 위해 우리는 준비해야 하는 것입니다. 그리고 한걸음 더 나아간다면 재일, 재미, 재러(고려인), 재중(조선족) 한국인들의 언어생활에도 관심을 기울이면서 그들의 언어생활에 주의를 기울일 수도 있겠지요.
느리지만 꾸준히, 그렇게 나아가는 우리의 모습을 보고싶습니다. -- 거북이 2003-3-10 23:31

1.7 # 참고

1.8 # 촌평

언어분류