전자사전에서 가능해진 발전들

(전자사전에서가능해진발전들에서 넘어옴)

1 # 요약[ | ]

  • 책 제목 : A Practical Guide to Lexicography(2003)
  • 논문 제목 : Developments in electronic dictionary design
  • 저자 : Lineke Oppentocht & Rick Schutz

이 책은 네덜란드 사람들이 사전 편찬 실무에 관계된 논문들을 모아서 낸 논문집입니다. 그중 '전자사전 설계에서의 성취'라는 소논문은 별것 아닌 내용이지만 보수적인 학계에서는 하기 힘든(아니면 하지 않는) 얘기를 하고있어서 볼만하네요. 간단하게 요약해보려고 합니다.

  • 일단 사전이 전자화되려면 컴퓨터가 읽을 수 있게 설계되어야 한다. 즉 DB로 되어있던, XML등으로 되어있던지 태깅이 되어있어야 컴퓨터가 처리할 수 있다.
  • 더 이상 축약은 필요없다.
종이사전은 한정된 지면에 많은 내용을 담기위해 무엇을 더 넣을것이며 어떻게 넣을 것인가에 대한 고민이 필요했다.
컴퓨터로 처리하면 용량이라는 한계도 없고 작은 지면에서 모든 것을 보여주려하지 않아도 된다.

예전에는 아래와같이 표현해야 했지만

  • hunting n. [U] 수렵, 사냥
  • job[apartment] ~ 일자리[아파트] 구하기
  • Good ~! 《영구어》 행운을 빈다!

지금은 아래와같이 표현해도 전혀 문제가 없다.

  • hunting [명사] [불가산 명사]
  • 수렵, 사냥, 총렵, 탐구
  • job hunting 일자리 구하기
  • apartment hunting 아파트 구하기
  • Good hunting! 행운을 빈다![영국식 구어, 특히 스코틀랜드]

표제어를 다양한 어형으로 표현해도 된다.

color, -our로 표현할 필요 없이 color와 colour를 모두 표제어에 넣을 수 있다.
이것은 검색을 위해서도 합리적인 구조이다.

참조가 불필요해진다.

종이사전들에서는 물리적인 이유때문에 => 등으로 표현하여 중복된 내용을 최소화했다.

이것은 사용자들에게 여러번 사전을 뒤지게 하는 불편함을 주었다.

전자사전에서는 겹치는 내용이라고 => 으로 표현하기 보다는 그냥 다 적어주면 된다. 딱히 비교해서 보게 하기 위해서 => 등을 쓸 수는 있을것이다.

아울러 주요한 본문에 링크를 달아서 자연스러운 하이퍼텍스트를 구현할 수 있다.

  • 반복적이고 지겨운 일을 최소화 할 수 있다.
좋다라는 뜻을 가진 영어단어를 모두 찾기 위해 사전 전체를 뒤질 수는 없다.
하지만 전자사전을 이용하면 다음과 같은 단어 목록을 금방 찾아낼 수 있다. admirable, admirableness, admirably, agree, amen, answer, answerless, hunting
물론 이러한 작업을 섬세하게 하기 위해서는 단어들을 설명하는데 사용하는 어휘를 통제하여 활용한다거나 하는 기초적인 작업이 필요하지만 여기서는 그것이 되어있는 상황이라고 가정한다.
  • 복합어로 된 표제어들에 대한 재인식이 가능하다.
very good이라는 어구는 very에서 찾을 것인가 good에서 찾을것인가 아니면 very good이라는 항목을 따로 만들 것인가.
사전편찬자의 의도에 따라 여러가지로 활용이 가능하겠지만 전자화가 되었으므로 저기서 예를 든 세가지 방법 모두를 선택해도 된다.
  • 많은 표제어를 담을 수 있다.
용량의 한계가 거의 없으므로 당연한 얘기다.

각각의 항목이 가진 속성을 최대한 잘라서 표현하는 것이 가능하다.

어떤 내용을 뺄 것인가에 대해 고민할 필요가 없으며 어떤 내용이 독자에게 유용하고 덜 유용한가에 대해 고민하면 된다.

  • 아래는 사전 뿐 아니라 사전을 만들기 위한 전처리작업에 관한 내용이다.
  • 특수한 사전을 만드는데 도움이 된다.
cough, through, dough 등 유사한 철자를 가진 어휘의 목록을 뽑을 수 있다.
역순사전이나 각운사전 등 목적에 따른 특수한 사전을 만들거나 직접 그 목록들을 추출하는 것이 가능하다.
  • 요소별 분석이 가능하다.(명칭론적 접근, onomasiological approach)
이탈리아어근을 가진 면류 어휘를 뽑아라라거나
말을 개별 요소로 포함하고 있는 집합(동물, 탈것, 성적상징...)을 뽑아라라는 것이 가능하다.
  • 대규모 말뭉치를 다룰 수 있다.
  • 사전과 사전과의 관계를 유기적으로 엮을 수 있다.

어학사전, 시소러스, 백과사전 등 여러가지로 분리된 사전들을 엔트리명을 기준으로 서로의 관계를 묶어줄 수 있다.

사실 온라인 업계에서 일하는 사람들에게는 당연한 일들을 적어둔 것이지만 사전쪽에서는 꽤 혁신적인 일일 수 있는 내용을 담고있습니다. 사전편찬자에게 필요한 기본 소양중 하나로 '보수적 태도'를 들 정도로 사전은 관습을 중시하는 분야이기 때문에 더욱 그렇습니다. 게다가 사전은 돈이 안된다라는 사실이 널리 알려진 지금 사전쪽에서 일하고 싶어하는 사람들이 너무 적어진 터라 사전업계는 노후화가 상당히 심화되어있다고 합니다.

이 논문이 말하고자 하는 것은 사전의 미디어가 바뀜에 따라 그 내용도 함께 바뀌어야 한다는 점입니다. 지금까지 사전은 물리적 한계때문에 많은 내용을 빼고 압축하는 편집을 했어야 했는데, 이제는 사람들에게 효율적으로 내용을 전달하기 위해서 편집을 신경써야 한다는 방향으로 완전히 패러다임이 바뀌었으니까요. 또 전자사전을 잘 만드는 것도 중요하지만 사전 편찬단계에서 전자화를 고려하지 않으면 안된다는 얘기이기도 합니다. -- 거북이 2005-4-12 11:49 am

2 같이 보기[ | ]

문서 댓글 ({{ doc_comments.length }})
{{ comment.name }} {{ comment.created | snstime }}