KTUG 한국 텍 사용자 그룹

Menu

KTUG :: 마당

사실 로마자 표기법을 완전하게 구현하려면 "사전"을 이용하지 않을 수 없습니다. 말씀하신 그 규정의 경우 고유명사라면 뭐 그런 요구가 있어도 무방하다고 생각합니다만 예컨대 "국화" 같은 단어를 체언이라는 이유로 이 규정을 적용하여 gukhwa라고 하는 건 말씀하신 대로 무의미하다고 생각합니다. (그래도 이게 규정에 따르는 표기입니다.)

그거 말고도 문제가 되는 것이 소리가 덧나는 경우들입니다. 예컨대 expl3 로마자 표기 패키지를 수정하면서 예외 항목 등록 파일(사전)을 이용하도록 해보았는데 간단한 예제 문서를 작성하는 데 다음 단어들을 등록하여야 했습니다.

학여울, 신문로, 묵호, 집현전, 국화, 반구대, 나뭇잎, 알약, 솜이불, 막일, 꽃잎, 내복약, 색연필, 담요, 영업용, 불여우, 수원역, 서울역, 금융, 검열, 깻잎, ...

심지어 로마자 표기법 규정만으로는 그 표기를 확정할 수 없는 경우조차 있습니다. 대표적인 예가 "초점"과 "개수" 같은 한자어의 사이에 사잇소리가 덧나는 경우인데요, 표기만을 존중하여 chojeom, gaesu라고 쓰면 "표준 발음법에 의한다"는 대원칙을 위반하게 됩니다. 이것을 표준국어대사전의 발음 표기대로 "chojjeom", "gaessu"라고 하는 것과 사이시옷이 숨어 있다고 보아서 "chotjeom", "gaetsu"라고 쓰는 것, 이 셋 중에 어느 것을 써야할지 확정되지 않습니다.

다양한 예외상황을 우회할 수 있는 방법을 마련하지 않을 수 없습니다. 그게 아니라면 표준국어대사전 API를 이용하여 표준발음을 얻어온 다음 변환하는 걸 생각해봐야 할 것입니다. (그런데... 그러자면 사전 검색을 할 수 있는 형태로 단어의 형태소 분석을 하여야 하는데...)

KTUG 한국 텍 사용자 그룹