KTUG 한국 텍 사용자 그룹

Menu

KTUG :: 마당자유글 › 국어의 로마자 표기법, 전자법

nanim | 2015.06.16 00:37:26 | 메뉴 건너뛰기 쓰기

별로 관심들은 없으신 것 같지만, 이왕 시작한 얘기니 끝을 보도록 하겠습니다.


http://www.ktug.org/xe/index.php?document_srl=207243&mid=KTUG_open_board 에 "문제"가 나와 있습니다.

지난 번 글에서 우리는 한글 음절 문자의 초/중/종성 분리를 할 수 있게 되었습니다. ( http://www.ktug.org/xe/index.php?document_srl=208182&mid=KTUG_open_board )


======


국 어의 로마자 표기법 제3장 제8항에 나와 있는 규정은, 표기법의 복원을 염두에 둔, 학술적 목적의 로마자 표기법입니다. 이를 "전자법"이라고 한다고 가르쳐주셨습니다. 이것은 한글 자소를 기계적으로 로마자에 대응시키는 것이므로 복잡한 음운현상을 고려하지 않아도 되어서 구현이 쉬운 편에 속합니다.


초/중/종성 각각의 대응 로마자 표기를 clist에 넣는데, 이것은 상수로 취급할 예정입니다. 즉 이 내용이 바뀔 일은 없습니다.


\clist_const:Nn \c_cho_clist
    {g,kk,n,d,tt,l,m,b,pp,s,ss,-,j,jj,ch,k,t,p,h}
\clist_const:Nn \c_jung_clist
    {a,ae,ya,yae,eo,e,yeo,ye,o,wa,wae,oe,yo,u,wo,we,wi,yu,eu,ui,i}
\clist_const:Nn \c_jong_clist
    {0,g,kk,gs,n,nj,nh,d,l,lg,lm,lb,ls,lt,lp,lh,m,b,bs,s,ss,ng,j,ch,k,t,p,h}


종성의 첫 글자는 "없는" 것이므로 '0'으로 넣어두긴 했지만 실제로 사용하지는 않을 것입니다.


지난번 작성한 \SylToLvt를 \split_hangul:n이라는 이름의 함수로 이름만 바꾸고,

한 글자를 전자하는 함수는 다음과 같습니다.


\cs_new:Npn \to_RR_a_char:n #1
{
%%% 초/중/종 코드를 얻습니다.
    \split_hangul:n #1
%%% 초성의 로마자 표현을 \c_cho_clist에서 얻어내어 \g_output_tl에 넣음
    \tl_gput_right:Nx \g_output_tl {
        \clist_item:Nn \c_cho_clist { \g_cho_int + 1 }
    }
%%% 중성의 로마자 표현을 \c_jung_clist에서 얻어냄.
    \tl_gput_right:Nx \g_output_tl {
        \clist_item:Nn \c_jung_clist { \g_jung_int + 1 }
    }
%%% 종성의 로마자 표현을 \c_jong_clist에서 얻어냄. 종성이 없으면 생략.
    \int_compare:nTF { \g_jong_int = 0 }
    { }
    {
        \tl_gput_right:Nx \g_output_tl {
            \clist_item:Nn \c_jong_clist { \g_jong_int + 1 }
        }
    }
}


=======


이제 단어를 처리할 차례입니다. 아이디어만 소개하면,

  • 인자로 한글 문자열이 들어옵니다.
  • 이 문자열을 토큰리스트(tl)에 넣습니다.
  • tl의 각 아이템에 대하여 반복 작업을 실행하는 mapping함수 \tl_map_inline:Nn을 불러서 출력 문자열을 만듭니다.
  • 완성된 출력 문자열의 첫 문자가 -이면 표기하지 않는다는 규정을 위해 이것을 검사하여 제거하고 출력합니다.

다른 방식의 해법도 얼마든지 있을 것입니다.


아무튼, 이리하여 입력된 문자열의 로마자 전자법 표기가 가능하게 되었습니다.

첨부파일을 참고하십시오. RR38.tex


=====


이제 한 번 더 남았습니다. 다음 번에 할 것은 실제로 "국어의 로마자 표기법" 자체를 구현해보는 것입니다.


첨부 [1]

댓글 [12]

댓글 쓰기

목록 삭제

KTUG 한국 텍 사용자 그룹