KTUG마당은 KTUG를 방문하는 모든 이용자가 대화를 나누고 소식을 전하는 곳입니다.

  • 로그인 없이 자유롭게 글을 읽고 쓸 수 있는 철학은 처음과 같이 계속됩니다.
  • Team Blog의 글을 이곳 게시판의 "정보글"로 모았습니다. Team blog는 기고자가 올린 글에 질문을 받는 부담을 줄이기 위하여 댓글을 허용하지 않았습니다. 그러나 이곳 게시판으로 모으면서 댓글을 달 수 있습니다. 게시물을 작성하실 때 댓글을 원하지 않으시면 댓글을 허용하시지 않으시기를 바랍니다. 또한 불필요한 소모성 댓글을 달지 않도록 주의하여 주시기를 바랍니다.
  • TeX과 관련된 질문이나 답변은 QnA 마당을 이용하십시오. TeX과 관련된 질문은 지웁니다
  • MathJax를 이용한 수식조판을 사용하실 수 있습니다. 여기를 참조하세요.
  • 스팸 글을 막기 위하여 짧은 시간 내에 다시 글이 등록되는 IP를 막거나, 광고 글을 막기 위하여 금지어로 .com, .net 등을 설정하고 있습니다. 다소간의 불편함이 있으시더라도 양해 바랍니다.
    • 금지어에서 stackexchange, stackoverflow, ctan, overleaf, , github, google.com, gmail.com, .org, .io, sil.org, wiki.com, tistory.com등은 해제하였습니다.
  • 사용하는 편집기는 CKeditor입니다. 편집기에서 [enter]를 누르면 <p> 태그가 들어가고, 문단으로 생각하고 한줄을 비웁니다. 글줄만 바꾸려면 shift-enter 를 누르시면 <BR>가 들어가므로 용도에 맞게 나누어 쓸 수 있습니다.

자유글 국어의 로마자 표기법, 전자법

2015.06.16 00:37

nanim 조회 수:78869 추천:1

별로 관심들은 없으신 것 같지만, 이왕 시작한 얘기니 끝을 보도록 하겠습니다.


http://www.ktug.org/xe/index.php?document_srl=207243&mid=KTUG_open_board 에 "문제"가 나와 있습니다.

지난 번 글에서 우리는 한글 음절 문자의 초/중/종성 분리를 할 수 있게 되었습니다. ( http://www.ktug.org/xe/index.php?document_srl=208182&mid=KTUG_open_board )


======


국 어의 로마자 표기법 제3장 제8항에 나와 있는 규정은, 표기법의 복원을 염두에 둔, 학술적 목적의 로마자 표기법입니다. 이를 "전자법"이라고 한다고 가르쳐주셨습니다. 이것은 한글 자소를 기계적으로 로마자에 대응시키는 것이므로 복잡한 음운현상을 고려하지 않아도 되어서 구현이 쉬운 편에 속합니다.


초/중/종성 각각의 대응 로마자 표기를 clist에 넣는데, 이것은 상수로 취급할 예정입니다. 즉 이 내용이 바뀔 일은 없습니다.


\clist_const:Nn \c_cho_clist
    {g,kk,n,d,tt,l,m,b,pp,s,ss,-,j,jj,ch,k,t,p,h}
\clist_const:Nn \c_jung_clist
    {a,ae,ya,yae,eo,e,yeo,ye,o,wa,wae,oe,yo,u,wo,we,wi,yu,eu,ui,i}
\clist_const:Nn \c_jong_clist
    {0,g,kk,gs,n,nj,nh,d,l,lg,lm,lb,ls,lt,lp,lh,m,b,bs,s,ss,ng,j,ch,k,t,p,h}


종성의 첫 글자는 "없는" 것이므로 '0'으로 넣어두긴 했지만 실제로 사용하지는 않을 것입니다.


지난번 작성한 \SylToLvt를 \split_hangul:n이라는 이름의 함수로 이름만 바꾸고,

한 글자를 전자하는 함수는 다음과 같습니다.


\cs_new:Npn \to_RR_a_char:n #1
{
%%% 초/중/종 코드를 얻습니다.
    \split_hangul:n #1
%%% 초성의 로마자 표현을 \c_cho_clist에서 얻어내어 \g_output_tl에 넣음
    \tl_gput_right:Nx \g_output_tl {
        \clist_item:Nn \c_cho_clist { \g_cho_int + 1 }
    }
%%% 중성의 로마자 표현을 \c_jung_clist에서 얻어냄.
    \tl_gput_right:Nx \g_output_tl {
        \clist_item:Nn \c_jung_clist { \g_jung_int + 1 }
    }
%%% 종성의 로마자 표현을 \c_jong_clist에서 얻어냄. 종성이 없으면 생략.
    \int_compare:nTF { \g_jong_int = 0 }
    { }
    {
        \tl_gput_right:Nx \g_output_tl {
            \clist_item:Nn \c_jong_clist { \g_jong_int + 1 }
        }
    }
}


=======


이제 단어를 처리할 차례입니다. 아이디어만 소개하면,

  • 인자로 한글 문자열이 들어옵니다.
  • 이 문자열을 토큰리스트(tl)에 넣습니다.
  • tl의 각 아이템에 대하여 반복 작업을 실행하는 mapping함수 \tl_map_inline:Nn을 불러서 출력 문자열을 만듭니다.
  • 완성된 출력 문자열의 첫 문자가 -이면 표기하지 않는다는 규정을 위해 이것을 검사하여 제거하고 출력합니다.

다른 방식의 해법도 얼마든지 있을 것입니다.


아무튼, 이리하여 입력된 문자열의 로마자 전자법 표기가 가능하게 되었습니다.

첨부파일을 참고하십시오. RR38.tex


=====


이제 한 번 더 남았습니다. 다음 번에 할 것은 실제로 "국어의 로마자 표기법" 자체를 구현해보는 것입니다.


번호 제목 글쓴이 날짜 조회 수
1124 [알림] 홈페이지 리뉴얼과 게시판 변경에 관하여 [4] 관리자 2010.12.23 322179
1123 제주 전용서체 [5] file Progress 2010.06.15 218013
1122 원숫자 file yihoze 2014.01.02 216052
1121 [공지] ko.TeX Live 2010 발표 [11] 관리자 2010.11.07 189406
1120 ko.TeX Live 2013 배포 [6] file 관리자 2013.10.12 175068
1119 한글텍사용자그룹/한국텍학회 웹 사이트 및 서비스 복구에 관한 말씀 관리자 2013.05.06 160062
1118 TeX Live 2016 pretest 설치 안내 [11] 관리자 2016.06.05 150662
1117 [공지] ko.TeX Live 2009 발표 [9] MadToad 2009.12.23 150472
1116 TeX의 수명이 긴 이유 그리고 널리 쓰이지 않는 이유 [45] 메타 2010.06.02 147964
1115 [공지] ko.TeX Live 2011 발표 [9] 관리자 2011.07.29 144675
1114 MathJax를 이용하여 웹에서 수식을 써 봅시다 [27] file 샘처럼 2010.12.29 142573
1113 [공지] お知らせ: TeXユーザの集い 2010 開催予定 (10/23土@東大生研) [1] ChoF 2010.02.01 137861
1112 An Earthshaking Announcement [6] 작은나무 2010.07.12 131469
1111 기존 회원이 아닌데 회비를 납부하신 분 [1] yihoze 2019.12.13 128786
1110 prologue vs preamble vs preface vs foreword 는 무슨 차이인가요? [4] 에드 2011.02.23 128551
1109 TeX Live 2010을 대비한 ko.TeX 프리테스트 [14] DohyunKim 2010.07.14 127986
1108 TeX Live 2013과 ko.TeX 설치 관련 안내 [11] 관리자 2013.09.01 126173
1107 [공지] 한국텍학회 회비를 입금한 분들 중 회원 미등록자 분들께 [7] 관리자 2011.10.20 123303
1106 (ko.) TeX Live 2014 설치를 권장합니다. [37] nanim 2014.07.14 121996
1105 한글 url 문제 [3] file noname 2020.03.08 121921



XE Login