KTUG마당은 KTUG를 방문하는 모든 이용자가 대화를 나누고 소식을 전하는 곳입니다.

  • 로그인 없이 자유롭게 글을 읽고 쓸 수 있는 철학은 처음과 같이 계속됩니다.
  • Team Blog의 글을 이곳 게시판의 "정보글"로 모았습니다. Team blog는 기고자가 올린 글에 질문을 받는 부담을 줄이기 위하여 댓글을 허용하지 않았습니다. 그러나 이곳 게시판으로 모으면서 댓글을 달 수 있습니다. 게시물을 작성하실 때 댓글을 원하지 않으시면 댓글을 허용하시지 않으시기를 바랍니다. 또한 불필요한 소모성 댓글을 달지 않도록 주의하여 주시기를 바랍니다.
  • TeX과 관련된 질문이나 답변은 QnA 마당을 이용하십시오. TeX과 관련된 질문은 지웁니다
  • MathJax를 이용한 수식조판을 사용하실 수 있습니다. 여기를 참조하세요.
  • 스팸 글을 막기 위하여 짧은 시간 내에 다시 글이 등록되는 IP를 막거나, 광고 글을 막기 위하여 금지어로 .com, .net 등을 설정하고 있습니다. 다소간의 불편함이 있으시더라도 양해 바랍니다.
    • 금지어에서 stackexchange, stackoverflow, ctan, overleaf, , github, google.com, gmail.com, .org, .io, sil.org, wiki.com, tistory.com등은 해제하였습니다.
  • 사용하는 편집기는 CKeditor입니다. 편집기에서 [enter]를 누르면 <p> 태그가 들어가고, 문단으로 생각하고 한줄을 비웁니다. 글줄만 바꾸려면 shift-enter 를 누르시면 <BR>가 들어가므로 용도에 맞게 나누어 쓸 수 있습니다.

자유글 xetexko의 한자음

2021.09.25 10:33

noname 조회 수:861

아시는 대로, xetexko는 자체 한자음 데이터를 가지고 있습니다. 

예컨대 羅자를 xetexko가 어떻게 읽고 있을까요? 다음 코드로 간단히 확인해볼 수 있습니다.

\ExplSyntaxOn

\int_new:N \l_code_int

\NewDocumentCommand \readingHanja { m }
{
	\str_set_convert:Nnnn \l_tmpa_clist { #1 } {} { clist }
	\clist_map_inline:Nn \l_tmpa_clist
	{
		\int_set:Nn \l_code_int { \int_eval:n { ##1 } }
		\fbox{\ttfamily \int_to_Hex:n { \l_code_int } }

		\int_set:Nn \l_tmpb_int { \l_code_int - 19968 + 1 }

		\get_read_from_file:nn { \l_tmpb_int } { hanja_hangul.tab }

		\exp_args:No \symbol{ \int_use:N \l_code_int }
		\exp_args:No \symbol{\g_tmpa_tl}
	}
}

\cs_new:Npn \get_read_from_file:nn #1 #2
{
	\int_zero:N \l_tmpa_int
	\ior_open:Nn \g_tmpa_ior { #2 }
	\ior_map_inline:Nn \g_tmpa_ior
	{
		\int_incr:N \l_tmpa_int
		\int_compare:nT { \l_tmpa_int == #1 }
		{
			\tl_gset:Nn \g_tmpa_tl { ##1 }
			\ior_map_break:
		}
	}
	\ior_close:N \g_tmpa_ior    
}

\ExplSyntaxOff

\readingHanja{羅}의 결과는 이렇습니다.
na.png

'나'라고 읽고 있네요 자동조사를 위해서 이 정도면 되지 않겠는가 합니다.

참고로, 한중일 호환한자는 파일 이름을 hanjacom_hangul.tab으로 하고 starting point를 63744로 해야 합니다. 한중일 통합 한자 확장 A 영역의 글자들은 hanjaexa_hangul.tab이고 starting point는 13312입니다.

 




XE Login