KTUG마당은 KTUG를 방문하는 모든 이용자가 대화를 나누고 소식을 전하는 곳입니다.
- 로그인 없이 자유롭게 글을 읽고 쓸 수 있는 철학은 처음과 같이 계속됩니다.
- Team Blog의 글을 이곳 게시판의 "정보글"로 모았습니다. Team blog는 기고자가 올린 글에 질문을 받는 부담을 줄이기 위하여 댓글을 허용하지 않았습니다. 그러나 이곳 게시판으로 모으면서 댓글을 달 수 있습니다. 게시물을 작성하실 때 댓글을 원하지 않으시면 댓글을 허용하시지 않으시기를 바랍니다. 또한 불필요한 소모성 댓글을 달지 않도록 주의하여 주시기를 바랍니다.
- TeX과 관련된 질문이나 답변은 QnA 마당을 이용하십시오. TeX과 관련된 질문은 지웁니다
- MathJax를 이용한 수식조판을 사용하실 수 있습니다. 여기를 참조하세요.
- 스팸 글을 막기 위하여 짧은 시간 내에 다시 글이 등록되는 IP를 막거나, 광고 글을 막기 위하여 금지어로 .com, .net 등을 설정하고 있습니다. 다소간의 불편함이 있으시더라도 양해 바랍니다.
- 금지어에서 stackexchange, stackoverflow, ctan, overleaf, , github, google.com, gmail.com, .org, .io, sil.org, wiki.com, tistory.com등은 해제하였습니다.
- 사용하는 편집기는 CKeditor입니다. 편집기에서 [enter]를 누르면 <p> 태그가 들어가고, 문단으로 생각하고 한줄을 비웁니다. 글줄만 바꾸려면 shift-enter 를 누르시면 <BR>가 들어가므로 용도에 맞게 나누어 쓸 수 있습니다.
자유글 정본 훈민정음 언해 어제 서문
2021.09.17 10:26
여러 번 제작한 바 있는 훈민정음 언해 어제 서문 샘플 파일 2021년판입니다.
이번 것은 pmhanguljamo 패키지를 이용하여 입력하였는데, 중요한 이유는 기존에 쓰던 텍스트의 방점을 수정해야 했기 때문입니다. 방점을 정확하게 입력하는 데 pmhanguljamo보다 나은 방법을 찾지 못했습니다.
"정본"이라는 용어는, 문화재청 (2007) <훈민정음 언해본 이본 조사 및 정본 제작 연구>라는 연구보고서가 제시하는 의미에서 "정본"입니다. 여러 판본을 비교하여 확립한 텍스트라고 보기 때문에 이 보고서에 나온 "정본"의 표기법을 따라서 방점을 대여섯 곳 수정했습니다.
다음은 소스 파일 첫머리에 나오는 "일러두기"
%% =============== %% 일러두기 %% 1. 문화재청 (2007), <훈민정음 언해본 이본 조사 및 정본 제작 연구>의 `정본'에 따라 %% 텍스트를 검수하여, 방점(성조점)을 수정하였음. 따라서 이 문서가 생성하는 텍스트의 %% 방점은 ``비평적으로 재구성된'' 것임. %% 2. 원본은 협주 부분에서 한자의 음을 표시한 글자가 더 작아지지 않지만 이 문서에서는 %% 다른 부분과 같이 한 수준 글자 크기를 줄여 조판하게 하였음. %% 3. 한 번 나오는 ``황제'' 앞에 대두법으로 한 칸 띄운 부분을 □로 표시하였음. %% 4. 단어 단위로 띄어쓰기한 것은 이 문서 제작자가 한 일임. %% 참고. xetexko의 설정을 바꾸어 띄어쓰기 없이 조판되도록 할 수 있을 것임. %% 5. pmhanguljamo 패키지와 xetexko를 이용하여 조판함.
* PDF: hunminjeongeumeonhae.pdf
* SRC: hunminjeongeumeonhae.tex
댓글 9
-
yihoze
2021.09.17 13:22
-
noname
2021.09.17 13:38
"製는 글짓는다는 뜻이니 御製는 임금(님이) 지으신 글이라."
訓은 가르친다는 뜻이요, 民은 백성이요, 音은 소리니, 訓民正音은 '백성 가르치시는 正한 소리'라. -
amicus magnus
2021.10.15 22:22
씨라는 단어가 뜻이라는 단어네요. 이제는 안쓰는 아쉽네.
-
noname
2021.10.16 06:30
"訓은 가르칠 씨요"의 "씨"는 -ㄹ 아래에서 '것'에 해당하는 의존명사라고 합니다. 그러니까 직역하면 "訓은 가르치는 것이요"라고 해야 하겠습니다.
-
noname
2021.09.19 12:58
<정본 훈민정음 언해> full text 버전입니다. 어제서문 이후 부분은 아무래도 초벌 입력하는 것이므로 오류가 있을 가능성이 있다고 봅니다. TeX으로 조판하는 <훈민정음>의 정본을 확립하려는 노력의 일환으로 이해해주시고, 오류가 발견되면 즉시 알려주십시오. 직접 수정하여 파일첨부하여 주시는 것을 환영합니다.
-
noname
2021.09.21 09:21
한 가지 더 시도해본 것은 이런 것입니다. pmhanguljamo 패키지로 입력한 한글은 현대 한글 음절문자이면 pdf에서 그대로 긁어오거나 pdftotext로 변환하여 한글 텍스트로 복원(변환)할 수 있습니다. 그런데 이 글의 예제들은 pdf의 복사-붙이기나 pdftotext로 완전히 한글이 복원되지 않습니다.
이 텍스트를 plain text로 복원할 방법이 없을까 고민하다가 다음과 같이 해보았습니다. 우리야 pdf로 잘 출력되니 만족하지만 이 결과물을 아래아한글에서 편집하고 싶을 수도 있으니까요.
- pmhanguljamo.sty를 조금 수정하여, \jamoword의 인자로 입력된 부호를 예를 들면 \u1106\u1161\u11AF\u302F 와 같은 문자열로 출력되게 합니다. 이것은 그다지 어렵지 않은데, pmhanguljamo가 알기 쉽게 작성되어 있기 때문입니다. 이 스타일을 임시로 pmhanguljamotocode.sty라고 하고, 이 패키지로 hunminjeongeumeonhae.tex 텍스트를 컴파일합니다.
- 그리하여 얻어진 pdf는 한자와 숫자 그리고 백슬래시와 A-F 알파벳만 포함하고 있기 때문에 pdftotext로 변환하여 손실없이 결과를 얻을 수 있습니다.
- 이제 예컨대 \u1106이라고 되어 있는 부분을 [U+1106]이라는 char로 변환합니다. 이것을 해주는 간단한 python 스크립트를 작성했습니다.
몇 가지 고려할 부분이 있기는 했습니다. 글자 크기가 변한다든가, 행 중간에 공백이 길다든가 하면 pdftotext가 변환한 텍스트의 위치가 조금 흔들리는 경우가 있더군요. 그리고 textwidth가 충분히 길지 않으면 한 줄에 들어가는 텍스트 분량이 너무 적어지기도 하더라고요. 그래서 페이지 크기를 조금 늘리고 문서 전체를 raggedright로 조판되도록 하였습니다.
최종적으로 얻어지는 출력물은 hmje-out.tex 입니다. (text 파일인데 이 게시판에 txt 확장자 파일이 업로드 금지되어 있어서 tex으로 바꾸었습니다.) 행 자르기라든가 등등에 약간의 수정이 더 필요할지 모르지만 원래 의도했던 것은 성공했다고 생각합니다.
테스트에 사용한 모든 파일을 첨부하였습니다(pmhanguljamotocode.zip). 다음 순서로 테스트할 수 있습니다.
$ xelatex hmje.tex
$ pdftotext hmje.pdf
$ python3 codepoint2char.py hmje.txt >hmje-out.txt -
DohyunKim
2021.09.23 16:27
xetex 이라면
\XeTeXgenerateactualtext=1
을 선언하여 복붙 가능한 문서를 만들 수 있습니다. luatex 이라면, 옛한글에 관한 한 아무런 선언 없이 자동으로 되게 해 두었습니다. -
noname
2021.09.23 17:00
아 그렇군요. 알려주셔서 감사합니다. 이렇게 편한 것을요.
(원래 저거는 codepoint2char.py를 작성하려고 하다가 나온 부산물 같은 것이었습니다.)
-
noname
2021.10.02 08:01
이 글타래는 http://www.ktug.org/xe/index.php?mid=KTUG_open_board&document_srl=255075 로 이어집니다.
(관리자님 원글에 첨부된 파일을 삭제해주세요.)
번호 | 제목 | 글쓴이 | 날짜 | 조회 수 |
---|---|---|---|---|
802 | 허허허... tabularray 는 정말 끝판급이네요.... | 불량양파 | 2022.06.24 | 866 |
801 | [잡담] 색인이 목차에 추가될 때 [2] | yihoze | 2022.06.21 | 662 |
800 | mediawiki2latex 을 일단은 성공했습니다. [5] | 불량양파 | 2022.06.18 | 691 |
799 | 정회원 되고 싶은데요 [2] | bjorkii | 2022.06.16 | 678 |
798 | mediawiki to latex 이 아예 다른 방향으로 발전한듯 합니다. | 불량양파 | 2022.06.07 | 827 |
797 | beamer simple animation (워크숍) [2] | noname | 2022.05.18 | 754 |
796 | 영어 한글 변환 [4] | yihoze | 2022.02.10 | 1145 |
795 | 공연하고 쓸데없는... [6] | nanim | 2015.05.13 | 3434 |
794 | 일본어 음독 달기 [10] | yihoze | 2021.08.06 | 1892 |
793 | [유물] 1996년의 TeX: 매킨토시 OzTeX+hLaTeXp [8] | noname | 2022.04.20 | 772 |
792 | 원고의 분량 [2] | noname | 2022.04.25 | 692 |
791 | LaTeX, MediaWiki, ePub [5] | 판돌이 | 2021.09.26 | 1194 |
790 | 심심풀이 도전과제 [4] | noname | 2022.03.31 | 846 |
789 | oblivoir의 chapter [2] | noname | 2022.03.30 | 695 |
788 | 싱글 페이지 엠프티 [3] | noname | 2022.03.19 | 650 |
787 | 콩조이팥조이 [7] | noname | 2021.12.10 | 990 |
786 | bfseries와 itshape를 겹치면 [2] | yihoze | 2022.02.15 | 649 |
785 | 풀어쓰기 | yihoze | 2022.02.15 | 38115 |
784 | 다국어 식자를 위한 ucharclasses 패키지 | yihoze | 2022.02.11 | 656 |
783 | 문단 단위 대역본 [2] | yihoze | 2022.01.11 | 688 |
놀랍습니다. 근데 이게 무슨 말이에요? 인터넷 뒤져봐도 죄다 "나랏말쌈이"부터 있고, 그 앞 해석은 못 찾겠네요.