Q&A 마당은 텍 관련 질문/답변을 위해 만들었습니다.
- 로그인 없이 자유롭게 글을 읽고 쓸 수 있는 철학은 처음과 같이 계속됩니다.
- 질문 전에 아래를 읽어 보세요. 좋은 질문이 좋은 답을 받을 수 있는 좋은 방법입니다.
- 질문에 맞는 제목을 붙이세요. 질문의 내용과 관련없는 "고수님", "긴급질문", "도와주세요"와 같은 제목은 답이 잘 올라오지 않습니다. 이 게시판에 올라오는 모든 글은 질문입니다. 굳이 [질문], [Q]를 적으실 필요도 없습니다.
- 내용을 충실히 적어 주시고, 같은 상황을 재현할 수 있는 최소한의 예제가 같이 있어야 합니다.
- 최소 예제는 "Minimal working example"을 읽어 보세요.
- 파일을 첨부하실 때에는 가능한 압축하여 파일 크기를 줄여서 올려주시길 바랍니다.
- 개인적으로 사용하신 글꼴이 들어 있는 경우, preparefont.sty에 관한 답변을 참조하세요.
- 스팸 글을 막기 위하여 짧은 시간 내에 다시 글이 등록되는 IP를 막거나, 광고 글을 막기 위하여 금지어로 .com, .net 등을 설정하고 있습니다. 다소간의 불편함이 있으시더라도 양해 바랍니다.
- 금지어에서 stackexchange, stackoverflow, ctan, overleaf, , github, google.com, gmail.com, .org, .io, sil.org, wiki.com, tistory.com등은 해제하였습니다.
- MathJax를 이용한 수식조판을 사용하실 수 있습니다. 여기를 참조하세요.
- 사용하는 편집기는 CKeditor입니다.
- 편집기에서 [enter]를 누르면 <p> 태그가 들어가고, 문단으로 생각하고 한 줄을 비웁니다.
- 글줄만 바꾸려면 [shift-enter]를 누르면 <BR> 태그가 들어가므로 용도에 맞게 나누어 쓸 수 있습니다.
- 수식를 문서내에 삽입하시려면 에디터를 툴바에서 [소스]를 눌러 HTML로 입력할 수 있게 바꾸신 후 <pre> </pre> tag를 사용하셔서 <pre> 여러 줄의 수식 </pre>처럼 입력하시면 좋습니다.
Noto Serif CJK KR 글꼴에 뭔가 문제가 있을까요?
2017.11.28 14:36
\documentclass{memoir}
\usepackage{kotex}
\setmainfont{Noto Serif CJK KR}
%\setmainfont{NanumMyeongjo}
%\setmainfont{Noto Sans CJK KR}
\begin{document}
1. I am sorry. : 미안합니다.
\end{document}
이걸 컴파일 해서 PDF를 만들어 보면 잘 나오는데, 텍스트 복사를 해 보면 숫자가 깨집니다.
나눔명조나 Noto Sans CJK KR은 이런 현상이 안 일어나는데... 그렇다면 Noto Serif CJK KR의 문제일까요?
댓글 12
-
yihoze
2017.11.29 08:48
-
Dennis
2017.11.29 15:13
그렇군요. 일단 GitHub의 Noto CJK 채널에 이슈 올려 놨습니다.
-
비블리아
2017.11.29 17:20
Source Han Serif랑 같은 글꼴인가요? 같은 문제가 있을까요?
자답: 같은 문제가 있어 보입니다.
-
Dennis
2017.11.30 04:07
Github에 이슈를 올려서 Dr. Ken Lunde 씨하고 몇 차례 메일을 주고 받았는데요,
https://github쩜com/googlei18n/noto-cjk/issues/111
문제의 증상은 예를 들어 숫자 1, 2라고 하면 각각 코드가 U+0031, U+0032인데 PDF 변환 과정에서 U+10F357, U+10F358로 코드가 바뀌었다고 합니다(Plane 16 PUA code points에 있는 코드라고 하는데 이건 뭔지 잘 모르겠습니다 ^^- 검색해 보니 사용자 정의 영역이네요). 이분 테스트로는 증상은 일러스트레이터에서만 발생했고 (이분이 TeX을 잘 아시지는 않는 듯... 쿨럭) 인디자인에서는 발생하지 않았다고 하네요. 그리고 Noto Sans CJK는 물론이고 어도비 버전의 Source Han Serif/Sans K에서도 발생하지 않았다고 합니다. 일단 이 분은 글꼴이 아닌 일러스트레이터의 버그로 보고 이쪽에다 이슈를 제출하겠다고 합니다.
(그렇다면 일러스트레이터와 XeTeX이 같은 PDF 변환 엔진을...?????)
아무튼 이게 Lunde 박사의 말처럼 일러스트레이터의 버그가 맞다면 결국 XeTeX에도 같은 버그가 있다는 뜻으로도 해석할 수 있겠네요. 전혀 다른 곳에서 만드는 전혀 다른 프로그램 둘이 똑같은 버그가 있다는 게 좀 믿어지지는 않습니다만...
-
yihoze
2017.11.30 11:04
테스트해보니, Lunde 선생의 주장도 틀리지 않네요. MS Office 프로그램들은 OTF를 임베드하지 못하나 봅니다. 죄다 비트맵으로 바뀝니다. 인디자인과 일러스트레이터는 같은 회사 프로그램들인데도 폰트 처리에서 다른 것 같습니다. 인디자인은 TTF와 OTF 모두 폰트 목록에 보여주지만 일러스트레이터는 그렇지 않습니다. 응용 프로그램들이 폰트를 자체적으로 처리하는 건 아니고 OS가 제공하는 무슨 라이브러리를 쓴다고 들은 것 같습니다. 제 생각에는 윈도우즈 말고 맥이나 리눅스에서 테스트해 볼 필요가 있지 않을까 싶습니다.
-
DohyunKim
2017.11.30 12:29
\XeTeXgenerateactualtext=1
이것을 선언해 보세요. TL2017을 사용하고 계신다면요.
-
Progress
2017.11.30 13:07
1. PDF reader에 따라 다른 것 같습니다. 텍스트를 선택해 복사/붙여넣기 했을 때
Sumatra PDF(캡처 위 화면)에서는 숫자가 ?로 나오고,
Adobe Reader(캡처 아래 화면)에서는 잘 나옵니다.2. Adobe Reader에서는 줄 나눙이 좀 이상합니다.
\documentclass{memoir}
\usepackage{kotex}
\setmainfont{Noto Serif CJK KR}
\begin{document}
\XeTeXgenerateactualtext=1
1234567890
1. I am sorry. : 미안합니다.
{\fontspec{Noto Sans CJK KR}
12345678901. I am sorry. : 미안합니다.}
\end{document}
-
Dennis
2017.11.30 14:50
이 옵션을 추가하면 Adobe Acrobat에서는 숫자가 깨지지 않고 텍스트 복사가 되네요. 그런데 보니까 이 옵션은 텍스트를 추가로 PDF에 넣는 거라서 파일 용량이 확실히 커지는 부작용이 있는 것으로 보입니다. 여하튼 Lunde 씨의 이야기가 맞다면 어째서 Noto Sans CJK KR도, Source Han Sans/Serif K도 문제가 없는데 Noto Serif CJK KR에만 이런 문제가 있는 건지 참 궁금해지네요. 만약 일러스트레이터의 문제라면 다 문제가 있든지, 최소한 같은 구글 계열 이름을 사용하는 Noto Sans에서도 문제가 나타나든지, 아니면 사실상 같은 폰트인 Source Han Serif에서도 문제가 있든지 해야 하는데, 딱 Noto Serif에만 문제가 있으니...
-
비블리아
2017.11.30 15:11
mac에서 테스트해 봤습니다.
간단하게는
\XeTeXgenerateactualtext=1
명령을 넣어도 TeXShop Viewer나 Preview에서는 코드를 제대로 못 보여줍니다.
Acrobat는 이 명령이 있으면 제대로 보여주고 아니면 다른 코드를 줍니다.
[PS]
그런데 Acrobat는 "1." 하는 부분은 완전히 무시되네요.(\XeTeXgenerateactualtext=1 를 선언했을 경우)Progress님 글을 이제 봤습니다. 줄나눔이 이상하군요.^^
\XeTeXgenerateactualtext=1를 선언하지 않으면 오히려 보여주는데
저도 Source Han Serif 는 에러가 납니다.
전체적으로 조금씩은 이상합니다.
-
Dennis
2017.12.06 10:12
일단 제가 Github에 올렸던 이슈는 개발자 쪽에서 일러스트레이터의 버그로 보고 닫았네요.
그럼 XeTeX 쪽의 폰트 처리 엔진(아니면 운영체제의 폰트 처리 엔진인지는 모르겠습니다만)도 수정이 필요하지 않을까 싶습니다.
\XeTeXgenerateactualtext=1 는 답이 아닌 듯합니다. 일단 스페이스가 이상하게 들어가기 때문에 텍스트 복사가 제대로 된다고 보기는 어렵네요.
-
yihoze
2017.12.15 22:58
\setmainfont[Script=Hangul, Language=Korean]{Noto Serif CJK KR}
김도현 회장님 말씀에 따르면, 폰트가 너무 좋아서 (OTF 정석대로 만들어져서라는 의미인 듯합니다) 발생하는 문제라고 합니다. 아스키 코드 블록에 있는 것이 아니라 한글 영역에 있는 것으로 해야 ... 라는 정도로 이해했는데 정확히 뭔지는 잘 모르겠습니다. 아무튼 김도현 회장님이 알려주신 대로 위와 같이 해서 그 문제의 증상이 더 이상 발생하지 않음을 확인했습니다.
-
Dennis
2018.02.03 22:13
이런, 이 해결책을 이제야 봤네요. 그런데 제 경우에는 위와 같이 했을 때 이번에는 쉼표나 구두점 같은 문장부호들이 깨지는 부작용이 일어났습니다. 그래서
\setmainfont[Script=Hangul]{Noto Serif CJK KR}
Language 옵션을 삭제한 결과 깨지는 글자 없이 조판되는 것을 확인했습니다. 감사합니다. 참고로 Script=CJK 해도 잘 되네요.
폰트가 문제인지 알아보고자, 워드에서 그 폰트를 이용하여 PDF를 만들어봤는데요. 글자들이 비트맵으로 바뀌네요. 일러스트레이터에서는 PDF가 제대로 만들어지지만 말씀하신 것과 동일한 증상이 발생하고요. 폰트에 문제가 있어 보입니다.