Q&A 마당은 텍 관련 질문/답변을 위해 만들었습니다.
- 로그인 없이 자유롭게 글을 읽고 쓸 수 있는 철학은 처음과 같이 계속됩니다.
- 질문 전에 아래를 읽어 보세요. 좋은 질문이 좋은 답을 받을 수 있는 좋은 방법입니다.
- 질문에 맞는 제목을 붙이세요. 질문의 내용과 관련없는 "고수님", "긴급질문", "도와주세요"와 같은 제목은 답이 잘 올라오지 않습니다. 이 게시판에 올라오는 모든 글은 질문입니다. 굳이 [질문], [Q]를 적으실 필요도 없습니다.
- 내용을 충실히 적어 주시고, 같은 상황을 재현할 수 있는 최소한의 예제가 같이 있어야 합니다.
- 최소 예제는 "Minimal working example"을 읽어 보세요.
- 파일을 첨부하실 때에는 가능한 압축하여 파일 크기를 줄여서 올려주시길 바랍니다.
- 개인적으로 사용하신 글꼴이 들어 있는 경우, preparefont.sty에 관한 답변을 참조하세요.
- 스팸 글을 막기 위하여 짧은 시간 내에 다시 글이 등록되는 IP를 막거나, 광고 글을 막기 위하여 금지어로 .com, .net 등을 설정하고 있습니다. 다소간의 불편함이 있으시더라도 양해 바랍니다.
- 금지어에서 stackexchange, stackoverflow, ctan, overleaf, , github, google.com, gmail.com, .org, .io, sil.org, wiki.com, tistory.com등은 해제하였습니다.
- MathJax를 이용한 수식조판을 사용하실 수 있습니다. 여기를 참조하세요.
- 사용하는 편집기는 CKeditor입니다.
- 편집기에서 [enter]를 누르면 <p> 태그가 들어가고, 문단으로 생각하고 한 줄을 비웁니다.
- 글줄만 바꾸려면 [shift-enter]를 누르면 <BR> 태그가 들어가므로 용도에 맞게 나누어 쓸 수 있습니다.
- 수식를 문서내에 삽입하시려면 에디터를 툴바에서 [소스]를 눌러 HTML로 입력할 수 있게 바꾸신 후 <pre> </pre> tag를 사용하셔서 <pre> 여러 줄의 수식 </pre>처럼 입력하시면 좋습니다.
cp949 인지 UTF-8 인지 확인하는 법
2013.12.12 13:03
맥에서 텍문서 파일이 cp949 인지 UTF-8 인지 (터미널에서) 확인하는 법을 가르쳐주시면 감사하겠습니다.
아울러 변환하는 법도 가르쳐주시면 감사하겠습니다! 즐건 하루 보내세용~
댓글 8
-
DohyunKim
2013.12.12 13:41
-
nanim
2013.12.12 13:57
김도현 교수님 방법은 실패할 가능성이 없는 방법이고요,
100% 정확성을 보장하지는 않지만... 파일 앞부분에 한글 글자가 있는 경우라면 간단한 방법이 있습니다.
# file -I foo.tex
윈도우즈 버전은 http://gnuwin32.sourceforge DOT net/packages/file.htm
이 바이너리로는 아마 소문자 -i 옵션을 주어야 할 겁니다.
-
DohyunKim
2013.12.12 14:41
-l (엘)이 아니라 -I (아이)로군요.
이 옵션은 그동안 모르고 있었습니다.
utf-8인지 확인만 하는 데는 iconv 보다 간편하고 좋네요.
-
지나가다
2013.12.13 11:50
권위있는 두분 글 감사합니다! 파일 (내용용) 앞부분에 한글 글자가 없어도 잘되는데요? 이건 무슨 뜻인지 자세히 가르쳐 주실 수 있으십니까?
그리고 charset=iso-8859-1 로 나오는데요. 이건 cp949인가요?
-
샘처럼
2013.12.13 12:10
ISO-8859-1 http://ko.wikipedia.org/wiki/ISO/IEC_8859
cp949 http://ko.wikipedia.org/wiki/%EC%BD%94%EB%93%9C_%ED%8E%98%EC%9D%B4%EC%A7%80_949
ISO-8859-1로 나온다면 최소한 유니코드는 아니다라고 생각하시면 되고, 내용중 한글이 있다면 cp949 혹은 EUC-KR이려니 하고 대충 생각하시면 될 듯 합니다.
-
지나가다
2013.12.13 12:36
감사합니다! 대충 알겠습니다. 유니코드가 아닐 때 내용중 한글이 있어야만 "cp949 혹은 EUC-KR로 인코딩되었다"라고 말할 수 있는가 보내요? 답변주신 분들께 거듭 감사드립니다!
-
수알치
2018.07.13 20:14
자나가다가, 저도 궁금해서 각 파일을 생성해서 살펴보니 구조가 다른 것으로 확인되었습니다./
즉, 어떤 코드를 사용하여 저장하는 가에 따라서 파일에 저장된 정보가 다릅니다.
윈도우 메모장에서 "123" 텍스트를 ansi, utf8(리틀엔디안), unicode 로 지정해서 각각 저장하고
해당 파일을 바이너리 코드로 읽어오면 다음과 같습니다.
ansi : 0x31, 0x32, 0x33,
utf8 : 0xef, 0xbb, 0xbf, 0x31, 0x32, 0x33,
unicode : 0xff, 0xfe, 0x31, 0x0, 0x32, 0x0, 0x33, 0x0
한글 사용과는 무관하게 어떤 코드를 사용하느냐에 따라서 저장된 파일 구조가 달라진 것을 알 수 있습니다.
utf8은 문서 앞쪽에 세 바이트 특수 코드( 0xef, 0xbb, 0xbf)로,
unicode는 문서 앞쪽에 두 바이트 특수 코드(0xff, 0xfe)를 이용하여 서로 구분하는 것 같습니다.
ansi 코드 파일은.특별한 헤더 코드가 없는 것 같습니다.
그럼 이만...
-
anonymous
2018.07.13 23:34
말씀하신 부분은 BOM ( Byte Order Mark, https://en.wikipedia.org/wiki/Byte_order_mark , http://faq.ktug.org/faq/BOM ) 라고 합니다.
BOM을 붙여서 텍스트 문서를 만드는 경우도 있지만, BOM을 붙이지 않고 텍스트 문서를 만드는 경우도 있습니다.
iconv -f utf8 < foo.tex
해서 에러가 없으면 utf-8입니다.
iconv -f cp949 < foo.tex
해서 에러가 없으면 cp949입니다.
변환은
iconv -f cp949 -t utf8 < foo.tex > bar.tex
iconv -f utf8 -t cp949 < foo.tex > bar.tex
Windows라면 아마 따로 다운받으셔야 할 겁니다. 구글링해 보세요.
아, 맥이시군요. 그러면 기본으로 들어있습니다.