KTUG마당은 KTUG를 방문하는 모든 이용자가 대화를 나누고 소식을 전하는 곳입니다.
- 로그인 없이 자유롭게 글을 읽고 쓸 수 있는 철학은 처음과 같이 계속됩니다.
- Team Blog의 글을 이곳 게시판의 "정보글"로 모았습니다. Team blog는 기고자가 올린 글에 질문을 받는 부담을 줄이기 위하여 댓글을 허용하지 않았습니다. 그러나 이곳 게시판으로 모으면서 댓글을 달 수 있습니다. 게시물을 작성하실 때 댓글을 원하지 않으시면 댓글을 허용하시지 않으시기를 바랍니다. 또한 불필요한 소모성 댓글을 달지 않도록 주의하여 주시기를 바랍니다.
- TeX과 관련된 질문이나 답변은 QnA 마당을 이용하십시오. TeX과 관련된 질문은 지웁니다
- MathJax를 이용한 수식조판을 사용하실 수 있습니다. 여기를 참조하세요.
- 스팸 글을 막기 위하여 짧은 시간 내에 다시 글이 등록되는 IP를 막거나, 광고 글을 막기 위하여 금지어로 .com, .net 등을 설정하고 있습니다. 다소간의 불편함이 있으시더라도 양해 바랍니다.
- 금지어에서 stackexchange, stackoverflow, ctan, overleaf, , github, google.com, gmail.com, .org, .io, sil.org, wiki.com, tistory.com등은 해제하였습니다.
- 사용하는 편집기는 CKeditor입니다. 편집기에서 [enter]를 누르면 <p> 태그가 들어가고, 문단으로 생각하고 한줄을 비웁니다. 글줄만 바꾸려면 shift-enter 를 누르시면 <BR>가 들어가므로 용도에 맞게 나누어 쓸 수 있습니다.
정보글 한국어 로마자 변환
2022.02.08 12:32
한국어를 로마자로 변환하는 스크립트를 파이썬으로 만들었습니다.
https://github.com/YiHoze/texwrapper/blob/master/hanroman.py
네이버나 부산대의 변환기보다 신뢰할 만한 것으로 만드는 게 목표 ... 이면 좋겠지만, 가능할지 모르겠습니다.
pythontex을 이용하여 hanroman.py를 돌리는 텍 문서를 만들어 봤습니다. 아래 예에서 네 문장이 반복되는데, 앞의 것들은 transcription, 뒤의 것들은 transliteration된 것입니다.
hanroman.py는 영어를 한글로 변환하는 기능도 제공하는데, 텍 문서에서 쓰려면 손을 좀 더 봐야 합니다.
아무튼 아직 버그가 많을 것입니다.
댓글 14
-
yihoze
2022.02.08 16:52
-
yihoze
2022.02.08 17:28
"백년"에 버그가 있군요. 고쳤습니다만, 이 프로그램을 완성하려면 언어학 공부를 해야 할 것 같네요. ㅠ.ㅠ
-
noname
2022.02.08 17:53
버그라기보다는... 백년이 one hundred years 라는 뜻이라면, 띄어쓰기 규정에 의하여 "백 년"으로 적어야 하고 따라서 baek nyeon으로 출력되어야 정상입니다. "백년"과 같이 붙여적는 것이 허용될 뿐이므로 로마자로 바꿀 때에는 원칙대로 띄어쓴 다음에 바꾸는 것이 옳겠죠.
만약 이것이 인명이라면 로마자 표기법 규정에 의하여 "Baeknyeon"으로 적어야 할 겁니다. 무슨 고유명사로 동네이름같은 것일 때만 "baengnyeon"이 될 것으로 봅니다.
-
yihoze
2022.02.09 08:46
"백 년"은 띄어쓰는 게 맞겠습니다만, 로마자 표기법 규정에 따르면 음운 변화, 이 경우에는 자음 동화의 발음을 반영해야 하는 것으로 알고 있습니다. 이를테면 북녘은 붕녁으로 소리나고 따라서 bungnyeok으로 표기하는 것이 맞을 겁니다.
-
jack.p78928
2022.02.08 21:00
응원하겠습니다! 로마자 표기에 고유명사 등 고려할것이 많아 개발하실게 많으실터, 모든 일이 잘풀리길 바라겠습니다!
-
noname
2022.02.09 09:27
처음 한 문장만, 예전에 했던 expl3 로마자 표기법으로 돌려봤습니다. (그 당시 게시판에 공개했던 것을 조금 더 수정하였던 것인데, 원하시는 분이 있으면 공개하겠습니다만 뭐 별스런 것도 아니기 때문에...)
아무튼, 몇 군데 차이를 보이는군요.
-
yihoze
2022.02.09 15:35
"행복합니다"는 고쳤습니다. 복모음 따위에서 애매함을 피하기 위해 하이픈을 넣는 방식도 흉내내어 고쳤습니다.
국어 로마자 표기법 규정에 따라 코딩할 수 있으리라 생각했지만, 마냥 마구잡이로 정규표현식을 추가하고 있습니다. 그런데 이런 규정이 있는데 이건 도저히 구현할 방법이 없을 것 같습니다. 격음화를 적용하지 말라는 옵션을 주는 것 말고는요.
다만, 체언에서 ‘ㄱ, ㄷ, ㅂ’ 뒤에 ‘ㅎ’이 따를 때에는 ‘ㅎ’을 밝혀 적는다.
묵호 Mukho
무의미하고 실속없는 규정으로 보입니다.
-
noname
2022.02.09 16:40
사실 로마자 표기법을 완전하게 구현하려면 "사전"을 이용하지 않을 수 없습니다. 말씀하신 그 규정의 경우 고유명사라면 뭐 그런 요구가 있어도 무방하다고 생각합니다만 예컨대 "국화" 같은 단어를 체언이라는 이유로 이 규정을 적용하여 gukhwa라고 하는 건 말씀하신 대로 무의미하다고 생각합니다. (그래도 이게 규정에 따르는 표기입니다.)
그거 말고도 문제가 되는 것이 소리가 덧나는 경우들입니다. 예컨대 expl3 로마자 표기 패키지를 수정하면서 예외 항목 등록 파일(사전)을 이용하도록 해보았는데 간단한 예제 문서를 작성하는 데 다음 단어들을 등록하여야 했습니다.
학여울, 신문로, 묵호, 집현전, 국화, 반구대, 나뭇잎, 알약, 솜이불, 막일, 꽃잎, 내복약, 색연필, 담요, 영업용, 불여우, 수원역, 서울역, 금융, 검열, 깻잎, ...
심지어 로마자 표기법 규정만으로는 그 표기를 확정할 수 없는 경우조차 있습니다. 대표적인 예가 "초점"과 "개수" 같은 한자어의 사이에 사잇소리가 덧나는 경우인데요, 표기만을 존중하여 chojeom, gaesu라고 쓰면 "표준 발음법에 의한다"는 대원칙을 위반하게 됩니다. 이것을 표준국어대사전의 발음 표기대로 "chojjeom", "gaessu"라고 하는 것과 사이시옷이 숨어 있다고 보아서 "chotjeom", "gaetsu"라고 쓰는 것, 이 셋 중에 어느 것을 써야할지 확정되지 않습니다.
다양한 예외상황을 우회할 수 있는 방법을 마련하지 않을 수 없습니다. 그게 아니라면 표준국어대사전 API를 이용하여 표준발음을 얻어온 다음 변환하는 걸 생각해봐야 할 것입니다. (그런데... 그러자면 사전 검색을 할 수 있는 형태로 단어의 형태소 분석을 하여야 하는데...)
-
그로몹
2022.07.08 15:52
오랜만에 로마자 표기법을 다시 보네요. 외국인이 잘 모르는 우리말을 읽기 편하게 하려는 목적이었을 것이라고 나름 생각했는데요. 하지만 저희는 사람 이름을 로마자로 써 놓은 것을 보고 원래 우리 이름이 무엇인지 확인할 수 있어야 한다고 생각해서 로마자 표기법 가운데 맨 마지막 방법 (이름이 뭐였지?)을 씁니다. (저희 학회에서 필요한 것은 대부분 사람의 이름과 우리말로 된 용어만을 로마자로 적을 필요가 있습니다.) 이 표기법도 하나의 옵션으로 들어갈 수 있으면 좋겠습니다.
-
판돌이
2022.02.10 11:14
이게 표기를 표기로 대응하지 않고 표기를 발음으로 대응하기 때문에 발생하는 문제입니다. 끝이 없지요. 옛날 맥쿤 라이샤워 방식보다야 낫습니다만. 유사한 카오스로 띄어쓰기 규정이 있습니다... -_-
-
yihoze
2022.02.10 11:43
글자 대 글자로만 대응하는 것은 유의미하지 않을 뿐더러, 그것조차 1:1 대응이 되지 않으니까 거북하죠. 영어를 한글로 옮기려면 음절을 따져야 하는데, 그것도 막막한 문제입니다. strike를 우리말로 옮기면 "스트라이크" 다섯 음절인데, strike는 (모음을 기준으로 해서) 한 음절이라고 합니다. 아무튼 strike를 글자 대응으로 옮기면 '스트리케'가 되려나요? ^^
-
판돌이
2024.05.09 14:21
최근 누군가가 한국 인지명을 맥쿤 라이샤워 방식으로 고쳐달라는 부탁을 해서 고통을 동반한 수작업으로 해결해준 적이 있습니다. 부산대 변환기는 사용 제한이 커서 불편했구요. 한국 학계의 세계화(?)에 꽤 중요한 요소인 것 같은데 규정부터가 문제적이니 이후는 더 말할 것도 없겠지요.
-
123
2023.12.01 14:12
사용방법좀 알려주시면 안되나요... 리드미도 읽기에 불편하고... 실행방법도 없고
-
likesam
2023.12.02 18:19
우선 TeX이 설치되어 있고 사용하실 수 있어야 하고,
Python이 설치되어 있다면,
첨부된 hanroman.tex 을 예제 삼아서, \begin{Romanize}와 \end{Romanize} 사이에 내용을 한글로 적으시고, 같은 디렉토리에 hanroman.py를 놓아두신 후 컴파일 하시면 (에러가 없다면) 결과가 PDF로 얻으실 수 있는 있겠네요.시험삼아 만들어 보신 것을 *굳이 설명서가 없어도* 시험하여 볼 수 있는 사람들이 있는 곳에 올리신 것이라서, Readme도 없고, 친절한 사용방법 안내도 없는 것으로 보시면 되겠어요.
ruby 명령으로 식자하도록 바꾸었습니다.