본문 바로가기

자동번역2

PDF자동번역기(2) # 언어 선택 나름대로 자연스럽게 사용할 수 있는 언어가 c#, python 인데 어떤 것을 기준으로 작업을 할 지를 선택해야 했다. 일단 내가 모든 소스 코드를 당장은 작업할 수 없으므로, 내가 사용할 수 있는 오픈 소스 라이브러리가 있어야했고, 내가 적당한 컨트롤을 할 수 있어야했다. # C#? 그런 면에서 봤을 때, 일단 C#이 나에게 훨씬 익숙한 언어이므로, C#으로 작업하는 것이 더 좋아보였다. 그러나 가장 핵심이 되는 두 개의 라이브러리가 필요한데, 하나는 PDF 를 컨트롤 할 수 있는 라이브러리고, 다른 하나는 번역을 할 수 있는 라이브러리다. 아무래도 윈도우 문서와 관련이 많이 되다보니 C# 쪽에는 완성도 높은 PDF 라이브러리가 있었다. (itext 등..) 거기에 일단은 내가 혼자 사용.. 2018. 2. 2.
PDF자동번역기(1) # 왜? 옛날에는 번역기들의 상태가 좋지 않아서 자동 번역 프로그램을 돌리는 것보다는 결국은 스스로가 번역을 해서 정리하거나, 영어를 아주 쉽게 읽을 수 있는 수준이 되어야만 해외에서 영문으로 출판된 문서들을 보는 것이 가능했던 것 같다. 하지만, 작년부터 네이버 및 구글의 번역 능력이 압도적으로 좋아졌기 때문에 간단한 수준에서는 자동 번역으로 변경을 하더라도 큰 문제가 없는 수준에 도달했다는 생각도 좀 든다. 물론, 여전히 뉘앙스의 차이가 있기 때문에 번역의 성공율은 약 80% 정도로 보아야겠지만, 개인적으로 소장하기 위한 용도의 프로그램에는 큰 문제가 없어보인다. # 목표? 세 개의 구역으로 나누어두고, 가장 왼쪽에는 원본 PDF 파일을 보여주고, 중간에는 그것을 Text로 변환한 것을, 가장 오른쪽.. 2018. 2. 2.