본문 바로가기
토이프로젝트/PDF자동번역기(완)

PDF자동번역기(3) - 완성

by 크라크라 2018. 2. 16.

# 경과


사실 처음에 생각했던 것이 100 정도 된다면, 완성품(?)이라고 말하기는 애매하지만 이건 한 20~30 정도 되는 것 같다. 그럼에도 불구하고 마무리를 지은 것은, 더 고급으로 만드려면 애로사항이 많기 때문이다. PDF 포맷이 가지는 한계. 그리고 그것을 구글 번역 유료 API를 쓰지 않은 것의 한계가 겹쳐져서 많은 문제가 생겼기 때문이다. 


일반적인 한글문서처럼 모든 텍스트가 깔끔하게 연결되어 있는 것도 아니고, 그래프나 표, 이미지 등 각종 요소들이 들어가 있을 수 있다는 점 때문에 텍스트를 정확하게 체크해서 꺼낼 수 없었고 그 텍스트를 번역한 것이 또 원하는만큼의 정확도로는 번역되지 않았다. 



# 결과물


최종 결과물은 다음과 같다. 시간이 나고, 기술적으로 더 좋아지면 + 돈이 좀 더 생긴다면 번역방식을 유료 API로 교체하고, PDF 추출도 Acrobat Pro SDK를 사용해서 바꾼다면 일반 번역의 품질은 더 좋아질 것이라고 생각된다. 번역 성능 상승, 그리고 최종 번역된 텍스트를 .txt 파일로 저장하기, 더 나아가서 원본 PDF의 디자인 그대로 결과물을 PDF로 만들 수 있는 것까지 사실 개선해야할 것들은 매우 많다. 이건 추후에 천천히 작업하고 이 정도로 마무리했다.



다음 그림은 파울로 코엘료의 연금술사를 번역한 일부 모습이다. 




&기능&


- File Open : 파일 다이얼로그 오픈

- FontSize : 기본 폰트사이즈는 14로 + 원하는 숫자 입력시 그에 맞는 폰트 사이즈로 변경

- Page : 20/89 총 89쪽 중에서 20쪽의 PDF 파일 현재 페이지로 설정 및 현재 페이지의 텍스트를 한글로 번역

- 숫자 입력 및 엔터 또는 Translate Page 버튼 누를 때 번역

- 죽지 않도록 예외 처리





'토이프로젝트 > PDF자동번역기(완)' 카테고리의 다른 글

PDF자동번역기(2)  (0) 2018.02.02
PDF자동번역기(1)  (0) 2018.02.02

댓글