Перевод файлов PDF — это очень часто обсуждаемый вопрос. Как их переводить, в какой формат конвертировать, каким конвертором?
Об этом можно писать очень долго. Но мне, кажется, удалось довольно кратко и ёмко ответить на этот вопрос в комментарии к одной из записей в этом блоге. Процитирую свой ответ здесь, чтобы все могли прочесть и обсудить:
Если в Вашем файле PDF выделяется текст (т. е. PDF не создан из сканированных изображений), то можно воспользоваться программой Infix PDF Editor. Платная версия позволяет экспортировать .xml, который можно перевести в memoQ, а затем импортировать обратно в Infix PDF Editor.
Но, поскольку русский текст не везде влезет, нужно будет ручками подправлять всё в Infix PDF Editor, который позволяет редактировать и сохранять изменённый PDF.
Но это для таких мазохистов, как я. Если же формат самого файла PDF не очень сложный, я ручками переношу текст и картинки (Adobe Acrobat Pro) в ворд, воссоздавая формат. Если есть несколько колонок, то их лучше делать с помощью таблицы со скрытыми границами.
Если нужно распознать файл, то сначала использую FineReader.
С такими файлами лучше день потерять, потом за 5 минут долететь. Если оно, конечно, того стоит.
Если заинтересует, распишу когда-нибудь подробнее. Жду ваших комментариев о переводе файлов PDF.