10月末から、職務明細書と題された文書の翻訳をやっています。英日で、ある外資系企業の、求人用の資料です。20 数ページの文書には、募集職種の詳細な勤務内容が書かれています。
問題は、原文が PDF だけでテキスト化されていないことです。
PDF ファイルが TIFF または JPG 形式で保存できれば、OCR ソフト(読取革命)で画像から直接テキストに変換できるのですが、PDF にプロテクトがかかっているようで、JPG 化ができません。
OCR で変換するとしたら、一旦 PDF を印刷してそれをスキャナで読み取り、テキスト化することですが、元の原稿の画質が悪い上に、印刷→スキャン何かしたら、OCR の認識率もひどくなりそう。
結局、PDF と MS-Word を開いて画面上で並置して作業しています。
こんな原始的な翻訳作業したの久しぶりだなぁ... 日頃から翻訳支援ソフト(Trados や SDLX)にいかに依存しているかを痛感しました。
今日は徹夜です~





