さり海馬

Thoughts walk away, blog stays.

2009-08-13から1日間の記事一覧

PDF からのテキスト抽出をいろいろ試してみた

pdf

PDF の英文ルールブックを OmegaT で翻訳する際には、まずテキスト抽出(PDF→英文テキストファイルにする)をする必要があります。前回のエントリーでは、その段階でいろいろと問題がありそうなことが分かりました。とりあえず、いろいろなツール(もしくは手…