添付文書のテキスト化

MS Word や PDF からテキストを抽出したいことがある。
前者は abiword など、後者は xpdf に付属の pdftotext などでできる。
が、一太郎となると、なかなかツールがない。

結局、データ変換研究所の製品かxdoc2txt くらいしかない。
後者はWinだから、Linux で動かすと成ると、前者。
しかし、数十万円するので、会社でなら良いが、個人では無理。。。

コメントを残す

メールアドレスが公開されることはありません。 が付いている欄は必須項目です

*

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください