最終更新:2012-05-08 (火) 23:32:45 (4364d)  

xdoc2txt
Top / xdoc2txt

PDF,DOC,XLS,一太郎?などの各種バイナリ文書からテキストを抽出

http://www31.ocn.ne.jp/~h_ishida/xdoc2txt.html

  • xdoc2txtはPDF,WORD,EXCEL,一太郎などの各種バイナリ文書から、テキスト要素を抽出する汎用テキストコンバータであり、Windowsのコマンドラインで動作します。
  • xdoc2txtは各種文書の構造を直接解析しているため、単独で変換できます。WORDや Acrobatなど、作成元のアプリケーションをインストールする必要はありません。
  • 高速に動作するので、各種全文検索エンジンのフィルタに最適です。
  • ワープロ文書の種類は、拡張子から判別します。次の拡張子のファイルに対応しています。

対応形式