最終更新:2010-04-08 (木) 04:27:32 (5103d)
PDFBox
Top / PDFBox
PDFの作成や操作を行えるオープンソースのJavaライブラリ
http://incubator.apache.org/pdfbox/
Features
- PDF to text extraction
- Merge PDF Documents
- PDF Document Encryption/Decryption
- Lucene Search Engine Integration
- Fill in form data FDF? and XFDF?
- Create a PDF from a text file
- Create images from PDF pages
- Print a PDF
メモ
Apache PDFBoxはPDFファイルの作成や操作、PDFドキュメントからの内容抽出?などを行うJavaライブラリ。PDFドキュメントの暗号化と解読、テキスト抽出などのコマンドラインツールも備える。「Apache Tika?」や「Apache Lucene」などとの連携も可能。
ApachePDFBox 1.0では性能の強化、ページラベルとAdobe CFF/Type 2フォントのサポートなどが特徴となる。暗号化されたPDFファイルの読み込みや暗号化PDFファイルから暗号化なしPDFファイルへの変換も可能となった。そのほかデフォルトのビルドシステムが「Ant」から「Maven」に移行、Java 5が必須となった。