最終更新:2010-04-08 (木) 04:27:32 (5122d)  

PDFBox
Top / PDFBox

Java PDF Library

PDFの作成や操作を行えるオープンソースのJavaライブラリ

http://incubator.apache.org/pdfbox/

Features

  • PDF to text extraction
  • Merge PDF Documents
  • PDF Document Encryption/Decryption
  • Lucene Search Engine Integration
  • Fill in form data FDF? and XFDF?
  • Create a PDF from a text file
  • Create images from PDF pages
  • Print a PDF

メモ

Apache PDFBoxはPDFファイルの作成や操作、PDFドキュメントからの内容抽出?などを行うJavaライブラリ。PDFドキュメントの暗号化と解読、テキスト抽出などのコマンドラインツールも備える。「Apache Tika?」や「Apache Lucene」などとの連携も可能。

ApachePDFBox 1.0では性能の強化、ページラベルとAdobe CFF/Type 2フォントのサポートなどが特徴となる。暗号化されたPDFファイルの読み込みや暗号化PDFファイルから暗号化なしPDFファイルへの変換も可能となった。そのほかデフォルトのビルドシステムが「Ant」から「Maven」に移行、Java 5が必須となった。

参考