Apache PDFBox 3.0介绍
豆豆 2023-09-15 11:05:54 3400人已围观
1、apache PDFBox官方网站(https://pdfbox.apache.org/)
Apache PDFBox库是一个开源的Java工具,专门用于处理PDF文档。它允许用户创建全新的PDF文件,编辑PDF文档,Apache PDFBox提供了创建、渲染、打印、合并、拆分、加密、解密、签名等多种操作PDF文件的功能。PDFBox还包括一个命令行工具,可以用于执行各种PDF处理任务。此外,它还支持文本提取和搜索,以及将PDF转换为其他格式,如图片和文本。PDFBox广泛应用于企业和开发者构建PDF处理相关的应用程序和工具。
2、Apache PDFBox 3.0主要特性
(1)、Extract Text:Extract Unicode text from PDF files.
提取文本:从PDF文件中提取Unicode文本
(2)、Split & Merge:Split a single PDF into many files or merge multiple PDF files.
拆分和合并:将单个PDF拆分为多个文件或合并多个PDF文件。
(3)、Fill Forms:Extract data from PDF forms or fill a PDF form.
填写表单:从PDF表单中提取数据或填写PDF表单。
(4)、Preflight:Validate PDF files against the PDF/A-1b standard.
预检/印前检查:根据PDF/A-1b标准验证PDF文件。
(5)、Print:Print a PDF file using the standard Java printing API.
打印:使用标准的Java打印API打印PDF文件。
(6)、Save as Image:Save PDFs as image files, such as PNG or JPEG.
另存为图像:将PDF保存为图像文件,如PNG或JPEG。
(7)、Create PDFs:Create a PDF from scratch, with embedded fonts and images.
创建PDF:使用嵌入的字体和图像从头开始创建PDF。
(8)、Signing:Digitally sign PDF files.
签名:对PDF文件进行数字签名。
3、主要工具或者jar文件
3.1、Command line tools(命令行工具)
(1)、PDFBox standalone :pdfbox脱机处理app,直接下载pdfbox-app-3.0.0.jar
(2)、Debugger standalone:pdfbox脱机调试器,直接下载 debugger-app-3.0.0.jar
(3)、Preflight standalone :pdf预检查app,直接下载preflight-app-3.0.0.jar
3.2、Libraries of each subproject(每个子项目的jar包)
(1)、pdfbox-3.0.0.jar :pdfbox主项目jar文件
(2)、pdfbox-io-3.0.0.jar :pdfbox文件读写IO专用jar文件
(3)、fontbox-3.0.0.jar :pdfbox处理字体相关jar文件
(4)、preflight-3.0.0.jar :pdfbox用于预处理检查、印前检查等项目jar文件
(5)、xmpbox-3.0.0.jar :pdfbox支持xmp元数据专用jar文件
(6)、pdfbox-tools-3.0.0.jar :pdfbox tools项目jar文件
(7)、pdfbox-debugger-3.0.0.jar :pdfbox调试类jar文件
4、文件下载
你可以直接访问官网下载,由于是国外网站访问可能不正常,也可以通过我的网盘下载