编程随想

AI时代，找源码已成为过去式，纪念我过去的十年 by Python自学0(回) 15天前

还有人吗 by 高嘉易2(回) 33天前

会python真的可以为所欲为 by Python自学0(回) 513天前

这里还有人吗 by mikeKil2(回) 698天前

这里还有人吗 by mikeKil0(回) 698天前

每天面对着电脑屏幕，敲打键盘。我所面对的并不只是代码，而是一种生活方式。 by js特效0(回) 922天前

云代码 - java代码库

java 读取PDF文件（需导入pdfbox包）

2012-11-22 作者：程序猿style举报

[java]代码库

	/**
	 * 读PDF文件，使用了pdfbox开源项目，新的版本已经支持中文了。
	 * 上www.pdfbox.org下载读PDF的jar包
	 * @param fileName
	 */
	public void readPDF(String fileName) {
		File file = new File(fileName);
		FileInputStream in = null;
		try {
			in = new FileInputStream(fileName);
			//新建一个PDF解析器对象
			PDFParser parser = new PDFParser(in);
			//对PDF文件进行解析
			parser.parse();
			//获取解析后得到的PDF文档对象
			PDDocument pdfdocument = parser.getPDDocument();
			//新建一个PDF文本剥离器
			PDFTextStripper stripper = new PDFTextStripper();
			//从PDF文档对象中剥离文本
			String result = stripper.getText(pdfdocument);
			System.out.println("PDF文件" + file.getAbsolutePath() + "的文本内容如下：");
			System.out.println(result);
			
		} catch (Exception e) {
			System.out.println("读取PDF文件"+ file.getAbsolutePath() + "生失败！" + e);
			e.printStackTrace();
		} finally {
			if (in != null){
				try {
					in.close();
				} catch (IOException e1) {
				}
			}
		}
	}

网友评论 (发表评论)

暂无评论 (抢沙发)

发表评论：

评论须知：

1、评论每次加2分，每天上限为30；
2、请文明用语，共同创建干净的技术交流环境；
3、若被发现提交非法信息，评论将会被删除，并且给予扣分处理，严重者给予封号处理；
4、请勿发布广告信息或其他无关评论，否则将会删除评论并扣分，严重者给予封号处理。

用户注册

用户登录

发表随想

该用户最新代码

编程随想

java 读取PDF文件（需导入pdfbox包）

[java]代码库

网友评论 (发表评论)

发表评论：

评论须知：

扫码下载

输入口令后可复制整站源码

用户注册

用户登录

发表随想

该用户最新代码

编程随想

java 读取PDF文件 （需导入pdfbox包）

[java]代码库

网友评论 (发表评论)

发表评论：

评论须知：

扫码下载

输入口令后可复制整站源码

java 读取PDF文件（需导入pdfbox包）