热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

ApacheOpenoffice安装及使用Java进行word转pdf总结

目录前言一、安装并启动OpenOffice的服务(RPM安装方式)(需要使用root用户安装启动)1.安装OpenOffice,启动服务二、Java使用Openoff

目录

  • 前言
  • 一、安装并启动OpenOffice的服务(RPM安装方式)(需要使用root用户安装启动)
        • 1.安装OpenOffice,启动服务
  • 二、Java使用Openoffice进行word转Pdf,并进行预览试验。
        • 1.进行单元测试
        • 2.测试效果
        • 3.测试代码地址
  • 三、Wordl转Pdf的restful服务提供(待完成)。




前言

项目中需要使用在线预览Word的功能,可借助Apache OpenOffice服务然先将word转换成pdf,然后在通过在线pdf在线预览的迂回方式实现,以下记录此过程。



一、安装并启动OpenOffice的服务(RPM安装方式)(需要使用root用户安装启动)

1.安装OpenOffice,启动服务

去官网找下载包,官网地址:https://www.openoffice.org/download/
我下载的是4.1.10这个,下载地址:https://udomain.dl.sourceforge.net/project/openofficeorg.mirror/4.1.10/binaries/zh-CN/Apache_OpenOffice_4.1.10_Linux_x86-64_install-rpm_zh-CN.tar.gz
下载速度特别慢,因此我将下载的文件已上传在csdn资源中
https://download.csdn.net/download/jxlhljh/18879159

先参考着官网安装文档来进行,官网安装文档地址:https://www.openoffice.org/download/common/instructions.html#linux-rpm
在这里插入图片描述

##解压
mkdir /root/openoffice
tar -zxvf /root/Apache_OpenOffice_4.1.10_Linux_x86-64_install-rpm_zh-CN.tar.gz -C /root/openoffice
cd /root/openoffice/zh-CN/RPMS
yum localinstall *.rpm
cd /root/openoffice/zh-CN/RPMS/desktop-integration
yum localinstall openoffice4.1.10-redhat-menus-4.1.10-9807.noarch.rpm

##安装成功后,会在 /opt目录下生成openoffice4文件夹, 即/opt/openoffice4

##添加字体库(ps:不然会出现转换中文字体乱码或直接不显示中文字体)
在 /usr/share/fonts 目录下新建文件夹,windowfonts,如图
在这里插入图片描述
##如果上面的步骤中发现找不到/usr/share/fonts目录说明部分依赖没安装,增加以下依赖安装

yum install libXext.x86_64
yum groupinstall "X Window System"

然后将我们windows系统得字体库文件拷贝到windowfonts下,windows字体库路径如下图
在这里插入图片描述
##启动服务,启动命令为:

/opt/openoffice4/program/soffice.bin -headless -accept="socket,host=0.0.0.0,port=8100;urp;" -nofirststartwizard & ##查看进程
ps -ef|grep openoffice4##或者
netstat -luntp|grep 8100

至此,安装并启动OpenOffice的服务完成,接下来进行Java调用测试

二、Java使用Openoffice进行word转Pdf,并进行预览试验。

1.进行单元测试

编写OpenOfficeTransferTest单元测试类

package openofficetest;import java.io.File;import org.junit.Test;
import org.slf4j.Logger;
import org.slf4j.LoggerFactory;import com.artofsolving.jodconverter.DocumentConverter;
import com.artofsolving.jodconverter.openoffice.connection.OpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.connection.SocketOpenOfficeConnection;
import com.artofsolving.jodconverter.openoffice.converter.StreamOpenOfficeDocumentConverter;public class OpenOfficeTransferTest {private Logger logger = LoggerFactory.getLogger(this.getClass());private String connectIp = "192.168.56.101";private int connectPort = 8100;// word转pdf,使用openoffice进行转换@Testpublic void wordToPdfTest() {OpenOfficeConnection connection = null;logger.info("connecting start...");try {connection = new SocketOpenOfficeConnection(connectIp, connectPort);connection.connect();logger.info("connected...> " +connection);DocumentConverter converter = new StreamOpenOfficeDocumentConverter(connection);logger.info("convert starting.....");long startMs = System.currentTimeMillis();converter.convert(new File("D:\\temp\\1.docx"), new File("D:\\temp\\1.pdf"));long endMs = System.currentTimeMillis();logger.info("convert success, spend time is : {} ms.",(endMs-startMs) );} catch (Exception e) {logger.error("", e);} finally {if(connection != null) {connection.disconnect();logger.info("connection disconnected. ");}}}}

##以上单元测试的jar包依赖如下,(有部分是直接依赖本地的jar,因为maven下载不到)

<dependencies><!-- junit start --><dependency><groupId>junit</groupId><artifactId>junit</artifactId><version>4.13</version></dependency><!-- junit end --><!-- office to pdf need install something start --><dependency><groupId>com.artofsolving</groupId><artifactId>jodconverter</artifactId><version>2.2.2</version><scope>system</scope><systemPath>${basedir}/lib/jodconverter-2.2.2.jar</systemPath></dependency><dependency><groupId>org.openoffice</groupId><artifactId>ridl</artifactId><version>4.1.2</version><scope>system</scope><systemPath>${basedir}/lib/ridl-4.1.2.jar</systemPath></dependency><dependency><groupId>org.openoffice</groupId><artifactId>juh</artifactId><version>4.1.2</version><scope>system</scope><systemPath>${basedir}/lib/juh-4.1.2.jar</systemPath></dependency><dependency><groupId>org.openoffice</groupId><artifactId>jurt</artifactId><version>4.1.2</version><scope>system</scope><systemPath>${basedir}/lib/jurt-4.1.2.jar</systemPath></dependency><dependency><groupId>org.openoffice</groupId><artifactId>unoil</artifactId><version>4.1.2</version><scope>system</scope><systemPath>${basedir}/lib/unoil-4.1.2.jar</systemPath></dependency><!-- office to pdf need install something end--><!-- commons-io start --><dependency><groupId>commons-io</groupId><artifactId>commons-io</artifactId><version>2.8.0</version></dependency><!-- commons-io end --><!-- jackson start --><dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-databind</artifactId><version>2.12.1</version></dependency><dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-core</artifactId><version>2.12.1</version></dependency><dependency><groupId>com.fasterxml.jackson.core</groupId><artifactId>jackson-annotations</artifactId><version>2.12.1</version></dependency><!-- jackson end --><!-- log start --><dependency><groupId>org.slf4j</groupId><artifactId>slf4j-api</artifactId><version>1.7.25</version></dependency><dependency><groupId>ch.qos.logback</groupId><artifactId>logback-core</artifactId><version>1.2.3</version></dependency><dependency><groupId>ch.qos.logback</groupId><artifactId>logback-classic</artifactId><version>1.2.3</version></dependency><!-- log end --></dependencies>

##不能下载到的jar如下&#xff0c;可直接在maven上搜索然后手工下载下来。
在这里插入图片描述

2.测试效果

在这里插入图片描述
转换后&#xff1a;
在这里插入图片描述

3.测试代码地址

测试代码地址&#xff1a;https://gitee.com/jxlhljh/openofficetest.git

三、Wordl转Pdf的restful服务提供&#xff08;待完成&#xff09;。

以上的单元测试由于每次都需要重新连接&#xff0c;占用资源&#xff0c;耗时太久&#xff0c;接下来再完善一个springboot的http服务工程&#xff0c;用来提供转换服务&#xff0c;并提供在线预览的功能&#xff08;待完成&#xff09;


推荐阅读
  • Java如何导入和导出Excel文件的方法和步骤详解
    本文详细介绍了在SpringBoot中使用Java导入和导出Excel文件的方法和步骤,包括添加操作Excel的依赖、自定义注解等。文章还提供了示例代码,并将代码上传至GitHub供访问。 ... [详细]
  • 如何实现织梦DedeCms全站伪静态
    本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态,以提高管理和SEO效果。全站伪静态可以避免重复URL的问题,同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式,可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具,如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]
  • 本文介绍了在开发Android新闻App时,搭建本地服务器的步骤。通过使用XAMPP软件,可以一键式搭建起开发环境,包括Apache、MySQL、PHP、PERL。在本地服务器上新建数据库和表,并设置相应的属性。最后,给出了创建new表的SQL语句。这个教程适合初学者参考。 ... [详细]
  • 本文介绍了数据库的存储结构及其重要性,强调了关系数据库范例中将逻辑存储与物理存储分开的必要性。通过逻辑结构和物理结构的分离,可以实现对物理存储的重新组织和数据库的迁移,而应用程序不会察觉到任何更改。文章还展示了Oracle数据库的逻辑结构和物理结构,并介绍了表空间的概念和作用。 ... [详细]
  • 本文介绍了在Mac上搭建php环境后无法使用localhost连接mysql的问题,并通过将localhost替换为127.0.0.1或本机IP解决了该问题。文章解释了localhost和127.0.0.1的区别,指出了使用socket方式连接导致连接失败的原因。此外,还提供了相关链接供读者深入了解。 ... [详细]
  • XML介绍与使用的概述及标签规则
    本文介绍了XML的基本概念和用途,包括XML的可扩展性和标签的自定义特性。同时还详细解释了XML标签的规则,包括标签的尖括号和合法标识符的组成,标签必须成对出现的原则以及特殊标签的使用方法。通过本文的阅读,读者可以对XML的基本知识有一个全面的了解。 ... [详细]
  • 本文介绍了在Windows环境下如何配置php+apache环境,包括下载php7和apache2.4、安装vc2015运行时环境、启动php7和apache2.4等步骤。希望对需要搭建php7环境的读者有一定的参考价值。摘要长度为169字。 ... [详细]
  • 本文介绍了一些Java开发项目管理工具及其配置教程,包括团队协同工具worktil,版本管理工具GitLab,自动化构建工具Jenkins,项目管理工具Maven和Maven私服Nexus,以及Mybatis的安装和代码自动生成工具。提供了相关链接供读者参考。 ... [详细]
  • 【shell】网络处理:判断IP是否在网段、两个ip是否同网段、IP地址范围、网段包含关系
    本文介绍了使用shell脚本判断IP是否在同一网段、判断IP地址是否在某个范围内、计算IP地址范围、判断网段之间的包含关系的方法和原理。通过对IP和掩码进行与计算,可以判断两个IP是否在同一网段。同时,还提供了一段用于验证IP地址的正则表达式和判断特殊IP地址的方法。 ... [详细]
  • SpringMVC接收请求参数的方式总结
    本文总结了在SpringMVC开发中处理控制器参数的各种方式,包括处理使用@RequestParam注解的参数、MultipartFile类型参数和Simple类型参数的RequestParamMethodArgumentResolver,处理@RequestBody注解的参数的RequestResponseBodyMethodProcessor,以及PathVariableMapMethodArgumentResol等子类。 ... [详细]
  • 小程序自动授权和手动接入的方式及操作步骤
    本文介绍了小程序支持的两种接入方式:自动授权和手动接入,并详细说明了它们的操作步骤。同时还介绍了如何在两种方式之间切换,以及手动接入后如何下载代码包和提交审核。 ... [详细]
  • JavaScript和HTML之间的交互是经由过程事宜完成的。事宜:文档或浏览器窗口中发作的一些特定的交互霎时。能够运用侦听器(或处置惩罚递次来预订事宜),以便事宜发作时实行相应的 ... [详细]
  • Android实战——jsoup实现网络爬虫,糗事百科项目的起步
    本文介绍了Android实战中使用jsoup实现网络爬虫的方法,以糗事百科项目为例。对于初学者来说,数据源的缺乏是做项目的最大烦恼之一。本文讲述了如何使用网络爬虫获取数据,并以糗事百科作为练手项目。同时,提到了使用jsoup需要结合前端基础知识,以及如果学过JS的话可以更轻松地使用该框架。 ... [详细]
  • Java和JavaScript是什么关系?java跟javaScript都是编程语言,只是java跟javaScript没有什么太大关系,一个是脚本语言(前端语言),一个是面向对象 ... [详细]
  • 本文介绍了2015年九月八日的js学习总结及相关知识点,包括参考书《javaScript Dom编程的艺术》、js简史、Dom、DHTML、解释型程序设计和编译型程序设计等内容。同时还提到了最佳实践是将标签放到HTML文档的最后,并且对语句和注释的使用进行了说明。 ... [详细]
author-avatar
七月de七月小
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有