热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

PDF.js代码的编译环境搭建以及错误处理

PDF.js代码的编译环境搭建以及错误处理-theme:smartblue  由于公司需要,需要在浏览器中展示PDF文件,虽然目前大部分浏览器中都可以使用iframe直接浏览p

theme: smartblue

  由于公司需要,需要在浏览器中展示PDF文件,虽然目前大部分浏览器中都可以使用iframe直接浏览pdf,但是这种方式就难以对pdf的显示进行配置。但这样不满足我们的需求,因此查询了相关资料,目前有两种解决方案:

  1、使用PDF.js来进行集成(目前firefox系列的浏览器中是使用的这种方案)

   2、使用WebAssembly技术,把mupdf编译成wasm模块来打开pdf文档。

  这两种方法的优劣,需要进行测试了来。

  虽然pdf.js的官网上有编译好的demo,但考虑到有可能会去修改对应的源码,因此需要自己搭建一个开发编译环境。

一、PDF.js简介

  PDF.js是使用HTML5构建的可移植文档格式(PDF)查看器。主要用于解析和渲染 PDF。
  PDF.js主要分为3层:

  ● 核心层。该层主要用于解析PDF文档。这层是基础,按照PDF文档的相关标准来构建数据,用于其他两层的调用。

  ● 显示层。该层对核心层进行了一个封装,用于获取核心层解析的文档数据值,例如文档标题、文档内容等。

  ● 展示层。用于展示显示层的数据,就是UI这一层。

二、环境概况

  现在大多数项目都是使用ubuntu16进行开发,因此我的虚拟机系统由原先的ubuntu14升级成了ubuntu16。因此我现在的机器环境是:ubuntu 16-04 LTS版本。如下图所示:

三pdf.js源码下载及编译 1、目录简介

  进入官网http://mozilla.github.io/pdf.js/,发现现在的源码都迁移到github上了。进入https://github.com/mozilla/pdf.js网站,拖到文档介绍部分,使用对应的命令进行代码迁移。但由于项目需要兼容老的firefox浏览器,我最终下载的pdf.js版本为2.5.207。下载后并进行解压缩,截图如下:
  ● docs:官网上的说明:website source code,说实话,我真心的没有搞明白这个目录的作用是什么。
  ● examples:包含了一些简单可用的demo。该目录下,按照README.md文件的操作即可进行演示。备注:有些demo运行不起来。

  ● extensions:该目录是WebExtension(扩展)的版本,里面包含chrome以及firefox的版本。

  ● external:第三方依赖库的代码。

  ● l10n: 多语言版本的按钮说明。

  ● src:源代码目录,包括core目录(核心层)、display目录(显示层)、shared目录(核心层跟显示层的之间链接库所在目录)等。

  ● test:字体、资源文件等相关测试项目。

  ● web:显示层。

  ● gulpfile.js:用于编译构建的js。

  ● package.json:指定依赖库以及对应的版本值。

  ● package-lock.json:用于锁定依赖版本的下载。

2、安装依赖库以及处理安装依赖库中出现的错误

  代码解压缩完成后,使用 npm install命令在安装pdf.js的依赖包(因为我的虚拟机同时搭建了webassembly的编译环境(https://blog.csdn.net/as3luyuan123/article/details/121648379?spm=1001.2014.3001.5502),npm对应的工具链已经安装)。中间有可能会遇到错误,这里顺便记录一下我在下载依赖包时遇到的错误。错误列表如下:

  • 这个问题是没有搭建webassembly环境下出现的,系统自带的npm以及node.js版本有点低,分别为V4.2.6和v3.5.2,不满足最新的pdf.js依赖包中node("node":"^12.20.0)的要求,错误截图如下:


  解决方法: 我为了以后更新node.js方便,直接使用curl -sL https://deb.nodesource.com/setup_14.x | sudo -E bash - 命令将node.js的下载链放入到ubuntu的下载源中去,然后使用sudo apt-get install -y nodejs命令,进行安装。安装完成后,使用node -v查看,版本为 v14.18.2,符合要求。然后继续运行npm install命令。

  • 在安装canvsa组件时,提示找不到"pixman-1"包。错误如下图所示:

      解决方法:发现是我的系统库中缺少pixman-1的开发库,因此使用apt-get命令进行安装就成。截图如下:

  • 在安装canvsa组件时,提示找不到"cario"包。错误如下图所示:

       解决方法:发现系统库中缺少cairo的开发库,因此使用apt-get命令进行安装就成。截图如下:

  • 在安装canvsa组件时,提示找不到"'pangocairo"包。错误如下图所示:

       解决方法:发现系统库中缺少pango1.0的开发库,因此使用apt-get命令进行安装就成。截图如下:

  • 在安装canvsa组件时,提示找不到"'gif_lib.h"头文件。错误如下图所示:

      解决方法:发现系统库中缺少gif的开发库,因此使用apt-get命令进行安装就成。截图如下:

    ● 在安装canvas组件时,提示"node-pre-gyp ERR! Completion callback never invoked!"的错误。备注:这个错误是编译pdf.js(2.10.377)版本遇到的,因此也记录到这里。经过查询资料发现是因为这个版本的canvas组件的安装需要sudo的权限,错误如下图所示

      解决方法:使用sudo npm install --unsafe-perm命令重新安装依赖包。截图如下:

    ● 在安装canvas组件时,有可能会提示" Error: Cannot find module 'nopt'"的错误。备注:这个错误是编译pdf.js(2.10.377)版本遇到的,因此也记录到这里。错误如下图所示:

      解决方法:原因是现在是全局安装上面的模块,需要把node-gyp模块进行全局安装。使用sudo npm install -g node-gyp命令重新安装依赖包。截图如下:

  依赖安装完成,会提示一些警告,可以忽略,不影响使用。 截图如下:

3、编译代码

  然后使用npm install -g gulp-cli命令来安装对应的编译命令。备注:加入sudo命令,有可能会报权限不足的错误。

  安装完成后,使用gulp generic来产生对应的js文件,产生后的目录是:build/generic/build/ 。截图如下:


  ● build:该目录下存储的是核心层以及显示层相关的js以及对应的资源映射。

  ● web:该目录下存储的是UI层。

  编译完成后,就可以将generic目录部署到其他服务器下去,然后启动就可以进行网页访问了。

  启动完成后,打开chrome浏览器,地址栏中输入http://localhost:8888/web/viewer.html,就可以看到打开的pdf文件,如下图所示:

  到这里为止,编译完成。这里需要注意的是:如果需要兼容老的版本浏览器,就需要使用gulp generic-legacy命令去进行编译。如果嫌弃编译出的pdf.js文件很大,则建议使用gulp minified命令,来编译压缩后的库。

  再来备注一下版本信息:经过我的详细测试,如果要兼容chrome71以前的浏览器,建议使用的最后版本是:v2.12.313 。因为后面的版本直接编译成ES6的版本以及会使用chrome71才加入的新特性:globalThis。
   后续详细研究一下pdf.js对应的接口以及相关的控制。

参考资料

1、http://mozilla.github.io/pdf.js/ pdf.js的官网地址

2、https://github.com/mozilla/pdf.js pdf.js源码位置

3、globalThis globalThis


推荐阅读
  • 页面预渲染适用于主要包含静态内容的页面。对于依赖大量API调用的动态页面,建议采用SSR(服务器端渲染),如Nuxt等框架。更多优化策略可参见:https://github.com/HaoChuan9421/vue-cli3-optimization ... [详细]
  • 本文详细介绍了如何在VSCode环境中配置Prettier工具以支持TypeScript项目,同时结合ESLint实现代码风格的一致性和自动化格式化。 ... [详细]
  • 使用 ModelAttribute 实现页面数据自动填充
    本文介绍了如何利用 Spring MVC 中的 ModelAttribute 注解,在页面跳转后自动填充表单数据。主要探讨了两种实现方法及其背后的原理。 ... [详细]
  • Docker基础入门与环境配置指南
    本文介绍了Docker——一款用Go语言编写的开源应用程序容器引擎。通过Docker,用户能够将应用及其依赖打包进容器内,实现高效、轻量级的虚拟化。容器之间采用沙箱机制,确保彼此隔离且资源消耗低。 ... [详细]
  • WebBenchmark:强大的Web API性能测试工具
    本文介绍了一款名为WebBenchmark的Web API性能测试工具,该工具不仅支持HTTP和HTTPS服务的测试,还提供了丰富的功能来帮助开发者进行高效的性能评估。 ... [详细]
  • 本文详细介绍了Java中的org.jooq.tools.json.Yytoken类的应用场景,并提供了多个实际使用的代码示例,帮助开发者更好地理解和运用这一工具。 ... [详细]
  • 探讨多种方法来确定Java对象的实际类型,包括使用instanceof关键字、getClass()方法等。 ... [详细]
  • 2023年1月28日网络安全热点
    涵盖最新的网络安全动态,包括OpenSSH和WordPress的安全更新、VirtualBox提权漏洞、以及谷歌推出的新证书验证机制等内容。 ... [详细]
  • selenium通过JS语法操作页面元素
    做过web测试的小伙伴们都知道,web元素现在很多是JS写的,那么既然是JS写的,可以通过JS语言去操作页面,来帮助我们操作一些selenium不能覆盖的功能。问题来了我们能否通过 ... [详细]
  • 本文由公众号【数智物语】(ID: decision_engine)发布,关注获取更多干货。文章探讨了从数据收集到清洗、建模及可视化的全过程,介绍了41款实用工具,旨在帮助数据科学家和分析师提升工作效率。 ... [详细]
  • 本文探讨了在AspNetForums平台中实施基于角色的权限控制系统的方法,旨在为不同级别的用户提供合适的访问权限,确保系统的安全性和可用性。 ... [详细]
  • 汇总了2023年7月7日最新的网络安全新闻和技术更新,包括最新的漏洞披露、工具发布及安全事件。 ... [详细]
  • 深入理解iOS中的链式编程:以Masonry为例
    本文通过介绍Masonry这一轻量级布局框架,探讨链式编程在iOS开发中的应用。Masonry不仅简化了Auto Layout的使用,还提高了代码的可读性和维护性。 ... [详细]
  • ArcBlock 发布 ABT 节点 1.0.31 版本更新
    2020年11月9日,ArcBlock 区块链基础平台发布了 ABT 节点开发平台的1.0.31版本更新,此次更新带来了多项功能增强与性能优化。 ... [详细]
  • Spring Security基础配置详解
    本文详细介绍了Spring Security的基础配置方法,包括如何搭建Maven多模块工程以及具体的安全配置步骤,帮助开发者更好地理解和应用这一强大的安全框架。 ... [详细]
author-avatar
逸之思
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有