热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

用于Python3x的Tesseract-OCR模块的安装错误-InstallationerrorofTesseract-OCRmoduleforPython3x

Iwanttousetesseract-ocrlibwithpython-3.4.Idownloadtesseractwithsudoapt-getinstalltes

I want to use tesseract-ocr lib with python-3.4. I download tesseract with "sudo apt-get install tesseract-ocr" and now i can use it at command line. But i want to use it with python3. But i couldn't find any tutorial for use native tesseract with python3x.

我想在python-3.4中使用tesseract-ocr lib。我用“sudo apt-get install tesseract-ocr”下载tesseract,现在我可以在命令行使用它。但我想用它与python3。但我找不到任何使用python3x本机tesseract的教程。

Actually i tried to use a wrapper like pytesseract. I download from https://code.google.com/p/python-tesseract/wiki/Python3Tesseract and install it with dpkg. I tried to import it but i get a strange error.

实际上我试图使用像pytesseract这样的包装器。我从https://code.google.com/p/python-tesseract/wiki/Python3Tesseract下载并使用dpkg安装它。我试图导入它,但我得到一个奇怪的错误。

The error message is;
"ImportError: /usr/lib/python3/dist-packages/_tesseract.cpython-34m-x86_64-linux-gnu.so: undefined symbol: _Z11GetUTF8TextPN9tesseract11TessBaseAPIE"

错误信息是; “ImportError:/usr/lib/python3/dist-packages/_tesseract.cpython-34m-x86_64-linux-gnu.so:undefined symbol:_Z11GetUTF8TextPN9tesseract11TessBaseAPIE”

I tried tesserPy wrapper for python3x. It is working good for turkish, english but not working for arabic. (I tested tesserpy for just those languages.) You can get tesserpy from that address; https://github.com/blindsightcorp/tesserpy

我试过python3x的tesserPy包装器。它对土耳其语,英语有用,但对阿拉伯语不起作用。 (我为那些语言测试了tesserpy。)你可以从那个地址得到tesserpy; https://github.com/blindsightcorp/tesserpy

and here is my error message while i run tesserpy for arabic language;

这是我运行tesserpy阿拉伯语时的错误信息;

tessdata_manager.SeekToStart(TESSDATA_INTTEMP):Error:Assert failed:in file adaptmatch.cpp, line 511

tessdata_manager.SeekToStart(TESSDATA_INTTEMP):错误:断言失败:在文件adaptmatch.cpp中,第511行

Has anybody see this kind of error message before ?

以前有人看到过这种错误信息吗?

Thanks in advance

提前致谢

1 个解决方案

#1


0  

I edit my question today and i told i could make ocr with tesserpy for english and turkish language. Most probably tesserpy works for all language. But i had still had a problem. I couldn't run tesserpy for arabic scripts. So i continued to search and found pyocr. It is working for arabic scripts also. You can clone and use it easily from git;

我今天编辑了我的问题,我告诉我可以使用tesserpy为英语和土耳其语言制作ocr。最有可能tesserpy适用于所有语言。但我还是有问题。我无法运行tesserpy阿拉伯语脚本。所以我继续搜索并找到了pyocr。它也适用于阿拉伯语脚本。你可以从git轻松克隆和使用它;

PyOcr github repository

PyOcr github存储库

I hope this issue may guide someone.

我希望这个问题可以指导某人。


推荐阅读
  • 通过使用 `pandas` 库中的 `scatter_matrix` 函数,可以有效地绘制出多个特征之间的两两关系。该函数不仅能够生成散点图矩阵,还能通过参数如 `frame`、`alpha`、`c`、`figsize` 和 `ax` 等进行自定义设置,以满足不同的可视化需求。此外,`diagonal` 参数允许用户选择对角线上的图表类型,例如直方图或密度图,从而提供更多的数据洞察。 ... [详细]
  • Python全局解释器锁(GIL)机制详解
    在Python中,线程是操作系统级别的原生线程。为了确保多线程环境下的内存安全,Python虚拟机引入了全局解释器锁(Global Interpreter Lock,简称GIL)。GIL是一种互斥锁,用于保护对解释器状态的访问,防止多个线程同时执行字节码。尽管GIL有助于简化内存管理,但它也限制了多核处理器上多线程程序的并行性能。本文将深入探讨GIL的工作原理及其对Python多线程编程的影响。 ... [详细]
  • 在 CentOS 7 中,为了扩展可用软件包的数量,通常需要配置多个第三方软件源。这些第三方源包括 EPEL、Nux Dextop 和 ELRepo 等,它们提供了大量官方源中未包含的软件包,从而增强了系统的功能性和灵活性。通过正确配置这些源,用户可以轻松安装和管理更多种类的软件,满足不同的需求。 ... [详细]
  • 【图像分类实战】利用DenseNet在PyTorch中实现秃头识别
    本文详细介绍了如何使用DenseNet模型在PyTorch框架下实现秃头识别。首先,文章概述了项目所需的库和全局参数设置。接着,对图像进行预处理并读取数据集。随后,构建并配置DenseNet模型,设置训练和验证流程。最后,通过测试阶段验证模型性能,并提供了完整的代码实现。本文不仅涵盖了技术细节,还提供了实用的操作指南,适合初学者和有经验的研究人员参考。 ... [详细]
  • 在尝试为 Unity 编译一个简单的 Java 库时,运行 `ant jar` 命令后遇到了 Java I/O 异常。具体错误信息为“无法启动程序 ${aAPT},错误代码 2”,这通常表示指定的文件或目录不存在。此问题可能是由于环境配置不正确或路径设置有误导致的。建议检查相关路径和环境变量,确保所有依赖项都已正确安装和配置。 ... [详细]
  • 技术分享:使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统
    技术分享:使用 Flask、AngularJS 和 Jinja2 构建高效前后端交互系统 ... [详细]
  • 如何将Python与Excel高效结合:常用操作技巧解析
    本文深入探讨了如何将Python与Excel高效结合,涵盖了一系列实用的操作技巧。文章内容详尽,步骤清晰,注重细节处理,旨在帮助读者掌握Python与Excel之间的无缝对接方法,提升数据处理效率。 ... [详细]
  • Unity与MySQL连接过程中出现的新挑战及解决方案探析 ... [详细]
  • 在List和Set集合中存储Object类型的数据元素 ... [详细]
  • 使用 ListView 浏览安卓系统中的回收站文件 ... [详细]
  • 利用ZFS和Gluster实现分布式存储系统的高效迁移与应用
    本文探讨了在Ubuntu 18.04系统中利用ZFS和Gluster文件系统实现分布式存储系统的高效迁移与应用。通过详细的技术分析和实践案例,展示了这两种文件系统在数据迁移、高可用性和性能优化方面的优势,为分布式存储系统的部署和管理提供了宝贵的参考。 ... [详细]
  • SSL 错误:目标主机名与备用证书主题名称不匹配
    在使用 `git clone` 命令时,常见的 SSL 错误表现为:无法访问指定的 HTTPS 地址(如 `https://ip_or_domain/xxxx.git`),原因是目标主机名与备用证书主题名称不匹配。这通常是因为服务器的 SSL 证书配置不正确或客户端的证书验证设置有问题。建议检查服务器的 SSL 证书配置,确保其包含正确的主机名,并确认客户端的证书信任库已更新。此外,可以通过临时禁用 SSL 验证来排查问题,但请注意这会降低安全性。 ... [详细]
  • C++ 开发实战:实用技巧与经验分享
    C++ 开发实战:实用技巧与经验分享 ... [详细]
  • 在开发过程中,我最初也依赖于功能全面但操作繁琐的集成开发环境(IDE),如Borland Delphi 和 Microsoft Visual Studio。然而,随着对高效开发的追求,我逐渐转向了更加轻量级和灵活的工具组合。通过 CLIfe,我构建了一个高度定制化的开发环境,不仅提高了代码编写效率,还简化了项目管理流程。这一配置结合了多种强大的命令行工具和插件,使我在日常开发中能够更加得心应手。 ... [详细]
  • 本文探讨了资源访问的学习路径与方法,旨在帮助学习者更高效地获取和利用各类资源。通过分析不同资源的特点和应用场景,提出了多种实用的学习策略和技术手段,为学习者提供了系统的指导和建议。 ... [详细]
author-avatar
尹嫱AileenDawnYin
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有