当前位置: 开发笔记 > 编程语言 > 正文

[从零开始]用python制作识图翻译器·二

作者：tantyana428_673 | 来源：互联网 | 2023-06-12 10:31

AlsoEasy-RecognitionTranslator需求分析系统分析功能拆解工程语言选择技术可行性分析具体实现需求分析见上篇[从零开始]用python制作识图翻译器一上篇分

AlsoEasy-RecognitionTranslator

需求分析
系统分析
- 功能拆解
- 工程语言选择
- 技术可行性分析
具体实现

需求分析

见上篇[从零开始]用python制作识图翻译器·一

上篇分析了该产品的需求以及市场上的可行性&＃xff08;没有被吊打的竞品&＃xff09;。而本篇将着重于分析如何实现。

系统分析

功能拆解

我们将一整个流程细化分成以下几个步骤&＃xff0c;并分析每步涵盖的技术&＃xff0c;一步步探索其可行性。

划定屏幕固定区域&＃xff08;用qq截图演示效果&＃xff09;

作用&＃xff1a;通过鼠标点击和松开确定识别区域的对角线坐标&＃xff1b;
相关技术&＃xff1a;GUI、鼠标事件、键盘热键。
获取固定区域图像&＃xff08;用qq截图演示效果&＃xff09;

作用&＃xff1a;获取区域的图像以进行后续的识别操作&＃xff1b;
相关技术&＃xff1a;GUI、PIL、屏幕截图。
识别图中文字&＃xff08;用qq截图演示效果&＃xff09;
作用&＃xff1a;将区域的图像中的文字识别出来&＃xff0c;作为翻译的源文字&＃xff1b;
相关技术&＃xff1a;文字识别。
将该文字翻译成目标语言的文字&＃xff08;用百度翻译演示效果&＃xff09;
作用&＃xff1a;将识别的到的文字翻译为目标语言的文字&＃xff1b;
相关技术&＃xff1a;机器翻译。
显示在某一区域&＃xff08;用qq截图演示效果&＃xff09;
作用&＃xff1a;将翻译的结果反馈到屏幕上&＃xff1b;
相关技术&＃xff1a;GUI、文本框。

工程语言选择

因为项目可能含有“文本识别”、“机器翻译”等人工智能方向的功能&＃xff0c;所以选择python作为基础编程语言&＃xff0c;后续的技术选择和分析会更有偏向性。

技术可行性分析

在将功能拆解以后&＃xff0c;整个产品的制作方式就变得非常清晰了&＃xff0c;现在我们只用从下至上一步步验证实现技术的可行性就行了。&＃xff08;从上到下发现最后一步翻译的技术难如登天的话那也太蛋疼了&＃xff09;

文字显示
稍微搜索就会发现用GUI就能实现。python的GUI有&＃xff1a;wxPython、pyQt、Tkinter……前端思维就是新建一个显示特定文字的box&＃xff0c;实现起来没什么难度。
机器翻译
机器翻译也是有很多种的&＃xff0c;比较古早的是基于符号系统的&＃xff0c;现在的主流方向都是人工智能方向&＃xff0c;网上有一些公开的模型&＃xff0c;一些大公司也对外开放了免费翻译API。百度的就很好用&＃xff0c;使用教程见&＃xff1a;python调用百度通用翻译API进行翻译。测试效果如下&＃xff1a;
文字识别
文字识别技术和机器翻译一样&＃xff0c;现在的主流方向都是人工智能方向了&＃xff0c;识别率高&＃xff0c;识别速度快&＃xff0c;网上同样有丰富的开源资源&＃xff0c;如&＃xff1a;TesseractOCR、EasyOCR、BaiduOCR、PaddleOCR……其中飞桨的PaddleOCR甚至提供了详细的模型训练的教程&＃xff1a;这是PaddleOCR在gitee上的代码仓库&＃xff0c;其中附带了详细的训练教程。测试效果如下&＃xff1a;
截图
用python中PIL库的ImageGrab.grab方法即可获取指定位置&＃xff0c;指定大小的矩形区域截图&＃xff08;当然必须是最顶层窗口的&＃xff0c;我没找到像腾讯会议那种直接获取进程窗口句柄的方法)。测试效果如下&＃xff1a;
确定矩形对角线
没想到这一步才是让我反复碰壁的。以前端思想&＃xff0c;就是在按快捷键后监听鼠标的按压和松开事件&＃xff0c;分别获取发生两个事件时的鼠标坐标就能确定要截图的矩形区域了。但是&＃xff0c;python中鼠标事件的库pyhook的版本2因安全性问题用不了了&＃xff0c;而pyhook3的python版本要求3.10以上&＃xff0c;和PaddleOCR要求的版本冲突了&＃xff0c;总之就是用不了。后面我想到一个办法&＃xff0c;可以利用GUI轻松实现&＃xff1a;在触发快捷键后&＃xff0c;直接生成一个覆盖全屏并置顶的半透明窗口&＃xff0c;通过点击这个矩形可以轻松获取当时的鼠标位置。测试效果如下&＃xff1a;

以上&＃xff0c;我们通过简单的测试确认了每一步的关键技术是可行的&＃xff0c;接下来只用着重于将各个模块实现并组合在一起即可。

具体实现

见下期&＃xff1a;[从零开始]用python制作识图翻译器·三。

推荐阅读

paddle
理工科男女不容错过的神奇资源网站

十一长假即将结束，你的假期学习计划进展如何？无论你是在家中、思念家乡，还是身处异国他乡，理工科学生都不容错过一些神奇的资源网站。这些网站提供了丰富的学术资料、实验数据和技术文档，能够帮助你在假期中高效学习和提升专业技能。 ... [详细]

蜡笔小新 2024-11-01 11:51:44
paddle
从零开始使用Python Flask构建鱼书应用：高级编程指南

本课程详细介绍了如何使用Python Flask框架从零开始构建鱼书应用，涵盖高级编程技巧和实战项目。通过视频教学，学员将学习到Flask的高效用法，包括数据库事务处理和书籍交易模型的实现。特别感谢AI资源网提供的课程下载支持。 ... [详细]

蜡笔小新 2024-10-31 08:56:47
paddle
Python爬虫技术深度解析：从B站海量数据中挖掘热门UP主的成功秘诀

本文深入解析了 Python 爬虫技术在 B 站数据挖掘中的应用，通过分析海量用户行为和内容数据，揭示了热门 UP 主成功的背后因素。Python 作为一种强大的编程语言，其面向对象和解释执行的特点使其成为数据抓取和处理的理想选择。文章详细介绍了如何利用 Python 爬虫技术获取 B 站的数据，并通过数据分析方法，探讨了热门 UP 主的创作策略和互动模式，为内容创作者提供了有价值的参考。 ... [详细]

蜡笔小新 2024-10-25 10:41:59
hook
开发笔记:Webpack5 搭建 Vue3 + TS 项目

篇首语：本文由编程笔记#小编为大家整理，主要介绍了Webpack5搭建Vue3+TS项目相关的知识，希望对你有一定的参考价值。 ... [详细]

蜡笔小新 2024-10-14 15:11:37
hook
【API 进阶之路】做 OCR 文字识别，谁说必须要有 AI 工程师？

摘要：有些功能还真不能光凭自己的直觉和认识，来自一线的声音才是最真实的用户需求。比方说名片录 ... [详细]

蜡笔小新 2024-10-11 19:18:19
hook
Vue生产环境调试的方法步骤

开发环境下Vue会提供很多警告来帮你对付常见的错误与陷阱,而在生产环境下,这些警告语句却没有用,反而会增加应用的体积,下面这篇文章主要给大家介绍了关于Vue生产环境调试的方法步骤, ... [详细]

蜡笔小新 2024-09-26 11:04:53
object
是否可以创建一个struct实例数组？ - Is it possible to create an array of struct instances?

Iamtryingtocreateanarrayofstructinstanceslikethis:我试图创建一个这样的struct实例数组：letinstallers: ... [详细]

蜡笔小新 2023-12-10 15:09:37
object
聊聊中国人工智能科技产业区域竞争力分析及趋势

原文链接：聊聊中国人工智能科技产业区域竞争力分析及趋势最近看了一个关于国内AI的报告《中国新一代人工智能科技产业区域竞争力评价指数（2021ÿ ... [详细]

蜡笔小新 2023-10-13 11:56:40
range
世界人工智能大赛OCR赛题方案！

Datawhale干货作者：阿水，北京航空航天大学，Datawhale成员本文以世界人工智能创新大赛（AIWIN）手写体OCR识别竞赛为实践背景，给出了OCR实践的常见思路和流 ... [详细]

蜡笔小新 2023-10-11 18:31:00
range
华为200万年薪招聘AI应届生——有多少本事，给多少钱

据新浪科技报道，阿里AIlabs年薪百万美元引进两位科学家。除AI顶尖科学家外，华为也是为多位AI应届博士开出了200万的高价年薪。19年9月，各大互联招聘企业陆续发布2019年人 ... [详细]

蜡笔小新 2023-10-11 14:19:53
range
百度AI的2020

百度AI的2020-世界的2020，是充满不确定性的变局之年；中国的2020，是团结一心、共克时艰、于变局中开新局的希望之年；百度AI的2020，是坚定信念，拥抱变化，践行“科技为 ... [详细]

蜡笔小新 2023-10-10 21:47:29
range
2018年热门趋势：轻松几步构建高效智能聊天机器人

2018年，构建高效智能聊天机器人的简易步骤成为行业焦点。作为AI领域的关键应用，聊天机器人不仅被视为企业市场智能化转型的重要工具，也是技术变现的主要途径之一。随着自然语言处理技术的不断进步，越来越多的企业开始重视并投资于这一领域，以期通过聊天机器人提升客户服务体验和运营效率。 ... [详细]

蜡笔小新 2024-10-28 12:59:49
utf-8
如何在jieba分词中加自定义词典_常见中文分词包比较

1jiebajieba.cut方法接受三个输入参数:需要分词的字符串；cut_all参数用来控制是否采用全模式；HMM参数用来控制是否使用HMM模型ji ... [详细]

蜡笔小新 2024-10-11 12:27:39
utf-8
【OCR学习笔记】What Is Wrong With Scene Text Recognition Model Comparisons Dataset and Model Analysis

文章目录摘要细节开源代码摘要提出了一个统一的四阶段STR框架。Transformation：TPS，归一化字符区域到预定义的矩形，校正图像。Featureextraction ... [详细]

蜡笔小新 2023-10-15 18:16:55
utf-8
以赛促学，飞桨助力大学生智能车竞赛升级！

点击左上方蓝字关注我们第十六届智能汽车竞赛-百度人工智能创意赛道已经开启！比赛虽好，但同学们苦核心开发硬件久矣！百度飞桨作为大赛的赞助商之 ... [详细]

蜡笔小新 2023-10-11 13:22:52

tantyana428_673

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章