当前位置: 开发笔记 > 编程语言 > 正文

pythonocr识别,OCR识别概述Python图像操作,ocr,总结,python,图片

作者：更东陌飞絮蒙蒙 | 来源：互联网 | 2023-08-23 23:42

本周使用了百度的OCR图片识别服务，遇到了一些问题，这里总结一下。其中api中说明识别限制：1.图片分辨率不高于4096*40962.图片

本周使用了百度的OCR图片识别服务&＃xff0c;遇到了一些问题&＃xff0c;这里总结一下。

其中api中说明识别限制&＃xff1a;

1.图片分辨率不高于4096*4096

2.图片 base64编码后小于4M

超过后&＃xff0c;需要重新上传

针对这两个要求做一下图片处理&＃xff0c;主要使用python的PIL包

思路主要是&＃xff1a;超过限制的就缩小图片分辨率

1.图片分辨率不高于4096*4096

from PIL import Image

#等比例缩小

def process_image(filename, mwidth&＃61;4000, mheight&＃61;4000):

image &＃61; Image.open(filename)

w, h &＃61; image.size

if w <&＃61; mwidth and h <&＃61; mheight:

print(filename, &＃39;is OK.&＃39;)

return

if (1.0 * w / mwidth) > (1.0 * h / mheight):

scale &＃61; 1.0 * w / mwidth

new_im &＃61; image.resize((int(w / scale), int(h / scale)), Image.ANTIALIAS)

else:

scale &＃61; 1.0 * h / mheight

new_im &＃61; image.resize((int(w / scale), int(h / scale)), Image.ANTIALIAS)

new_im.save(filename)

new_im.close()

im &＃61; Image.open(local_img_path)

width, length &＃61; im.size[0], im.size[1]

if width > 4096 or length > 4096:

print(&＃39;img长宽&＃39;, width ,length)

process_image(local_img_path)

2.图片 base64编码后小于4M

def get_file_content(file_path):

&＃39;&＃39;&＃39;

读取文件内容,file_path可能为图片地址

:param file_path:

:return:

&＃39;&＃39;&＃39;

with open(file_path, &＃39;rb&＃39;) as fp:

return fp.read()

image &＃61; get_file_content(local_img_path)

data &＃61; base64.b64encode(image)

img_limit &＃61; 4 * 1024 * 1024

if len(data) > img_limit:

print(&＃39;之前base64字节长度&＃39;, len(data), "> 4M ")

process_image(local_img_path,3000,3000)

image &＃61; get_file_content(local_img_path)

data &＃61; base64.b64encode(image)

print(&＃39;之后base64字节长度&＃39;,len(data))

图片操作总结&＃xff1a;

PIL提供了通用的图像处理功能&＃xff0c;以及大量的基本图像操作&＃xff0c;如图像缩放、旋转、颜色转换等。

基本图像操作和处理(python)

图片保存本地

python3中urllib.request模块提供的urlretrieve()函数。urlretrieve()方法直接将远程数据下载到本地。

import urllib.request as request

local_img_path &＃61; &＃39;temp_img.jpg&＃39;

request.urlretrieve(img_url, local_img_path)

推荐阅读

get
树莓派语音控制的配置方法和步骤

本文介绍了在树莓派上实现语音控制的配置方法和步骤。首先感谢博主Eoman的帮助，文章参考了他的内容。树莓派的配置需要通过sudo raspi-config进行，然后使用Eoman的控制方法，即安装wiringPi库并编写控制引脚的脚本。具体的安装步骤和脚本编写方法在文章中详细介绍。 ... [详细]

蜡笔小新 2023-12-12 03:02:49
get
Android自定义控件绘图篇之Paint函数大汇总

本文介绍了Android自定义控件绘图篇中的Paint函数大汇总，包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数，可以更好地掌握Paint的用法。 ... [详细]

蜡笔小新 2023-12-10 23:11:57
get
Sleuth+zipkin链路追踪SpringCloud微服务的解决方案

在庞大的微服务群中，随着业务扩展，微服务个数增多，系统调用链路复杂化。Sleuth+zipkin是解决SpringCloud微服务定位和追踪的方案。通过TraceId将不同服务调用的日志串联起来，实现请求链路跟踪。通过Feign调用和Request传递TraceId，将整个调用链路的服务日志归组合并，提供定位和追踪的功能。 ... [详细]

蜡笔小新 2023-12-09 19:14:50
default
如何实现织梦DedeCms全站伪静态

本文介绍了如何通过修改织梦DedeCms源代码来实现全站伪静态，以提高管理和SEO效果。全站伪静态可以避免重复URL的问题，同时通过使用mod_rewrite伪静态模块和.htaccess正则表达式，可以更好地适应搜索引擎的需求。文章还提到了一些相关的技术和工具，如Ubuntu、qt编程、tomcat端口、爬虫、php request根目录等。 ... [详细]

蜡笔小新 2023-12-14 19:45:47
get
sklearn数据集库中的常用数据集类型介绍

本文介绍了sklearn数据集库中常用的数据集类型，包括玩具数据集和样本生成器。其中详细介绍了波士顿房价数据集，包含了波士顿506处房屋的13种不同特征以及房屋价格，适用于回归任务。 ... [详细]

蜡笔小新 2023-12-13 17:45:15
get
计算机存储系统的层次结构及其优势

本文介绍了计算机存储系统的层次结构，包括高速缓存、主存储器和辅助存储器三个层次。通过分层存储数据可以提高程序的执行效率。计算机存储系统的层次结构将各种不同存储容量、存取速度和价格的存储器有机组合成整体，形成可寻址存储空间比主存储器空间大得多的存储整体。由于辅助存储器容量大、价格低，使得整体存储系统的平均价格降低。同时，高速缓存的存取速度可以和CPU的工作速度相匹配，进一步提高程序执行效率。 ... [详细]

蜡笔小新 2023-12-13 17:32:41
get
Vue项目中结合Element UI解决连续上传多张图片及图片编辑问题

本文介绍了在Vue项目中如何结合Element UI解决连续上传多张图片及图片编辑的问题。作者强调了在编码前要明确需求和所需要的结果，并详细描述了自己的代码实现过程。 ... [详细]

蜡笔小新 2023-12-13 13:42:30
get
SpringMVC接收请求参数的方式总结

本文总结了在SpringMVC开发中处理控制器参数的各种方式，包括处理使用@RequestParam注解的参数、MultipartFile类型参数和Simple类型参数的RequestParamMethodArgumentResolver，处理@RequestBody注解的参数的RequestResponseBodyMethodProcessor，以及PathVariableMapMethodArgumentResol等子类。 ... [详细]

蜡笔小新 2023-12-11 19:55:40
get
使用JSONObiect和Gson相关方法实现json数据与kotlin对象的相互转换

本文介绍了如何使用JSONObiect和Gson相关方法实现json数据与kotlin对象的相互转换。首先解释了JSON的概念和数据格式，然后详细介绍了相关API，包括JSONObject和Gson的使用方法。接着讲解了如何将json格式的字符串转换为kotlin对象或List，以及如何将kotlin对象转换为json字符串。最后提到了使用Map封装json对象的特殊情况。文章还对JSON和XML进行了比较，指出了JSON的优势和缺点。 ... [详细]

蜡笔小新 2023-12-11 16:20:50
get
Servlet多用户登录时HttpSession会话信息覆盖问题的解决方案

本文讨论了在Servlet多用户登录时可能出现的HttpSession会话信息覆盖问题，并提供了解决方案。通过分析JSESSIONID的作用机制和编码方式，我们可以得出每个HttpSession对象都是通过客户端发送的唯一JSESSIONID来识别的，因此无需担心会话信息被覆盖的问题。需要注意的是，本文讨论的是多个客户端级别上的多用户登录，而非同一个浏览器级别上的多用户登录。 ... [详细]

蜡笔小新 2023-12-10 12:00:40
get
微信官方授权及获取OpenId的方法，服务器通过SpringBoot实现

主要步骤：前端获取到code(wx.login)，传入服务器服务器通过参数AppID和AppSecret访问官方接口，获取到OpenId ... [详细]

蜡笔小新 2023-12-10 10:54:58
get
PHP反射API的功能和用途详解

本文详细介绍了PHP反射API的功能和用途，包括动态获取信息和调用对象方法的功能，以及自动加载插件、生成文档、扩充PHP语言等用途。通过反射API，可以获取类的元数据，创建类的实例，调用方法，传递参数，动态调用类的静态方法等。PHP反射API是一种内建的OOP技术扩展，通过使用Reflection、ReflectionClass和ReflectionMethod等类，可以帮助我们分析其他类、接口、方法、属性和扩展。 ... [详细]

蜡笔小新 2023-12-09 20:45:15
get
基于移动平台的会展导游系统APP设计与实现的技术介绍与需求分析

本文介绍了基于移动平台的会展导游系统APP的设计与实现过程。首先，对会展经济和移动互联网的概念进行了简要介绍，并阐述了将会展引入移动互联网的意义。接着，对基础技术进行了介绍，包括百度云开发环境、安卓系统和近场通讯技术。然后，进行了用户需求分析和系统需求分析，并提出了系统界面运行流畅和第三方授权等需求。最后，对系统的概要设计进行了详细阐述，包括系统前端设计和交互与原型设计。本文对基于移动平台的会展导游系统APP的设计与实现提供了技术支持和需求分析。 ... [详细]

蜡笔小新 2023-12-09 20:03:30
get
H323资料

概述H.323是由ITU制定的通信控制协议，用于在分组交换网中提供多媒体业务。呼叫控制是其中的重要组成部分，它可用来建立点到点的媒体会话和多点间媒体会议 ... [详细]

蜡笔小新 2023-10-17 19:16:37
get
【Python 爬虫】破解按照顺序点击验证码(非自动化浏览器)

#请求到验证码base64编码json_img_datajson_raw.get(Vimage)#获取到验证码编码 #保存验证码图片到本地defbase64_to_img(bstr ... [详细]

蜡笔小新 2023-10-17 11:36:05

更东陌飞絮蒙蒙

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章