1.对数字图像部分进行处理
预处理部分同样需要,步骤与选择题模块相似,但目的不同,文字部分主要将数字变粗,便于识别。其实也就是和选择题模块相比变了几个参数
NumImg=cv2.blur(thresh,(15,15))
NumImg=cv2.threshold(NumImg, 170, 255, cv2.THRESH_BINARY)[1]
2.调用百度ocr api
试过多种检测方式,还是用别人家现成的好http://apistore.baidu.com/
百度api使用方法:
首先需要注册一个百度云账号,这样在个人中心里就会看到apikey。这个就是和百度进行交流的钥匙。然后找到百度ocr的入口找到接口地址。虽然这里给出了但还是可以看下文档,里面有些细节,比如图片想免费就要300k以内。上面给的python示例代码是py2的,这里给出py3的方式(http://apis.baidu.com/idl_baidu/baiduocrpay/idlocrpaid)
import sys, urllib, json
import urllib.request
import urllib.parse
import base64
url = 'http://apis.baidu.com/idl_baidu/ocridcard/ocridcard'
data = {}
data['fromdevice'] = "pc"
data['clientip'] = "10.10.10.0"
data['detecttype'] = "LocateRecognize"
data['languagetype'] = "ENG"#英文模式
data['imagetype'] = "1"
#图片在本地
file_object = open('T.png','rb')
try:
img = file_object.read( )
finally:
file_object.close( )
data['image'] =base64.b64encode(img)
decoded_data = urllib.parse.urlencode(data)
decoded_data = decoded_data.encode('utf-8')
req = urllib.request.Request(url,decoded_data)
req.add_header("Content-Type", "application/x-www-form-urlencoded")
req.add_header("apikey", "这里填入个人中心的apikey")
resp = urllib.request.urlopen(req)
content = resp.read()
if(content):
content = json.loads(content.decode())
print(content)
3.切割图片
根据具体情况需要切割图片才能让百度api识别,具体限制因素还是图片大小,切割方式,这里只给出示例
#切割具体位置[起始y:终止y,起始x:终止y]
tempimg1=img[240:461,213:939]
#图片切割,width,height分别填入目标宽高
tempimg1 = cv2.resize(tempimg1, (width, height), cv2.INTER_LANCZOS4)
#图片保存,png,jpg格式均可
cv2.imwrite("T.png", tempimg1)
之后调用,若识别为英文需要转化,比如可能将0识别为D,这时转换即可,如:
def temp(char):
if(char=='D'):
return '0'
效果如图展示
当然若是能想办法去掉答题卡外围边框效果应该会更好……