热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

在Android中调用百度的OCR接口

在Android中调用百度的OCR接口,Go语言社区,Golang程序员人脉社

前言

最近实验室开了个新项目,是一个通过扫描单词后把扫描过的单词生成游戏来让小朋友记单词的APP,扫描单词这个功能需要用到OCR.
现在常用的OCR有


下面进入正文


如何在Android 中调用百度的OCR进行文字识别

1.获取百度文字识别产品服务的 Ak/Sk

1.在百度AI开放平台中进入控制台

2.找到文字识别 产品服务

3,创建应用

4,填写信息,注意这里的包名一定要和项目的包名一致

5.获得AK/SK

6.下载license文件,在项目中如果直接用AK/SK明文调用百度的OCR,很不安全,可能会被别人反编译之后获得你的AK.SK
license文件集成了AK/SK 放在项目中可以防止别人破解。

7.下载之后将获得的api.license文件放入main目录下的assets目录中


2.添加百度OCR的SDK到项目中

1.下载 百度OCR的android Sdk


2.下载的SDK压缩包将其解压,并将libs下的ocr-sdk的jar包放入项目的libs目录下

3.在main目录下新建jniLibs目录,并将libs文件夹中的其他文件放入其中

4.在app下的build,gradle中添加

将添加在libs下的sdk JAR包编译

5.这里下载的压缩包中包括了百度提供的相机扫描时的UI,在拍完照有裁剪框,比较方便,这里我们可以作为module引入项目中


3.调用百度OCR

做完准备工作我们就可以开始调用百度的OCR接口了。

首先在我们需要进行识别的页面所在的文件中创建 根据License文件初始化OCR实例的函数,并在onCreate()方法中调用

/**
* 自定义license的文件路径和文件名称,以license文件方式初始化
*/

private void initAccessTokenLicenseFile() {
OCR.getInstance(mActivity.getApplicationContext()).initAccessToken(new OnResultListener<AccessToken>() {
@Override
public void onResult(AccessToken accessToken) {
String token = accessToken.getAccessToken();
Log.d(TAG,token);
hasGotToken = true;
}
@Override
public void onError(OCRError error) {
error.printStackTrace();
alertText("自定义文件路径licence方式获取token失败", error.getMessage());
}
}, "aip.license", mActivity.getApplicationContext());
}

定义我们的打开相机事件

/**
* 打开相机,进入的相机页面是借用百度OCR 官方DEMO中的相机页面
* 能够在相机中裁剪图片,和进入图库
* @author cyd
*/

private void openCameraForResult() {
if (!checkTokenStatus()) {
return;
}
Intent intent = new Intent(mActivity, CameraActivity.class);
intent.putExtra(CameraActivity.KEY_OUTPUT_FILE_PATH,
FileUtil.getSaveFile(getActivity()).getAbsolutePath());
intent.putExtra(CameraActivity.KEY_CONTENT_TYPE,
CameraActivity.CONTENT_TYPE_GENERAL);
startActivityForResult(intent, REQUEST_CODE_GENERAL_BASIC);
}

这里的CameraActivity用的是引入OCR_UI中的相机活动,自带剪裁框

接下来需要我们新建一个可以存放OCR的识别方法的类RecognizeService

**
* 这个类是用于将拍摄或者图库中获得的图片进行识别,返回JSON格式的字符串。
*/
public class RecognizeService {
public interface ServiceListener {
public void onResult(String result);
}

//高精度版
public static void recAccurateBasic(Context ctx, String filePath, final ServiceListener listener) {
GeneralParams param = new GeneralParams();
param.setDetectDirection(true);
param.setVertexesLocation(true);
param.setLanguageType(GeneralBasicParams.ENGLISH);
param.setRecognizeGranularity(GeneralParams.GRANULARITY_SMALL);
param.setImageFile(new File(filePath));

//这里的recognizeAccurateBasic方法为百度OCR识别的核心方法
OCR.getInstance(ctx).recognizeAccurateBasic(param, new OnResultListener<GeneralResult>() {
@Override
public void onResult(GeneralResult result) {
StringBuilder sb = new StringBuilder();
for (WordSimple wordSimple : result.getWordList()) {
WordSimple word = wordSimple;
sb.append(word.getWords());
sb.append("n");
}
listener.onResult(result.getJsonRes());
}
@Override
public void onError(OCRError error) {
listener.onResult(error.getMessage());
}
});
}
}

在onActivityResult方法中,我们调用刚刚新建的类的recAccurateBasic方法,此方法接收三个参数,分别是context,拍照获取的图片路径,和在RecognizeService类中定义的监听接口,这里的获取图片路径方法,我用的是百度官方DEMO中的方法

在onResult方法中,返回的result字符串即为识别结果的json字符串,只需要对JSON解析一下就能得到识别结果啦

@Override
public void onActivityResult(int requestCode, int resultCode, Intent data) {
super.onActivityResult(requestCode, resultCode, data);
switch (requestCode) {
case REQUEST_CODE_GENERAL_BASIC:
if (resultCode == Activity.RESULT_OK) {
RecognizeService.recAccurateBasic(mActivity, FileUtil.getSaveFile(mActivity.getApplicationContext()).getAbsolutePath(),
new RecognizeService.ServiceListener() {
@Override
public void onResult(String result) {
Bundle bundle = new Bundle();
bundle.putString("wordResultJson",result );
Intent intent = new Intent(mActivity,SelectWordsActivity.class);
intent.putExtra("wordResultBundle",bundle );
startActivity(intent);
}
});
}
break;
default:
Log.d(TAG, "onActivityResult: "+"run in default");
break;
}
}

FileUtil类

public class FileUtil {
public static File getSaveFile(Context context) {
File file = new File(context.getFilesDir(), "pic.jpg");
return file;
}
}



推荐阅读
  • Iamtryingtocreateanarrayofstructinstanceslikethis:我试图创建一个这样的struct实例数组:letinstallers: ... [详细]
  • 利用Visual Basic开发SAP接口程序初探的方法与原理
    本文介绍了利用Visual Basic开发SAP接口程序的方法与原理,以及SAP R/3系统的特点和二次开发平台ABAP的使用。通过程序接口自动读取SAP R/3的数据表或视图,在外部进行处理和利用水晶报表等工具生成符合中国人习惯的报表样式。具体介绍了RFC调用的原理和模型,并强调本文主要不讨论SAP R/3函数的开发,而是针对使用SAP的公司的非ABAP开发人员提供了初步的接口程序开发指导。 ... [详细]
  • Iamtryingtomakeaclassthatwillreadatextfileofnamesintoanarray,thenreturnthatarra ... [详细]
  • Android Studio Bumblebee | 2021.1.1(大黄蜂版本使用介绍)
    本文介绍了Android Studio Bumblebee | 2021.1.1(大黄蜂版本)的使用方法和相关知识,包括Gradle的介绍、设备管理器的配置、无线调试、新版本问题等内容。同时还提供了更新版本的下载地址和启动页面截图。 ... [详细]
  • 拥抱Android Design Support Library新变化(导航视图、悬浮ActionBar)
    转载请注明明桑AndroidAndroid5.0Loollipop作为Android最重要的版本之一,为我们带来了全新的界面风格和设计语言。看起来很受欢迎࿰ ... [详细]
  • CF:3D City Model(小思维)问题解析和代码实现
    本文通过解析CF:3D City Model问题,介绍了问题的背景和要求,并给出了相应的代码实现。该问题涉及到在一个矩形的网格上建造城市的情景,每个网格单元可以作为建筑的基础,建筑由多个立方体叠加而成。文章详细讲解了问题的解决思路,并给出了相应的代码实现供读者参考。 ... [详细]
  • Imtryingtofigureoutawaytogeneratetorrentfilesfromabucket,usingtheAWSSDKforGo.我正 ... [详细]
  • 本文介绍了在iOS开发中使用UITextField实现字符限制的方法,包括利用代理方法和使用BNTextField-Limit库的实现策略。通过这些方法,开发者可以方便地限制UITextField的字符个数和输入规则。 ... [详细]
  • 本文介绍了在MFC下利用C++和MFC的特性动态创建窗口的方法,包括继承现有的MFC类并加以改造、插入工具栏和状态栏对象的声明等。同时还提到了窗口销毁的处理方法。本文详细介绍了实现方法并给出了相关注意事项。 ... [详细]
  • Android自定义控件绘图篇之Paint函数大汇总
    本文介绍了Android自定义控件绘图篇中的Paint函数大汇总,包括重置画笔、设置颜色、设置透明度、设置样式、设置宽度、设置抗锯齿等功能。通过学习这些函数,可以更好地掌握Paint的用法。 ... [详细]
  • Java容器中的compareto方法排序原理解析
    本文从源码解析Java容器中的compareto方法的排序原理,讲解了在使用数组存储数据时的限制以及存储效率的问题。同时提到了Redis的五大数据结构和list、set等知识点,回忆了作者大学时代的Java学习经历。文章以作者做的思维导图作为目录,展示了整个讲解过程。 ... [详细]
  • 自动轮播,反转播放的ViewPagerAdapter的使用方法和效果展示
    本文介绍了如何使用自动轮播、反转播放的ViewPagerAdapter,并展示了其效果。该ViewPagerAdapter支持无限循环、触摸暂停、切换缩放等功能。同时提供了使用GIF.gif的示例和github地址。通过LoopFragmentPagerAdapter类的getActualCount、getActualItem和getActualPagerTitle方法可以实现自定义的循环效果和标题展示。 ... [详细]
  • 本文介绍了Android 7的学习笔记总结,包括最新的移动架构视频、大厂安卓面试真题和项目实战源码讲义。同时还分享了开源的完整内容,并提醒读者在使用FileProvider适配时要注意不同模块的AndroidManfiest.xml中配置的xml文件名必须不同,否则会出现问题。 ... [详细]
  • 本文讨论了如何在dotnet桌面(Windows)应用程序中添加图标。作者提到可以使用dotnet命令行工具与resource.rc文件一起使用来为标准.NET核心应用程序添加图标。作者还介绍了在创建控制台应用程序时如何编辑projeto1.csproj文件来添加图标。 ... [详细]
  • 如何搭建Java开发环境并开发WinCE项目
    本文介绍了如何搭建Java开发环境并开发WinCE项目,包括搭建开发环境的步骤和获取SDK的几种方式。同时还解答了一些关于WinCE开发的常见问题。通过阅读本文,您将了解如何使用Java进行嵌入式开发,并能够顺利开发WinCE应用程序。 ... [详细]
author-avatar
借钱买黄瓜
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有