198
云计算
负载均衡
产品简介
产品价格
快速入门
用户指南
实践操作
常见问题
购买指南
云服务器
产品简介
计费规则
购买指导
控制台使用指南
常见问题
云数据库
产品简介
计费规则
购买指导
快速入门
连接实例
控制台使用指南
对象存储
产品简介
控制台使用指南
程序员百科
Python
百度智能云文字识别OCR是什么?

产品推荐:

1、安全稳定的云服务器租用,2核/2G/5M仅37元,点击抢购>>>

2、高防物理服务器20核/16G/50M/200G防御仅350元,点击抢购>>>

3、百度智能建站(五合一网站)仅880元/年,点击抢购>>> 模板建站(PC+手机站)仅480元/年,点击抢购>>>


本文档主要介绍OCR Android SDK的安装和使用。在使用本文档前,您需要先了解Optical Character Recognition(OCR)的基础知识,并已经开通了OCR服务。


点击申请百度智能云VIP客户,立即体验OCR文字识别>>>


接口能力

远程API能力

SDK提供了下列百度AI开放平台RESTful接口的封装:

接口名称接口能力简要描述
通用文字识别识别图片中的文字信息
通用文字识别(高精度版)更高精度地识别图片中的文字信息
通用文字识别(含位置信息版)识别图片中的文字信息(包含文字区域的坐标信息)
通用文字识别(高精度含位置版)更高精度地识别图片中的文字信息(包含文字区域的坐标信息)
通用文字识别(含生僻字版)识别图片中的文字信息(包含对常见字和生僻字的识别)
网络图片文字识别识别一些网络上背景复杂,特殊字体的文字
身份证识别识别身份证正反面的文字信息,并支持端上数据加密
银行卡识别识别银行卡的卡号并返回发卡行和卡片性质信息,并支持端上数据加密
驾驶证识别识别机动车驾驶证所有关键字段
行驶证识别识别机动车行驶证所有关键字段
车牌识别对小客车的车牌进行识别
营业执照识别对营业执照进行识别
通用票据识别对各类票据图片(医疗票据,保险保单等)进行文字识别,并返回文字在图片中的位置信息
增值税发票识别对增值税普票、专票、卷票、电子发票进行识别
出租车发票识别识别全国各大城市出租车票
VIN码识别对车辆挡风玻璃处的车架号码进行识别
火车票识别对红、蓝火车票进行识别
数字识别对图片中的数字进行提取和识别
二维码识别对二维码、条形码中对应的文字内容进行识别
飞机行程单识别对飞机行程单中的姓名、始发站、目的站、航班号、日期、票价字段进行结构化识别
机动车销售发票识别对机动车销售发票的号码、代码、日期、价税合计等字段进行结构化识别
车辆合格证识别对车辆合格证的编号、车架号、排放标准、发动机编号等字段进行结构化识别
试卷分析与识别可对作业、试卷的版面进行分析,输出图、表、标题、文本的位置,并输出分版块内容的OCR识别结果
手写文字识别对手写汉字或手写数字进行识别
护照识别支持对中国大陆居民护照的资料页进行结构化识别
户口本识别对户口本的出生地、出生日期、姓名、民族、与户主关系、性别、身份证号码等字段进行识别别
通用机打发票识别对国家/地方税务局发行的横/竖版通用机打发票的号码、代码、日期、合计金额、类型等字段进行结构化识别
医疗费用明细识别支持识别全国医疗费用明细识别
网约车行程单识别对国家/地方税务局发行的横/对各大主要服务商的网约车行程单进行结构化识别
磅单识别结构化识别磅单的车牌号、打印时间、毛重、皮重、净重、发货单位、收货单位、单号8个关键字段,现阶段仅支持识别印刷体磅单

本地质量控制能力

除了包含远程API调用能力外,安卓SDK中还集成了身份证识别的本地质量控制能力,提供给开发者本地检测身份证的功能。SDK可以先行在本地完成身份证的预判断,然后上传至服务端识别,以达成“自动扫描识别”的功能,使用时可实时检测取景框中是否包含身份证,是否存在模糊、欠/过曝等情况,并提示用户矫正,提高图片采集质量,提升识别准确率。

版本更新记录

上线日期版本号更新内容
2022.6.92.0.1修复身份证、银行卡的采集质控模块鉴权问题
2022.2.172.0.0升级安全策略,更新鉴权校验规则,需绑定应用签名 MD5 生成鉴权文件进行账号鉴权。使用此版本 SDK 建议前往 文字识别控制台-应用管理 编辑添加 Android 签名 MD5 信息
2022.1.71.4.9更新身份证、银行卡数据加密功能,新增磅单识别、网约车行程单、医疗费用明细识别功能
2021.8.51.4.7新增二维码、飞机行程单、机动车销售发票、车辆合格证、试卷分析与识别、手写识别、护照、户口本、通用机打发票识别功能
2021.2.21.4.6新增增值税发票、出租车发票、VIN码、火车票和数字识别功能
2020.12.31.4.5修复安卓10环境下的闪退问题
2018.2.81.4.2修复高精度通用文字识别调用api错误的问题
2018.2.11.4.1优化和修复了一些引起崩溃的问题;身份证本地扫描新增一个用户手动加和释放模型的类,强烈推荐用户参照demo中手动初始化和释放模型
2017.11.231.4.0新增高精度版通用文字,营业执照,通用票据接口
2017.11.21.3.3修复一个本地代码内存泄露问题,优化代码结构
2017.10.171.3.2修复token对象expireTime时间异常的问题
2017.9.211.3.1修复了一些机型下autofocus fail的错误;添加了请求接口token过期前10秒自动获取新token的逻辑;对demo界面文案做了微调
2017.8.151.3.0增加驾驶证,行驶证,车牌识别功能;修复了一个潜在内存泄露问题;身份证本地质量控制模型升级,加入完整性保证
2017.8.11.2.3ui库输出格式RGB565压缩,身份证识别参数加入压缩质量,对焦实现改为间隔自动对焦,修复了一些问题
2017.7.141.2.2配合添加身份证本地能力升级SDK的安全性,身份证识别支持自动质量控制扫描模式以及默认的拍照识别模式
2017.6.301.2.11.对SDK的安全性作出优化 2.对本地身份证输入校验功能进行升级,该功能暂时不可用
2017.6.201.2.0ocr_ui库身份证识别升级,交互修改为基于本地模型实现实时扫描判断后自动上传识别身份证
2017.5.181.1.0增加通用文字识别基础版,生僻字,网图接口的SDK接口和demo演示;移除okhttp依赖;支持x86架构CPU;略微优化了demo的交互
2017.4.131.0.2修复部分用户使用ak,sk方式无法获取token的问题
2017.3.231.0.1更新demo获取token失败的错误提示的交互
2017.3.161.0.0在线OCR第一版!



这条帮助是否解决了您的问题? 已解决 未解决

提交成功!非常感谢您的反馈,我们会继续努力做到更好! 很抱歉未能解决您的疑问。我们已收到您的反馈意见,同时会及时作出反馈处理!