OCR文字识别

本页目录

通用文字识别

更新时间:2023-10-24 10:45:42

1.报文协议

HTTP(S) + JSON

2.接口地址

测试环境:https://test-api-open.chinaums.com/v1/brain/ocr/universal-identification-text

生产环境:https://api-lob.open.chinaums.com/v1/brain/ocr/universal-identification-text

3.报文格式

3.1 请求HTTP报文头:

参数名称 参数说明 参数类型 是否必须 备注
Authorization 认证内容 字符串 请见认证流程章节

URL参数:无

POST参数:

格式:JSON

参数名称 参数说明 参数类型 长度 是否必须 备注
picBase64 文本 字符串 图片文件的BASE64编码

3.2 响应

格式:JSON

参数名称 参数说明 参数类型 长度 是否必须 备注
data 结果 字符串
-->PageInfo 识别返回的页面信息 数组
-->PageIndex 页数信息 数字型 第一页为1,第二页为2,以此类推
-->ErrorCode 返回值 数字型 0成功,其他值失败
-->Time 识别时间 字符串
-->ResultList 返回结果数组 数组
-->pid 证件对应类型pid 数字型
-->type 证件类型 字符串
-->ocr_error_code 识别响应状态码 数字型 0代表识别成功
-->FieldList 识别返回的数据结果集 数组
-->direct 图片方向 数字型
-->angle 图片角度 数字型
-->key 英文字段名称 字符串
-->chn_key 中文字段名称 字符串
-->value 对应字段识别结果 字符串
-->score 置信度 数字型 (0-100)
-->color color 数字型 0:未检测到1: black 2: red 3:blue
-->shape shape 数字型 0:未检测到1:circle 2:ellipse 3:rect 4: other
-->is_image 是否为图片base64 数字型 1:是 0:不是
-->position 数组
-->left 数字型 位置信息
-->top 数字型 位置信息
-->width 数字型 位置信息
-->height 数字型 位置信息
-->quad 四点坐标 数组 区域四个 点(左 上、右 上、左 下、右 下)的坐 标
errCode 返回码 字符串 20
errInfo 返回码说明 字符串 256

通用识别-文本特有字段

格式:JSON

参数名称 参数说明 参数类型 长度 是否必须 备注
PageInfo 识别返回的页面信息 数组
Result 识别返回结果数 数组
ErrorCode 返回值 数字型 0成功,其他值失败
Time 识别时间 字符串 单位:ms
PageIndex 页数信息 数字型 第一页为1,第二页为2,以此类推
UniversalData 返回结果json数据 数组
filePath 源文件路径 字符串 目前都设置为null
PageData 返回识别的json数据数组 数组
pageNo 页码 数字型
pageWidth 页宽 数字型
pageHeight 页高 数字型
direction 方向 数字型
angle 角度 数字型
horRes 水平分辨率 数字型
verRes 垂直分辨率 数字型
RowData 行识别结果 数组
word 识别字段 字符串
type 行类型 数字型 0-文本 1-表 格
parse 语法解析 数字型 0代表为图片 解析识别(pdf先拆分成图片再识别)
left 数字型 位置信息
top 数字型 位置信息
width 行宽 数字型 位置信息
height 行高 数字型 位置信息
score 置信度 数字型 (0-100)
CellData 区域识别结果 数组
subword 单字符信息 数组
row 行信息 数字型
col 列信息 数字型
row_no 单元格起始行信息 数字型
col_no 单元格起始列信息 数字型
SubRowData 表格字段行识别内容 数组
SubCellData 表格字段区域识别内容 数组
< 上一篇:OCR能力清单
下一篇: 手写体识别 >