智能ICR识别系统

通过AI+OCR使文字高精度识别,文本内容高质量检测,结构化信息高准确度输出

智能ICR解决方案立足于解决各类影像单据的字符识别,即借助自主研发的AI模型,以AI+OCR的方案解决文字高精度识别,文本内容高质量检测,结构化信息高准确度输出,从而满足文字录入、证照识别、单据识别、合同识别与对比等各类业务场景。

应用场景

单据分类

可对用户上传的各类型单据进行快速分类和归档,并根据分类结果进行结构化处理。

图像预处理

采用印章检测、印章消除、角度矫正、降噪等技术进行图像预处理,如歪斜、褶皱和印章干扰票据。

文本检测

通过预训练专属行业的文本检测模型,实现高精度的有效文本位置检测。

版面分析

对于一些有固定表格的票据,通过版面分析的辅助判断,大大提升结构化识别准确率。

文字识别

该产品文字识别模型包括400种常见的印刷体,字符集覆盖GB18030的一二级常用字符和生僻字符集以及大量手写字体样本,且能识别中英文混合的文字。

结构化输出

能对版式不一的各类合同、凭证进行分析,以最优的方式进行结构化处理,从而得到较高的结构化准确识别率。

核心模型

ICR识别模型

自主知识产权的模型,利用机器学习算法和开源框架进行深度定制开发,并通过大量文本样本和真实单据样本进行训练,识别快且准确度高,可进行二次开发和再训练。

文本监测模型

用于识别单据影像资料的文字,如角度倾斜、变形等,需要使用基于深度学习的方法进行文字检测,文本定位模型的算法和训练数据完全自有,也可进行二次开发和再训练。

印章检测/识别/去除模型

金融机构的单据上有一些印章覆盖在待识别的内容上,需要对印章进行检测,并识别其中的环形文字,再去除,避免意向被覆盖内容识别。

二值化模型

二值化就是为了自动生成二值化阈值,将图片像素灰度设置成0和1两个值。以便取得最理想的图像分析效果,从而提升文本识别率和检出率。

产品优势

ICR识别能力

ICR识别准确率高,文本定位能力、结构化输出能力突出;可进行图像预处理,解决金融行业一些影像模糊、水印干扰问题;可进行中英文印刷体识别、部分中文手写体识别、印章内容识别。

产品成熟度

提供SDK和API调用,也支持独立部署整套ICR产品系统;提供一套完整的App,包括内嵌各类型票据、单据的各类识别功能。

票证种类覆盖

提供常见的20余种票证,开箱即用;票证类型目前客制化差异较大,可提供定制化的训练服务。