智能ICR解决方案立足于解决各类影像单据的字符识别，即借助自主研发的AI模型，以AI+OCR的方案解决文字高精度识别，文本内容高质量检测，结构化信息高准确度输出，从而满足文字录入、证照识别、单据识别、合同识别与对比等各类业务场景。

应用场景

单据分类

可对用户上传的各类型单据进行快速分类和归档，并根据分类结果进行结构化处理。

图像预处理

采用印章检测、印章消除、角度矫正、降噪等技术进行图像预处理，如歪斜、褶皱和印章干扰票据。

文本检测

通过预训练专属行业的文本检测模型，实现高精度的有效文本位置检测。

版面分析

对于一些有固定表格的票据，通过版面分析的辅助判断，大大提升结构化识别准确率。

文字识别

该产品文字识别模型包括400种常见的印刷体，字符集覆盖GB18030的一二级常用字符和生僻字符集以及大量手写字体样本，且能识别中英文混合的文字。

结构化输出

能对版式不一的各类合同、凭证进行分析，以最优的方式进行结构化处理，从而得到较高的结构化准确识别率。

核心模型

ICR识别模型

自主知识产权的模型，利用机器学习算法和开源框架进行深度定制开发，并通过大量文本样本和真实单据样本进行训练，识别快且准确度高，可进行二次开发和再训练。

文本监测模型

用于识别单据影像资料的文字，如角度倾斜、变形等，需要使用基于深度学习的方法进行文字检测，文本定位模型的算法和训练数据完全自有，也可进行二次开发和再训练。

印章检测/识别/去除模型

金融机构的单据上有一些印章覆盖在待识别的内容上，需要对印章进行检测，并识别其中的环形文字，再去除，避免意向被覆盖内容识别。

二值化模型

二值化就是为了自动生成二值化阈值，将图片像素灰度设置成0和1两个值。以便取得最理想的图像分析效果，从而提升文本识别率和检出率。

产品优势

ICR识别能力

ICR识别准确率高，文本定位能力、结构化输出能力突出；可进行图像预处理，解决金融行业一些影像模糊、水印干扰问题；可进行中英文印刷体识别、部分中文手写体识别、印章内容识别。

产品成熟度

提供SDK和API调用，也支持独立部署整套ICR产品系统；提供一套完整的App，包括内嵌各类型票据、单据的各类识别功能。

票证种类覆盖

提供常见的20余种票证，开箱即用；票证类型目前客制化差异较大，可提供定制化的训练服务。

智能ICR识别系统

通过AI+OCR使文字高精度识别，文本内容高质量检测，结构化信息高准确度输出