让机器人“读懂文字”!中关村科金得助OCR平台上线

机器人“读懂文字”!中关村科金得助OCR平台上线来源:南早网  过去,每到月末,公司财务都会犯愁,面对一堆发票,增值税发票、火车票、行程单、船票、出租车票、小票等,手工录入耗费大量时间。现在,财务再也不用为陷入海量票据而发愁,因为有了 OCR技术。  近日,中关村科金基于自研的机器视觉和NLP技术,发布了一站式全流程文字识别产品“得助OCR平台”。该平台赋予机器能够读懂文字能力,不仅可识别海量票据信息并批量导出,提升企业日常办公场景下资料录入整理和审核的效率,而且可以自定义文字识别模型,让企业掌握关键技术且自主可控、精度高,响应快。  OCR需求大,自建OCR平台面临诸多挑战  OCR (Optical Character Recognition,光学字符识别)是指针对印刷体字符,采用光学的方式将纸质文档中的文字转换成为黑白点阵的图像文件,并通过识别软件将图像中的文字转换成文本格式,供文字处理软件进一步编辑加工的技术。  随着各行各业数字化转型提速,涉及凭证票证类别的需求不断增加,业务人员每天面对大量繁杂、重复的信息录入和流程审核工作,OCR需求压力越来越大,企业亟需建设自身的OCR平台,但面临定制成本高、核心模型管理不能自主掌控、效果迭代不及时等诸多挑战。  中关村科金推得助OCR平台,助力企业降本增效  针对行业痛点,中关村科金推出的得助OCR平台,即使零算法经验人员,基于自身业务场景数据,通过该平台随时可以迭代专属模型,快速提升企业数字化能力!  该平台采用自研机器视觉和NLP技术,通过内置智能图像预处理、文字检测、文字识别和多模态结构化分析等四大引擎,从而提升人工录入文字和业务审核效率,实现企业降本增效,助力企业数字化转型。  平台包含4大产品矩阵:OCR自训练平台、SAAS能力平台、原子算法库和垂直场景解决方案,可以提供全场景、高精度的文字识别服务。其中,OCR自训练平台,面向0算法经验人员实现一站式全流程模型管理能力,通过私有化部署到自身业务场景,随时可以迭代专属模型,解决模型迭代依赖技术供应商、模型精度不能持续提升、数据安全合规、业务响应慢等痛点,让企业实现真正意义自定义OCR模型能力,掌握关键技术且自主可控。  该平台可以自定义文字识别模型,具备自主掌控、识别精度高、数据安全合规、业务响应快四大优势:  1、企业可自主掌控核心技术,不依赖技术商  传统OCR解决方案,面对新的业务场景OCR需求,需要依赖技术供应商,核心技术无法自主掌控。通过使用自训练工具,不管是固定版式还是复杂版式需求,都可以自主生产需要的模型。  2、识别精度高,提升业务效率,节省人力  通过自主训练的模型,完全适配自身业务场景数据,做到完全量身定制的产品,更好的服务自身业务。另外平台内置了经过真实场景验证的OCR预训练模型,清晰文本识准确率95%以上,助力提升业务效率,节省人力成本。  3、数据安全合规,有效防范泄露风险  模型在生产环境使用过程中,会出现精度下降的问题。如何迭代模型效果,传统做法将数据交给技术供应商进行优化算法,存在数据泄露风险。  4、业务响应快,快速赋能业务  传统模型迭代过程,需要经过需求沟通、招标、POC测试、投标、交付实施等全流程,迭代周期非常长。面对紧迫的业务需求,如何最快获得优化好的模型?通过自训练模型,业务人员随时可以迭代模型效果,0秒延迟启动算法优化,交付周期预计缩短80%以上,快速赋能业务。  得助OCR平台可适用于银行票据处理、合同文档、身份验证、交通票据等80+场景,帮助企业快速提升业务效率,节省人力成本,推动企业数字化转型发展。  以银行票据信息录入为例,银行票据种类多,人力成本投入巨大。针对数据标注过程枯燥繁琐、机械性高,大量训练数据需要人工标记,时间金钱成本昂贵问题,通过内置智能半自动标注工具,标注员只需要简单审核机器标注数据即可完成任务,标注效率提升50%以上,有效节省了人力成本。  对于深度学习训练数据需求大问题,平台内置数据合成工具,后台自动生成超过100倍级人工标注量的合成数据加入模型训练,提升模型效果,文字识别精度高达96%以上,相比传统方案,至少提升5个百分点。  通过得助OCR自训练工具可视化界面可完成数据标注、模型训练、评价、测试及部署上线全流程,实现自主掌控关键技术,节省人力成本,提升业务效率,加速企业持续规模化数字化转型。  未来,中关村科金得助OCR平台将根据自身在银行、保险、证券、信托、教育、医疗、智能制造等领域的深耕经验,不断开拓和深入更多的应用场景,依托强大的NLP算法和机器视觉技术,洞悉用户所需,快速响应行业需求,确保高精度OCR识别效果,用更具前瞻性的人工智能科技赋能千行百业数字化发展。

THE END
分享
二维码
< <上一篇
下一篇>>