走到合合信息的展位,多块“龟甲”和“兽骨”吸引了记者的注意,龟甲上则刻着不少看不懂的“文字”。展台工作人员告诉记者,这是甲骨文,即中国发现最早的成熟文字,但由于所处年代过于久远,为甲骨文的信息辨认和文字检索蒙上了一层面纱,“今天来现场参展的人,没有一个人能猜出文字意思。”
那么, 智能文字识别技术能读懂甲骨文吗?记者随便抽取了一块龟甲,放置在高清扫描仪下方,点击确认键,通过后台的技术提取,屏幕上就出现了翻译结果:“买它买它,白富美”,令人忍俊不禁。工作人员告诉记者,目前这一技术处于内测阶段,这也是首次在人工智能大会上进行展示,这些甲骨文的复刻来自学术支持单位安阳殷墟景区。
要“解读”这种3600多年前的古老文字,其实并不容易。目前世界上已出土的甲骨碎片多达16万余件,但由于年代久远、残缺严重,很难有完整的信息。“随着人工智能的引进,通过图像识别技术,可以为甲骨文的自动识别、撮合,为甲骨文学者提质增效。”合合信息相关负责人告诉记者,甲骨文识别的难点在于甲骨残缺严重、素材难获取、拓片清晰度低等,这些都是需要通过技术来解决,“比如,针对样本素材少的情况,从技术层面上,我们需要解决少样本训练的问题,目前我们主要是初步研究,更多的工作还在路上。”
智能文字识别技术主要包含智能图像处理,基于深度学习的复杂场景文字识别,自然语言处理三个核心技术层。智能图像处理技术主要对用户拍摄的复杂文档图像进行预处理,使得文档图像质量得到大幅度提升。例如对图像进行增强,让图像看起来更清晰,对形变图像进行还原矫正,对图像中因光照不均产生的阴影问题进行处理,对不同角度拍摄的图像进行定位和透视变换矫正。基于深度学习的复杂场景文字识别技术主要利用合合信息自研的手写印刷混排识别,抗强干扰识别,扭曲文字识别,复杂印章和手写识别等一系列先进深度学习识别技术来解决各种不同复杂场景下的文字识别问题。而自然语言处理技术,则是对识别出的结果进行进一步的语义理解。
目前合合信息的智能文字识别技术支持中、英、俄等56种语言的文档图像、100+种证件的快读智能分类,以及全球不同国家、不同行业的卡证、票据、定制识别等多个AI场景的产品和解决方案。
作者:徐晶卉
编辑:王翔
责任编辑:唐玮婕
*文汇独家稿件,转载请注明出处。