电 话:18937133779
网 址:https://www.zboao.com
邮 箱:zboao@qq.com
济南市别称泉城,是我国山东省下辖地级市,山东省省会、国家历史文化名城,环渤海地区南翼的中心城市。作为国家历史文化名城和旅游胜地,济南市积累了较为丰富的档案资源,并积极开展档案数字化扫描转型工作。
济南档案扫描服务过程中,光学字符识别(OCR)是其中一项非常重要的步骤,是数字化档案后续管理、利用和快速检索定位的基础。因此,做好OCR工作十分重要。
传统OCR 工作的不足:
一是传统OCR处理流程的工序太多,且多串行,导致错误不断被传递放大。如,在OCR处理流程中,假如每一步都是90%的正确率,看似很高,但是经过5步的错误叠加之后,结果就已经不合格了。
二是传统OCR处理流程涉及较多人工设计,并不一定能够抓住问题的本质。例如,在文字的二值化这一预处理过程中,二值化的阈值在一些情况下很难调整好。由于这个模型的复杂度较低且无法充分拟合全部数据,在实际处理过程中不得不过滤掉很多有用的信息。
三是在一些背景稍微复杂或者存在变体文字的情况下,传统OCR基本会失效,处理模型的适应性较弱。版面分析以及行切分的方式只能处理相对简单的场景,一旦面临复杂排版等情况,就很难实现准确处理。
四是对单字的识别,传统OCR无法考虑到上下文的语义关联。为了解决这个问题,传统OCR进行了很多组合,如,对识别的结果进行动态路径搜索。在路径寻优过程中,经常需要结合文字的外观特征以及语言模型进行处理,存在较多的耦合,导致在识别系统中堆砌了较多的算法。即便如此,传统OCR也存在很多无法处理的问题,如,手写字体等存在较多的笔画粘连,传统OCR很难进行切分。
人工智能OCR技术还能应用于具有多样性和复杂性的识别场景。如,不同大小、字体、颜色、亮度、对比度的文字,排列和对齐方式不相同的文字,图像的非文字区域与文字区域存在相似的纹理,低对比度、模糊断裂、残缺文字等。因此,人工智能OCR不仅能应用于文档的识别,还可应用于自然场景文字图像的识别。此外,人工智能OCR还能提高工作效率、节省大量成本。
基于此,将人工智能OCR应用在档案工作中,具有重要的作用和意义,必将成为支撑档案行业数字转型、智能升级、融合创新的重要基础。
人工智能OCR工作流程主要包括图像输入、文本检测、文本识别、人工确认、人工干预等。
首先,将需要识别的纸质档案数字化副本图像单个或批量导入OCR系统中。
其次,进行文本检测。文本检测主要是定位文字在数字图像中的位置,并进行位置标注。文本检测的方法主要有基于候选框的文本检测、基于语义分割的文本检测,以及基于两种方法的混合方法等。基于候选框的文本检测是先预生成若干候选框,之后再回归坐标和分类,最后经过NMS(非极大抑制)算法得到最终的检测结果;基于语义分割的文本检测是通过FPN(特征金字塔网络)直接进行像素级别的语义分割,并处理得到相关的坐标。再次,进行文本识别。文本识别主要是针对定位好的文字区域,识别文本的具体内容,并将图像中的一串文字转换为对应的字符。文本识别的算法可分为基于CTC(连接时序分类)技术的方法和基于注意力机制的网络模型两大类。其中,基于CTC技术的方法可以有效地捕获输入序列的下文依赖关系,同时能够很好地解决图像和文本字符对不齐的问题,但在自由度较大的手写场景下会出现识别错误。基于注意力机制的网络模型主要应用于卷积神经网络特征权重的分配上,并提高强特征的权重、降低弱特征的权重,在由图像到文字的解码过程中有天然的语义捕获能力。
然后,进行人工确认。对OCR识别后的结果进行确认,判断是否出错。在人工确认过程中,可以采用后期批量处理等灵活性较强的方式。
最后,进行人工干预,修正OCR识别结果中可能存在的错误。
综上所述,济南档案扫描服务的广泛应用,标志着档案管理从传统纸质模式向现代化、智能化模式的转变。通过专业的扫描技术和规范的整理流程,档案信息得以高效存储、快速检索和安全共享,极大地提升了档案管理的效率和安全性。未来,随着人工智能、大数据分析、云计算等前沿技术的不断融入,档案扫描服务将更加智能化、高效化。