SaigeOCR®
基于深度学习的 OCR 系统
印刷文本无处不在,从财务文件到序列识别码,企业数字化转型的第一步通常是将这些印刷文本数字化。 SaigeOCR® 采用深度学习来自动检测图像中单词和文本的位置并将其转换为数字字符串。 SaigeOCR® 提取文本周围区域的曲率和其他几何信息,并在失真的情况下稳健地识别文本。 SaigeOCR® 拥有最先进的性能,可提供高效、实时、强大的 OCR 解决方案。
主要特点
1. 使用几何信息快速和稳定的检测
- 与现有的专注于检测文本位置的商业 OCR 产品不同,SaigeOCR® 提取文本区域的几何信息,例如旋转、平移位移、扭曲和曲率。 然后,SaigeOCR® 可以在“不扭曲”周围区域的前提下拉直弯曲或扭曲的文本,使其能够稳健地识别扭曲的文本。
- SaigeOCR®’的轻量级网络架构提供实时 OCR,使其成为制造业和文档处理等大批量应用的理想选择。
2. 强大的OCR数据库
虚拟 OCR 数据生成技术
- 不同的行业有不同的文本格式和印刷惯例。 例如,财务文件遵循标准格式,而在物流环境中,文本可以直接打印在产品表面上。
- SaigeOCR® 使用我们专利的 OCR 文本数据库,用一系列平直和扭曲的文本样本对神经网络进行预训练。 然后对网络进行微调以检测不同目标域中的目标文本。
3. 文档理解
- 使用从 OCR 获得的文本字符串和位置信息,SaigeOCR® 自动提取文本字符串信息并将其格式转化为用户指定的结构。
- 结合 OCR 和文档理解能力,SaigeOCR® 可将任何非结构化图像中的所需信息输出到用户指定的结构中。