我的位置: 上观号 > 上海宝山 > 文章详情

这家宝山企业的文档解析“黑科技”获奖了!

转自:上海宝山 2025-09-25 20:31:37

2025年“数据要素×”大赛上海分赛自启动以来,吸引了全市众多优秀项目参与角逐。来自环上大科技园的上海守扣科技有限公司凭借“SoMark文档智能”项目,以其在非结构化文档数据处理方面的领先技术与创新应用,荣获开放性创新赛道“最具技术创新奖”。

该项目是数据要素在文档智能化处理与多模态信息融合领域的创新实践,通过AI驱动的文档解析与结构化输出,实现对海量非结构化文档数据的高效治理与价值挖掘,为金融、法律、政务、医疗等多个行业提供标准化、智能化的文档处理解决方案。

SoMark文档智能具备多元素、细粒度的文档解析能力,支持页眉、页脚、文字、表格、公式、目录、参考文献、化学式等21类文档元素的精准识别与坐标回溯,适配多种常见文档版式类型。团队全自主创新研发的OXR算法有效平衡了非结构化数据解析速度与准确率,实现对长文档的快速处理与高质量结构化输出,在保证单字符识别准确率的同时兼顾整体版面语义理解,满足高精度、高效率的文档处理需求。

在应用层面,该项目已成功服务于金融合同解析、法律文书处理、政务档案数字化、医疗病历结构化、物流单据识别等多个场景,助力企业实现文档数据的自动化录入、跨语言处理与关键信息提取,大幅降低人工成本与错误率。同时,该平台还可为大型语言模型(LLM)提供高质量、结构化的训练语料,有效缓解公开结构化数据资源短缺问题。在RAG文档问答场景中,产品能够高效处理法律、金融、医疗等领域的合同、研报、病历等专业文档,提升智能问答与内容总结能力,为专业人士提供高效工具支撑。

作为一家专注于文档智能领域的AI研发企业,上海守扣科技致力于推动非结构化数据向高价值数据资产的转化。未来,公司将继续深化数据要素在多元场景中的创新应用,拓展智能文档处理技术的融合边界,助力构建更加高效、智能的数据应用新生态。

编辑:王之仪(实习)

资料:区数据局

*转载请注明来自上海宝山官方微信