TOP

网店工商信息图片文字提取
2018-02-08 15:32:30 来源: 作者: 【 】 浏览:1068

第七届“中国软件杯”大学生软件设计大赛

赛题名称: 网店工商信息图片文字提取

组类: A 本科及以上  

赛题简介:介绍整个赛题的思路和整体要求

根据国家工商总局《网络交易管理办法》要求对网店营业执照信息进行公示,天猫网店经营者营业执照信息会在天猫店铺上以图片形式进行公示,但图片信息不能进行结构化处理,需要提取出图片中的企业注册号、企业名称形成结构化文档。

赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景

如果需要统计某家企业在天猫平台的网店经营情况,就需要先把天猫平台的企业信息采集下来进行结构化处理。参赛者可以用附件提供的天猫平台上采集的50家企业图片作为测试数据,提取出文字信息后汇总进Excel作为交付文件。

功能性需求

1、程序能够自动读取企业工商信息图片所在的文件夹路径。

2、从图片文件夹路径中顺序取出图片进行识别。

3、因为天猫平台公示的图片内容没有固定格式,所以需要程序能匹配不同格式的图片内容提取信息。

3、能够提取出图片中的企业注册号、企业名称数据项,并保存进Excel中,因为企业注册号、企业名称数据项要进行分析处理,所以需要保证提取信息的准确性,识别准确率需要保证在95%以上。

3、 最终的识别结果以一份汇总的Excel交付,格式如下:

非功能性需求

识别速度保持在60秒识别50张图片

其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件(请尽量明确)

开发环境操作系统:Windows 和 Linux均可

开发语言:C++、JAVA 

 

测试数据或平台:提供给参赛者的测试环境和测试数据。

(可提供电子档)

网页原始图片信息:

 

识别后数据信息:


开发所需设备及设备指标需求说明

暂无

其他要求

参赛人员与企业共享知识产权和成果代码


测试数据:

A5测试数据.rar


答疑老师联系方式:

李永伟 liywei@inspur.com





关键字: 责任编辑:cnsoft
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到QQ空间
分享到: 
上一篇智能问答系统设计与开发 下一篇基于企业进销项发票数据的异常企..

相关栏目