TOP

Online Store BusinessInformation Picture and Text Extraction
2017-03-22 13:59:27 来源: 作者: 【 】 浏览:1422

Topic: Online Store BusinessInformation Picture and Text Extraction

Group A: Undergraduates or above

Topic introduction: Explaining the whole idea andrequirements of the topic

In accordance with provisions on publicity of onlinestore business license information of Measures for the Administration ofInternet Business issued by SAIC, owners of Tmall stores need to disclose thebusiness license information. However, structured handling is not available forpicture information, and the company registration number and company name inpictures need to be extracted to form structured documents.

 

Topic scenarios: Describing the business scenarios ofrelated real companies, and simplifying or extracting proper competition scenariosfrom the real ones

Where statistics on business of Tmall stores of someenterprise is required, Tmall enterprise information should be collected forstructured handling first. In the case, competitors can extract textinformation from 50 Tmall enterprise pictures provided in attachment and then deliveran Excel document gathering the information.

 

Functional requirements

1. Read the folder path of company businessinformation pictures automatically through procedures.

2. Take out pictures from the folder pathin sequence and then perform picture identification.

3. Create procedures matching pictureextracted information of different formats since pictures public on Tmall haveno fixed format.

4. Extract data about company registrationnumber and company name from pictures, and store the data in Excel, whereinsince the data needs processing, it’s essential to ensure that the extractedinformation is accurate and that the identification accuracy is up to 95% or above.

5. Deliver Excel document gathering finalidentification results in the format as follows:


Non-functional requirements

Keep the speed of identifying 50 pictures every 60seconds.

Other restrictions: Development environment, testplatform, development language, database, complier, etc. (as explicit aspossible)

Development environment operating system: Windowsor Linux

Developmentlanguage: C++ or JAVA

 

Test data or platform: Test environment and dataprovided to competitors (electronic documents are acceptable)

Original webpage picture information:


Identified data information:



Instructions about development equipment and equipmentmetrics

None

 

Other requirements

Competitors and relevant companies share intellectualproperties and codes achieved in competition.

 


关键字: 责任编辑:cnsoft
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到QQ空间
分享到: 
上一篇Intelligent QA SystemDesign And.. 下一篇Problem Enterprise PredictiveAn..

相关栏目