TOP

图形图像敏感文字信息识别及语义分析技术
2014-01-20 17:14:21 来源: 作者: 【 】 浏览:13045
赛题简介:介绍整个赛题的思路和整体要求    社会发展进入信息时代,人们已经不再停留在自己的耳朵和眼睛去直接获得这些信息,而是使用计算机将文字自动的输入计算机。以图像为主的多媒体信息迅速成为重要的信息传递媒介,图像中的文字信息包含了丰富的高层语义信息。提取出这些文字,对于图像高层次语义的理解、索引和检索非常有帮助。
    文字识别可用于手稿的识别、检索;单据的识别;车牌识别和标牌识别;银行卡账号的识别。以及各种大、中型计算机的输入,诸如出版印刷、新闻通讯、银行、邮政、资料文献等部门使用的计算机,都有大量文字输入的问题,所以文字识别研究的突破必将显著提高这些部门的工作效率。
赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景      在保密环境中,部分非法用户会故意把电子资料或屏幕截屏存成图像格式以防止保密检查工具或反泄密、防泄漏系统检测到。因此,对图形图像文字识别技术提出了较高要求。 
      可以在图像文件上标记密级等级的字样,通过识别这些密级等级的字样。可以方便的对不同等级的图片进行分类管理。
      首先,需要提取这些图像中的文字信息,然后比对密级等级字典,对于不同等级的图像,用一种显著方式对这些图像进行区分。
功能性需求      参赛者可以在完全自主开发或在开源代码上做算法上的优化和改进。 
      1、在文字图像清晰的情况下识别率应达到85%以上(50)。 
      2、支持按中英文关键字的文字提取与识别(15)。 
      3、支持身份证号码、车牌号码、银行账号等规则信息的提取和识别(15)。 
      4、指定一个文件目录,给定一个字典,列举出包含这些关键词的所有图像,识别速度达到秒级(10)。
      5、支持jpg,png,bmp等多种图像格式(10)。
非功能性需求    支持语义理解与分析,能够按同义词、反义词等相关性进行识别。(可列为加分项,20分)
其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件      开发环境:不限
      开发语言:不限 
      操作系统:Windows XP/Windows  7/Windows 8/Linux
测试数据或平台:提供给参赛者的测试环境和测试数据。(可提供电子档)    测试用图片,可通过屏幕截屏自行准备,建议使用新浪、腾讯等门户首页、技术方案或论文等截屏。初赛及决赛时由出题企业统一准备。
其他要求提交相关文档: 
      需求规格书 
      详细描述课题的功能与非功能需求,使软件设计开发人员能够清晰地理解课题的背景、功能要求、运行环境等,使之成为整个设计开发工作的基础。
      系统设计说明书 
      详细描述软件的架构、设计理念、算法思路等。
      测试文档 
      描述测试环境的搭建、准备的测试数据、测试方法等。按照测试文档进行功能与非功能测试,对测试方案可能出现的问题进行分析和评估。 
      程序源代码, 请注明使用到的第三方代码。
      指未编译的按照一定的程序设计语言规范书写的程序代码,包括代码结构说明书。
关键字: 责任编辑:cnsoft
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到QQ空间
分享到: 
上一篇移动端(安卓或IOS)物品识别 下一篇便于单手握持使用的手机2D涂鸦软件

相关栏目