TOP

图片认知分类系统设计与开发
2017-03-08 12:39:05 来源: 作者: 【 】 浏览:23856

 第六届“中国软件杯”大学生软件设计大赛赛题--开源赛题1

 

赛题名称: 图片认知分类系统设计与开发

组类: A 本科及以上

赛题简介:介绍整个赛题的思路和整体要求

 机器视觉作为人工智能的重要组成部分,在如今的生活中发挥着越来越重要的作用。比如图片的分类标记:它可以将海量的图片标签化,让我们能够快速的查找某一类图片。

但是机器视觉系统在训练过程中,需要通过识别已经标注好的样本来逐步提高机器视觉系统识别图片的准确性。这样就需要提前准备海量已经标注好的训练样本图片。传统的制作训练样本的方法是集中一部分人,以人工方式对图片标签化,这种方式不仅效率低,而且因为每个人具备的专业知识不一样,导致标注的质量参差不齐。

针对上述问题,我们希望能开发一款基于手机终端的“图片认知分类系统”,它能够将需要标注的原始图片有针对性地发送给愿意参与协作的志愿者,并利用志愿者的专业知识和空闲时间对原始图片进行标注,从而为机器视觉系统提供训练样本。

赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景

        一个机器视觉系统要想达到比较好的模型训练效果大约需要1万个以上的训练集图片(一张图片通常包含五六个标签),且每个标签对应的训练集图片大约需要20多张。再加上测试集的设置,大概需要10万张标签化的图片。

而10万张图片的标签化如果由专门的团队去完成是比较耗时而且完成质量不高的。但是,如果发动大量的具备专业知识的志愿者利用各自的闲散时间去完成图片的标签化,这不仅能加快训练样本库的构建过程,也能够大大提高图片的标签化质量。

因此,我们希望能开发一款基于手机终端的“图片认知分类系统”(包括客户端APP和服务器端两部分)。它能够将需要标注的原始图片有针对性地发送给愿意参与协作的志愿者,并利用志愿者的专业知识和空闲时间对原始图片进行标注,从而为机器视觉系统提供训练样本。

需要注意的是,一张图片的标签不能仅依赖于一个人,而是需要多个人共同对一张图片进行标注,并取共同的标签作为该图片的标签,这样才能保证标签的正确性。

功能性需求

用户端app1(志愿者使用):

1、提供用户个人信息管理功能。包括增、删、修改用户信息(个人基本资料、用户积分、任务完成情况等。

2、提供良好的操作界面,包括:用户登录、注册界面,图片打标签的界面。

3、查询用户的历史标签记录,在图片被系统判定为完成标签化之前,用户可修改自己的操作。

4、用户可以跳过系统推送的图片,选择自己感兴趣的图片进行打标签。

用户端app2(管理员使用):

1、管理员可以在APP界面上进行一些管理操作,比如修改用户资料、上传图片资料、导出图片标签化结果。并且能够对一些异常场景进行处理。

服务器端:

1、任务分配系统。根据策略(分配策略由参赛选手自己设计),给志愿者分派待标签的图片。

2、标签判定系统。根据不同志愿者反馈的标签,自动对同一张图片的标签集进行整理和归类,确保每张图片的标签准确。

3、图片存储索引系统。支持从图片库中快速查找指定类型的图片并读取出来。

设计要点:

1、任务分配时需要同时考虑志愿者的意愿和能力两个部分。例如:系统应该通过志愿者完成的图片,推送跟之前完成的类似图片给志愿者。图片的首次标注可以利用已有图片识别算法进行也可以直接随机推送给志愿者,由志愿者完成。具体策略由参赛选手根据自己的策略进行设计。

2、系统采纳用户标签的规则:多个用户对同一张图片进行标签化必然会产生分歧。比如:图片当中有一只金毛狗,有的人识别为狗、有的人识别为金毛狗。这两个标签都是对的,如何让系统同时接纳这两个标签,需要在系统中设置恰当的策略。

3、对外提供接口,供用户app和管理员界面调用

整个系统的目标是:在最短时间内完成对海量训练集图片的准确标注。围绕这个目标,可以自行增加新的功能。上述描述的功能在原则上需要实现,如果某些功能没有实现,但觉得能更好的完成图片标签化工作,需要详细说明理由。

非功能性需求

  1. 整个系统应该能比较快的响应,用户、管理员应该可以流畅得使用功能;

  2.  UI的设计应该符合常规的使用习惯;

  3. 图片打标签的过程是一个迭代过程,迭代收敛的速度越短越好;

  4. 图片标注越准确越好 ;

  5. 系统支持动态伸缩,当用户端数量发送变化时,部署在云平台上的“系统“支持动态变化,不会出现系统瓶颈;

其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件(请尽量明确)

  1. 客户端可以是android或者 ios其中一种;

  2. 服务器端需要部署在华为公有云开发平台上;

 

 

 

测试数据或平台:提供给参赛者的测试环境和测试数据。(可提供电子档)

1、为了方便选手参赛,华为企业云将提供开发环境和测试环境。参赛选手可以直接申请免费的云主机和云存储服务(测试用数据已经存储在华为云存储平台中,可以直接使用),并在该平台上完成相应的开发和测试工作。免费申请注册入口:http://www.hwclouds.com 

2、华为大数据平台提供了一系列的服务API,例如大数据服务API(例如:画像服务,自动分析用户的特征)、云存储服务API等。参赛选手可以自由选用华为企业云提供的服务API来提升系统的能力。服务API学习地址:http://developer.hwclouds.com/index.html(包括大数据服务API和云存储服务API使用说明)

开发所需设备及设备指标需求说明

 

  

答疑联系人

周景才

0755-36832309

zhoujingcai@huawei.com

 

关键字: 责任编辑:cnsoft
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到QQ空间
分享到: 
上一篇基于云计算技术的PM2.5监控系统 下一篇“无微不至”的借阅伴侣

相关栏目