第十一届中国软件杯大赛--A组赛题
赛题名称:智能创作平台
组类:A组( 本科、研究生、高职)
出题企业:无锡永中软件股份有限公司
答疑QQ群:172848717
线上赛题解析直播回放:https://wx.vzan.com/live/tvchat-1530467645?shauid=undefined&vprid=0&v=1652958190475
标题生成算法评测(初赛)二次测试说明
因系统原因,存在少数团队提前获取测试数据的可能性,为确保测试结果的公平、公正、可靠性,经与出题单位商讨,现启动A9赛题的二次算法测试。具体如下:
一、时间及发布地址
算法评测时间:7月8日19:00-19:30(测试数据500条以内)
测试集发布时间:7月8日19:00,提交截止时间19:30
测试集下载:测试7.8.rar
二、测试集结果请同时通过以下两个邮箱提交:
夏老师:xzt@yozosoft.com
组委会:cnsoftbei@qq.com
邮件标题命名:团队编号-队伍名称-队长姓名-队长手机号
文件命名格式:团队编号-队伍名称-队长姓名.json
(请确保文件命名和文件格式正确)
以上两个邮箱已设置自动回复,为确保邮件发送成功,未收到回复邮件,请及时在答疑QQ群中告知或致电13811798226(组委会 王艳)
三、选手提交测试集文件格式需和发布的测试集文件格式相同,包含id、title、content字段
例:[{“id”: 1, “title”: “xxx”, “content”:“xxx”}, {“id”: 2, “title”: “xxx”, “content”:“xxx”}]
四、本次测试结果将与第一次结果进行比对,综合两次结果得分,发现存在作弊行为的,或者未按照截止时间提交结果的,此项得分不计入初赛成绩
赛题简介:介绍整个赛题的实现目标、实用价值、涉及技术和整体要求 | 标题和摘要对于创作非常重要,但构思一个具有吸引力的标题和从文章抽取或生成符合文章主旨的摘要并非易事。本赛题给定高质量训练数据,参赛者使用人工智能算法,生成契合文章主题内容和有吸引力的优质标题和摘要,并开发出一套智能创作WEB系统,帮助人类提升写作的效率和质量。本赛题主要涉及自然语言处理、自然语言生成、自然语言理解技术。 |
赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景 | 目前,标题和摘要主要由人工完成,人工理解整个输入文本后,为输入文本确定对应的文本标题和摘要。由于人工处理的方式需要经历人工文本理解,受主观性影响较大,可能会由于人的主观意识导致对文本类型误判,因此使得生成的文本标题和摘要不够准确,并且人工处理的方式效率较低。 场景:新闻资讯创作、办公写作等 |
基本功能要求 | 1、选手实现标题生成和摘要抽取(生成)两大功能。 (1) 使用自然语言生成技术实现标题抽取(生成)功能。 (2) 使用自然语言生成技术或抽取技术实现摘要功能。 (3) 选手可使用现有的人工智能算法 (4) 标题生成作为算法考核项 2、软件运行在WEB平台 (1) 系统运行流畅 (2)UI界面设计合理、美观,人机交互友好 |
非功能性要求 | 1、技术文档详细 2、使用开源的人工智能算法需标明出处 |
实现条件:开发环境、实验平台、开发语言、数据库、编译器、涉及硬件等实现条件 | 1、人工智能算法部分推荐使用python开发,深度学习框架推荐使用pytorch、tensorflow、paddlepaddle 2、WEB系统部分,选手选择熟悉的WEB框架,推荐使用主流的python web框架,如Django;或java web框架 |
测试数据或平台:提供给参赛者的测试环境和测试数据 | 1、提供标题生成的训练集和开发集,训练集和开发集来自学习强国的评论员文章。参赛者根据文章内容生成标题; 下载链接:https://pan.baidu.com/s/1TMMyAGPxEAPKp_CKpw4I5w 提取码:jlvw 2、以Rouge-n(n取1和2)和Rouge-L作为算法性能的评价指标。 |
开发所需设备及设备指标需求说明 | 无 |
文档及其他要求 | 技术文档需要包括以下内容: 1、用户使用说明书 2、概要设计文档 3、详细设计文档 4、软件源文件 |
各评分项及大致占比 | 1、标题生成算法评测(20%): 在规定时间提交标题生成测试集的结果,根据模型测试评分得到参赛者榜单排名,按照排名计算成绩。 2、WEB系统(60%): (1) 实现标题生成和摘要抽取(生成)两大功能(30%) (2) 系统运行流畅,UI界面合理和美观,人机交互友好(30%) 3、技术文档详细且清楚,展示汇报逻辑清晰、亮点突出(20%) |
初赛作品提交要求 | 1、技术文档包含:用户使用说明书、概要设计文档、详细设计文档 2、软件源文件 3、软件使用演示视频(5分钟之内) 4、展示汇报视频(ppt讲解,7分钟之内) |
【参赛团队作品中团队自主开发部分的软件作品著作权归参赛团队所有,其中具有市场应用及拓展的优秀作品,出题企业具有优先权,可以优先合作开发或者优先购买。另如基于该作品的任何合作升级开发、市场拓展等活动,以及在这一过程中所获得的任何商业费用,出题企业应与参赛团队协商解决。】
工业和信息化部
教育部
江苏省人民政府
中国电子信息产业发展研究院
江苏省工业和信息化厅
江苏省教育厅
教育部高等学校计算机类专业教学指导委员会
南京航空航天大学
中国信息化周报
中国(南京)软件谷
江苏软件产业人才发展基金会
客服电话:010-88559646
邮编:100048
联系地址:北京市海淀区紫竹院路66号赛迪大厦18层