TOP

旅游网络评论情感分析
2015-01-20 17:54:16 来源: 作者: 【 】 浏览:12395

 第四届“中国软件杯”大学生软件设计大赛

赛题(B组)

赛题名称: 旅游网络评论情感分析

组类( B ):    高职组

赛题简介:介绍整个赛题的思路和整体要求

自媒体的时代,消息的传播异常迅猛。一条网络评论产生的影响不容忽视。在旅游领域,航空公司、酒店等也十分重视网络舆论的主动引导。由于网络评论的时效性强,对于意见类诉求若不及时响应,往往对企业形象造成负面影响。文本情感分析是自然语言处理的一个分支,借助有监督学习或无监督学习等方法,让机器理解文本的情感倾向。有了情感分析这一工具,对网络评论的自动分析与预警成为可能。

本赛题要求:开发一款软件,抓取旅游行业的网络评论,分析评论文本的情感倾向,向用户推送适当的预警消息。

 

赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景

据民航局统计,2013年全行业完成旅客运输量3.5亿人次,增长10.8%(数据来源:民航局《2013年民航行业发展统计公报》)。2014全年的统计数据还未出炉,但预计旅客量仍将增长10%。无论是商务、旅游,乘飞机成为越来越多旅客的出行方式。关于民航旅客服务的曝光率也有提高。

例如,2014年1月22日,新东方教育集团有限公司董事长俞敏洪发布微博称“早上去上海,买了张特价商务舱的机票,经济舱的价格,本来挺开心,结果到了机场,不让走商务通道,不让到休息室休息,办票的服务员一看是特价票马上冷若冰霜……”引来大量回复和转发。

再如:2014年11月,知名地产商任志强连发五条微博炮轰航空公司“歧视服务”;2013年8月孟非抱怨航班行李托运晚点,微博“死磕”民航局局长。

这些事件的一个共同点是,都是首先在微博等网络媒体爆发的。如果航空公司在第一时间做出回应,既能及时解决旅客诉求、改善服务质量;又可转危为安,成为一次漂亮的危机公关,维护企业形象。

 

功能性需求

抓取民航、旅游行业网络评论,以微博为例,亦可是其他主流平台;

抓取功能可离线或通过第三方软件完成,如有余力可实现自动抓取功能;

评论文本的语义分析,主题词提取;

评论文本的情感分析,判断情感倾向,可分为几类、亦可量化打分;

负面评论的预警功能,可结合网络评论的转发数、阅读数等指标确定评论的重要等级,向用户推送适当的预警消息。

 

非功能性需求

抓取的有效网络评论数在1000条以上;

每条网络评论的分析时间控制在毫秒级以内;

在提交的报告中给出评论文本情感分析的准确率。

 

其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件(请尽量明确)

语言不限,请注明使用到的第三方代码。

宜采用开源开发平台。

 

测试数据或平台:提供给参赛者的测试环境和测试数据。(可提供电子档)

标记有正面、负面词性的词库;

测试文本(网络评论正文,及情感偏向的分值)。

 

情感识别.zip  (测试数据)

开发所需设备及设备指标需求说明

 

其他要求

提交相关文档及程序源码:

《需求分析与算法论述》详细分析、提炼题目功能与非功能需求(包含但不限于题目给出的要求),针对题目问题,阐述解题思路、算法;

《概要设计说明书》简要描述软件结构、模块、接口、功能等,为读者提供清晰的编码思路;

《详细设计说明书》详细描述软件结构、模块、接口、功能等;

《测试用例与测试报告》包含测试环境、测试用例、测试方法、评价标准,应包含功能与非功能测试;

程序安装包、源码及注释、外部数据。

参赛选手可制作幻灯片、视频等,以生动形象的方式展示作品。

 


关键字: 责任编辑:cnsoft
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到QQ空间
分享到: 
上一篇面向海量音频内容的快速关键音标.. 下一篇气体污染扩散模拟及其可视化软件

相关栏目