TOP

基于多社交媒体的用户信息融合研究
2014-01-20 17:06:00 来源: 作者: 【 】 浏览:14700
赛题简介:介绍整个赛题的思路和整体要求

    信息融合起始被称为数据融合,起源于1973年美国国防部资助开发的声纳信号处理系统,其概念在20世纪70年代就出现在一些文献中。在20世纪90年代,随着信息技术的广泛发展,具有更广义化概念的“信息融合”被提出来。参考wiki的定义:信息融合是一个实时的连续的过程,它多层次、多方面地对多源信息进行探测、联想、估计以及组合处理,其目的是获得精确的被测目标的状态、一致性估计和完整的实时评价。

    随着计算机网络信息技术的快速发展,云计算、物联网、移动互联网等新兴技术正在逐步改变人们生活方式,助推人类社会向着智能化的方向发展。在社交媒体领域,普遍都存在着单个个体同时使用多个社交媒体平台发布信息,如微信、微博、人人网等。这些信息在不同的社交媒体平台各有不同,而当前存在着单个个体在不同社交媒体平台上用户名不一致的情况,故而不能简单地根据用户名来进行信息融合。因此本题就是研究如何融合用户在不同社交媒体平台上信息的方法。 

    本题要求能够提出融合单个体在不同社交媒体平台上信息的解决方案,并进行原型实现。 

赛题业务场景:描述赛题相关的真实企业业务背景。从真实场景中,适当简化或者提炼出适合比赛的赛题场景    

    当前,人们在网络社交媒体平台上发布着各种不同类型的信息,其中这些信息中包含着民航旅客对航空公司、机场等民航业的不同需求和喜好等内容。

    中国民航局在十二五规划中,提出了构建全流程旅客服务体系。这就需要我们深化理解旅客的需求,在行程计划、预订、值机、机上等环节为主动为旅客提供所需服务。采用本题研究成果可以通过分析用户在不同网络社交媒体中发布的各种民航相关信息,综合用户对民航业的需求和体验,有助于完善航空公司对旅客需求的了解,积极主动为旅客提供(推荐)相关服务。

功能性需求

    1.利用不同网络社交媒体提供的公开API获取用户的注册、发布等信息内容;       

    2.分析用户在不同网络社交媒体上发布信息的内容,清洗过滤非真实用户(机器人等)。

    3.分析真实用户在不同网络社交媒体上发布信息的内容,研究用户在不同社交媒体上的行为特征。 

    4.利用真实用户在不同社交媒体上的行为特征,结合注册、发布的信息内容,进行真实用户信息融合。

非功能性需求

    1.选取当前主流网络社交媒体(比如微信、微博、人人网等)进行信息清洗和融合,融合后的真实用户量达到10万量级。 

    2.信息融合的准率率达到70%以上,融合准确率定义为已经按用户融合的不同的社交媒体平台信息,确实为同一用户的概率。

其他限制条件:开发环境、实验平台、开发语言、数据库、编译器等限制条件    

交付物:       1.详细设计文档;       2.测试报告;       3.可运行应用及源代码; 

测试数据或平台:提供给参赛者的测试环境和测试数据。(可提供电子档)    测试会严格概率抽样的科学方法对融合的用户进行校验。同时也会考虑提供部分已知真实用户的数据(一些敏感信息会进行漂白),用以当场测试。
其他要求    本次重点是提供融合不同社交媒体平台用户的方法,对于研究过程中融合的信息不做限制。
关键字: 责任编辑:cnsoft
】【打印繁体】【投稿】【收藏】 【推荐】【举报】【评论】 【关闭】 【返回顶部
分享到QQ空间
分享到: 
上一篇简易安卓客户端新闻发布平台 下一篇没有了

相关栏目