攀峰网络舆情监测系统V2[1][1].0说明书.docx
《攀峰网络舆情监测系统V2[1][1].0说明书.docx》由会员分享,可在线阅读,更多相关《攀峰网络舆情监测系统V2[1][1].0说明书.docx(38页珍藏版)》请在冰点文库上搜索。
成都攀峰云监测---网络舆情监测系统说明书
攀峰云监测
—网络舆情监测
系
统
说
明
书
成都攀峰科技有限公司
文档声明
本报告书属商业机密文件,书中的所有信息均为机密信息,仅供成都攀峰科技有限公司舆情监测系统项目使用。
未经成都攀峰科技有限公司明确的书面许可,不得以任何方式或手段对文档的任何部分进行复制或传播。
尽管成都攀峰科技有限公司已经尽力保证文档内容的完整性和有效性,但是,仍可能有技术方面不够准确的地方或印刷错误。
成都攀峰科技有限公司将根据需求变化对有关内容进行相应的调整。
目录
第一章系统简介.....................................................3
第二章系统结构..................................................5
第三章系统优势及特点................................................7
3.1安全可靠.....................................................8
3.2全网检测.....................................................8
3.3语音播报.....................................................8
3.4预警机制.....................................................9
3.5分析智能化...................................................9
3.6方案系统化.................................................9
第四章系统功能..................................................6
4.1智能舆情采集功能...........................................12
4.2舆情分析与处理功能..........................................13
4.3舆情可视化展现..............................................17
第五章系统应用....................................................19
第六章操作界面.....................................................21
第七章常见问题解答.................................................35
第八章版本说明.....................................................38
PFscout·系统简介
攀峰云监测系统(PFscout)是一套专业的网络舆情监测平台。
是经成都攀峰科技有限公司通过对自身丰富的舆情监测经验、技术实力和行业资源进行整合后研发的高端舆情监测产品,其灵活的可定制性和可扩展性满足了不同客户对舆情监测的需求。
攀峰是国内唯一一家在舆情监测领域引入“云计算”技术并成功研发网络舆情“云监测”系统的高科技企业。
目前,攀峰云监测系统已经为政府的宣传机构、保密部门、司法系统、纪检监察、教育部门及拥有知名品牌企业在内的众多客户成功实施了网络舆情监测服务。
攀峰云监测系统采用先进的云计算技术,能同时对数千个包括综合门户、博客平台、论坛社区、行业门户、地方站点、贴吧空间等在内的中英文站点进行实时监测,并且拥有数字平媒挖掘技术,做到舆情监测的全网覆盖。
系统具有每秒钟超过数百个新增舆情文档的吞吐量,可以并行快速聚合分析和统计超过千万的论坛讨论信息,可以同时索引查找超过T级数量的舆情数据。
攀峰的“云计算”理念帮助客户摆脱了长期以来对设备和技术人员的严重依赖,让舆情监测的实施降低成本,提高效率。
攀峰在透析互联网特点、网民习惯和舆情传播规律的基础上,充分运用自身技术实力与经验、资源优势,帮助客户及时、全面、高效的获取网络舆情并为己所用。
对网络舆情实时并发监测、汇总和追踪互联网舆论热点,以帮助客户了解网民对其机构、品牌、产品、服务、内部员工、综合竞争实力及其形象、声誉相关的正负面评价和认知情况,负面舆情及时预警,保护其机构形象和企业品牌声誉等不受舆论损害。
同时,系统可帮助客户获取商业信息和行业动态,为制定战略决策、提高核心竞争力提供强有力的信息依据。
攀峰的云监测服务,在客户网络舆情危机期间提供周度及月度监测报告,追踪危机发展态势;在危机事件的不同阶段提供全面的舆情监测和分析报告,评估危机对客户各方面的影响,为客户提供危机公关建议,成功应对舆情危机。
PFscout·系统结构
PFscout网络舆情监控系统组成由舆情采集平台、舆情管理平台、舆情发布平台、舆情检索引擎、舆情数据库五部分组成。
(1)舆情采集平台
提供对舆情数据进行自动过滤、自动排重、自动摘要、自动
关键词属性提取,是舆情监控系统的的核心部分。
(2)舆情管理平台
提供对各项舆情数据的综合管理,主要包括舆情信息管理、舆
情分类管理、舆情统计管理、系统用户管理、用户个性化管理等。
(3)舆情发布平台
提供舆情分类浏览、舆情专题浏览、舆情分类数据统计、舆情
趋势图呈现及比较、信息的个性化订阅月及邮件推荐。
(4)舆情检索引擎:
提供舆情搜索功能,按舆情来源渠道进行检索、按关键词进行
检索、按全文进行检索、相关检索、二次检索等功能。
(5)舆情数据库:
提供对舆情数据的综合管理功能。
包括全文数据、统计数据、
日志操作等。
l检索性能指标:
自动分类达到95%以上准确率
在G级数据集合上达到亚秒级检索速度
数据索引更新时间平均小于0.06s/记录(每条记录5Kb)
全文检索数据库的索引空间膨胀率<0.8
多用户并发检索,每秒可响应85个以上查询
l采集性能指标:
在10M网络带宽环境下,每小时可以采集4-6万个网页
单个采集工具能够支持千万数量级的网页采集。
l舆情分析性能指标:
自动分类达到90%以上准确率
智能分析处理速度达到每小时处理4-6万个网页。
自动聚类速度为每分钟处理6000个网页以上。
信息抽取的速度为每秒450K以上
网页排重的速度为每小时12万篇以上。
系统结构如图1-1所示:
图1-1系统结构图
图1-1.1系统结构图
PFscout·优势特点
PFscout系统基于云计算理念进行设计研发,舆情监测的所有流程都在“云”端实现。
服务器采用集群结构,可实现海量访问。
系统具有高安全性、可靠性和扩展性优势,摆脱因客户端的不稳定造成数据丢失和系统崩溃。
PFscout系统具有如下优势与特点:
l云技术安全可靠:
PFscout基于云计算理念设计研发,系统的运行完全依托集群式服务器,舆情信息的采集、处理、分析等核心工作环节均在服务器“云”端实现。
先进的云技术及双重备份技术可有效避免因系统故障或遭受攻击所带来的数据丢失等严重后果。
l全方位监测范围:
系统监测范围广,可同时监测中英文网站。
舆情采集引挚内置数千个网址,涵盖全球主流搜索引挚、大型综合门户、新闻媒体、博客论坛、行业门户、微博系统、贴吧空间等各种类型网络平台,可监测数字化平面媒体,网上线下无遗漏。
同时还可以根据需要自定义监测网站。
l实时监测语音播报:
PFscout系统7×24小时全天候进行信息抓取不间断,系统可以实时对用户关心的舆情信息进行监测。
对舆情因变或新发舆情,系统自动在第一时间采集并呈现在用户面前。
为提醒用户关注最新舆情动向,系统还提供对实时监测信息的语音播报功能。
l预警机制及时全面:
PFscout为用户提供了及时的舆情预警和全面的预警手段,免除人工监测之累。
系统通过短信、邮件、MSN等多种通信方式向用户传达危机预警信息,做到危机舆情紧急传递,让用户第一时间获取信息,及时启动危机应对方案。
l舆情分析智能化:
系统采用了数字化中英文智能分析及自动情感分析技术,自动判断舆情情感倾向,得出舆情信息的正负面指数,将用户最关心的舆情信息优先呈现。
l服务方案系统化:
攀峰对舆情传播与危机公关有着深入的理解和丰富的经验,依托技术平台、人才优势与行业资源为用户提供更加专业的舆情分析研判和舆情危机应对的整体解决方案。
如图2-1所示:
图2-1舆情危机应对解决方案
l操作页面友好:
攀峰云监测系统操作端的设计摒弃了传统软件设计的思路,客户无需在电脑上进行软件安装和繁复配置,PFscout让舆情监测像打开网页一样轻松操作,并能随时随地灵活实施。
l支持境外站点监测:
攀峰云监测PFscout监测系统,通过代理服务器功能支持对指定站点监测,包括对境外违禁站点的监测功能。
1、通过正常途径无法浏览境外违禁站点:
2、通过代理服务器完成对该站点的抓取、去噪、分析、呈现的功能。
完成对境外违禁站点的监测:
l自定义ip地址段监测
攀峰云监测PFscout监测系统,支持对自定义某一ip地址段之间的新增网站进行监测。
PFscout·系统功能
攀峰云监测系统主要功能有智能舆情采集、舆情分析与处理、舆情可视化展现三个方面,舆情采集功能主要负责在网络上抓取符合监测条件的网页信息并进行信息的自动过滤与排重处理,然后存入数据库;舆情分析与处理,主要负责对采集到数据库中的网页数据进行包括网民情感倾向、媒体报道倾向在内的智能分析,得出舆情的传播态势与媒体的关注情况等的分析结果;舆情可视展现主要通过操作界面将当前舆情状况以图形和文字形式进行展现,同时系统提供了简报导出、任务定制等功能。
一.智能舆情采集功能
1.强大精准的信息检索
PFscout具有功能强大精准的信息检索引挚。
面对互联网的海量信息,系统通过关键词的组别设定、监测网址设定,确定舆情检索方向与信息采集目标,将符合监测需求的信息数据采集到舆情数据库进行保存。
系统具有每秒钟超过数百个新增舆情文档的吞吐量,可以同时索引查找超过T级数量的舆情信息。
2.采集信息种类的多样性
舆情采集实现基于网页结构的统计分析算法。
除采集舆情文档信息外,系统会自动识别新闻报道、论坛贴子、博客文章等网页结构,提取文章类别、发布时间、来源、评论、标题等信息,满足舆情分析需要。
3.支持多样网络平台采集
系统除了对传统的门户网站进行采集外,还可以对搜索引挚、论坛社区、博客平台、微博系统等进行采集,同时可对数字平面媒体进行采集。
多样的网络平台采集保证了舆情信息的全面和系统。
4.支持RSS解析
RSS订阅服务,系统不仅提供网页的基本信息,还提供包含丰富的元数据信息,比如标题、作者、发表日期、分类、关键词等,这些元数据对于舆情分析往往具有重要的价值。
PFscout系统对舆情采集实现了对RSS聚合内容的自动解析和采集。
使舆情分析更加方便。
5.自动过滤
系统可对网页内容进行分析和过虑,精确获取目标内容主体。
在海量的数据信息中,系统对与监测内容有关的大量广告、价格、评测、规格、性能等垃圾信息自动过滤剔除,提高对海量信息的处理效率。
6.自动排重
根据文档中信息的匹配程度确定重复性,将重复的信息自动进行统计归类,方便用户实施信息检索,提高舆情分析效率。
7.舆情实时监测
PFscout系统可以实时对用户关心的舆情信息进行监测。
对舆情因变或新发舆情系统自动在第一时间采集并通过系统界面呈现在用户面前,重要舆情通过手机短信、邮件通知等多种方式传递客户。
8.中英双语种采集
PFscout支持中文、英语双语种信息采集,满足用户对舆情信息需求的多样性和全面性需求。
9.舆情采集条件自定义
用户可根据舆情变化灵活设置舆情的采集条件,包括关键词组别设定、关键词情感指数设定,根据舆情分布特性设置不同网络平台的信息采集权重,自定义特殊网址采集。
10.全面关键词匹配
监控匹配是指按用户定义监控需求,同互联网上采集的信息做比对,以发现有价值的舆情信息。
PFscout系统支持关键词的完整匹配、同音字匹配、不完整匹配、暗语、网络语言匹配,做到舆情信息不漏报,大大提高监测的准确性和全面性。
二.舆情分析与处理功能
1.热点事件追踪
系统具有对热点事件的全程追踪功能,从某一热点事件的发生、发展到结束,通过事件链分析技术,帮助用户了解事件发生的来龙去脉、事件发展趋势,有助于对舆情热点进行分析研判。
2.文章相关度指数
对采集到的信息,系统可自动判断文章与监测条件的相关度,给出相关度指数,以此判断文章的重要性。
相关度指数是攀峰独创的文章主题判断算法,普通的舆情监测只是通过简单的检索功能找出和企业相关的关键词,即认为文章和客户相关。
攀峰相关度指数,不仅仅是简单的检索,还结合文章的语义分析(自然语言处理)和web文本挖掘技术,得出综合指数。
指数越高的文章越符合用户的监测需求。
3.文章情感倾向分析
系统通过在关键词组别中设置的情感指数,对采集的每一篇文章进行情感倾向性分析并以图形标识,文章是正面、负面还是中性让用户一目了然,提高舆情分析效率。
4.渠道来源分析
系统通过对所采集的信息来源是行分析后,会为用户提供清晰的信息渠道来源信息,帮助用户了解所关注的舆情信息在网络上的分布情况,为舆情应对提供数据依据。
5.媒体关注度分析
用户通过对给定日期、给定关键词的聚合分析,得出媒体对舆情的关注趋势及关注数量,同时针对特定的重要媒体平台进行监测分析,让用户轻松了解媒体每一天对舆情的关注动态和报道倾向。
6.舆情走势分析
系统通过对企业品牌、产品及服务所获得声誉度、影响力等情况进行分析,得出当前宏观舆情态势、舆情总体表现并给出舆情分值,辅助用户及时准确把握宏观的舆情走势,化解舆情危机。
7.品牌美誉度分析
系统会自动对采集到的每日舆情信息进行综合分析与统计,并将每日的舆情表现通过图形展现。
智能化的分析技术让用户清晰了解自己企业的品牌在消费者心中的整体形象,为用户及时调整品牌战略提供信息依据。
8.网站关注度趋势
用户可查看指定网站对监测信息的关注情况。
系统根据给定时间段和关键词,对数据进行分析处理,得出指定网站对舆情信息的关注状况,并通过图形呈现。
9.搜索引挚收录趋势
可查看六大搜索引挚(百度、谷歌、搜狗、搜搜、必应、雅虎)在给定时间内对监测关键词的网页收录情况,包括最大收录数、最小收录数、平均收录数和收录总数,并通过图形进行呈现,方便用户了解所监测关键词在互联网中的传播状况。
10.搜索引挚关注趋势
查看六大搜索引挚(百度、谷歌、搜狗、搜搜、必应、雅虎)在给定时间内对监测关键词的搜索情况,并得出每个搜索引挚对关键词的关注比例,同时用图形对关注趋势进行呈现,帮助用户了解网民对所监测关键词的关注度和对搜索引挚的使用情况。
11.舆情关注重点地区分析
系统通过对关注用户舆情信息的网民进行分析和统计,给出舆情搜索量MAP图,通过舆情搜索量MAP图,用户可直观了解不同地域、空间的网民对该舆情的关注度,协助用户调整和制定区域策略。
12.媒体报道倾向分析
系统自动分析和统计在给定时间内每一个网站所报道内容的情感倾向,并给出报道总量与倾向指数,例如某个网站对用户的正面报道比例是多少负面报道比例是多少,可以帮助用户更好的了解网络媒体的报道倾向与传播情况。
三.舆情可视化展现
1.舆情态势图形展现
PFscout系统为用户提供了多种形式的图形,配合数字与各种符号,让用户对舆情状况一目了解,更直观了解舆情宏观发展态势。
2.舆情汇总报表
系统对舆情信息进行分析处理后会自动生成舆情汇总报表。
报表对被监测关键词组的舆情基本状况进行展示,用户通过该报表可以清晰的查看舆情信息的渠道来源、搜索引挚关注趋势、媒体关注趋势和品牌美誉度走势情况。
同时还可以了解被监测关键词的活跃程度,协助用户对关键词进行调整。
3.舆情文章列表
系统将采集到的文章按时间进行排列,同时对每一篇文章的采集条件、渠道来源、情感倾向指数、转载量、相关度、抓取时间、文章发表时间、文章分类等做出标注,对采自平面媒体的文章,提供了预览功能,用户不需要打开页面即可进行查阅。
4.舆情数据全文检索
系统提供了检索舆情数据的多种方式,用户可以根据给定时间、给定关键词、给定来源、给定网址、情感倾向值、过滤条件等对数据进行全方位检索,另外还可通过对转载量、文章相关度等条件设定实现检索,并可将常用的检索需要存入搜索器,方便信息检索。
5.任务定制
系统提供任务定制功能是为方便用户及时了解网民对企业品牌和产品及服务反馈情况。
通过不同的渠道在第一时间传递给用户所关注的信息。
此功能用户可自定义。
通过页面提示进行设置,系统自动通过短信或邮件向用户发送定制信息。
6.舆情简报自动生成
PFscout系统具有自动生成简报功能,用户可以根据需要,按给定时间、给定条件,随时随地将当前舆情态势生成EXCEL格式简报,让舆情查阅更简便、更清晰明了。
PFscout·系统应用
l企业形象监测:
满足各类大型集团、连锁企业、行业协会等对品牌形象和企业声誉的监测需求。
为集团企业和行业协会提供长期的品牌监测和形象追踪服务,及时获取公众对企业品牌形象的认知情况和品牌文化对社会的影响,为企业的品牌战略提供信息依据。
l行业竞品情报监测:
用于各类企业对行业竞品和市场竞争状况的监测需要。
用户利用PFscout系统可实现对指定企业、品牌和产品进行信息监测,包括竞品销售状况、市场动向、营销策略、产品形象等,同时可对整个行业的市场状况及动向进行监测,为企业及时调整产品和营销策略提供信息支持。
l危机公关监测:
舆情危机发生后,监测系统会对本次危机事件的各类信息进行全面扫描,并识别和分辨出各类信息的关键要素,提取舆情危机焦点,诊断当前危机状态。
并在处理危机的各个阶段及时监测舆论走向,提供危机公关建议,辅助危机管理者决策判断。
l产品信息反馈和客户服务监测:
通过搜集消费者自发的对品牌和产品的反馈意见、建议和投诉信息,为企业及时了解消费者使用偏好、习惯、关注的性能和购买驱动因素等,为产品的改进与开发提供极具价值的参考。
l营销活动效果监测:
通过对客户营销活动和广告进行监测,了解消费者对广告和营销活动的网络讨论趋势和讨论热度,帮助广告商、广告公司和公关公司及时调整营销活动策略,使客户的营销活动获得最佳效果。
PFscout·操作界面
l登录界面
输入经过授权的用户名与密码登录系统。
l功能导航
系统操作导航区,可从菜单中选择各项操作,包括实时监测、关键词管理、网络监控等。
右上角可进行中英文版本切换。
系统操作导航区,可选择各项操作
中英文版本切换
选择关键词分组和类别
l关键词设定
操作路径:
关键词—关键词列表—新增
用于添加监测关键词。
可根据需要设置关键词在不同网络媒体的采集权重。
设置不同类型网站的采集权重
关键词关系设定
l自定义网站列表
操作路径:
网址管理—自定义网站地址列表。
用于选择在“网站关注度趋势图”中进行关注度比较的网站。
选择不同网站同时选择一种颜色,将在网站关注度趋势图中显示。
如“网站关注度趋势图”中所示。
l网站关注度趋势图
操作路径:
网络监控—网站关注度趋势图—定制
选择需要进行关注度对比的网站后点击关闭。
设置查询条件点击查询,图中显示所选网站对监测信息的关注态势及关注总量和平均、最大、最小关注度。
l单词情感指数设定:
操作路径:
录入管理—单词情感倾向列表
用于添加与用户自身业务相关或带有情感倾向的敏感词,设置情感倾向指数。
单词情感倾向用于判断文章的情感指数。
输入单词
选择情感指数
l实时监测
操作路径:
实时监测—实时监测。
用于快速监测实时信息。
实时监测列表随时间不断刷新信息,最新信息会显示在列表顶部。
列表给出信息所属关键词组、渠道来源、网站、标题及时间。
重复信息会在标题处标出重复数量。
重复文章数量
(重复文章列表)
l渠道来源图:
操作路径:
网络监控—渠道来源图
用于帮助用户了解舆情信息在互联网上的宏观分布状况。
渠道来源图给出被监测信息的渠道来源及数量、分布比例。
信息来源渠道共7种,分别为政府类网站、垂直门户、网站门户、论坛、搜索引挚、报业新闻和博客。
点击渠道来源图中的某一渠道,系统会给出从该渠道抓取的信息列表。
(渠道来源图)
(单一渠道信息列表)
l搜索引挚关注度趋势图:
用于查询被监测对象在搜索引挚中被网民搜索关注的情况。
在查询区设置查询起止日期与查询关键词组别,点击查询即可。
图形给出每天6大搜索引挚各自的关注数量,同时也可将折线图切换为柱形图。
搜索引挚关注度列表:
给出每一个搜索引挚在查询起止日期内的最大、最小和平均关注度。
(搜索引挚关注度列表)
l媒体关注度图:
操作路径:
网络监控—媒体关注度图
用于帮助用户了解每一天媒体对监测信息的关注数量的情况,同时给出在查询起止时间内的关注度总量、平均关注度、最大和最小关注度及日期。
媒体对关键词的关注数量
当天信息列表:
对图形中的某一日期进行点击,会给出当天的所有信息。
l舆情走势图:
操作路径:
网络监控—舆情走势图
用于反映被监测的关键词组别在某一时间段的整体舆情走势及每一天的舆情得分。
舆情得分
l品牌美誉度走势图:
操作路径:
网络监控—品牌美誉度走势图
用于反映被监测关键词组别在某一时间段内的整体美誉度走势及每一天的美誉度比例。
品牌美誉度得分
l搜索量MAP图:
操作路径:
网络监控——搜索量MAP图
用于反映在给定时段内关键词在不同地区被搜索引挚关注的热度排名。
可帮助用户了解网络上对自身关注度较高的地区有哪些。
搜索量关注排名
l查看文章列表:
操作路径:
网络监控——查看文章列表
用于查看在给定条件内与被监控关键词有关的所有文章。
文章列表中显示被抓取文章的所属关键词、关键词分组类别及来源渠道、情感倾向和指数、文章标题、转载量、文章与关键词的相关度、文章的发表日期和抓取日期。
同时可通过检索区设置条件进行文章检索,也可将检索到的文章列表导出至EXCEL报表中。
情感倾向及情感指数
检索区
l相关关键词
操作路径:
网络监控——相关关键词
显示系统根据用户定义关键词进行智能匹配所得的关键词。
系统根据关键词词库和关键词定义规则,自动扫描相关文章内容,识别出与用户自定义的关键词相关的词语,并对出现相关关键词的文章作出标识,其中所显示的相关关键词字体越大、颜色越深说明该关键词被网民关注度越高。