谷尼网络舆情监控系统技术白皮书.doc

上传人:wj 文档编号:1234381 上传时间:2023-04-30 格式:DOC 页数:7 大小:643KB
下载 相关 举报
谷尼网络舆情监控系统技术白皮书.doc_第1页
第1页 / 共7页
谷尼网络舆情监控系统技术白皮书.doc_第2页
第2页 / 共7页
谷尼网络舆情监控系统技术白皮书.doc_第3页
第3页 / 共7页
谷尼网络舆情监控系统技术白皮书.doc_第4页
第4页 / 共7页
谷尼网络舆情监控系统技术白皮书.doc_第5页
第5页 / 共7页
谷尼网络舆情监控系统技术白皮书.doc_第6页
第6页 / 共7页
谷尼网络舆情监控系统技术白皮书.doc_第7页
第7页 / 共7页
亲,该文档总共7页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

谷尼网络舆情监控系统技术白皮书.doc

《谷尼网络舆情监控系统技术白皮书.doc》由会员分享,可在线阅读,更多相关《谷尼网络舆情监控系统技术白皮书.doc(7页珍藏版)》请在冰点文库上搜索。

谷尼网络舆情监控系统技术白皮书.doc

谷尼网络舆情监控系统

技术白皮书

(简版)

谷尼国际软件(北京)有限公司

二〇一〇年八月

5

谷尼国际软件(北京)有限公司制

目录

1 系统概述 1

2 系统结构 1

3 系统特点 2

4 功能描述 3

4.1 热点话题、敏感话题识别 3

4.2 舆情主题跟踪 3

4.3 自动摘要 4

4.4 舆情趋势分析 4

4.5 突发事件分析 4

4.6 舆情报警系统 5

4.7 舆情统计报告 5

5 运行环境 5

1系统概述

网络舆情形成迅速,对社会影响巨大,不仅需要各级党政干部密切关注,也需要社会各界高度重视。

该方案可应用在政府的新闻监管、舆论监督等部门。

网络舆情监控系统是一套利用搜索引擎技术、文本处理技术、知识管理方法,通过对互联网海量信息自动获取、提取、分类、聚类、主题监测、专题聚焦,实现用户对网络舆情监测和热点事件专题追踪等需求,形成舆情决策库、舆情简报等分析结果,为客户全面掌握舆情动态,做出正确舆论引导提供分析依据。

谷尼网络舆情监控系统是以信息采集技术为核心,应用信息采集技术、内容管理技术、知识管理技术、信息分类技术,实现网络舆情监测和新闻热点追踪、新闻监管等功能需求。

为客户全面掌握群众思想动态,做出正确舆论引导,提供分析依据。

系统工作流程如下:

•信息采集:

互联网信息实时监测、采集、内容提取及排重;

•信息处理:

对抓取的内容进行自动分类聚类、主题检测、专题聚焦等;

•信息服务:

将采集并分析整理后的信息直接为用户或为用户辅助编辑提供信息服务,如自动形成舆情信息简报、追踪已发现的舆论焦点等。

2系统结构

总体来说,网络舆情监控系统软件的结构如下:

3系统特点

该项目与国内外互联网舆情监控系统或类似功能的系统比较,具有自己显著的技术特点,如允许用户定制舆情监控的范围、方式等,具体如下:

•支持网页编码自动识别

•支持URL去重识别

•支持正文自动识别抽取,无须标签配置

•支持分页采集

•可设置采集频率

•支持分布式部署

•强大的信息采集功能

•智能化的中文信息处理

•全面的敏感信息分布式检索系统

•分类、聚类等中文智能处理技术广泛采用

•实时增量备份原则

•合理的模块化结构及方便的分类监控

•灵活的调度算法

•支持新闻、博客、论坛、贴吧的采集监控

•基于内容相似性去重识别

•支持互联网关键词搜索采集入库

•支持敏感词过滤提取

•支持热点发现

•支持网页快照

4功能描述

4.1热点话题、敏感话题识别

   网络舆情监控系统可以根据新闻出处权威度、发言时间密集程度等参数,识别出给定时间段内的热门话题。

利用内容主题词组和回贴数进行综合语义分析,识别敏感话题。

4.2舆情主题跟踪

  网络舆情监控系统分析新发表文章、贴子的话题是否与已有主题相同。

是根据文档内容间的相关程度进行分组归并。

聚类不需要类别及相关训练样本。

聚类可以发现当前舆论焦点,或者相关文档的查找.

网络舆情监控系统通过对同一个阶段搜索到的大量信息进行聚类,我们可以很方便地发现当前关于什么类别的文章数量更多,那些信息之间的关系更紧密,这样我们可以很直观地了解到当前舆论的焦点,以及各个舆论点之间的联系紧密程度。

4.3自动摘要

 网络舆情监控系统对各类主题,各类倾向能够形成自动摘要。

信息自动摘要的中心思想是让用户在查看搜索结果时候,无需点击进入每一个搜索结果去了解具体内容,而自动在搜索结果条目下显示摘要信息。

这些“摘要”帮助用户迅速了解搜索结果的主要内容,提高了工作效率。

4.4舆情趋势分析

  分析某个主题在不同的时间段内,人们所关注的程度。

4.5突发事件分析

  网络舆情监控系统对突发事件进行跨时间、跨空间综合分析,获知事件发生的全貌并预测事件发展的趋势。

4.6舆情报警系统

  网络舆情监控系统对突发事件、涉及内容安全的敏感话题及时发现并报警。

4.7舆情统计报告

  网络舆情监控系统根据舆情分析引擎处理后生成报告,用户可通过浏览器浏览,提供信息检索功能,根据指定条件对热点话题、倾向性进行查询,并浏览信息的具体内容,提供决策支持。

5运行环境

操作系统:

MicrosoftWindowsXP/NT/2000/2003/

数据库为:

SQL2005/MYSQL/ORACLE

服务器:

CPU3.2G/内存2G/硬盘40G以上

带宽要求:

2M独享以上

服务器数量:

2台(1台采集监控、1台数据库服务器)

应用规模较大,可以采用多服务器集群的方式

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > PPT模板 > 商务科技

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2