信息资源综合管理共享软件.docx

上传人:b****1 文档编号:13543024 上传时间:2023-06-15 格式:DOCX 页数:41 大小:452.96KB
下载 相关 举报
信息资源综合管理共享软件.docx_第1页
第1页 / 共41页
信息资源综合管理共享软件.docx_第2页
第2页 / 共41页
信息资源综合管理共享软件.docx_第3页
第3页 / 共41页
信息资源综合管理共享软件.docx_第4页
第4页 / 共41页
信息资源综合管理共享软件.docx_第5页
第5页 / 共41页
信息资源综合管理共享软件.docx_第6页
第6页 / 共41页
信息资源综合管理共享软件.docx_第7页
第7页 / 共41页
信息资源综合管理共享软件.docx_第8页
第8页 / 共41页
信息资源综合管理共享软件.docx_第9页
第9页 / 共41页
信息资源综合管理共享软件.docx_第10页
第10页 / 共41页
信息资源综合管理共享软件.docx_第11页
第11页 / 共41页
信息资源综合管理共享软件.docx_第12页
第12页 / 共41页
信息资源综合管理共享软件.docx_第13页
第13页 / 共41页
信息资源综合管理共享软件.docx_第14页
第14页 / 共41页
信息资源综合管理共享软件.docx_第15页
第15页 / 共41页
信息资源综合管理共享软件.docx_第16页
第16页 / 共41页
信息资源综合管理共享软件.docx_第17页
第17页 / 共41页
信息资源综合管理共享软件.docx_第18页
第18页 / 共41页
信息资源综合管理共享软件.docx_第19页
第19页 / 共41页
信息资源综合管理共享软件.docx_第20页
第20页 / 共41页
亲,该文档总共41页,到这儿已超出免费预览范围,如果喜欢就下载吧!
下载资源
资源描述

信息资源综合管理共享软件.docx

《信息资源综合管理共享软件.docx》由会员分享,可在线阅读,更多相关《信息资源综合管理共享软件.docx(41页珍藏版)》请在冰点文库上搜索。

信息资源综合管理共享软件.docx

信息资源综合管理共享软件

 

信息资源综合管理共享软件

 

 

1.引言

1.1.编写目的

       为了信息资源综合管理共享软件的可行性,完整性,并能按照预期的设想实现该系统,特编写需求说明书。

同时,说明书也发挥与策划和设计人员更好地沟通的作用。

1.2.背景

农业信息服务业的发展是必然的趋势。

据专家研究,不少国家都很重视这个领域的发展战略研究。

其总的特征是,农业信息服务业的总额和它在整个国民生产中的比重逐步上升,社会对农业信息服务业的依赖会逐步加大。

我国近十年来对农业信息服务业也愈来愈重视,特别是实行社会主义市场经济以后,对农业信息服务业的发展战略研究提出了许多重大课题。

这些课题的研究必将对我国本世纪末至下世纪初的农业信息服务的发展产生重大的影响。

信息流通滞后是影响我省广大农村地区经济发展的主要制约因素之一。

根据到茂名、湛江、河源、韶关、江门等地农村进行调查,了解到农业科技、市场信息、实用技术等信息在我省广大农村地区是十分受欢迎的。

目前我省共有21个地级市、50多个县、1188个镇、19884个村,农村信息化建设将采取由点到面,分期分批实施的模式发展。

前期先在广州、韶关、河源、茂名等地区进行试点,采用政府补贴的方式共发展一批农村用户,主要是发展属于种植、养殖、加工等行业的龙头大户。

经过推广,获得用户的反馈信息,我们将总结归纳出一套更贴近农村实际需要的服务体系,最终把服务覆盖至全省所有乡镇。

1.3.定义

●在IPO图中的输入部分,如有红黑相间的文字,红色代表必输入数据,黑色代表可选输入数据。

●IPO表示输入,处理,输出

●信息引用表示信息从一个频道映射到另一个栏目,这个栏目只保存映射关系,不重新生成静态页面

●信息镜像表示信息从一个栏目映射到另一个栏目,这个栏目保存映射关系并根据本栏目的模板重新生成静态页面

2.任务概述

2.1.目标

本研究项目在广东省农村信息直通车工程整体建设的基础上,立足于原有省级综合服务平台(MISP)和已建立的丰富信息资源基础上,以提高信息资源管理高效、实效、经济为目标,遵循“开放、共建、共享、服务”的原则,构建一个以资源建设、内容服务、协同管理、资源共享为核心的信息管理系统。

通过加强信息资源的开发利用,完善信息资源联盟机制,建成一批有特色的专业数据库,发展一批面向基层农村服务的专家队伍,使“直通车”工程信息资源建设管理实现平台化和信息化。

信息资源联盟单位通过VPN远程登陆到本管理系统,可以自建、管理、维护和共享全省直通车工程的信息内容,有效的整合农业、教育、劳动保障、卫生、气象、物价、旅游等相关部门和涉农科研院校、行业协会、专业市场及民间机构的信息资源,扩大信息资源的存储、传播和利用,实现科技、农业、经贸、劳动等单位的信息资源互联互通,提高资源的共享程度和利用率,从而形成直通车工程的核心竞争力。

建设内容包括:

内容管理子系统、信息自动采集子系统、工作流程管理子系统、共享资源检索子系统、统计分析子系统、统一身份认证子系统等六大部分。

2.2.最终用户的特点

本项目的用户主要是农民、农业政府官员、农村合作社相关工作人员、农资配送商、合作单位的管理员等。

由于用户的电脑操作水平不一,所以要求我们开发的系统一定要操作简便。

3.系统设计

3.1.内容管理子系统

3.1.1.功能描述

3.1.1.1.栏目管理

●支持虚拟栏目,可以设置检索条件,根据检索条件从其它栏目引入数据,组合形成新的栏目。

●支持为每个栏目指定不同的管理用户,让不同的人员负责维护、发布不同的栏目。

●支持每个用户可定制不同的首页显示模板、不同的栏目模板,以及以邮件、RSS、WAP的方式来定制网站模板的发布。

●支持每个栏目都可以设置对应的存放位置,以便存放发布后的页面。

●栏目分为普通栏目、头条新闻、图片新闻、链接栏目和表单栏目五种类型,不同类型的栏目所执行操作也不同,其应用特点亦不同。

●支持多个栏目管理入口,方便管理人员快速定位功能。

●支持栏目权限的设定与继承。

●支持栏目替换内容、扩展字段的管理功能。

●支持栏目导入导出功能,当栏目结构或数据出现错误时,可以保证系统的稳定可靠运行并可根据需要修复错误的栏目结构并保证数据不丢失。

3.1.1.2.模板管理

●支持新建、修改、删除、预览、导入、导出模板。

●支持模板检索功能,便于用户查询模板名称或者按模板ID查询。

●支持多种置标,例如:

图片新闻、头条新闻、相关链接、相关新闻、上条下条新闻、栏目属性等。

●支持XML格式输出的模板,以便生成XML格式文件,便于和外部程序沟通和交换数据

●系统可以支持任意风格的HTML模板,模板的置标和HTML、XML规范兼容。

3.1.1.3.信息录入

●文档标题和摘要支持可视化编辑,文档标题支持字数的自动计算。

●支持在当前文档正文中插入系统中其它站点或栏目(包括当前站点/栏目)下的文档。

●支持插入多种格式的媒体文件,包括:

swf类型的Flash文件,asf、avi、mpg、mpeg、mpe、mov、rm、rmvb、wmv等格式的视频文件;wav、mid、midi、mp3、mpa、mp2、ra、ram、rm、wma格式的音频文件。

●支持文字库与图片库的整合,可插入图片库中的图片素材,并对图片可进行等比缩放、边框大小、位置及对齐方式等属性设置。

●支持表格编辑,包括行列的增、删,单元格的合并、拆分等。

●支持批注、分页、热词替换等功能,并提供完整的热词分类和管理功能。

●支持自动保存,当系统出现异常时候可以从历史记录上恢复。

●录入文档时,系统能自动查重,可根据需要自动提取文章的摘要和关键词,还能自动对一些政治敏感词进行过滤和校对。

3.1.1.4.文档发布

●对某篇文章、栏目首页、整个栏目、整个站点进行发布

●允许发布状态的控制和发布后状态的生成

●发布权限的管理

●自动定时发布

3.1.2.逻辑流程图

3.1.2.1.栏目操作流程图

3.1.2.2.文档操作流程图

3.1.2.3.模板操作流程图

3.1.2.4.发布流程图

3.1.3.IPO图表

3.1.3.1.栏目建立

模块名称:

栏目的建立

输入部分  I

处理描述  P

输出部分  O

1.在某个站点或父栏目的菜单上点击新建栏目

2.输入栏目的唯一标识(可用中文),显示名称,栏目排序和存放位置

3.选择概览模板和细览模板

4.设置栏目文档显示的过滤条件和排序条件

5.设计定时发布任务

1.检测唯一标识的可用性

2.检测栏目位置在同级目录下是否存在

1.将栏目数据保存到数据库中

2.在默认发布站点中新建站点文件夹

3.继承父目录的权限

3.1.3.2.栏目修改

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.在栏目的菜单中选择修改栏目信息

2.输入栏目的唯一标识(可用中文),显示名称,栏目排序和存放位置

3.选择概览模板和细览模板

4.设置栏目文档显示的过滤条件和排序条件

5.设计定时发布任务

1.检测唯一标识的可用性

2.检测栏目位置在同级目录下是否存在

3.检测栏目修改后存放位置是否发生了变化

1.将栏目数据保存到数据库中

2.将以生成的页面转移到修改后的存放位置

3.删除原来的发布目录

3.1.3.3.栏目放入回收站

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.在栏目的菜单中选者删除栏目,或在站点或父栏目的子栏目视图中勾选要删除的栏目,点击删除选中的栏目

2.用户确认操作继续进行

1.将选中栏目放入删除操作的队列

2.用悲观锁判断当前是否有其他人正在使用该栏目,如果有的话则等待对方操作完毕

3.对栏目进行锁定,避免其他用户再做操作

1.将栏目放入回收站,在数据库中做相应的标识

3.1.3.4.从回收站中将栏目彻底删除

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.进入站点或栏目的回收站

2.选中要删除的栏目,点击删除选中的栏目

3.用户确认操作继续进行

1.检查栏目文档的引用关系

2.检查栏目的模板引用关系

3.检查栏目权限的映射

1.删除栏目中的对其他栏目的数据引用

2.删除栏目的权限映射

3.删除栏目中文档

4.删除栏目的模板映射

5.删除栏目的模板

6.删除栏目发布文件夹

3.1.3.5.模板新建与修改或模板导入

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.在站点和栏目的模板视图中选择新建模板

2.输入模板名称、模板类型和模板内容

3.保存

1.检查模板名称的唯一性

2.检查模板置标的正确性

3.如果是模板导入,提示用户是否覆盖原有模板

将模板数据存入数据库

3.1.3.6.模板绑定栏目

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.在站点或栏目中选择概览模板和细览模板

2.选择是否同步模板到子栏目

1.检查模板类型是否匹配

建立模板与栏目的映射关系

3.1.3.7.模板删除

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.在站点或栏目中选中要删除的模板

2.点击删除并确认操作继续进行

1.检查模板与栏目的映射关系

2.检测模板的悲观锁

3.存入删除列表

1.删除模板

3.1.3.8.信息录入

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.输入文章标题、文章内容、首页标题、副标题、摘要、信息来源,或者用xml从外部导入

2.确认保存

1.检查文章的唯一性

1.保存文章到数据库

2.建立文章与栏目的映射

3.1.3.9.信息删除

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.选中要删除的文章

2.确认操作进行

1.检查文章与栏目的映射

2.检查文章的发布状态

1.从数据库删除文章

2.删除文章与栏目的映射关系

3.删除发布的文件

3.1.3.10.文档与栏目的发布

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.选中文章,选择发布或选中某个栏目,选择仅发布栏目首页或增量发布栏目或完全发布该栏目

1.获取要发布模板的栏目映射或文档映射

2.将队列放入操作队列

3.为队列分配发布线程

1.生成html文件替换原有的html文件

2.更改发布状态

3.1.3.11.撤销发布

模块名称:

输入部分  I

处理描述  P

输出部分  O

1.选中文章或栏目,选者撤销发布

1.用悲观锁判断栏目当前是否正处于发布状态

2.锁住栏目

3.删除原有生成的html文件

1.更改栏目的发布状态

2.更改栏目的可发布属性

3.2.自动采集子系统

3.2.1.功能描述

3.2.1.1.信息采集

●维护人员可方便指定采集的目标站点或页面。

●单个采集工具能够支持千万数量级的网页采集。

●内嵌脚本引擎,能够实现对网页中特定JAVAScript的自动解析。

●通过脚本引擎,为雷达提供一种开放式编程接口,支持用户自行编写JAVAScript脚本对网页进行个性化解析。

●支持论坛采集功能,支持通过定义论坛模版控制采集工具对论坛元数据属性的抽取。

●支持利用mata标签和html标签定位元数据的功能,实现各项元数据信息的精准采集,并提供可视化操作界面。

●支持多媒体数据采集,允许用户配置所需采集的媒体类型。

●支持RSS解析功能,可自动解析RSS的XML文件,抽取网页的链接、标题、时间等信息。

●提供更新采集的控制功能,用户可对更新操作所需要检查的url特征和深度进行设置。

●采集配置支持Cookie和Referer参数的设置。

●翻页采集支持翻页步长设置,支持.Net的POST翻页方式。

●增加网页内容自动摘要和关键词抽取功能。

●改进用户认证的处理过程,简化用户配置,并可适应更复杂的网站认证过程。

●支持采集数据的个性化输出,采集到的网页元数据可以按照用户配置的字段输出,并可输出到用户自定义结构的数据库中。

●支持多语言网页的采集。

采集工具自动将网页内容由原来的多语种编码统一转换为Unicode的UTF-8编码进行存储和索引,并利用全文数据库的多语言支持能力实现对这些网页内容的管理和检索。

支持的多语言包括中、英、日、韩、俄、法、西、德、阿拉伯语等。

对于繁体中文BIG5先自动转换为GBK然后再进行UTF-8转换。

除了UTF-8编码,采集工具还可以统一输出GB18030编码。

●支持网站测试功能,用户在添加新的采集站点时,可以测试目标网站的解析效果,判断采集工具对目标网站的支持能力,并支持在使用翻页变量、数字变量、脚本解析等情况下的效果测试。

●提供日期变量、页码变量和数字变量,使用户可以精确定位监控栏目。

●采用多线程并发搜索技术,采集过程高效准确。

●提供高效的更新手段,已经采集过的信息不会重复采集,更新时只获取前次采集后更新的网页。

●采集目标网站可以按组管理和调度。

维护人员可方便设定每组网站采集的时间周期,包括指定一天之内的多个定点执行时间,或者设定两次更新之间的时间间隔,以分钟为单位,并可设置为不间断运行。

当一组网站不再需要采集时,可以将该组设置为不采集。

●支持基于网页内容的自动分类,自动分类的模板可有智能分类器设置。

●支持基于网页内容的自动排重,可将重复的网页进行标注,只发布不重复信息;自动排重采用相似性检索技术实现,可根据文档内容的匹配程度确定是否重复,比利用网页标题和大小等规则判断据有更强的准确性、实用性以及运行效率。

●自动分类和自动排重功能作为可选项提供,可由维护人员设定。

●自动过滤网页中新闻的正文内容,剔除垃圾信息。

●支持采集模板定制功能,采集工具的维护人员可以通过可视化模板定义正文内容的页面位置属性,以及所要采集链接区域的位置属性,实现对采集内容的精确定位。

●采集的信息可以存储到多种数据库中,包括、SQLServer、Oracle,存储的格式公开,可以方便开发其它应用。

●提供数据导出和数据导入工具,实现采集信息的文件级共享,为内外网的数据交换提供支持。

●具有线程的采集延时设置,实现对采集目标的采集强度控制。

●支持需要用户身份验证的网站的自动采集。

●对于采集失效的采集源,采集工具中用红色显示,表明采集失效。

●可以采集网页中的图片和表格,并在正文中标记图片和表格的位置;维护人员可以指定是否采集图片和表格,并且可以指定数据库存储策略,即在哪些数据库中存储图片。

●可利用脚本引擎实现对基于http传输的视频信息的采集。

●支持对采集点的测试功能,对于采用翻页变量、脚本引擎的采集点,也能够进行测试。

●支持关键词过滤功能,只有符合关键词过滤条件的网页才被采集入库。

3.2.1.2.信息智能化处理

●可对采集的网页进行基于内容的自动分类,不需人工干预。

●基于统计学原理设计,通过在大量语料库上的机器自动学习方法生成分类模板,采用先进的支持向量机和相似性检索相结合的分类方法。

●自动分类准确率达到85%以上。

●提供智能分类训练工具,可根据用户提供的分类语料库进行学习,允许用户自行根据自己的分类需求和数据特点设定分类结构和生成特征模板。

●机器学习和规则分类无缝集成。

机器学习和规则分类是两种自动分类方法,在雷达中把两种分类方法统一实现在一个智能分类器中,使自动分类的实施更加方便。

●支持多级分类。

包括提供支持多级分类的分类训练器,以及对网页实施多级分类操作。

●支持基于网页内容的排重功能。

●自动生成网页摘要。

●自动抽取网页中的关键词。

3.2.1.3.信息发布

●对采集的信息可及时通过Web服务器发布到提供服务的网站上,页面刷新的频率可由最终用户调节。

●可按分类、来源、专题建立网页信息导航,把从各网站采集的不同风格的信息统一导航;分类和专题均可以支持多级,分类导航和专题导航的生成条件可以使用复杂的表达式,表达式只需满足检索表达式格式规范即可。

●实现本地页面浏览和原网页浏览两种浏览方式,使用本地页面浏览方式可以节省互联网带宽,而且访问速度不受互联网接入带宽的限制;使用本地页面浏览方式还可以在不接入互联网的情况下浏览互联网上的信息,适用于内网、专网和外网相互隔离的应用环境。

●支持自动发布和人工发布两种方式,在自动发布方式下,采集到的网页将自动发布到网站上,人工发布方式下,采集到的网页需要经过维护人员的选择才能发布到网站上。

各分类和专题所发布的信息可以由管理员完全控制。

●每个发布的分类或专题均可以单独设定是采用自动发布还是人工发布。

●可以显示网页中的图片和表格。

●支持将采集到信息传输到采编发系统或WCM系统中,成为采编发系统或WCM系统可管理的内容,目前支持采编发4.1和WCM5.x。

图片和表格内容可以跟随网页内容一起导入到WCM系统中。

●在Web端实现对采集工具的控制,维护人员可以通过Web方式控制网页采集工具,包括维护采集站点,设置各种采集参数和属性。

●支持网页快照。

3.2.1.4.信息检索

●支持多语言网页的采集和检索。

雷达4.0支持多语言网站的采集,自动将网页内容统一转换为UTF-8编码进行存储和索引,并实现多语言检索功能。

支持的语言包括中、英、日、韩、俄、法、西、德、阿拉伯语等。

●检索核心采用基于成本优化的查询算法(索引分区技术,多线程并行运算技术,面向全文检索的Cache技术,大内存技术)提高查询速度。

●支持大量并发用户的查询请求。

●检索核心内嵌中文分词系统,并且内含中文分词表、主题词典、同义词典等知识词典(同时提供词典的维护手段),以提高全文检索的查准率和查全率。

●支持对多种属性的检索,包括按日期(及日期范围)、URL、标题、关键词、文件大小等。

●支持检索结果的后排序功能,包括按相关性、日期等。

●自动识别简体和繁体文件,并提供动态内码转换,使用户可以同时浏览简体和繁体文件。

●支持中英文混合检索,中文实现按词检索。

●提供二次检索功能。

●通过网络采集到的信息永久性存入本地数据库,形成本地资料库,不受原网站删除内容的影响。

3.2.2.逻辑流程图

3.2.2.1.信息采集流程图

3.2.2.2.信息智能化处理流程图

3.2.2.3.信息发布流程图

3.2.2.4.信息检索流程图

3.2.3.IPO图表

3.2.3.1.采集内容分组建立

模块名称:

采集内容分组建立

输入部分  I

处理描述  P

输出部分  O

1.输入分组名称

2.选择采集扩展方式

3.选择更新方式

4.选择是否采集该分组的页面

1.确认分组名称不为空且唯一

2.分组中必须有采集点才可建立成功

3.保存分组配置信息在分组配置文本文件中

1.按选择的更新方式准时采集分组信息

2.采集信息时链接按选择的方式进行扩展

3.不采集分组信息

3.2.3.2.采集内容分组修改

模块名称:

采集内容分组修改

输入部分  I

处理描述  P

输出部分  O

1.输入分组名称

2.选择采集扩展方式

3.选择更新方式

4.选择是否采集该分组的页面

1.确认分组名称不为空且唯一

2.分组中必须有采集点才可建立成功

3.保存分组配置信息在分组配置文本文件中

1.按选择的更新方式准时采集分组信息

2.采集信息时链接按选择的方式进行扩展

3.不采集分组信息

3.2.3.3.采集内容分组删除

模块名称:

采集内容分组修改

输入部分  I

处理描述  P

输出部分  O

1.在分组下拉框中选择要删除的分组

2.点击删除按钮,并确认

删除分组配置文本文件中该分组的配置信息

删除该分组,不再采集该分组信息

3.2.3.4.采集起始点新建

模块名称:

采集起始点建立

输入部分  I

处理描述  P

输出部分  O

1.选择采集内容分组

2.输入采集点的URL

3.输入采集点的站点名称

4.输入采集点的栏目名称

5.选择采集点的分类名称

6.点击“增加”按钮

1.URL不为空

2.检查站点名称唯一性

3.在采集点配置文件中添加该采集点信息

1.在采集内容分组中新添改采集点

2.显示该采集点的站点名称

3.显示该采集点的栏目名称

4.显示该采集点的分类名称

3.2.3.5.采集起始点修改

模块名称:

采集起始点修改

输入部分  I

处理描述  P

输出部分  O

1.输入采集点的URL

2.输入采集点的站点名称

3.输入采集点的栏目名称

4.选择采集点的分类名称

5.点击“更新”按钮

1.URL不为空

2.检查站点名称唯一性

3.在采集点配置文件中修改该采集点信息

1.显示该采集点的站点名称

2.显示该采集点的栏目名称

3.显示该采集点的分类名称

3.2.3.6.采集起始点删除

模块名称:

采集起始点删除

输入部分  I

处理描述  P

输出部分  O

1.在采集内容分组中选择采集点

2.点击“删除”按钮,并确认

在采集点配置文件中修改该采集点信息

不再采集该采集点的信息

3.2.3.7.采集起始点链接属性设置

模块名称:

采集起始点链接属性设置

输入部分  I

处理描述  P

输出部分  O

1.选择是否对链接进行智能过滤

2.编辑链接脚本

3.选择是否对链接进行RSS分析

4.输入网址包含字符

5.输入网址排除字符

6.输入页面采集深度

7.输入更新包含字符

8.输入更新排除字符

9.输入页面更新深度

1.采用智能算法,滤掉垃圾链接

2.内嵌脚本引擎,运行链接脚本

3.解析RSS的XML文件

4.根据页面采集深度进行采集

5.更新时根据页面更新深度进行更新

1.页面垃圾链接被过滤掉

2.根据链接脚本解析出页面链接

3.提取出网页的标题、时间、链接等信息

4.采集网址包含某些字符串的链接

5.不采集网址包含某些字符串的链接

6.更新包含某些字符串的链接

7.不更新包含某些字符串的链接

3.2.3.8.采集起始点内容属性设置

模块名称:

采集起始点内容属性设置

输入部分  I

处理描述  P

输出部分  O

1.选择是否对内容进行智能过滤

2.编辑内容脚本

3.编辑内容模板

4.选择是否存储图片内容

5.选择是否存储表格内容

6.输入链接包含字符

7.输入链接排除字符

8.输入标题包含字符

9.输入标题排除字符

10.输入内容包含字符

11.输入内容排除字符

1.采用智能算法,滤掉垃

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > 临时分类 > 批量上传

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2