信息检索信息搜索鉴别和筛选.docx

上传人:b****8 文档编号:12681653 上传时间:2023-06-07 格式:DOCX 页数:10 大小:19.82KB
下载 相关 举报
信息检索信息搜索鉴别和筛选.docx_第1页
第1页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第2页
第2页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第3页
第3页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第4页
第4页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第5页
第5页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第6页
第6页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第7页
第7页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第8页
第8页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第9页
第9页 / 共10页
信息检索信息搜索鉴别和筛选.docx_第10页
第10页 / 共10页
亲,该文档总共10页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

信息检索信息搜索鉴别和筛选.docx

《信息检索信息搜索鉴别和筛选.docx》由会员分享,可在线阅读,更多相关《信息检索信息搜索鉴别和筛选.docx(10页珍藏版)》请在冰点文库上搜索。

信息检索信息搜索鉴别和筛选.docx

信息检索信息搜索鉴别和筛选

信息检索信息搜索、鉴别和筛选

一提到网络搜索,大家马上会想到谷歌和XX。

当然,一遇到问题人们可能最先想到的就是这两大搜索引擎。

但是呢,好的信息搜索并不只有这两个,每一种搜索引擎都有各自的利弊,选不对搜索引擎,就像选了不合脚的鞋一样,能走路,但艰辛痛苦,也跑不快走不远。

使用搜索引擎首先要了解各种搜索引擎特点,否则你可能浪费大量时间。

这次搜索,你应该使用XX还是Yahoo?

Google还是XX?

分析你的需求,选根据需求找拥有相应功能优势的搜索引擎。

这里介绍一些:

1.方向着手

(1)从行业入手查找,比较好用的是“XX产品大全”(点击首页“更多”选项即可):

行业报告——各行业官方报告、评定、专家解读,行业与单个品牌市场综述、分析,行业与单个品牌数据、过往新闻。

当然这个不乏广告成分,所以需要鉴别,当心受骗。

(2)寻找特定领域的人了解情况,寻找合适采访对象,如专家学者、老一辈,想熟悉某个领域或了解某个城市、历史、词条……这些比较细致的东西,可以用“XX百科”,网友们集体贡献的智慧是无穷的,而且网友的料也是无穷的,你往往能有意外收获。

另外wikipedia(维基百科)也是巨型资料库,而且更新很快。

(3)Google有一个实用搜索功能是“大学搜索”,要知道现在多数有点名的所谓专家学者都没少在大学挂职,各种研究所、实验室、官方组织的这个那个不少也扎根大学,而大学又是产生思想文化的重要阵地。

用这个搜索可以一网打尽和某所大学有关的所有东西。

(4)现在有一些新开发的搜索引擎,它们可以对网页库中的某类专门的信息进行一次整合。

有人称之为:

元搜索引擎。

这种搜索引擎的特点是大大减少了你整合资料的时间。

比如比比猫(Bbmao)。

这个搜索引擎的特点是:

自动分类、自动去掉重复结果、汇集五大搜索引擎结果。

智能分类,你可能在分类中发现一些你不曾想到的东西。

不过元搜索是不是好用,可能仁者见仁智者见智,但是只要适应了这种新方式,会给你带来很多方便。

2.技巧着手

(1)设计关键词:

使用搜索引擎要避免大而空的关键词,它不知道你要找啥,就可能返回很多莫名其妙结果。

因此需要习惯多关键词搜索,一般情况下两个关键词搜索就够了,注意关键词与关键词之间以空格隔开。

你可以先用简单关键词测试,不忙着仔细查看搜索结果,而先从搜索结果页面里寻找更多信息(如果使用元搜索引擎,注意看“分类结果”),再设计一个更好的关键词重搜,这样重复几次后,就能设计出很棒的关键词,也就能搜索到满意结果了。

(2)学会使用逻辑符号:

搜索引擎基本上都支持附加逻辑命令查询。

北京+旅游,表示搜索包含所有北京和旅游这两个词组的页面,不过现在基本用不着这个了,一般敲个空格就OK了。

“-”可去除无关搜索结果,提高搜索结果相关性。

比如,你要找“青岛”的城市信息,输入“青岛”却找搜到一堆“青岛啤酒”新闻,在发现这些新闻的共同特征是“啤酒”后,输入“青岛–啤酒”来搜索,就不会再有啤酒烦你了。

利用双引号,来查询完全符合关键字串的网站。

例如:

键入“莎士比亚喜剧”,会找出包含完整莎士比亚喜剧词组的页面。

这种查询方法要求用一对半角的双引号来把关键字包括起来。

(3)告别错别字:

细节决定成败,这老话也适用在搜索上。

输入的关键词有错别字,会影响搜索准确性。

光“蔡依林”网上就有“蔡依灵”“蔡依琳”“蔡依玲”等众多版本,你指望这样的关键词搜到些啥?

所以发扬你深厚的中文功底吧,别让错别字害了。

(4)英文搜索首选Google(注意最好是Google英文版,而不是“谷歌”哦),其次Yahoo。

中文搜索优先XX,在中文领悟上,XX还是很老道的。

概念查找优先WIKE,維基百科的优势在于它对概念理解都是的,比如你要查LINUX,这里会告诉你最新的版本,及拓展应用,让你比较容易的对这一新概念,有一个准确的印象,这里还会提供一些参考,都一些权威的网站或图书。

3.他方实力

官网、熟用提供网址导航的网站(典型的是hao123)、知名论坛的力量(天涯、网易都不错),博客也别忘了,尤其是名人博客。

温馨提示:

在访问过程中,遇到好的资源网站可以单击鼠标右键,把该网站加入收藏夹,下次可以方便的访问。

(收藏夹经过一段时间,也可以进行优化。

从网络或其它途径获得信息后,是不是就可“拿来主义”直接使用呢?

答案显然是否定的。

__络既是信息的万花筒,也是信息的垃圾场。

如果人们不具备相应的审视和判断能力,就会被一大堆信息垃圾所湮没。

因此对获取的信息需要进行辨证分析,通过价值判断,剔除糟粕,然后,对有用信息进行深层挖掘,寻找其中隐含的价值和意义,来满足需求。

分析和判断的过程就是去粗取精、去伪存真的过程。

伪信息产生的原因:

1、信息骗子的兜售。

2、受经济利益的驱动。

(电信局电话号码注册)

3、人员素质偏低。

4、用户缺乏自我保护意识与识别力。

5、设备本身的缺陷。

(机器故障与计算机病毒)

6、缺乏权威统一的管理与监督机构。

7、信息严重污染。

(信息老化)

在这里我们需要了解信息的特征:

传递性、共享性、依附性、可处理性、价值相对性、时效性、真伪性。

在信息的鉴别中,我们主要是依据信息的、价值相对性、时效性做出判断。

在信息的筛选中,我们主要是依据信息的价值相对性、时效性、真伪性进行选择。

信息的鉴别方法

全面检验

从多方面来检验信息以确定其完整与否,不完整的就是伪信息。

(如美国菠萝罐头厂的建立因伪信息而导致严重损失)

多要素核查

一条真实而有价值的信息,含有时间、地点、事物或物品、数量与价格、状态、本质、规格与功用、信息。

要识别一条信息的真与假,要一一核查落实。

(核查方法有电话电报询问、委托有关人员查询或通过__络核查、现场调查)

权威佐证

一条貌似真实的信息,只要用权威__加以比较就会原形毕露,现出假象。

(如一条内部公布的数字是否准确,只要用__的数字予以佐证,就能识别真假。

相互检验

同一客观事物反映的信息,可用不同方式检验。

(如同一品牌、同一档次的汽车价位可以通过不同的购车网站的信息进行比较。

对进行鉴别和评价的方法,可以从下面几个方面对信息进行鉴别和评价:

1、信息是否真实可靠。

2、信息是否具有权威性。

3、信息是否可用。

4、信息是否具有时效限制。

5、信息包含哪种情感成分。

6、信息是否具有实用性。

信息筛选方法

信息筛选,就是指对各种途径、经鉴别后的信息,将其归类分析,依据个人的需求,去掉哪些与目标不符、无价值乃至价值甚微的冗余信息,而保留与目标相符、有参考价值的信息的过程。

信息筛选方法:

需求取舍法

针对个人信息需求目的,将所掌握的信息需求分出层次,以决定其取舍的方法。

首先要明确信息需求的范围,再将所了解到的信息需求累积起来,而后将其分解为重点需求、常规需求与相关需求等层次。

最后根据需求的强度来决定取舍。

逐层筛选法:

粗选。

就是将从各种渠道、运用不同的方法采集来的信息,经鉴别筛选后,分成与用户有关和无关的两种。

精选。

就是对相关的信息进行进一步区分的办法。

首先在粗选的基础上,将与用户有关的信息分成直接有关与间接有关的信息两类。

然后对直接相关的信息又区分为最重要的信息、较重要的信息、一般的信息。

查重法

剔除内容重复的信息,选留有用信息,以减少其他信息工作环节的无效劳动。

当然这种方法也并非一味重复,如果需要,也可以保存一部分重要的信息复本,以供一定情况下的多人使用。

时序法

按时间顺序对公关信息资料进行取舍。

在同一内容的情况下,较新的信息资料选留,较旧的则剔除。

这样可以使选留的信息在一定时间区间内更有价值,特别是对于文献中的信息资料,更需选择时间最近的予以留存。

类比法

将同类型的信息进行比较,哪个信息量大,哪个更能反映事物的本质问题,则选留下来;反之,则剔除。

当然有的虽然信息量并不很大,或者反映事物本质也并不深刻的信息资料,可能作为主要信息资料的重要补充内容,或对公共关系工作有启发作用,也应选留,不能一概剔除。

专家评估法

对某些专业性强、性强的信息,公关信息人员一时难以确定其取舍问题,可以请有关专家或专业人员进行评估,根据其评估结果,结合本组织当前与长远的需要综合考虑选留和剔除问题。

老化规律法

这主要是针对文献信息资料而言的,文献学认为,文献的使用价值随时间而逐渐降低,甚至完全失去价值,这就是老化规律。

一般来说,文献的利用率第一年最高,以后逐渐下降,呈等级分布状态,文献的老化情况在文献学中一般用半衰期来表示。

所谓半衰期,即指某学科目前尚在利用的全部文献的一半是在近期内多长的一段时间内发表的。

一般地说,半衰期越长,说明老化速度越慢;半衰期越短,说明老化速度越快。

文献信息资料的筛选应对其行文年代及本学科文献老化的半衰期两方面进行考察,以便确定取舍。

网络信息筛选的六项原则

权威性原则

信源具有权威性。

例如权威学者、权威学术期刊、政府官方网站.中国世界卫生组织专家组组长、流行病学家罗伯特、中科院院士钟南山的讲话、世界权威杂志《科学》报道等都具有权威性.。

多重信道可重复性原则

多重信道传输着相同的信息。

例如不同学科多位权威学者各自独立测试,获得同样的信息就具有多重信度。

时效性原则

信息发布的时间效度。

例如权威信源针对同一问题,最近发布的信息比以往所发布的信息信度更。

下图中的第二个消息就更加准确了。

逻辑性原则

从已知事实出发,利用比较与分类、分析与综合,抽象与概括,归纳与演绎等逻辑方法得出合理的结论。

例如野生动物的贩卖者、饲养者、首批感染SARS病毒的人,都有和果子狸的的接触史,可推论果子狸与SARS病毒有关.

实证性原则

一切结论都要由科学实验来提供确凿的证据.在案例1中,上海生命科学所和广东省非典医疗救治专家组副组长都提出了疑问,但因无实证,所以不可信.

代表性原则

中国从76只果子狸中未发现SARS样病毒,不代表所有的果子狸都不是病毒的携带者.

对六项原则信息筛选时有些必须具备,有些可不一定同时具备.

内容仅供参考

展开阅读全文
相关资源
猜你喜欢
相关搜索
资源标签

当前位置:首页 > IT计算机 > 电脑基础知识

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2