goole.docx

上传人:b****5 文档编号:14456555 上传时间:2023-06-23 格式:DOCX 页数:12 大小:25.79KB
下载 相关 举报
goole.docx_第1页
第1页 / 共12页
goole.docx_第2页
第2页 / 共12页
goole.docx_第3页
第3页 / 共12页
goole.docx_第4页
第4页 / 共12页
goole.docx_第5页
第5页 / 共12页
goole.docx_第6页
第6页 / 共12页
goole.docx_第7页
第7页 / 共12页
goole.docx_第8页
第8页 / 共12页
goole.docx_第9页
第9页 / 共12页
goole.docx_第10页
第10页 / 共12页
goole.docx_第11页
第11页 / 共12页
goole.docx_第12页
第12页 / 共12页
亲,该文档总共12页,全部预览完了,如果喜欢就下载吧!
下载资源
资源描述

goole.docx

《goole.docx》由会员分享,可在线阅读,更多相关《goole.docx(12页珍藏版)》请在冰点文库上搜索。

goole.docx

goole

本文简要的介绍了GOOGLE的历史和特点,GOOGLE的基本搜索语法和高级搜索语法,GOOGLE的特色功能,包括图片搜索、新闻组搜索和集成工具条等,还简单的介绍了一些常用搜索技巧和实用个案。

尽管本文名为“GOOGLE搜索从入门到精通”,但事实上,笔者对运用GOOGLE进行搜索也尚处于“入门”阶段。

3、如何使用本文

阅读本文最好具备一些最基本的布尔代数基础,如“与”、“或”、“非”等。

不过,即便你没有这方面的知识,也不必在意。

对那些实例进行练习,你的疑惑就会迎刃而解。

对于刚刚接触网络搜索的读者而言,也许你应该从头到尾的阅读本文;但对于那些有一定搜索基础的读者而言,只需要跳跃着寻找自己所需要的信息就可以了。

当然,如果你有一定的英文基础,也可以把本文与GOOGLE大全(http:

//www.go...om/about.html)参照阅读,那样效果会更好。

4、GOOGLE简介

Google()是一个搜索引擎,由两个斯坦福大学博士生LarryPage与SergeyBrin于1998年9月发明,GoogleInc.于1999年创立。

2000年7月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。

98年至今,GOOGLE已经获得30多项业界大奖。

GOOGLE的成功得益于其强大的功能和独到的特点:

GOOGLE支持多达132种语言,包括简体中文和繁体中文;

GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;

GOOGLE速度极快,据说有10000多台服务器,200多条T3级宽带;

GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;

GOOGLE的搜索结果摘录查询网页的含有关键字的内容,而不仅仅是网站简介;

GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;

GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。

5、搜索入门

要用GOOGLE做搜索,当然首先要进GOOGLE网站--;不过,和使用的实际上也是GOOGLE搜索引擎,只是对搜索结果进行了编排,但无法提供一些特色功能,如图片搜索等。

第一次进入GOOGLE,它会根据你的操作系统,确定语言界面。

需要提醒的是,GOOGLE是通过cookie来存储页面设定的,所以,如果你的系统禁用cookie,就无法对GOOGLE界面进行个人设定了。

GOOGLE的首页很清爽,LOGO下面,排列了四大功能模块:

网站、图像、新闻组和目录服务。

默认是网站搜索。

现在进行第一次搜索实践,要查找所有关于“易筋经”的中文网站和网页。

在搜索框内输入一个关键字“易筋经”,然后点击下面的“google搜索”按钮(或者直接回车),结果就出来了。

搜索:

“易筋经”

结果:

已搜索有关易筋经的中文(简体)网页。

共约有5,930项查询结果,这是第1-10项。

搜索用时0.12秒。

6、初阶搜索

在上例子中,你已经知道了最基本的搜索,即查询包含单个关键字的信息。

现在,进一步探讨多个关键字以及关键字间不同逻辑关系的查询。

6.1、搜索结果要求包含两个及两个以上关键字

一般搜索引擎需要在多个关键字之间加上“+”,而GOOGLE无需用明文的“+”来表示逻辑“与”操作,只要空格就可以了。

示例:

搜索所有包含关键词“易筋经”和“吸星大法”的中文网页

搜索:

“易筋经吸星大法”

结果:

已搜索有关易筋经吸星大法的中文(简体)网页。

共约有774项查询结果,这是第1-10项。

搜索用时0.24秒。

注意:

文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。

6.2、搜索结果要求不包含某些特定信息

GOOGLE用减号“-”表示逻辑“非”操作。

示例:

搜索所有包含“易筋经”而不含“吸星大法”的中文网页

搜索:

“易筋经-吸星大法”

结果:

已搜索有关易筋经-吸星大法的中文(简体)网页。

共约有5,150项查询结果,这是第1-10项。

搜索用时0.40秒。

注意:

这里的“+”和“-”号,是英文字符,而不是中文字符的“+”和“-”。

此外,操作符与作用的关键字之间,不能有空格。

比如“易筋经-吸星大法”,搜索引擎将视为关键字为易筋经和吸星大法的逻辑“与”操作,中间的“-”被忽略。

6.3、搜索结果至少包含多个关键字中的任意一个

GOOGLE用大写的“OR”表示逻辑“或”操作。

假定你是布兰妮和批头士的歌迷,现在要查找所有关于布兰妮和批头士的中文网页。

示例:

搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。

搜索:

“BritneyORBeatlesOR布兰妮OR批头士”

结果:

已搜索有关BritneyORBeatlesOR布兰妮OR批头士的中文(简体)网页。

共约有31,300项查询结果,这是第1-10项。

注意:

小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。

6.4、“+”、“-”和“OR”的混合查询

混合查询涉及到逻辑操作符的顺序问题。

一般而言,搜索引擎按照从左往右的顺序读取操作符号。

如果只涉及“与”操作和“非”操作,则不会产生顺序问题,搜索结果数量和关键字顺序无关,不过,具体搜索的结果顺序会视关键字的顺序而定。

单纯的“或”操作也同样道理。

但是,如果“或”查询和其他两种查询混合在一起,问题就复杂了。

现在我们做这样的查询:

“所有关于Britney或者Beatles、但是没有Madonna相关信息的中文网页”。

搜索:

“BritneyORBeatles-Madonna”

结果:

已搜索有关BritneyORBeatles-Madonna的中文(简体)网页。

共约有16,200项查询结果,这是第1-10项。

搜索用时0.23秒。

搜索:

“-MadonnaBritneyORBeatles”

结果:

已搜索有关-MadonnaBritneyORBeatles的中文(简体)网页。

共约有16,200项查询结果,这是第1-10项。

搜索用时0.13秒。

搜索:

“Britney-MadonnaORBeatles”

结果:

找不到和您的查询-Britney-MadonnaORBeatles-相符的网页

搜索:

“BritneyOR-MadonnaBeatles”

结果:

找不到和您的查询-BritneyOR-MadonnaBeatles-相符的网页

可见,“或”操作的前后两个关键字必须是默认的“与”查询,否则,搜索引擎将无法完成搜索。

6.5、用“+”和“-”减少冗余信息

通常情况下,用一个关键字查询,会得到很多和查询目的不相关的冗余信息。

我们总是希望,搜索结果的第一个条目中就包含所需要的信息。

“+”和“-”很多时候就起到缩小搜索结果的范围,以提高查询结果命中率。

例:

查阅天龙八部具体是哪八部。

分析:

如果光用“天龙八部”做关键字,搜索结果有20,300项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。

可以用两个方法减少无关结果。

(1)、如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字。

“天龙八部阿修罗”的搜索结果就只有1,050项,可以很快找到全部八部。

(2)、如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录。

“天龙八部佛教-金庸”的查询结果为1,120项,可以迅速找到需要的资料。

7、辅助搜索

7.1、通配符问题

很多搜索引擎支持通配符号,如“*”代表一连串字符,“?

”代表单个字符等。

GOOGLE不支持通配符,只能做精确查询,关键字中的“*”或者“?

”会被忽略掉。

7.2、关键字的字母大小写

GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

7.3、搜索整个句子

GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。

示例:

搜索包含“long,longago”字串的页面。

搜索:

“"longlongago"”

结果:

已搜索有关longlongago的中文(简体)网页。

共约有16,500项查询结果,这是第1-10项。

搜索用时0.06秒。

7.4、搜索引擎忽略的字符和词汇

GOOGLE对一些网路上出现频率极高的英文单词,如“i”、“com”、“www”等,以及一些符号如“*”、“.”等,作忽略处理。

示例:

搜索关于第一次世界大战的信息

搜索:

“"worldwari"”

结果:

"i"使用过于频繁,没有被列入搜索范围。

已向英特网搜索"worldwari".共约有7,370项查询结果,这是第1-10项。

搜索用时0.17秒。

7.5、强制搜索

如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的“+”号。

示例:

搜索包含“WhoamI?

”的网页。

如果用“"whoami?

"”,“Who”、“I”、“?

”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。

搜索:

“"+who+am+i"”

结果:

已向英特网搜索"+who+am+i".共约有332,000项查询结果,这是第1-10项。

搜索用时3.68秒。

注意:

大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。

8、进阶搜索

上面已经探讨了GOOGLE的一些最基础搜索语法。

通常而言,这些简单的搜索语法已经能解决绝大部分问题了。

不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西。

8.1、对搜索的网站进行限制

“site”表示搜索结果局限于某个具体网站或者网站频道,如“”、“”,或者是某个域名,如“”、“com”等等。

如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。

示例:

搜索中文教育科研网站()上所有包含“金庸”的页面。

搜索:

“金庸site:

结果:

已搜索有关金庸site:

的中文(简体)网页。

共约有1,730项查询结果,这是第1-10项。

搜索用时0.23秒。

示例:

搜索包含“金庸”和“古龙”的中文新浪网站页面,

搜索:

“金庸古龙site:

结果:

已在搜索有关金庸古龙的中文(简体)网页。

共约有734项查询结果,这是第1-10项。

搜索用时0.12秒。

示例:

搜索新浪文教频道中关于鲁迅的信息。

搜索:

“鲁迅site:

结果:

已在搜索有关鲁迅的中文(简体)网页。

共约有672项查询结果,这是第1-10项。

搜索用时0.24秒。

注意:

site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:

”将被作为一个搜索的关键字。

此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。

诸如“金庸site:

8.2、查询某一类文件(往往带有同一扩展名)

“filetype:

”,这是个尚在测试阶段的GOOGLE特色查询,不过功能已经非常强大,可以做很多意想不到的事情哦。

最重要的文档搜索是PDF搜索。

PDF是ADOBE公司开发的电子文档格式,现在已经成为互联网的电子化出版标准。

目前GOOGLE检索的PDF文档大约有2500万左右。

PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中全面。

示例:

搜索关于电子商务(ECOMMERCE)的PDF文档。

搜索:

“ecommercefiletype:

pdf”

结果:

已向英特网搜索ecommercefiletype:

pdf.共约有25,500项查询结果,这是第91-100项。

搜索用时0.44秒。

下面是某项搜索结果:

[PDF]www.ecommerce.gov/apec

文档类型:

PDF/AdobeAcrobat-一般文字档

Page1.APartnershipoftheBusinessCommunityWithAPECEconomiesE-COMMERCE

READINESSASSESSMENTGUIDEwww.ecommerce.gov/apecPage2....

www.ecommerce...pec/docs/read...adiness_guide_5.pdf-类似网页

可以看到,GOOGLE在PDF档前加上了[PDF]的标记,而且,GOOGLE把PDF文件转换成了文字档,点击“一般文字档”,可以粗略的查看该PDF文档的大致内容。

当然,PDF原有的图片以及格式是没有了。

搜索PDF文档还可以用“inurl:

”语法。

比如上例,也可以用“inurl:

pdfecommerce”。

搜索结果数量大致相同,不过查询结果顺序则略有很大差别。

注意,上述查询均是对PDF内文的检索,“ecommerce”这个关键字是包含在PDF文档中的。

“filetype”的另一个强大用处则在图片搜索。

下文将对GOOGLE的图片搜索功能作详细说明,此处只是略提一下。

进入“

搜索:

“BinLadenfiletype:

jpg”

结果:

搜索有关BinLadenfiletype:

jpg的图片()。

(试验版)共约有1,630项查询结果,这是第1-20项。

搜索用时0.14秒。

除此之外,我尚未发现其他的filetype用法。

如果有谁知道,请给我发邮件。

预先感谢。

8.3、搜索的关键字包含在URL链接中

“inurl”语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。

有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP3”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。

INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的专题资料。

示例:

查找MIDI曲“沧海一声笑”。

搜索:

“inurl:

midi沧海一声笑”

结果:

已搜索有关inurl:

midi沧海一声笑的中文(简体)网页。

共约有16项查询结果,这是第1-10项。

搜索用时0.16秒。

示例:

查找微软网站上关于windows2000的安全课题资料。

搜索:

“inurl:

securitywindows2000site:

结果:

已在内搜索有关inurl:

securitywindows2000的网页。

共约有188项查询结果,这是第1-10项。

搜索用时0.27秒。

注意:

“inurl:

”后面不能有空格,GOOGLE也不对URL符号如“/”进行搜索。

例如,GOOGLE会把“cgi-bin/phf”中的“/”当成空格处理。

“allinurl”语法返回的网页的链接中包含所有作用关键字。

这个查询的关键字只集中于网页的链接字符串。

示例:

查找可能具有PHF安全漏洞的公司网站。

通常这些网站的CGI-BIN目录中含有PHF脚本程序(这个脚本是不安全的),表现在链接中就是“域名/cgi-bin/phf”。

语法:

“allinurl:

"cgi-bin"phf+com”

搜索:

已向英特网搜索allinurl:

"cgi-bin"phf+com.共约有37项查询结果,这是第1-10项。

搜索用时0.36秒。

8.4、搜索的关键字包含在网页标题中

“intitle”和“allintitle”的用法类似于上面的inurl和allinurl,只是后者对URL进行查询,而前者对网页的标题栏进行查询。

网页标题,就是HTML标记语言title中之间的部分。

网页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中。

因此,只查询标题栏,通常也可以找到高相关率的专题页面。

示例:

查找日本明星藤原纪香的照片集。

搜索:

“intitle:

藤原纪香写真”

结果:

已搜索有关intitle:

藤原纪香写真的中文(简体)网页。

共约有465项查询结果,这是第1-10项。

搜索用时0.16秒。

9、其他罕用语法

9.1、搜索所有链接到某个URL地址的网页

如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接。

而“link”语法就能让你迅速达到这个目的。

示例:

搜索所有含指向华军软件园“”链接的网页。

搜索:

“link:

结果:

搜索有链接到的网页。

共约有856项查询结果,这是第1-10项。

搜索用时0.17秒。

注意:

“link”不能与其他语法相混合操作,所以“link:

”后面即使有空格,也将被GOOGLE忽略。

9.2、查找与某个页面结构内容相似的页面

“related”用来搜索结构内容方面相似的网页。

例:

搜索所有与中文新浪网主页相似的页面(如网易首页,搜狐首页,中华网首页等),“related:

9.3、从GOOGLE服务器上缓存页面中查询信息

“cache”用来搜索GOOGLE服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网页,相当于使用普通搜索结果页面中的“网页快照”功能。

示例:

查找GOOGLE缓存的中文yahoo首页

搜索:

“cache:

结果:

这是Google内的页库快照。

Google已先预览各网站,拍下网页的快照存档。

这网页可能有更新的版本,请按此查看新版。

Google和网页作者无关,不对网页的内容负责。

...

9.4、info

info用来显示与某链接相关的一系列搜索,提供cache、link、related和完全包含该链接的网页的功能。

示例:

查找和新浪首页相关的一些资讯。

搜索:

“info:

结果:

有关的网页信息。

新浪首页

北京站上海站广东站....首页,|,新闻,|,体育,|,财经,|,

科技,|,娱乐,|,游戏,|,军事,|,健康,|,教育,|,汽车,|,

女性,|,个人家园....

简介:

位于北京的新闻中心,包括新闻与评论。

类别:

World>ChineseSimplified>新闻

Google提供这个网址的信息:

查看Google网页快照里的存档

寻找和类似的网页

寻找网页有链接到

寻找网页包含有""

10、图片搜索

我不得不承认,GOOGLE的图片搜索功能真是个伟大的发明!

GOOGLE自称可以检索320,000,000张图片,并称自己为“互联网上最好用的图像搜索工具”。

尽管目前该功能尚在B测试阶段,但的确已经非常好用!

GOOGLE首页点击“图像”链接就进入了GOOGLE的图像搜索界面“”。

你可以在关键字栏位内输入描述图像内容的关键字,如“britneyspears”,就会搜索到大量的小甜甜布兰妮的图片。

我目前尚不是很清楚图片的排列标准,不过以观察来看,似乎图片文件名完全符合关键字的结果排列比较考前,然后才按照普通的页面搜索时的标准排列。

GOOGLE给出的搜索结果具有一个直观的缩略图(THUMBNAIL),以及对该缩略图的简单描述,如图像文件名称,以及大小等。

点击缩略图,页面分成两祯,上祯是图像之缩略图,以及页面链接,而下祯,则是该图像所处的页面。

屏幕右上角有一个“RemoveFrame”的按钮,可以把框架页面迅速切换到单祯的结果页面,非常方便。

GOOGLE图像搜索目前支持的语法包括“+”,“-”,“OR”,“site”和“filetype”。

示例:

查找美国教育网上的宇宙大爆炸jpg图片

搜索:

“BIGBANGfiletype:

jpgsite:

edu”

结果:

搜索有关BIGBANGfiletype:

jpgsite:

edu的图片()。

(试验版)共约有337项查询结果,这是第1-20项。

搜索用时1.99秒。

11、目录内搜索

如果不想搜索广泛的网页,而是想寻找某些专题网站,可以访问GOOGLE的分类目录“http:

//directory.google.com/”,中文目录是“http:

//direct...e_Simplified/”。

目前GOOGLE使用的分类目录采用了ODP的内容。

“OpenDirectoryProject”是网景公司所主持的一项大型公共网页目录。

由全世界各地的义务编辑人员来审核挑选网页,并依照网页的性质及内容来分门别类。

因此,在某一目录门类中进行搜索往往能有更高的命中率。

另外,GOOGLE根据其专业的“网页级别”(PageRank)技术对目录中登录的网站进行了排序,可以让一般的检索更具高效率。

示例:

查找一下关于癌症治疗以及护理方面的中文资料

搜索:

先进入中文简体分类目录,再进入“健康”子目录,确定选中“只在健康中搜索”单选项目。

在搜索栏内填入“癌症”进行搜索。

结果:

在分类健康项中搜索癌症。

共约有370项查询结果,这是第1-10项。

搜索用时0.05秒。

可以看到,上述查询结果比普通的检索更有效,因为在分类健康项中进行搜索剔除了很多不相关的诸如新闻之类的无效信息。

不过,对于中文用户而言,现在最大的问题是志愿的中文目录编辑太少,导致收录站点太少,因此搜索结果范围显得过于狭隘。

但愿这个问题能随着GOOGLE以及ODP项目在国内名声的响亮而能得到改观。

12、新闻组(USENET)搜索

新闻组有详尽的分类主题,某些主题还有专人管理和编辑,具有大量的有价值信息。

由于新闻组包含的信息实在是海量,因此不利用工具进行检索是不大可能的。

DEJA一直是新闻组搜索引擎中的佼佼者。

2001年2月份,GOOGLE将DEJA收购并提供了所有DEJA的功能。

现在,除了搜索之外,GOOGLE还支持新闻组的WEB方式浏览和张贴功能。

进入GOOGLE新闻组“

搜索:

“山顶洞人”

结果:

在各群组内搜索山顶洞人共约有18项查询结果,这是第1-10项。

搜索用时0.29秒。

搜索结果默认按照“留言内容”排列,但是你也可以点击“依照日期”按钮,让帖子按照发布日期排列。

因为新闻组中的帖子实在是多,而且又涉及一些普通搜索所没有的语法,所以建议使用“高级群组搜寻”进入高级搜索界面。

新闻组高级搜索提供留言内容、分类主题、标题、留言者、留言代码、语言和发布日期作为条件进行搜索。

其中作者项指作者发帖所用的唯一识别号电子信箱。

展开阅读全文
相关资源
猜你喜欢
相关搜索

当前位置:首页 > 农林牧渔 > 林学

copyright@ 2008-2023 冰点文库 网站版权所有

经营许可证编号:鄂ICP备19020893号-2