Google搜索从入门到精通Word格式文档下载.docx
《Google搜索从入门到精通Word格式文档下载.docx》由会员分享,可在线阅读,更多相关《Google搜索从入门到精通Word格式文档下载.docx(19页珍藏版)》请在冰豆网上搜索。
2,摘要
本文简要的介绍了Google的历史和特点,Google的基本搜索语法和高级搜索语法,Google的
特色功能,包括图片搜索,新闻组搜索和集成工具条等,还简单的介绍了一些常用搜索技巧和
实用个案.尽管本文名为"
Google搜索从入门到精通"
但事实上,笔者对运用Google进行搜
索也尚处于"
入门"
阶段.:
)
3,如何使用本文
阅读本文最好具备一些最基本的布尔代数基础,如"
与"
"
或"
非"
等.不过,即便你
没有这方面的知识,也不必在意.对那些实例进行练习,你的疑惑就会迎刃而解.对于刚刚接
触网络搜索的读者而言,也许你应该从头到尾的阅读本文;
但对于那些有一定搜索基础的读者
而言,只需要跳跃着寻找自己所需要的信息就可以了.此外,你也可以参考中文Google大全:
http:
//www.G
4,Google简介
Google(www.G)是一个搜索引擎,由两个斯坦福大学博士生LarryPage与SergeyBrin
于1998年9月发明,GoogleInc.于1999年创立.2000年7月份,Google替代Inktomi成为
Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎.98年至今,Google
已经获得30多项业界大奖.到Google的新闻中心
(http:
闻资料.
Google的成功得益于其强大的功能和独到的特点:
Google支持多达132种语言,包括简体中文和繁体中文;
Google网站只提供搜索引擎功能,没有花里胡哨的累赘;
Google速度极快,据说有10000多台服务器,200多条T3级宽带;
Google的专利网页级别技术PageRank能够提供准确率极高的搜索结果;
Google智能化的"
手气不错"
功能,提供可能最符合要求的网站;
Google的"
网页快照"
功能,能从Google服务器里直接取出缓存的网页.
Google具有独到的图片搜索功能;
Google具有强大的新闻组搜索功能;
Google具有二进制文件搜索功能(PDF,DOC,SWF等);
Google还有很多尚在开发阶段的令人吃惊的设想和功能.
等等
5,搜索入门
要用Google做搜索,当然首先要进Google网站--www.G;
不过,和
使用的实际上也是Google搜索引擎,只是对搜索结果进行了编排,而且无法提供
一些特色功能,如图片搜索等.因此,如果你要搜索网页的话,就直接使用G吧.
第一次进入Google,它会根据你的操作系统,确定语言界面.需要提醒的是,Google是通过cookie
来存储页面设定的,所以,如果你的系统禁用cookie,就无法对Google界面进行个人设定了.
Google的首页很清爽,LOGO下面,排列了四大功能模块:
网站,图像,新闻组和目录服务.默
认是网站搜索.现在进行第一次搜索实践,假定你是个搜索新手,想要了解一下搜索引擎的来
龙去脉和搜索技巧.在搜索框内输入一个关键字"
搜索引擎"
选中"
搜索中文(简体)网页"
选项,然后点击下面的"
Google搜索"
按钮(或者直接回车),结果就出来了.
搜索:
结果:
已搜索有关搜索引擎的中文(简体)网页.共约有707,000项查询结果,这是第1-10项.
搜索用时0.08秒.
仔细看一下搜索结果的前十项,就会发现绝大部分链接是搜索引擎本身,而不是对搜索引擎的
或者搜索技巧方面的介绍.
注意:
文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内.
6,初阶搜索
上例是最基本的搜索,即查询包含单个关键字的信息.但是,你可以发现,上例中,单个关键
字"
搜索得的信息浩如烟海,而且绝大部分并不符合自己的要求,怎么办呢我
们需要进一步缩小搜索范围和结果.
6.1,搜索结果要求包含两个及两个以上关键字
一般搜索引擎需要在多个关键字之间加上"
"
而Google无需用明文的"
来表示逻辑"
操作,只要空格就可以了.现在,我们需要了解一下搜索引擎的历史,因此期望搜得的网页上
有"
和"
历史"
两个关键字.
示例:
搜索所有包含关键词"
的中文网页
搜索引擎历史"
已搜索有关搜索引擎历史的中文(简体)网页.共约有78,600项查询结果,这是第1-10
项.搜索用时0.36秒.
用了两个关键字,查询结果已经从70多万项减少到7万多项.但查看一下搜索结果,发现前列
的绝大部分结果还是不符合要求,大部分网页涉及的"
并不是我们所需要的"
搜索引
擎的历史"
.怎么办呢删除与搜索引擎不相关的"
.我们发现,这部分无用的资讯,
总是和"
文化"
这个词相关的,另外一些常见词是"
中国历史"
世界历史"
历史书籍"
等.
6.2,搜索结果要求不包含某些特定信息
Google用减号"
-"
表示逻辑"
操作."
A–B"
表示搜索包含A但没有B的网页.
搜索所有包含"
但不含"
搜索引擎历史-文化-中国历史-世界历史"
已搜索有关搜索引擎历史-文化-中国历史-世界历史的中文(简体)网页.共约有
36,800项查询结果,这是第1-10项.搜索用时0.22秒.
我们看到,通过去掉不相关信息,搜索结果又减少了将近一半.第一个搜索结果是:
搜索引擎直通车≡搜索引擎发展历史
搜索引擎直通车,...搜索引擎专业介绍站点....
www.se--14k-网页快照-类似网页
非常符合搜索要求.另外,第八项搜索结果:
463搜索王
本站检索整个网站在此输入关键词.你的当前
位置:
首页>
>
Internet搜索手册>
搜索引擎的历史....
-21k-网页快照-类似网页
也符合搜索要求.但是,10个结果只有两个符合要求,未免太少了点.不过,在没有更好的策
略之前,不妨先点开一个结果看看.点开se-的这个名为"
搜索引擎发展历史"
的
网页,我们发现,搜索引擎的历史,是与互联网早期的文件检索工具"
Archie"
息息相关的.
此外,搜索引擎似乎有个核心程序,叫"
蜘蛛"
而最早成型的搜索引擎是"
Lycos"
使搜索
引擎深入人心的是"
Yahoo"
.了解了这些信息,我们就可以进一步的让搜索结果符合要求了.
这里的"
号,是英文字符,而不是中文字符的"
+"
.此外,操作
符与作用的关键字之间,不能有空格.比如"
搜索引擎-文化"
搜索引擎将视为关键字为"
搜
索引擎"
的逻辑"
操作,中间的"
被忽略.
6.3,搜索结果至少包含多个关键字中的任意一个.
Google用大写的"
OR"
操作.搜索"
AORB"
意思就是说,搜索的网页中,
要么有A,要么有B,要么同时有A和B.在上例中,我们希望搜索结果中最好含有"
archie"
lycos"
等关键字中的一个或者几个,这样可以进一步的精简搜索结果.
搜索如下网页,要求必须含有"
没有"
可以含有以下
关键字中人任何一个或者多个:
搜索引擎历史archieOR蜘蛛ORlycosORyahoo-文化"
已搜索有关搜索引擎历史archieOR蜘蛛ORlycosORyahoo-文化的中文(简体)网
页.共约有8,400项查询结果,这是第1-10项.搜索用时0.16秒.
我们看到,搜索结果缩小到8千多项,前20项结果中,大部分都符合搜索要求.如果你想了解
一下解搜索引擎的历史发展,就不妨研究一下现在搜索到的结果吧.
操作必须用大写的"
而不是小写的"
or"
在上面的例子中,我介绍了搜索引擎最基本的语法"
这三种搜索语法
Google分别用"
(空格),"
表示.顺着上例的思路,你也可以了解到如何缩
小搜索范围,迅速找到目的资讯的一般方法:
目标信息一定含有的关键字(用"
连起来),
目标信息不能含有的关键字(用"
去掉),目标信息可能含有的关键字(用"
连起来).
7,杂项语法
7.1,通配符问题
很多搜索引擎支持通配符号,如"
*"
代表一连串字符,"
代表单个字符等.Google不支持
通配符,只能做精确查询,关键字中的"
或者"
会被忽略掉.
7.2,关键字的字母大小写
Google对英文字符大小写不敏感,"
GOD"
god"
搜索的结果是一样的.
7.3,搜索整个短语或者句子
Google的关键字可以是单词(中间没有空格),也可以是短语(中间有空格).但是,用短语
做关键字,必须加英文引号,否则空格会被当作"
操作符.
搜索关于第一次世界大战的英文信息.
worldwarI"
已向英特网搜索"
worldwari"
.共约有937,000项查询结果,这是第1-10项.搜索
用时0.06秒.
7.4,搜索引擎忽略的字符以及强制搜索
Google对一些网路上出现频率极高的英文单词,如"
i"
com"
www"
等,以及一些符号
如"
."
等,作忽略处理.
搜索关于www起源的一些历史资料.
www的历史internet"
以下的字词因为使用过于频繁,没有被列入搜索范围:
www的.已搜索有关www的历史
internet的中文(简体)网页.共约有75,100项查询结果,这是第1-10项.搜索用时0.22
秒.
我们看到,搜索"
但搜索引擎把"
的"
都省略了.于是上述
搜索只搜索了"
internet"
.这显然不符合要求.这里我顺便说一点搜索引擎分词
的知识.当我们在搜索"
www的历史"
的时候,搜索引擎实际上把这个短语分成三部分,"
分别来检索,这就是搜索引擎的分词.所以尽管你输入了连续的"
www的历
史"
但搜索引擎还是把这个短语当成三个关键字分别检索.
如果要对忽略的关键字进行强制搜索,则需要在该关键字前加上明文的"
号.
+www+的历史internet"
已搜索有关+www+的历史internet的中文(简体)网页.共约有25,000项查询结果,这
是第1-10项.搜索用时0.05秒.
另一个强制搜索的方法是把上述的关键字用英文双引号引起来.在上例"
中,
I"
其实也是忽略词,但因为被英文双引号引起来,搜索引擎就强制搜索这一特定短语.
internet"
已搜索有关"
internet的中文(简体)网页.共约有7项查询结果,这是第
1-6项.搜索用时0.26秒.
我们看到,这一搜索事实上把"
作为完整的一个关键字.显然,包含这样一个特定
短语的网页并不是很多,不过,每一项都很符合要求.
大部分常用英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行.
8,进阶搜索
上面已经探讨了Google的一些最基础搜索语法.通常而言,这些简单的搜索语法已经能解决绝
大部分问题了.不过,如果想更迅速更贴切找到需要的信息,你还需要了解更多的东西.
8.1,对搜索的网站进行限制
site"
表示搜索结果局限于某个具体网站或者网站频道,如"
或者是某个域名,如"
等等.如果是要排除某网站
或者域名范围内的页面,只需用"
-网站/域名"
搜索中文教育科研网站()上关于搜索引擎技巧的页面.
搜索引擎技巧site:
已搜索有关搜索引擎技巧site:
的中文(简体)网页.共约有608项查询结果,
这是第1-10项.搜索用时0.05秒.
上著名IT门户网站ZDNET和CNET搜索一下关于搜索引擎技巧方面的资讯.
searchengine"
tipssite:
ORsite:
已在内搜索有关"
tipsORsite:
的网页.
共约有1,040项查询结果,这是第1-10项.搜索用时0.09秒.
注意,在这里Google有个小BUG."
已在内搜索…"
其实应该表述成"
已在
和内搜索…"
搜索新浪科技频道中关于搜索引擎技巧的信息.
已在搜索有关搜索引擎技巧的中文(简体)网页.共约有163项查
询结果,这是第1-10项.搜索用时0.07秒.
site后的冒号为英文字符,而且,冒号后不能有空格,否则,"
site:
将被作为一个搜
索的关键字.此外,网站域名不能有"
//"
前缀,也不能有任何"
/"
的目录后缀;
网站
频道则只局限于"
频道名.域名"
方式,而不能是"
域名/频道名"
方式.
8.2,在某一类文件中查找信息
filetype:
是Google开发的非常强大实用的一个搜索语法.也就是说,Google不仅能搜索
一般的文字页面,还能对某些二进制文档进行检索.目前,Google已经能检索微软的Office文
档如.xls,.ppt,.doc,和Adobe的.pdf文档.其中最实用的文档搜索是PDF搜索.PDF是ADOBE
公司开发的电子文档格式,现在已经成为互联网的电子化出版标准.目前Google检索的PDF文
档大约有2500万左右.PDF文档通常是一些图文并茂的综合性文档,提供的资讯一般比较集中
全面.
搜索几个资产负债表的Office文档.
资产负债表filetype:
docORfiletype:
xlsORfiletype:
ppt"
已搜索有关资产负债表filetype:
ppt的中文(简体)
网页.共约有481项查询结果,这是第1-10项.搜索用时0.04秒.
注意,下载的Office文件可能含有宏病毒,谨慎操作.
搜索一些关于搜索引擎知识和技巧方面的PDF文档
tipsORtutorialfiletype:
pdf"
pdf.共约有12,600项
查询结果,这是第1-10项.搜索用时0.22秒.
我们来看其中的一个结果:
[PDF]SearchEnginesTips
文档类型:
PDF/AdobeAcrobat-HTML版
...Seewhatpeoplearesearchingonat
G
*SearchEngineWatchSomefreetips...
-类似网页
可以看到,Google用[PDF]来标记这是一个PDF的文档检索,另外,它还给出了该PDF文档的
HTML版本,该HTML版保留了文档的文字内容和结构,但没有图片.
Google原来还支持搜索JPG文档,但现在由于有了专门的图片搜索,因此这个语法已经被废弃.
8.3,搜索的关键字包含在URL链接中
inurl"
语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文
档中.有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如
MP3"
GALLARY"
等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二
个关键词确定是否有某项具体资料.INURL语法和基本搜索语法的最大区别在于,前者通常能提
供非常精确的专题资料.
查找MIDI曲"
沧海一声笑"
inurl:
midi"
已搜索有关inurl:
的中文(简体)网页.共约有27项查询结果,这是
第1-10项.搜索用时0.34秒.
后面不能有空格,Google也不对URL符号如"
进行搜索.例如,Google
会把"
cgi-bin/phf"
中的"
当成空格处理.
allinurl"
语法返回的网页的链接中包含所有作用关键字.这个查询的关键字只集中于网页
的链接字符串.
查找可能具有PHF安全漏洞的公司网站.通常这些网站的CGI-BIN目录中含有PHF脚本
程序(这个脚本是不安全的),表现在链接中就是"
域名/cgi-bin/phf"
allinurl:
cgi-bin"
phf+com"
已向英特网搜索allinurl:
phf+com.共约有51项查询结果,这是第1-10项.
搜索用时0.11秒.
8.4,搜索的关键字包含在网页标题中
intitle"
allintitle"
的用法类似于上面的inurl和allinurl,只是后者对URL进行查
询,而前者对网页的标题栏进行查询.网页标题,就是HTML标记语言title中之间的部分.网
页设计的一个原则就是要把主页的关键内容用简洁的语言表示在网页标题中.因此,只查询标
题栏,通常也可以找到高相关率的专题页面.
查找日本明星藤原纪香的照片集.
intitle:
藤原纪香"
写真集"
已搜索有关intitle:
的中文(简体)网页.共约有315项查询结果,
这是第1-10项.搜索用时0.15秒..
9,其他罕用语法
9.1,搜索所有链接到某个URL地址的网页
如果你拥有一个个人网站,估计很想知道有多少人对你的网站作了链接.而"
link"
语法就能
让你迅速达到这个目的.
搜索所有含指向华军软件园"
链接的网页.
link:
搜索有链接到的网页.共约有920项查询结果,这是第1-10项.搜
索用时0.12秒.
不能与其他语法相混合操作,所以"
后面即使有空格,也将被Google
忽略.
除了上述功能,link语法还有其它妙用.一般说来,做友情链接的网站都有相似地方.这样,
你可以通过这些友情链接,找到一大批具有相似内容的网站.比如说,你是个天文爱好者,你
发现某网站非常不错,那么,可以用link语法查一下与之做链接的网站,也许可以找到更多符
合你兴趣的内容.
9.2,查找与某个页面结构内容相似的页面
related"
用来搜索结构内容方面相似的网页.例:
搜索所有与中文新浪网主页相似的页面(如
网易首页,搜狐首页,中华网首页等),"
related:
在也不明白这个语法有什么作用,如果有谁知道,请不吝指教.预先感谢.:
9.3,从Google服务器上缓存页面中查询信息
cache"
用来搜索Google服务器上某页面的缓存,通常用于查找某些已经被删除的死链接网
页,相当于使用普通搜索结果页面中的"
功能.
其它罕用语法如info,stock等不一一介绍