欢迎来到个人简历网!永久域名:gerenjianli.cn (个人简历全拼+cn)
当前位置:首页 > 范文大全 > 实用文>百度与Google文档搜索比较

百度与Google文档搜索比较

2023-03-27 07:58:03 收藏本文 下载本文

“马化腾云驾雾”通过精心收集,向本站投稿了5篇百度与Google文档搜索比较,下面是小编为大家整理后的百度与Google文档搜索比较,仅供大家参考借鉴,希望大家喜欢,并能积极分享!

百度与Google文档搜索比较

篇1:百度与Google文档搜索比较

互联网上除一般网页外,还如PDF、DOC、RTF、xls、PPT(S)等的文档文件,虽然这些文件不象HTM文件那样多,但这些文件通常会包含一些别处没有的重要资料,因此具有独特的价值和吸引力!所以对网络中这部分资源的挖掘和利用也是搜索引擎的一个重要功能,对网络的这部分资源的挖掘和分析的水平也成了衡量一个搜索引擎完整与否,成熟与否的重要指标。多文档搜索是高级搜索的重要内容,与其他高级搜索功能一起,构成高级搜索功能体系。

我们就一些搜索案例的比较来给大家展示一些网络文档搜索的技巧,并对主要提供文档搜索的搜索引擎百度和google做一比较,这些比较和方法也许会对你进一步准确获得你想要的信息有帮助!

主要比较文档数量,语法使用的灵活性,准确性,多语法混合使用等等。

文档数量比较:

其他参数比较:

一搜也提供文档搜索,目前支持的文件类型不多,文档的数量也不够(或者可检出的数量不够),而且使用习惯与其他的不同(google,altavista,alltheweb等)所以不列入比较范围,

总体评价:百度多文档搜索无论从搜索的质量和数量都是要与google相当,甚至超出google,说明,中文搜索引擎在应用的深层次挖掘上已经不再落后于外来服务商。我们有理由相信百度会提供更多更好的功能?br/>

点击阅读更多学院相关文章>>

分享到

篇2:百度统计与搜索排名

今天闲来无事,打完游戏后上来写写;最近在使用百度统计,颇有些心得,上来和大家分享一下,

不知道现在的站长朋友对于百度统计的认知是个什么情况,反正我已经开始使用很久了,对于该统计的一些感受可以说也是早应该写一写(因为博客中还未提及过关于数据分析的内容);首先,大家应该清楚:作为网站运营中的大部分数据提供,站点统计肩负的责任重大;现在主流的统计无非是:cnzz.com、51.la、google analytics以及以及今天的介绍重点“百度统计”等;

对于我来说,作为一个SEO从业人员,我当然会更关注搜索引擎自身的统计:百度的、谷歌的,我是一个都不少;原因很简单,想必各位站长朋友都有过这样的猜测:搜索引擎为什么要做站点统计?这些统计数据背后是什么?是不是为了下一步的引擎搜索排名做数据收集?还是想知道互联网中各行业到底是个什么样子?是不是要看我的网站到底怎么样?等等;今天就来谈谈我对于百度统计与搜索排名的一些看法,供大家思考和交流。

我的结论是,百度统计数据暂不可能作为搜索排名数据依据;之所以这样说,我简单从两个角度来判断:

1.排名算法逻辑思维分析;

如果将上面的结论否定后的逻辑推算,得出的结论是:在百度眼里,没有百度统计数据的站点,不是”好站“!(唐僧一下:因为没有百度统计就没有数据依据,没有数据依据就没有排名依据,没有排名依据就不会有搜索排名)那么,显然不符合逻辑;照这个结论看,很多的权威站点在百度眼里都不是”好站“,原因是这些权威站点,更多情况是自己开发统计工具(为的是得到更有针对性和更多安全保证的数据),即使百度真用了上面的逻辑去强推百度统计(广告词我都想好了:想排名,用统计,哈哈。)像新浪、搜狐他们,估计永远也不要想在百度有关键词排名了,这对百度本身就是倒退,只会让使用客户慢慢流逝掉。所以,在逻辑上不具备可行性,这种结合的想法,只是一个理想化的假设:在这个算法实施前,首先要满足所有的站点都安装了百度统计,有数据可依,这显然很难做到,从逻辑角度,根本行不通!

2.从技术实施角度分析;

说到排名算法,逻辑通顺只是第一个阶段,还有后续的许多技术实施问题;我们单从数据汇总和备份角度切入分析;拿最常见的”搜索关键词“举例,cnzz每天的搜索关键词的保存极限值是1000左右,而百度大概是2万4千个左右(大家如果用心,可以去查看一下),但即使这样,对于我来讲都是远远满足不了的;我曾经咨询过cnzz的客服人员,给出的答复是:我们不可能保存您所有的数据,因为不光您一家在用我们的统计,我们的设备资源也是有限的!我想了一下,客服给的答案很能理解,因为不说别人,就我一个中等站点,每个月从搜索引擎过来的关键词总量就接近一千万个,如果都储存下来,是一件多么恐怖的事情,而且他们还是免费提供服务,

这种情况其实同样适用到百度统计(虽然百度很有钱);这样就造成一个问题,在排名前,本身的依据数据就会不精准;举个例子,如果在你做报告时,报告数据本身就是错的,那再好看的PPT又有什么价值那?就单这一个技术点的解决已经非常困难了,所以,技术角度分析依然行不通!

有的人会问,即使不能全部依据,还不能部分依据么?(或者这样说:用了就会有更多排名机会或者排名优势?)

其实这个问题的答案,我上面已经说过了:不具备排名算法的普遍性,所以就更谈不上使用这当中的某一个或几个点作为排名依据,也就是说,添加百度统计和不添加,对搜索排名是不影响的,因为这个统计本身就不具备普遍性,就更谈不上这个统计当中的某一项或几项具备普遍性;试想,不具备普遍性的算法,如何算的上公正?又如何可能被广泛应用那?

总结一下,其实通过这件事,我要说:网上的文章很多,”传说“当然也会很多,但不一定看到的、听到的都是可信的,在决定相信之前,最好先仔细的思考一下哦。

作者: 张岩

原载: seo博客-张岩

原创版权归张岩所有,必须以链接形式注明作者和原始出处。

篇3:效仿Google?百度将推出国学搜索频道

百度将于1月12日推出“国学搜索频道”,主要提供国学相关信息的特色搜索服务,百度已为国学搜索频道筹备数月,10月即有人发现guoxue.baidu.com域名已经可用。据百度网站提供的信息显示,目前“百度国学”资源已包括10多万网页,1.4亿文字,内容已经过校勘,收录上起先秦、下至清末两千多年以汉字为载体的历代典籍,并仍在增加和更新中,

国学频道的推出显示百度希望提供差异化的服务,以巩固自己在中文搜索市场的地位,不过国学频道究竟是以何种形式出现仍然并不清晰。目前互联网上并没有丰富、系统的免费古文典籍资源,因此仅仅依靠搜索未必能提供令人满意的服务,预计百度将采取与合作伙伴合作的方式,将古籍电子化,并自行为这些内容提供服务器空间和带宽。而不少古文字在电脑的字库中无法显示,也不排除百度会采取类似Google数字图书馆一样的方式,将古籍扫描之后,以图片的形式上传至服务器,再由用户查阅。不过目前的信息仍停留再猜测阶段,百度国学频道的最终形式可能需要等到12日发布时才能确认,据百度网站显示的信息称,国学频道是完全免费的。

篇4::GOOGLE搜索秘籍全攻略

一,GOOGLE简介

Google(Page与SergeyPage与SergeyBrin于99月发明,GoogleInc.于9创立,07月份,Google替代Inktomi成为Yahoo公司的搜索引擎,同年9月份,Google成为中国网易公司的搜索引擎。98年至今,GOOGLE已经获得0多项业界大奖。

二,GOOGLE特色

GOOGLE支持多达种语言,包括简体中文和繁体中文;

GOOGLE网站只提供搜索引擎功能,没有花里胡哨的累赘;

GOOGLE速度极快,据说有8000多台服务器,00多条T级宽带;

GOOGLE的专利网页级别技术PageRank能够提供高命中率的搜索结果;

GOOGLE的搜索结果摘录查询网页的部分具体内容,而不仅仅是网站简介;

GOOGLE智能化的“手气不错”功能,提供可能最符合要求的网站;

GOOGLE的“网页快照”功能,能从GOOGLE服务器里直接取出缓存的网页。

三,基本搜索:,-,OR

GOOGLE无需用明文的“”来表示逻辑“与”操作,只要空格就可以了。

示例:搜索所有包含关键词“易筋经”和“吸星**”的中文网页

搜索:“易筋经吸星**”

结果:已搜索有关易筋经吸星**的中文(简体)网页。共约有76项查询结果,这是第-0项。搜索用时0.秒。

注意:文章中搜索语法外面的引号仅起引用作用,不能带入搜索栏内。

GOOGLE用减号“-”表示逻辑“非”操作。

示例:搜索所有包含“易筋经”而不含“吸星**”的中文网页

搜索:“易筋经-吸星**”

结果:已搜索有关易筋经-吸星**的中文(简体)网页。共约有5,0项查询结果,这是第-0项。搜索用时0.秒。

注意:这里的“”和“-”号,是英文字符,而不是中文字符的“+”和“-”。此外,操作符与作用的关键字之间,不能有空格。比如“易筋经-吸星**”,搜索引擎将视为逻辑“与”操作,中间的“-”被忽略。

GOOGLE用大写的“OR”表示逻辑“或”操作。但是,关键字为中文的或查询似乎还有BUG,无法得到正确的查询结果。

示例:搜索包含布兰妮“Britney”或者披头士“Beatles”、或者两者均有的中文网页。

搜索:“britneyORbeatles”

结果:已搜索有关britneyORbeatles的中文(简体)网页。共约有,600项查询结果,这是第-0项。搜索用时0.08秒。

搜索:“布兰妮OR披头士”

结果:找不到和您的查询-布兰妮OR披头士-相符的网页。

注意:小写的“or”,在查询的时候将被忽略;这样上述的操作实际上变成了一次“与”查询。

“”和“-”的作用有的时候是相同的,都是为了缩小搜索结果的范围,提高查询结果命中率。

例:查阅天龙八部具体是哪八部。

分析:如果光用“天龙八部”做关键字,搜索结果有6,500项,而且排前列的主要与金庸的小说《天龙八部》相关,很难找到所需要的资讯。可以用两个方法减少无关结果。

,如果你知道八部中的某一部,比如阿修罗,增加“阿修罗”关键字,搜索结果就只有995项,可以直接找到全部八部,“天龙八部阿修罗”。

,如果你不知道八部中的任何一部,但知道这与佛教相关,可以排除与金庸小说相关的记录,查询结果为,00项,可以迅速找到需要的资料,“天龙八部佛教-金庸”。

四,辅助搜索:通配符、大小写、句子、忽略字符以及强制搜索

GOOGLE不支持通配符,如“*”、“?”等,只能做精确查询,关键字后面的“*”或者“?”会被忽略掉。

GOOGLE对英文字符大小写不敏感,“GOD”和“god”搜索的结果是一样的。

GOOGLE的关键字可以是词组(中间没有空格),也可以是句子(中间有空格),但是,用句子做关键字,必须加英文引号。

示例:搜索包含“long,longago”字串的页面。

搜索:“”long,longago“”

结果:已向英特网搜索”long,longago“.共约有8,00项查询结果,这是第-0项。搜索用时0.8秒。

注意:和搜索英文关键字串不同的是,GOOGLE对中文字串的处理并不十分完善。比如,搜索“”啊,我的太阳“”,我们希望结果中含有这个句子,事实并非如此。查询的很多结果,“啊”、“我的”、“太阳”等词语是完全分开的,但又不是“啊我的太阳”这样的与查询。显然,GOOGLE对中文的支持尚有欠缺之处。

GOOGLE对一些网路上出现频率极高的词(主要是英文单词),如“i”、“com”,以及一些符号如“*”、“.”等,作忽略处理,如果用户必须要求关键字中包含这些常用词,就要用强制语法“”。

示例:搜索包含“WhoamI?”的网页。如果用“”whoami?“”,“Who”、“I”、“?”会被省略掉,搜索将只用“am”作关键字,所以应该用强制搜索。

搜索:“”whoami“”

结果:已向英特网搜索”whoami“.共约有6,000项查询结果,这是第-0项。搜索用时0.0秒。

注意:英文符号(如问号,句号,逗号等)无法成为搜索关键字,加强制也不行。

五,高级搜索:site,link,inurl,allinurl,intitle,allintitle

“site”表示搜索结果局限于某个具体网站或者网站频道,如“sina.com.cn”、“edu.sina.com.cn”,或者是某个域名,如“com.cn”、“com”等等。如果是要排除某网站或者域名范围内的页面,只需用“-网站/域名”。

示例:搜索中文教育科研网站(edu.cn)上所有包含“金庸”的页面。

搜索:“金庸site:edu.cn”

结果:已搜索有关金庸site:edu.cn的中文(简体)网页。共约有,680项查询结果,这是第-0项。搜索用时0.秒。

示例:搜索包含“金庸”和“古龙”的中文新浪网站页面,

搜索:“金庸古龙siteina.com.cn”

结果:已在sina.com.cn搜索有关金庸古龙的中文(简体)网页。共约有869项查询结果,这是第-0项。搜索用时0.秒。

注意:site后的冒号为英文字符,而且,冒号后不能有空格,否则,“site:”将被作为一个搜索的关键字。此外,网站域名不能有“http”以及“www”前缀,也不能有任何“/”的目录后缀;网站频道则只局限于“频道名.域名”方式,而不能是“域名/频道名”方式。诸如“金庸site:edu.sina.com.cn//”的语法是错误的。

“link”语法返回所有链接到某个URL地址的网页。

示例:搜索所有含指向华军软件园“www.newhua.com

搜索:“link:www.newhua.com

结果:搜索有链接到www.newhua.com

注意:“link”不能与其他语法相混合操作,所以“link:”后面即使有空格,也将被GOOGLE忽略。

inurl语法返回的网页链接中包含第一个关键字,后面的关键字则出现在链接中或者网页文档中。有很多网站把某一类具有相同属性的资源名称显示在目录名称或者网页名称中,比如“MP”、“GALLARY”等,于是,就可以用INURL语法找到这些相关资源链接,然后,用第二个关键词确定是否有某项具体资料。INURL语法和基本搜索语法的最大区别在于,前者通常能提供非常精确的