Archive for 八月, 2009

如何不让百度收录我的网页?

By 壹佰萬 - Last updated: 星期一, 八月 31, 2009

当你的网站还没有正式上线,或者你不想让百度收录你网站上的一些隐私内容时,该怎么办呢?通过学习下面的方法,你将知道如何去做到这个功能。

百度严格遵循搜索引擎Robots协议(详细内容,参见http://www.robotstxt.org/)。
您可以设置一个Robots文件以限制您的网站全部网页或者部分目录下网页不被百度收录。具体写法,参见:如何撰写Robots文件。
如果您的网站在被百度收录之后才设置Robots文件禁止抓取,那么新的Robots文件通常会在48小时内生效,生效以后的新网页,将不再建入索引。需要注意的是,robots.txt禁止收录以前百度已收录的内容,从搜索结果中去除可能需要数月的时间。
如果您的拒绝被收录需求非常急迫,也可以发邮件给webmaster@baidu.com请求处理。

什么是robots.txt文件?
搜索引擎使用spider程序自动访问互联网上的网页并获取网页信息。spider在访问一个网站时,会首先会检查该网站的根域下是否有一个叫做 robots.txt的纯文本文件,这个文件用于指定spider在您网站上的抓取范围。您可以在您的网站中创建一个robots.txt,在文件中声明 该网站中不想被搜索引擎收录的部分或者指定搜索引擎只收录特定的部分。
请注意,仅当您的网站包含不希望被搜索引擎收录的内容时,才需要使用robots.txt文件。如果您希望搜索引擎收录网站上所有内容,请勿建立robots.txt文件。
robots.txt文件放在哪里?
robots.txt 文件应该放置在网站根目录下。举例来说,当spider访问一个网站(比如http://www.abc.com)时,首先会检查该网站中是否存在 http://www.abc.com/robots.txt这个文件,如果Spider找到这个文件,它就会根据这个文件的内容,来确定它访问权限的范 围。
我在robots.txt中设置了禁止百度收录我网站的内容,为何还出现在百度搜索结果中?
如果其他网站链接了您robots.txt文件中设置的禁止收录的网页,那么这些网页仍然可能会出现在百度的搜索结果中,但您的网页上的内容不会被抓取、建入索引和显示,百度搜索结果中展示的仅是其他网站对您相关网页的描述。
禁止搜索引擎在搜索结果中显示网页快照,而只对网页建索引
百度支持通过设置网页的meta,防止搜索引擎显示网站的快照。方法如下:
要防止所有搜索引擎显示您网站的快照,请将此元标记置入网页的 <HEAD> 部分:
<meta name=”robots” content=”noarchive”>
要允许其他搜索引擎显示快照,但仅防止百度显示,请使用以下标记:
<meta name=”Baiduspider” content=”noarchive”>
注:此标记只是禁止百度显示该网页的快照,百度会继续为网页建索引,并在搜索结果中显示网页摘要。

Zac访谈Matt Cutts [收藏文章]

By 壹佰萬 - Last updated: 星期天, 八月 30, 2009

在点石博客上看到Zac 访谈 Matt Cutts 的对话后,获益匪浅。这可是绝好的SEO内部信息啊,相信看过后的SEOer 们肯定都会感觉学到不少,我就借花献佛转过来,一来作为自己的收藏文章;二来作为和大家分享的东西,一举两得,何乐而不为?详细谈话内容请看下文:
访谈主要围绕中文搜索和搜索引擎优化。Matt Cutts和Google的“顶级中文反垃圾工程师”, Jianfei(朱健飞),回答了我的问题。当然很多问答并不局限于中文搜索和SEO,对所有SEOers都有参考意义。
下面是访谈的中文翻译。
Zac: 首先谢谢你们接受这个访问,我相信对中国的SEO和网络营销者们会很有帮助。
目前在中国对SEO有不少误解。有的人听到SEO的第一个念头是“垃圾”。有的说SEO是短视的,是自寻死路。从搜索引擎的观点看,这是真的吗?对Google来说,SEO是被讨厌的,允许的,还是鼓励的?我指的是白帽SEO。
Matt: 认为搜索引擎不喜欢SEO是常见的误会。事实是,遵循Google质量指南(quality guidelines)的SEO是OK的。这包括像确保你的站点能被爬行,想出人们在搜索时会用的词并把这些词自然地包含在网站内容中,让网页标题和URL具有描述性等。
Google和其他搜索引擎不喜欢的是,有些人尝试欺骗或走捷径获得比他们本应有的更高的排名。当站点违反我们的质量指南时,Google称为垃圾(spam)。
Zac: Google在2006年4月正式启用中文名“谷歌” ,不过大部分中国用户好像不喜欢这个新名字。
根据中国互联网信息中心的调查,Google的市场份额从05年的33%降到了06年的25.3%。你们怎么看调查中市场份额的降低?
Jianfei (朱健飞): 就这个市场份额,让我们参考李开复的说明,“这些调研数量可能会有一定的误差。不同的用户,使用搜索引擎的频率会不同,有人可能一天用10次搜索引擎,有人可能一天只用一次,简单的采样结果也许并不能真实反映流量。”
Zac: 我注意到Google总部有中国员工。知不知道Googleplex里有多少中国人?他们做的怎么样?对想加入Google的粉丝有什么建议?
Jianfei: 我们在Googleplex确实有很多中国工程师。他们做得都很出色。你可以浏览 http://www.googlechinablog.com/ 上一些中国工程师关于他们在Google生活的文章。
想加入Google的粉丝可以在 http://www.google.cn/jobs/ 查招聘的职位。不能加入Google也欢迎给我么建议和想法。他们的支持对我们很重要。举报垃圾站可以到 http://www.google.cn/contact/spamreport.html
Matt: 实际上,如果你注册了Google Webmaster Central
http://www.google.com/webmasters/
你也可以用这两个表格报告垃圾
https://www.google.com/webmasters/tools/spamreport?hl=zh-cn
https://www.google.com/webmasters/tools/spamreport?hl=zh-tw
另外,如果你不想注册Google账户,也可以在这里举报spam:
http://www.google.cn/contact/spamreport.html
http://www.google.com.tw/contact/spamreport.html
不过我还是建议用前两个。我们对Webmaster Central的垃圾报告给于更多权重。
Zac: 我们谈谈复制内容,最近很热的话题。
我在中文网站看到更多的内容复制。很多中文站长喜欢从其他网站“采集”内容,有的用软件,有的人工,然后放在自己的网站上。Google是否惩罚这种放满了四处可见的内容的网站?是否有个百分百或门槛,超过了会导致惩罚?
原创者应该怎么做才能确保原创版本被正确辨认?
Jianfei: 我们注意到了一些中文网站有很多复制内容。用户喜欢看到不同的搜索结果,所以Google尽力提供多样的结果。我们的算法已经有了一些清除复制内容的办法,我们会继续寻找改进的方法。
Zac: 有的网站使用多个域名,内容完全一样,比如说domain.com和domain.com.cn 。这样危险吗?最好的处理方法是什么?
Matt: 如果内容真的一样,我会选一个域名,另一个域名做转向到选定域名。比如,google.com 做永久转向 (301) 到 www.google.com,我们会看到并通常会选择转向指向的那个。如果内容是不同的语言(比如中文和英文),那么在两个不同的域名的内容没什么危 险,但是如果内容完全一样,最好从复制域名做永久转向到一个选定域名。
没有转向的镜像网页可以产生问题。最好使用301/永久转向,因为Google也许选择删除或不显示你最喜欢的版本。
Zac: 我一直在我的博客强调好的原创内容,这个观念也被中国的SEOers很好地接受。问题是,正像很多读者问的,比如说,如果我的公司是卖“玻璃磨边机”的,这东西根本就太乏味了,我能写些什么有意思的内容呢?能不能给些这种高度专业化产品内容发展的窍门?
Matt: 别忘了创造性真的会帮很大忙。比如,有个做工业混合机的站,听起来是挺乏味的题目。但是去看看这段视频: http://www.youtube.com/watch?v=aM94aorYVS4 你会看到奇妙的东西。他们把各种物品扔进混合机来证明他们的机器有多厉害。
确实,一些重型机械或工业站点初听之下是比较无聊乏味,但从创造性的角度看的话,你经常能提高对你公司的兴趣。即使像newsletters,博客,行业信息,或其他资源也可以是别人对你的站感兴趣并连向你的原因。
Zac: 我们能找到的PR最高的中文站是PR8。就PR来说对中文站有歧视吗?如果没有,为什么没有PR9甚至PR10的站点?PR对排名还有用吗?
Matt: PageRank确实取决于互联网的链接结构,但我不会因为看不见PR9或PR10的站而灰心。 其一,中文站通常是跟其他中文站比较排名,所以比赛还是公平的。同样很重要的是Google的PageRank有更细的量度(并不是简单的1到10),所 以都显示工具条PR6的两个站可能有不同的PageRank。
Google对非英文站点的权威声望度的测量有特殊处理来帮助。
Zac: 英文网站SEO和中文网站SEO有什么显著区别吗?你们的算法对不同语言处理有不同吗?
Matt: 我觉得不同国家在怎么做SEO方面确实有不同。比如,在德国,人们更可能在域名里用连词符(-)。有的国家更倾向于通过联署计划(affiliate programs)赚钱,有的国家通过手机比信用卡赚的多,因为信用卡不是在每个国家都同样常见。 但是在SEO的操作上也有很多相同点。
Jianfei: 英文网站SEO和中文网站SEO的一个主要区别是要做的搜索词。比如“viagra”是英文里垃圾最多的搜索词之一,“手机铃声”在中文里垃圾更多。另一个区别是差不多所有大中型中文站都有博客,其他语言就不是。
Zac: 其他国家的AdWords用户一般直接在Google注册。不过Google在中国采取了另一种方式,与AdWords代理合作,在某种意义上是本地化的方式,因为中国的所有其他关键词竞价(PPC)提供商都这么做。
与广告商保持直接关系已经在世界范围被证明是成功的,为什么Google在中国采取了本地化的方式?你觉得AdWords在中国成功吗?
Matt: 我不是专家,但我知道Google尝试适应每个市场,以那个国家最有效的方式呈现产品。我为AdWords组感到自豪,我认为他们在中国干的非常好。
Zac: 一些SEO相信新鲜度(freshness)在Google排名中起到很重要作用。很多人认为博客容易得到好的排名,部分得益于新鲜度。但是有的SEO认为经常修改网页不是个好主意。
你的建议是什么?经常更新还是不?
Matt: 这取决于你所在的行业。我会做对用户有益的所有事。为更新网页而更新网页可能效率不会高。但如果你有个博客,经常更新可能吸引更多用户。所以对有些人来说,不太常更新可能更适合(比如生产制造公司),对另一些人经常更新更好(比如你是个博客的话)。
Zac: SEO服务是个可靠的商业模式并值得向中国的SEOers推荐吗?我这么问是因为在中国有规模有声望的SEO公司非常非常少。很多公司声称他们提供SEO服务但实际上他们做的就是在论坛和博客发垃圾。
遵守规则的单独的SEO们正在为生存奋斗。
我相信你们知道很多成功的SEO公司。在中国,SEO行业有前途吗?我们怎么从个人成长为有信誉的SEO公司呢?
Jianfei: 我认为如果SEO按照Google的质量指南的话,他可以有很好的未来。搜索引擎结果对行业很重要,所以对守规矩的公司的市场需求会很多。
Matt: [...]

好域名在SEO中的作用

By 壹佰萬 - Last updated: 星期五, 八月 28, 2009

域名中的字符:取域名的原则除了方便用户访问之外,对搜索引擎而言,涉及到域名中是否包含关键词的问题。英文网页内容的网站如果在域名中含有关键字,或以复合关键字作域名,都应该用短横线隔开。如:www.electronic-supermarket.com 而不是 www.electronicsupermarket.com。这是因为搜索引擎通常会把分隔符”-”当作一个空格来看待,因而能够识别出你的关键词,为网站排名加分(尽管影响不是很大)。短横线隔开后的关键词组还可以获得更多的词组搜索结果,如www.electronicsupermarket.com被认为只有一个词electronicsupermarket,而electronic-supermarket则被看作正常的electronic  supermarket词组。
有些搜索引擎目录对网站在分类目录中的排名顺序是根据域名或网站title名称的数字顺序或字母顺序甚至中文笔画,总体上数字又比字母靠前。Yahoo!中国称,”在同一类目中,网站是按照拼音顺序来排列的”。
google则根据其独创的”网页级别”技术”分辨出常用的重要网站,排放在目录的前面以提升网页搜索的效率”。此外,域名的后缀选择也有一定讲究。有一种观点认为:在同等情况下,代表非商业性网站的后缀.org和.net有着比.com更高的排名优势;对中文网站来说,表示中国域的.cn和.com.cn又比无地区性的.com有一定优势。

如何确定关键词?

By 壹佰萬 - Last updated: 星期四, 八月 27, 2009

确定好一个网站的关键词,这是做好SEO工作的前提和重点。那么,如何去确定网站的主关键词呢?
深圳SEO提供以下建议,供大家参考:

选择符合自己实力的关键词
不选择流量太低的关键词

我们平时分析和确定一个关键词的大概流程:

了解行业概况
行业关键词集合
关键词竞争性分析
关键词发展规划和流量预计
确定目标关键词

了解行业概况

搜索行业主关键词,搜索结果前5页的网站基本上可以说明该行业的概括。比如:SEO 这个关键词排前50名的基本上都是非常专业的站点,而且绝大部分是主域名,域名中包含 SEO 的居多。
你所熟悉的站点,包括这个站点的建站时间、专业性、站点规模、主关键词等。比如对于自己网站上的关键词,你要明确他先在排名在哪一个位置?
在行业关键词搜索结果的前10个站点,主要是竞价网站?行业网站?企业网站?还是个人网站?如果竞价网站和行业网站居多,则说明关键词商业价值强;个人网站,该行业大部分采用广告联盟形式,具有创新赢利模式者可以考虑切入;简单企业网站,则说明行业竞争性不强。

行业关键词集合

搜索行业主关键词,点击搜索结果第一页底部的更多相关搜索。从这里获得行业关键词的集合,做适当的筛选。
从百度指数获得每个关键词的每日搜索量。
如果你需要更多的行业关键词,可以采用中文版 Google关键字工具。

如果以上这些方面你能把握的好,那么你就很容易能确定下来自己将要做的关键词。

企业网站如何做好百度排名优化?

By 壹佰萬 - Last updated: 星期天, 八月 23, 2009

百度,中国最大,最权威的搜索引擎门户网站。我相信,每一家企业网站都想在这个最大最权威的搜素引擎网站长让自家的网站排在自然搜索排名的前面。但是,针对目前百度混乱的算法,过多的人工干预策略,让很多的SEOer莫名奇妙,对百度算法和排名规则摸不着头脑。现在,我们将针对企业网站应该如何合理有效的在国内知名搜索引擎百度上进行好的排名问题分析:
一、充分利用百度
1、向百度搜索引擎提交你的网站。不仅只提交主页,同时还需要提交你网站的内页。
以我的网站“深圳SEO”为例:提交主页以及提交内页,一次可提交五十个网页。没有时间可提交最关键的网页。如首页、产品、服务、联系等等。
2、建立自己网站的百度贴吧、百度知道、上传百度图片等等。
建立百度贴吧和百度知道的时候,谨防出现过多的网站链接及广告用语。一般更开始建的时候最好不要出现网站链接。做百度知道,提问和回答要有策略。这两项百度都是人工编辑。
3、百度新闻主要收录一些知名网站发布的关于自己网站的新闻。网站可以委托一些别的公司发布相关新闻。也可以自己转载一些热点文章,签上自己的站名,就可以出现在百度新闻的搜索页面。
4、百度图片
百度图片里会收录网站的一些图片。在网站达到一定流量的时候可以在网页上加图片。
5、百度百科
建立自己企业网站站点的百科词典。
6、建立站点的百度知识堂
百度知道问题达到五个时,就可以创建自己站点的百度知识堂。
充分利用百度搜索工具,可以有效提高网站排名。
二、做编辑要利用百度更新网站的时间和规律
百度网站90%以上在每周的周三凌晨1-4点这个阶段有一个大更新。其余10%在周四更新。更新的内容是之前一周所加的内容。而且更新的文章主 要是原创文章。最好的办法是刚开始做SEO时每小时更新一次网站。百网的排名座次更新在每天每天的上午的9点—11点,以及下午的2点—5点,一般采用手 工更新的方式进行。
三、巧编辑来保证更多的原创文章
第一阶段标题伪原创法
即对网站标题在符合网站内容的前提下对网站标题进行修改和优化。
第一招:
数字替换的方法实现伪原创,如你看到的文章标题是“企业网站如何做好百度排名优化?”那么你可以改为“如何有效的进行网站优化”或者“网站优化合理有效的办法”。
第二招:
语言替换法,如“网站优化从业人员应该掌握的技巧”那么我们也可以改为“帮助网站优化人员做好优化工作”。
第二阶段内容伪原创法,即对网站内容进行调整和更改使网站内容增加新的生机。
方法一:文章首部更改法即对文章的第一段话采用原创或伪原创方式,也就是文章开头的一段话自己来写,自数大概一到两百左右为好,比如第一段话你可以写你看过这篇文章的一些观点与看法的总结,这样也可以起到引导作用。
方法二:在文章的尾部加上你自己的一段话,我相信大家都看到非常多的朋友,在很多网站下都看到很多加了注释的。
方法三:段落调整法的伪原创,在不影响文章内容和阅读性的情况下,你可以把文章的顺序从新排列。
方法四:伪原创之合并法,将多个相关的文章合并成一个文章,自然而然的就成为了一篇属于你自己的原创文章。
方法五:其他方法,网站内部链接建设和锚文字建设,增加用户体验度也降低了相同网站内容的相似性。
总之,合理自然巧妙优化的方法很多,看你怎样去发挥和把握咯。