网站优化seo.docx
《网站优化seo.docx》由会员分享,可在线阅读,更多相关《网站优化seo.docx(23页珍藏版)》请在冰点文库上搜索。
网站优化seo
网站优化
第一节、什么是搜索引擎。
搜索引擎是指根据一定的策略、运用特定的计算机程序从互联网上搜集信息,在对信息进行组织和处理后,为用户提供检索服务,将用户检索相关的信息展示给用户的系统。
搜索引擎包括全文索引、目录索引、元搜索引擎、垂直搜索引擎、集合式搜索引擎、门户搜索引擎与免费链接列表等。
XX和谷歌等是搜索引擎的代表。
第二节、怎样评价一个搜索引擎的优劣。
A、搜索精确——精准
B、内容全面——全面
C、及时有效——及时
D、公正的信息——公正
第三节、搜索蜘蛛的工作原理。
A、什么是蜘蛛
搜索引擎用来爬行和访问页面的程序被称为蜘蛛(spider),也叫机器人(bot)。
搜索引擎蜘蛛访问网站页面时类似于普通用户使用浏览器。
蜘蛛程序发出页面访问请求后,服务器返回HTML代码,蜘蛛程序把收到的代码存入原始页面数据库。
搜索引擎为了提高爬行和抓取的速度,都使用多个蜘蛛分布爬行。
蜘蛛访问网站时,首先会访问网站根目录下的robots.txt文件。
如果robots.txt文件禁止搜索引擎抓取某些网页或者内容或者网站,蜘蛛将遵循协议,不对其进行抓取。
蜘蛛也是有自己的代理名称的,在站长日志中可以看出蜘蛛爬行的痕迹,所以为什么这么多站长解答问题的时候会说先查看网站日志(作为一个出色的SEO你必须具备不借助任何软件查看网站日志的能力,并且要非常熟悉其代码的意思)。
B、追踪链接
由于搜索引擎蜘蛛为了能够抓取网上尽量多的页面,它会追踪网页上的链接,从一个页面爬到下一个页面,就好像是蜘蛛在蜘蛛网上爬行那样,这就是搜索引擎蜘蛛这个名称的来因。
整个互联网网站都是相互链接组成的,也就是说,从任何一个页面出发最终会爬完所有页面。
据CNNIC《29次中国互联网络发展状况统计报告》显示我国网站数量为230万,网页数量为866亿个,当面对着亿万级别的页面,平均每爬行一个页面需要一分钟时间计算,蜘蛛爬完所有页面需要2746年,蜘蛛只有采用一定的策略才能够爬完所有页面。
爬行策略有以下几种方式:
1、爬取的深度
爬取的深度是指蜘蛛沿着发现的链接一直向前爬行,直到前面再也没有其他链接,然后返回到第一个页面,沿着另一个链接再一直往前爬行。
2、爬取的广度
爬取的广度是指蜘蛛在一个页面发现多个链接时,不是顺着一个链接一直向前,而是把页面上所有链接都爬一遍,然后再进入第二层页面沿着第二层上发现的链接爬向第三层页面。
从理论上说,无论是深度优先还是广度优先,只要给蜘蛛足够的时间,都能爬完整个互联网。
在实际工作中,蜘蛛的带宽资源、时间都不是无限的。
也不能爬完所有页面。
实际上最大的搜索引擎也只是爬行和收录了互联网的一小部分。
因此,为了尽量多的抓取用户信息,深度爬去和广度爬去通常是混合使用的,这样既可以照顾到尽量多的网站,也能照顾到一部分网站的内页。
那么,友情链链接的作用就不言而喻。
C、吸引蜘蛛
虽然理论上说蜘蛛可以爬行和抓取所有页面,但实际不行。
那么SEO人员想要收录更多的页面就只有想办法引诱蜘蛛抓取。
既然抓不了所有页面,那么我们就要让它抓取重要页面。
因为重要页面在索引中起到重要决定,直接影响排名的因素。
1、网站和页面权重质量高、年龄老的网站被给予很高的权重,这种网站上的页面蜘蛛爬行的深度比较高,所以会有更多的内页被收录。
2、页面更新度
蜘蛛每次爬行都会把页面数据储存起来。
如果第二次爬行时发现此页面与第一次收的内容完全一样,说明页面没有更新,蜘蛛也没必要经常再来爬行和抓取。
如果页面内容经常更新,蜘蛛就会频繁的爬行和抓取。
那么页面上的新链接自然的会被蜘蛛更快的追踪和抓取。
这也就是为什么需要每天更新文章。
3.、导入链接
无论是外部链接还是同一个网站的内部链接,要被蜘蛛抓取,就必须有导入链接进入页面,否则蜘蛛根本不知道页面的存在。
此时的URL链接起着非常重要的作用,内链的重要性发挥出来了。
另外,高质量的导入链接也经常使页面上的导出链接被爬行的深度增加。
第四节、主要搜索引擎有哪些及特点。
目前在国内比较出名的主要搜索引擎有:
XX、谷歌、搜搜
做SEO不管是做XX优化、谷歌优化、还是搜搜优化等等,做之前了解搜索引擎特点是非常有必要的,也只有这样,才能投其所好,关键词有个好的排名。
关于三大知名搜索引擎:
XX、搜搜、谷歌特点也是不尽相同的:
A、对新站的态度
XX:
对新站很不友好,对于新站,XX是有考察期的,而且考察期是越来越长。
如果你前期工作做的好,可以先收录个首页。
至于排名,得看你是否拿大把的原创文章来贿赂XX蜘蛛了。
或许把蜘蛛伺侯舒服了,过一两个月,你的站突然就从乌鸦变成凤凰、野鸡变成打工皇帝了。
谷歌:
谷歌是一个慈祥而严谨的老头,以包容和严谨而著称。
谷歌对于新站是没有什么歧视的,就好像老头看见年轻人。
谷歌对于新站的收录是一视同仁的,收录数量和速度都是第一位的。
不过要说到排名,那就要慎重了。
谁让他严谨呢?
他会长期地考察你,磨练你,然后循序渐进地给你上升排名。
也就是说,做谷歌SEO,耐心是很重要的。
搜搜:
搜搜本身搞搜索引擎这一块就比较晚,起步晚,影响力也远远弱于XX,谷歌。
所以搜搜的特点就是英雄不问出身,不看历史,不搞论资排辈,只要你足够优秀,就会给你应有的地位。
B、对内容与外链的态度
XX:
对内容极其看重原创,对于纯粹复制的网站,给的权重很低。
对外链看得很重。
一个网站即便内容再优秀,更新再及时,如果没有优秀的外链,一样无法获得很好的排名。
谷歌:
对内容原创要求相对较低,只要定时更新即可。
对外链和内容通常是具备一样就能获得好的排名。
也就是说,对于竞争不是很强的关键词,即便没有什么外链,只要内容足够优秀,一样能获得好的排名。
对于内容一般的网站,只要外链足够地多,一样也能获得好的排名。
搜搜:
搜搜对于内容与外链的关键处理得更合理些,要求内容与外链并重。
二者不可偏废。
只要把内容与链都建设好了,才会获得最好的排名。
C、收录严肃及排名合理
XX:
喜怒无常,有事没事喜欢降权,快照回档、site不到首页实在是家常便饭,排名无故大起大落也早已习以为常。
谁让我们都要靠XX吃饭呢,广大站长除了接受它的折磨之外并无他法。
谷歌:
前面已经讲了,谷歌是很严谨的,他不会乱来,不会动不动就K站,排名也很少出现大起大落。
搜搜:
搜搜一般也不会乱来,做得很不错。
不过有时排名也会出现一定的无故波动,不过通常过几天就能恢复。
排名比较合理,甚至超过了谷歌。
第五节、影响网站搜索排名的因素。
编号
因素
描述
分数
关键词
1
网页Title中出现关键词
这是一个关键词最重要的地方,因为
标签的内容显示的是您在搜索结果中的网页标题。Title标签要短(最多6到7个关键词)并且关键词要与文章开头相关。
+3
2
关键词在网页的密度
关键词密度也是很重要的因素,关键词的密度在3%到7%为最佳,1~2%显得少了点。
但是如果密度超过10%,看上去显得可疑,更像关键词堆积,而不是自然的文本。
+3
3
导入链接中出现关键词
也很重要,尤其是外链接出现关键词,因为你在从其它网站链接过来的链接中出现关键词,一般就不仅会为你的网站投一票,特别是为关键词。
+3
4
关键词用
标签标记
多一个出现关键词的地方有很大的帮助,但是你的页面内容要确实包含这些关键词。
+3
5
在页面的第一段中出现关键词
虽然不像锚文字、title标签或者headings这么重要。
不过,有一点,文件开始不一定是第一段–例如,如果你使用表格的话,第一段文字可能出现在表格的下半部分。
+2
6
Alt标签中出现关键词
蜘蛛不是人不会分辨图片,所以如果你的页面有图片的话,最好在图片的ALT标签标注一些于图片相关的关键词。
+2
7
Metatags中出现关键词
虽然已经不是很重要了,特别是Google。
但是baidu和soso还是有影响。
如果你打算在baidu和soso优化,标注Meta标签的关键词,对你并没有什么坏处。
+1
8
关键词的相近性
关键词相近性-关键词在文中词于词关联密切性。
例如(诺基亚手机)这里诺基亚和手机中间没有其他词组,关联密切。
如果诺基亚在第一段,手机在第三段落,就显得不够相近。
关键词相近性对于2个和两个以上的词组比较有用。
+1
9
关键词短语
除了关键字,你还可以优化的关键字短语,包含数个词。
例如:
"SEO技术服务",是很受欢迎的流行词组,所以你可以得到不少的精确匹配搜索结果。
但有时优化2个或3个独立的关键词(简称"SEO"和"服务")是有道理的,因为他比1个关键词,更可能得到精确匹配。
+1
10
次要关键词
优化次要关键词可能是金矿,因为大家优化最热门的关键词,次要关键词会有更少的竞争者(可能更多的点击)。
例如,“杭州酒店预订”的搜索次数远远少于“酒店预订”,但是如果你针对的是杭州市场的话,你的流量会更有价值。
+1
11
关键词拼写错误
拼写错误是十分频繁的,如果你知道你优化的关键词经常会拼错为什么词(例如,代理记帐和代理记账),你可能回去优化他。
不错,这可能会给你带来流量,但是你的网站会给用户产生不好的印象。
因此最好不要用,要用也用在meta标签内。
0
12
关键词稀释
当你优化了过量的无关关键词,这会影响你优化的目标关键词,甚至使你的目标关键词从文本中稀释。
-2
13
关键词堆积
任何人为的增加关键词密度(10%甚至更高)都会被认为关键词堆积,随时会被搜索引擎给踢掉。
-3
链接-内部链接、外链接、外向链接
14
外链接出现关键词
作为在关键词章节讨论的因素,这是的确是获得好排名的一个最重要的因素。
如果你有一个关键词在外链接文本里,这样最好,但即使没有,它仍然可用。
+3
15
外链接的质量
外链接除了有关键词这点,连接到你的站点的信誉也很重要。
一般PR值高的网站信誉比较好。
+3
16
相似网站的外链接
相似网站的链接是非常有用的。
这标志着你的内容在同行业内是很受欢迎的。
+3
17
从edu和gov域名来的外链接
这些链接十分宝贵,因为在搜索引擎中这些域名的权重要大于.com.cn等域名,而且这些链接是很难获得的。
+3
18
外链接的数量
一般来说,越多越好。
但外链的质量比数量更重要,还有外链接的锚文本,是否有关键词,链接多久了。
+3
19
内部链接的锚文本
这一点也很重要,虽然比不上外链接的锚文本。
+2
20
外链接的时间
外链接是越老越好。
可以去购买,从而短时间内获得大量新的相互的外链。
(但是要循序渐进的购买)
+2
21
加入目录
如果你的网站能加入DMOZ这些目录的相应目录列表,对获得好的排名是非常有益的。
但是如果你有大量的外链接来自一些PR值为0的目录,这是没有什么用处的,甚至有可能会被认为是外链作弊。
+2
22
命名锚
命名锚(内部链接的目标地点)不仅在内部链接导航有用而且对搜索引擎优化也很有益。
因为你特别强调一个详细的页面、一个段落、一段文字很重要。
在代码里,命名锚的格式是:
挖掘机这里“#挖掘机”就是被命名的锚。
+1
23
外链接的IP
Google认同来自同一个IP或者IP段的外链接,但是MSN和XX有可能放弃来自同一个IP或者IP段的外部链接,所以外部链接最好是不同IP。
+1
24
来至链接工厂的外链接
这对你是没有什么用处的,因为链接不是相互的。
你不会得到惩罚,因为你无法控制谁来连接你的站点,这也会成为你竞争者来陷害你的手段。
所以你最好离这些文字链远一点。
0
25
太多的外向链接
Google不喜欢页面有太多的链接,最好一个页面的链接不要超过100个。
太多的话对你的排名是没有好处的甚至情况可能更糟。
-1
26
过多的链接、链接泛滥
对于你的排名,这是一件坏事。
你有太多的链接来至或去同一个站点(即它不是一个相互的连接或链接到一个不好的站点),这看起来是买的链接至少是链接泛滥。
最好的情况是搜索引擎会认同一些链接。
-1
27
外向链接到链接工厂
这点于来至链接工厂的外链不同,如果你外向链接到的网站被处罚的话,可能就会殃及鱼池。
所以你要定期检查你网站的链接,有时候好的网站可能变成坏的,反之也依然。
-3
28
交叉链接
交叉链接就是指很多站都互相链接来增加链接广泛度。
(我有ABC三个站,我A上连接了BC,B上连接了AC,C上连接了AB)这也属于作弊的手段。
顺带提一句,国内卖1200一本seo电子书的人就是用这种方法来给客户做排名的,结果是只要被google发现,这些站全死。
-3
29
隐藏的链接
隐藏链接被设计来只被蜘蛛来访问,而不能被人发现。
作弊者从很多PR高的站点,用隐藏链接到他们想要优化的网页。
-3
Meta标签
30
meta标签
Meta标签正变得越来越微不足道,但是和还是有作用的。
你在Meta的标签内描述网站,有时会出现在搜索的结果中。
+1
31
meta标签
虽然当Google对于所有Meta标签和Msn和雅虎对于部分Meta标签已经不重视了,但Meta中标签还是重要的。
关键词的数量保持适量,在10~20个之间。
不要在标签堆积你页面上不存在的关键词,这样不利于你的排名。
+1
内容
32
原创内容
原创内容是王
+3
33
内容时时更新
搜索引擎喜欢内容时时更新的网站,经常的更新内容而不是小的修改。
+3
34
关键词的大小
文本里大尺寸的关键词更容易得到注意,这一点同样适用于Headings(
,),总的来说相对普通文本,大尺寸文字更有优势。
+2
35
关键词格式化
粗体和斜体是另一种突出关键词的方法。
但是使用好合理,否则起到适得其反的效果。
+2
36
文档的时间
新文档(或经常更新的文档)更有利
+2
37
文件尺寸
总的来说大尺寸的文件不是很有利,或者说同标题的一篇长文章,分成三页的比一页的排名靠前。
所以一篇长文章最好分为几页。
+1
38
内容不一致
从网络营销的观点看网站内容多样化(基于同一IP,浏览器)很不错。
但对于SEO是不可取的,同一URL不同的内容,搜索引擎不知道到什么内容是真实的反应网站定位。
-2
39
不合理的页面布局
搜索引擎不喜欢页面布局不友好的网站。
虽然很少页面布局不合理的网站受到处罚,但搜索引擎可能不会再索引这样的网站,所以从某种意义上说布局不合理的网站是不利的。
-2
40
违法的内容
未经允许使用有版权的内容或者法律禁止的内容,会被踢出。
-3
41
隐藏内容
作为黒帽SEO的行为,设计来只被蜘蛛访问,而不是人,如果受到处罚一点都不奇怪。
-3
42
伪装(Cloaking)
被称为IP发送(IPdelivery),一种作弊技术,对同样的URL,设计一个程序来返回给真实的访客的网页,以及一个给搜索引擎蜘蛛的不同版本的网页(满是关键词的网页),后面这个网页被设计来得到更高的搜索排名。
-3
43
桥页(Doorwaypages)
一个网页被专门用于得到高的搜索排名,而对站点的访客没有任何价值。
和搜索登陆页面不同,桥页网页通常尽量保持对浏览网站访客的隐藏。
-3
44
重复内容
在几个不同的页面放一样内容,并不能是你的搜索结果更多因为重复的页面都被踢出。
而文章目录和镜像并没有被禁止。
-3
页面布局
45
JavaScript
如果聪明的使用可能无妨。
但是如果你的重要内容通过JavaScript方式显示的话,,这样内容很难让蜘蛛收录,如果代码出错的话、蜘蛛将不收录。
0
46
文中的图片
只有文字显得乏味,但是只有图片有不合理。
在所有的图片的标签,标注意味深长的描述而不是关键词的堆积和无关的内容。
0
47
视频和博客
播客和视频变得越来越流行,和其他的多媒体一样,蜘蛛不认识它们。
所以如果你不提供播客和视频内容清单,搜索很难索引它。
0
48
图片代替文字链接
用图片代替文字链接是很不好的,尤其没有标注标签。
哪怕就算你标注了标签,它也无法起到有粗体、下划线、16磅文字链接的效果。
所以除非是对页面布局至关重要。
-1
49
框架
框架是非常、非常不利于SEO的,能不用就不用。
-2
50
Flash
蜘蛛无法索引Flash电影,如果你要用的话,不要忘记提供另类文字说明。
-2
51
Flash主页
幸运地是用Flash做主页的流行病已经结束了。
用Flash做主页(甚至整个页面都是Flash),没有任何Html,兼职是SEO的噩梦。
-3
其他
52
网站正常访问
另一个容易被忽略的基本因素。
如果网站经常因为无效链接,404错误,密码限制和其他的相似原因而无法正常访问,那么蜘蛛也无法正常检索。
+3
53
网站地图
蜘蛛很喜欢最新的网站地图,不论是老式HTML格式还是特别的Google网站地图格式。
+2
54
网站大小
蜘蛛喜欢大型的站点,总的来说越大越好。
然而,大的站点用户访问变得不友好并且导航烦琐,所以有时候将把一个大的站点分成几个小的站点还是很有意义的。
而且,很少站点被处罚,因为一个页面超过10,000站点,不把它分开的话,会变得越来越大。
+2
55
网站历史
就像是酒,网站是越久越醇。
已经被访问并保留下来旧的站点比刚刚建立起来随时会消失的新站点更可信赖。
+2
56
网站主题
网站的主题对排名很重要,因为当一个网站的主题确定,站点内的页面都应该与这个主题相关。
+2
57
网站文件的位置
网站文件的位置很重要。
文件在根目录和次根目录比文件埋在5或者更高目录的更有优势。
+1
58
一级域名
一级域名很重要。
+1
59
顶级域名
不是所有的顶级域名都有一样.com的权重大于cn、net,edu和gov的权重最高。
+1
60
IP地址
网站放在被处罚的IP和IP段的共享主机或者免费的空间才是问题。
0
61
主机停机
主机停机与访问性直接有关。
当网站常常停机,将不会索引。
实际上仅仅当你的主机提供者不可靠并且正常时间少于97~98%这才是问题。
-1
62
动态URLs
蜘蛛更喜欢静态的URLs,虽然你看到很多动态URLs排在首位。
长URLs很不利,最好用工具重写动态URLs。
-1
63
robots.txt禁止检索
如果蜘蛛索引站点被禁止的话,可能会影响另外没有本禁止索引的内容,因为蜘蛛对被禁止索引的站点访问次数会减少。
-2
64
重定向(301and302)
如果使用不合理,重定向更有害。
当用户很快被定向到其它页面,目标页面无法打开,甚至更糟的话会被认为是黒帽作弊。
-3
知识点:
A、nofollow
nofollow是一个HTML标签的属性值。
这个标签的意义是告诉搜索引擎"不要追踪此网页上的链接"或"不要追踪此特定链接。
Nofollow标签的作用有两方面,简单的说,一是不给链接投票,降低此链接的权重,二是使添加nofollow的部分内容不参与网站排名,便于集中网站权重。
B、Sitemap
Sitemap可方便网站管理员通知搜索引擎他们网站上有哪些可供抓取的网页。
最简单的Sitepmap形式,就是XML文件,在其中列出网站中的网址以及关于每个网址的其他元数据(上次更新的时间、更改的频率以及相对于网站上其他网址的重要程度为何等),以便搜索引擎可以更加智能地抓取网站。
C、断链与缺链对蜘蛛的影响。
D、
标题(Title)一般不超过80个字符
关键词(KeyWords)一般不超过100个字符
描述(Description)一般不超过200个字符
E、内链与外链对网站权重的影响。
F、网页的扩展名
网页中常见的扩展名有.html.htm.asp..jsp.php.aspx等。
网页中常见的首页默认地址有index与default等。
网页中并不是所有的页面都是静态页面(html)是和优化,网页应当有动态页面与静态页面相互配合,所谓静态页面就是那些最终的页面已经不再进行修改的页面适合采用.html,而导航页面如:
新闻导航需要经常更新,那么这类的页面当然应当采用动态页面(asp、php)来写,这样可以直接告诉蜘蛛这类页面是动态可能需要更新。
还有采用静态页面(html)的优势是打开速度快。
总所周知动态页面在需要展现内容的时候首先需要语言解释成html代码然后呈现给客户,所以动态页面的打开速度要慢一点,占用的服务器资源要大一些。
第一节课:
点击对搜索排名的影响。
链接都搜索排名的影响。
原创内容对搜索排名的影响。
决定网站权重的几个因素。
A、网站是否稳定。
B、网站内容是否总够吸引人。
C、网站内容数量的多少。
D、网站页面被其他网站转载的次数。
如何判断两篇文章的相似性(分析是否原创)。
蜘蛛如何抓取网页内容
服务器的质量影响蜘蛛的抓取
网站导航清晰
网内容充实
站内页面没有死链接
找东西方便
美观,简练,好看
网站内容有产品跟服务的介绍
有在线留言
直接提问有回答就是最好的了。
网站打开速度不能太慢。
好网站的标准
层次清晰
内容充实
美观大方
沟通流畅
速度快接
坏网站的现象
层次混乱
找不到东西
网站只有一个页面
页面很长,看起来很复杂
重复的内容太多。
网站打开速度太慢
没有友情链接
第一天上午
第一节课:
什么是SEO?
学习SEO后我们能做什么?
从制作网站讲起
XX年收入220亿人民币
第二节课:
什么是搜索引擎
搜索引擎的好坏
中国现有那些搜索引擎
搜索蜘蛛的工作原理
第三节课
点击对排名的影响
第四节课
链接对排名的影响
如何选择优质连接
连接的加分减分机制
判断伪连接的方法
第五节课
内容对排名的影响
如何做内容(做加法不做减法)
如何查询一个网站被XX收录页面的多少?
网站对新站的态度?
第六节课
分析网站的优缺点
如何认识一个网站
网站那些页面需要静态页面,那些页面需要动态页面
第七节课
如何设置关键词,标题,内容说明以及其位置及长度。
设置标题及加粗。
减少连接的使用
如何做sitemap
开始测试一下