您好,游客注册登录繁體
有问题找尘埃 SEO教程学习群
首页 >> 网站优化 >> 搜索引擎排名原理解析

搜索引擎排名原理解析

福建SEO 2016-06-04 0
浏览次数176

作为一名优秀合格的SEOer,如果不懂搜索引擎排名原理,那么你在SEO的道路上将寸步难行。许多新手SEOer眼里的SEO基本就是写文章发外链,还停留在多年前的优化格局当中,今天福建SEO尘埃博主就和大家分享下搜索引擎排名原理的详细解析。

搜索引擎工作原理

一、为什么用户从搜素引擎输入关键词的时候,下方就会出现很多与搜索的关键词

 

相符内容的页面?而且速度还怎么快?
答:这就是搜索引擎的工作原理,搜索引擎的工作并非如同搜索框一样简单。搜素引擎为用户展现的每一条搜索结果,都对应着互联网上的每一个页面。每一条搜索结果从产生到被搜索引擎展现给用户,都需要经过四个过程:抓取、过滤、收录(建立索引)、展现(输出结果)。为什么展现速度这么快,因为搜索引擎排名已经计算好的,只是把结果展现出来而已。

 

 

二、搜索引擎的抓取原理:

 

(1) 什么是搜索引擎蜘蛛?
答:搜索引擎用来爬行和访问网站页面的程序被称为蜘蛛,也可称之为机器人。蜘蛛访问浏览器,就和我们平时上网一个样子,蜘蛛同样会申请访问,得到允许后才可以浏览,可是有一点,搜索引擎为了提高质量和速度,它会放很多蜘蛛一起去爬行和抓取。

蜘蛛访问任何一个网站时,都会先去访问网站根目录下的robots.txt文件。如果robots.txt文件禁止搜索引擎抓取某些文件或目录,蜘蛛将遵守协议,不抓取被禁止的网址。
和浏览器一样,搜索引擎蜘蛛也有表明自己身份的代理名称,站长可以在日志文件中看到搜索引擎的特定代理名称,从而辨识搜索引擎蜘蛛。

 

(2) 搜索引擎是怎样抓取网页的呢?
答:发现某一个链接→下载这个网页→加入到临时库中→再提取网页中的链接→再下载网页→循环。
搜索引擎如何发现链接的,就是通过链接链接链接。搜索引擎发现这个链接后,就会把这个网页下载下路并且放在临时的数据库中,当然,同时也会提取这个网页的全部链接,然后就是继续循环。

 

(3) 搜索引擎抓取网页是规律吗?
答:肯定是有的,如何蜘蛛胡乱抓取网页,那么就要费劲死,互联网上的网页,每天都增加怎么多,如何抓取的过来呢?所以说,肯定是有规律的。

 

(4) 蜘蛛抓取网页策略1:深度优先
答:什么是深度优先。简单的说,深度优先是指当蜘蛛发现一个链接时,它就会顺着这个链接指出的路一直向前爬行,直到前面再没有其它的链接,这时候就会返回链接的第一个页面,然后再继续下一个链接再一直向前爬行。

 

(5) 蜘蛛抓取网页策略2:广度优先
答:蜘蛛在一个页面发现多个链接的时候,不是跟着一个链接一直先前爬,而是把页面上的所有的第一层链接都爬一边遍,然后再沿着第二层页面发现的所以链接,然后等等。

 

(6) 蜘蛛抓取网页策略3:权重优先
答:现在网页制作一般都是两种抓取策略一起使用,也就是深度优先+广度优先。并且在使用这两条策略抓取的时候,要参照这条链接的权重,如果权重还不错,那么就采用深度优先,如果权重很低,那么就采用广度优先! 那么搜索引擎是如何知道这条链接的权重呢?这里有两个因素:① 层次的多与少 ② 这个链接的外链多少与质量。

 

(7) 蜘蛛抓取网页策略4:重访抓取
答:这个好理解,比如昨天搜索引擎来抓取我们的网页,而今天我们在这个网页又加入的新的内容,那么搜索引擎蜘蛛今天又来抓取新的内容,这就是重访抓取!重访抓取也分为两个:
① 全部重访:所谓全部重访指的是上次抓取的链接,然后再这个月的某一天,全部重新
去访问抓取一次。
② 单个重访:单个重访一般指的是针对某个页面更新频率比较快比较稳定的页面,如果我们有一个页面,一个月也不更新一次。那么搜索引擎蜘蛛第一天来了你是这个样子,第二天,还是这个样子,那么第三天搜索引擎蜘蛛就不会来了,会隔一段时间在来一次,比如隔1个月在来一次,或者等全部重访的时候在更新一次。

 

(8) 数据分析系统
答:数据分析系统,是处理搜索引擎抓取回来的页面,那么数据分析分为以下几个:
① 网页结构化
简单的说,就是把那些html代码全部删掉,提取出剩下的内容。
② 消噪
消噪是什么意思呢?在网页结构化中,已经删掉了html代码,剩下了文字,那么消噪指的就是留下网页的主题内容,删掉没用的内容,比如版权!
③ 查重
查重比较好理解,就是搜索引擎查找重复的网页与内容,如果找到重复的页面,就删除。
④ 分词
分词是神马东西呢?就是搜索引擎蜘蛛在进行了前面的步骤,然后提取出正文的内容,然后把我们的内容分成N个词语,然后排列出来,存入索引库!同时也会计算这一个词在这个页面出页面现了多少次。
⑤ 链接分析
这一个步骤就是我们平时所做的做烦躁的工作,搜索引擎会查询,这个页面的反向链接有多少,导出链接有多少以及内链,然后给这个页面多少的权重等。

 

3.如何建立一个有利于搜索引擎抓取的网站?

 

(1) 简单明了的网站结构:

 

(2) 简洁美观的url规则:
a. 唯一性网站中同一内容页只与唯一一个url相对应,过多形式的url将分散该页面的权重,并且目标url在系统中有被滤重的风险;
b. 简洁性动态参数尽量少,保证url尽量短;
c. 美观性使得用户及机器能够通过url即可判断出页面内容的主旨;
注:我们推荐如下形式的url:url尽量短且易读使得用户能够快速理解,例如使用拼音作为目录名称;同一内容在系统中只产生唯一的url与之对应,去掉无意义的参数;如果无法保证url的唯一性,尽量使不同形式的url301到目标url;防止用户输错的备用域名301至主域名。

 

4.蜘蛛不喜欢或者抓不到的内容?

 

(1)图片(使用alt属性,告诉蜘蛛这个图片的意思)

(2)js

(3)flash(蜘蛛是不知道视频的具体内容,需要我们提供一些文字描述)

(4)嵌套table

(5)iframe框架(层级多)

(6)需要登录信息之后的页面

注:内页的信息不建议放链接,因为蜘蛛是顺着链接进行抓取的,页面还没有看完,就跳走了。

 

5. 如何吸引蜘蛛抓取?

 

蜘蛛式不可能抓取所有的页面的,它只会抓取重要的页面,那么哪些页面被认为比较重要呢?有以下几点:

 

(1) 网站和页面权重
(2) 页面更新度
(3) 导入链接
(4) 与首页点击距离

 

6. 搜索引擎过滤:

 

a. 那什么是过滤?
就是淘汰一些垃圾的或者低质量的内容。
低质量的内容:
(1)价值低
(2)文不对题
(3)没有丰富的内容

 

b. 详情:
网站的页面被抓取了并不代表一定会被收录。蜘蛛来抓取了之后,会把数据带回去,放到临时的数据库中,再进行过滤,过滤掉一些垃圾的内容或者是低质量的内容。

你页面的信息如果是采集,在互联网上有大量的相同信息,搜索引擎就很有可能不为你的网页建立索引。有时候我们自己写的文章也不会被收录,因为原创的不一定就是高质量的。关于文章质量的高低,福建SEO尘埃博主会在以后的文章中单独拿出一篇来和大家详细讨论。

过滤这一过程就是一个去掉糟粕的过程,如果你的网站的页面顺利通过了过滤这一过程,说明页面的内容达到了搜索引擎设定的标准,页面会就会进入建立索引和输出结果这一步。

 

7.收录于索引量的区别:

 

(1) 网站收录:指的是搜素引擎被收录的网页的内容,只有被收录的内容才能参与到用户的搜索排序中。网站收录的内容都被记录在搜索引擎数据库中,参与关键词排名。
(2) 网站索引量:站点中有多少页面可以作为搜索候选结果,也就是蜘蛛抓取了网站的哪些内容并被认可,可以进入搜索引擎数据库被收录。
(3) 站点内容页面需要经过搜索引擎的抓取和层层筛选后,方可在搜索引擎中展现给用户。页面通过系统筛选,并作为搜索候选结果的过程,即为建立索引。
(4) 网站收录查询:采用 site:域名 的方式在百度搜索框中查询。
(5) 索引量查询:网站验证了百度站长平台,就可以在里面看到网站的索引量。

 

seo优化的日常注意事项:

 

1、已经收录的页面不要随意删除或者移动位置

2、展现结果需要一定的时间(2个月之内是正常的)

3、内容的丰富度

4、吸引蜘蛛(主动向搜索引擎提交、外链)

5、蜘蛛的跟踪,网站IIS日志

 

今天尘埃SEO博主就和大家分享到这里。希望能对SEOer们有所帮助。下面给广大新手SEOer一些总结建议:

 

1、想要学好seo,首先要有一个良好的学习心态。
2、不要妄图靠所谓的捷径,如黑帽,只能取得一时的效果,却要遭到永久的惩罚,降权甚至K站(俗称拔毛)。
3、seo的学习是需要长期坚持,用心做好每一个点。
4、努力、坚持每天学习,学好每一个知识点,学会灵活运用,付出努力比别人多一点。

版权声明:本文著作权归尘埃SEO所有,欢迎分享本文,谢谢支持!

转载请注明:搜索引擎排名原理解析 | 尘埃SEO博客

全部评论:0