搜索引擎的工作原理是什么你知道吗?

原创 yesu520  2017-05-27 19:10  阅读 24 次

 

今天跟大家分享一下搜索引擎的工作原理,这里的搜索引擎并不特指某个搜索引擎,只是工作原理,至于具体的算法就不可能总结得出来了,因为那些都是搜索引擎的核心技术。那么下面进入正题:搜索引擎的工作原理,可分为4步:抓取,过滤,收录,排序

搜索引擎工作原理

一、抓取

搜索引擎会通过系统的计算,来决定对你网站哪些内容施行抓取,以及抓取的内容和频率值。搜索引擎的计算过程会参考您的网站在历史中的表现,比如内容是否足够优质,是否存在对用户不友好的设置,是否存在过度的搜索引擎优化行为等等。

二、过滤

互联网中并非所有的网页都对用户有意义,比如一些明显的欺骗用户的网页,死链接页面等。这些网页对用户、站长和蜘蛛来说,都没有足够的价值,因此蜘蛛会自动对这些内容进行过滤,以避免为用户和您的网站带来不必要的麻烦。

三、收录

蜘蛛对抓取回来的内容会逐一进行标记和识别,并将这些筛选合格的页面内容进行分词建立索引,什么是分词呢?简单说就是划分句子,比如“段亮个人博客-分享web前端和SEO技术的个人博客网站”,就会划分为段亮、段亮个人博客、SEO博客、个人博客。等等的组合;

四、排序

结合搜索引擎的算法,把用户输入的关键词,其进行一系列复杂的分析,并根据分析的结论在索引库中寻找与之最为匹配的一系列网页,按照用户输入的关键词所体现的需求强弱和网页的优劣进行打分,并按照最终的分数进行排列,展现给用户。

那么为了让我们的网站有更好的排名,我们这四部分需要注意哪些细节呢

一、抓取

搜索引擎抓取程序—百度蜘蛛

1、怎么可以让蜘蛛快速抓取呢?首先提交链接,其次写入robots协议,之后增加一些外部链接。

2、还有怎么知道蜘蛛来过呢?第一,登录百度站长平台,没有使用百度站长平台建议使用,查看平均抓取频率;第二,查看服务器日志。

3、影响蜘蛛抓取的因素有哪些?第一个就是路径设置过长,其次就是网站访问速度,再者就是设有中文路径。

二、过滤

1、为什么要过滤?第一点是互联网有大量无价值页面、死链、欺骗性的页面;第二点是节省搜索引擎工作时间,节约服务器资源。

2、影响的过滤因素?a、蜘蛛要对页面中文字、链接、图片、视频进行识别,当然蜘蛛只能识别文字与链接;b、用户受众,也就是被用户喜爱程度;c、内容稀缺,d、页面质量;e、网站权重;f、时间因素;

三、收录(索引)

1、查看

2、记录  a、网址; b、三大标签:title、keywords; c记录源代码

3、收录率,收录的比率

四、排序

排序要注意两点

1、方向问题 ; 2、时间问题

本文地址:http://www.mywzseo.com/16.html
关注我们:请关注一下我们的微信公众号:扫描二维码温州SEO以斯拉的公众号,公众号:aiboke112
版权声明:本文为原创文章,版权归 yesu520 所有,欢迎分享本文,转载请保留出处!

发表评论


表情