2014-06-27

浅析百度绿萝算法的收录规则

tag:

 

 

百度的绿萝算法已经更新了很长时间了,各大成都网站制作公司都在不断地研究新算法的收录规则,一下就为大家整理了一些相关资料以供参考。

一个网站想要获得良好的排名,那么首先需要收录,那么收录的前期,必须是网站有内容,那么什么样的才算有内容呢?

空白页面:我个人认为,登入页面、注册页面、帮助中心、联系我们等类似于这种页面可以算是空白页面。之所以我们断定为空白页面其原因是,第一我们不可能依靠关键词“联系我们”来获得流量,就算获得流量了,这种垃圾流量只会影响我们网站的跳出率、PV量等数据。

重复页面:重复页面也就是大家所说的转载、伪原创等页面,个人认为百度算法中,重复页面不仅针对的是这两点,我们可以看到,我们的文章内容页除了标题和文章正文,其他地方均是重复的地方,如果一篇文章的字数只有200字,而其他地方重复的字数有1000字,那么个人认为会很容易把这一篇200字的原创文章判断为伪原创。毕竟百度分析的是一个页面,而不是一段文字或一篇文章。

频率规则:百度收录算法中还是重点考虑在你网站的更新频率上面,我们可以看到一个论坛转载的非常多,并且外链也非常多,同时空白页面也不少,但是可以看出论坛的收录相对博客、企业站点收录都高,可以得出结论主要还是依靠网站的更新频率来收录站点的。

对此我们可以总结为:想要获得稳定持续的收录,那么做好定时更新、屏蔽空白页面及动态垃圾页面和减少伪原创、抄袭,被收录将变得非常简单和愉快。