在我们进行影响网站收录的因素介绍之前,先来整理一下搜索引擎原理,对了解搜索引擎原理的都知道搜索引擎有四大系统:下载系统、分析系统、索引系统、查询系统,它们对应到SEO层面有三个环节:收录-排名-点击,由此推导出SEO流量的基本公式为:SEO流量 = 整体收录量 X 整体排名 X 整体点击率,而且收录量是处在SEO流量漏斗模型的顶端,没有收录,排名和点击都无从谈起,因此收录的重要性不言而喻。
我们都知道只有爬虫抓取了才有可能收录,当然这只是有可能,不是一定,因为决定页面是否被收录还有另一个因素:页面质量。由此我们推导出网站整体收录量的公式:整体收录量 = 搜索引擎页面抓取量 X 页面质量整体收录量,我们知道搜索引擎蜘蛛在一个网站上总停留时间是固定的,权重越高停留的越久,在这总停留时间内抓取n个网页。因此我们又可以推导出以下公式:
搜索引擎页面抓取量 = 搜索引擎爬虫总停留时间 / 单个页面停留时间我们在对这个公式进行分解:
搜索引擎爬虫总停留时间 = 搜索引擎主动给的时间 + 被动吸引的时间
其中搜索引擎主动给的时间是由上面说到的网站权重决定的,这点努力去提升网站权重就行了,权重高了,搜索引擎分配给你网站的主动抓取时间自然就多了。
而在页面质量方面则需要关注下head信息,包括charset、language、last-mondified、content-length、http返回码等技术层面内容,还有内容方面,文章最好都要是原创的。