很多初学者一直分不清“抓取”与“收录”有什么区别,甚至认为这两者是同一个意思,那么真是大错特错。掌握搜索引擎抓取、收录的工作原理,对于百度优化甚至其他搜索引擎优化将会有很大的帮助。
一、抓取原理 搜索引擎在抓取到我们网站的前提是必须要有渠道,当你新建一个域名,新建了一个普通页面,页面没有经过任何人的访问,也没有任何地方出现过你的页面,那么搜索引擎是无法正确的抓取到你的页面的,之所你建议页面以后什么都没有操作,搜索引擎一样可以抓取和收录,其原因主要是通过以下几个渠道。 链接渠道:我们做外链的主要目的是什么,更重要的是让搜索引擎能够通过此链接正确的抓取到我们的网站,这也是SEOER都在说,现在新站建议做外链,老站就没必要的原因之一。 提交渠道:80%的站点在建立以后会手动提交到搜索引擎,这是搜索引擎在收录到更多站点的一个重点渠道。
二、收录原理 为什么同时发布两篇文章,一篇被收录,还有一篇未收录? 对比:当搜索引擎在抓取到你网站的文章页面的时候,会识别你的每一个内页的相同区与不同区,也你网站的不同区将会被定义为主题内容区域,然后拿着你的主题内容与其他网站的主题内容进行对比,分出你页面主题内容的原创度。 分类:通过对你的站点进行对比后,可以直接对你的内容进行分类,如同一篇关于SEO相关的文章,搜索引擎可直接通过对比来判断,你的网站属于那种类型,是否适合你的站点。 用户得分:分类之后,并不是代表搜索引擎就一定会收录你的文章,主要还是要依靠用户的得分,用户的点击率、停留时间判断出此文的价值。