Crawled(已爬网) - 当前未编入索引(Currently Not Indexed) Google Search Console 状态指南

Crawled(已爬网) - 当前未编入索引(Currently Not Indexed) Google Search Console 状态指南

一个网页要出现在谷歌搜索上,必须经过两个过程;被搜索引擎蜘蛛爬虫和索引。通常,该过程快速而简单,Google 通过抓取发现该页面,然后对其进行处理以进行索引。但是,有时 Google 能够抓取网页但未将其编入索引,因此无法出现在搜索结果中。

这些页面属于 Google Search Console 中“已抓取 - 当前未编入索引”(Crawled - currently not indexed)的排除状态类型。被 Google 抓取但未编入索引的页面对于网站站长来说都是常见的。

这些数字可能会让一些人感到震惊。通常,网站的页面数量越多,添加到此状态的页面就越多。但是,这些数字并不能说明全部情况,除了页面数和列表中包含的 URL 之外,没有什么可看的。在这篇博文中,我将介绍你需要了解的有关 Google Search Console 中“已抓取 – 当前未编入索引”状态的信息。

什么是 Google Search Console 中的“已抓取 - 当前未编入索引”?


已抓取 – 当前未编入索引是 Google Search Console 中排除下的状态类型。在此状态类型下列出的网址已被 Google 抓取,但它决定暂时不将其编入索引。根据 Google Search Console 帮助中心,Google 将来可能会决定将其编入索引或不编入索引。

如果你检查你的 Google Search Console 帐户并看到标签、类别、档案等页面,则无需担心。但是,如果你在此处看到重要页面,例如登录页面、产品页面和博客文章,则你可能需要开始单独评估这些页面。

为什么谷歌不索引这些页面?


谷歌仍在处理新数据

当 Google 第一次抓取网站或单个页面时,Google 需要时间来处理收集到的数据。有很多因素需要考虑,但主要因素是网站的流量和大小(文章数和访客)。


如果一个网站有数千个页面并且每天都在生成新页面,那么 Google 需要限制它将索引的页面数量并优先考虑它应该首先索引哪些页面。如果满足其他条件,其他页面最终将被编入索引。

缺乏重要性

Google 的算法足够聪明,可以了解特定页面对用户是否重要。如果 Google 决定不对特定页面编入索引,那么它只是决定目前对用户来说并不重要,但它会在下次抓取该页面时再次重新评估该页面。

内容过少

如果内容太少或我们称之为内容稀少,Google 可能会决定不对页面编制索引。内容稀少的网页被认为对用户没有价值。如上所述,谷歌希望有效地使用其资源,因此它会更专注于为用户提供价值的其他页面编制索引。

如何修复已爬取 - 当前未编入索引状态


与“错误”下的状态不同,你可以手动验证是否已修复,但无法手动告诉 Google 你已对“排除”部分下的页面进行了改进。

根据 Google Search Console Help,在这种状态下不需要手动请求重新索引页面,因为他们最终会再次重新评估页面。

但是,如果你想确保 Google 在下次抓取这些网页时将这些网页编入索引,你可以采取以下几个步骤。

改进内容

改进网页的内容不仅意味着添加更多字数,还意味着添加对用户进入你的网站时有用的内容。你应该考虑某个页面如何在你网站上的用户浏览中发挥作用。

显然,这就是你打算让用户看到的页面的情况。但是,如果这些是不必要的页面,例如档案和提要页面,则将它们保持原样完全没问题。事实上,你可能需要考虑阻止它们被抓取以节省你的抓取预算。

增加内部链接

增加进入页面的内部链接数量解决了两个问题;首先,谷歌会更频繁地抓取页面,其次,谷歌会更加重视它。如果你的网站上还有其他内容,例如博客文章,我强烈建议你添加一些指向 Google 已抓取但尚未编入索引的页面的内部链接。

减少点击深度

点击深度是用户登陆特定页面所需的点击次数。如果用户需要多次点击才能到达想要的页面,这对用户体验很不利,谷歌可以认为该页面不重要。一个很好的数字是将重要页面限制为 1 到 2 次点击。我不会超过 4 次点击,因为这已经太深了。

Crawled Not Indexed 和 Discovered 之间的区别


“已爬网 - 当前未编入索引”(Crawled - currently not indexed)和“已发现 - 目前未编入索引”(Discovered - currently not indexed)是两种不同的状态,可能会让某些人感到困惑。两者之间的主要区别在于“已抓取 - 当前未编入索引”,Google 已经发现了该页面并已对其进行了抓取,但决定暂时不将其编入索引。



对于“已发现 - 当前未编入索引”,Google 能够通过在页面下抓取来发现该页面,但决定不对其进行抓取,因此尚未将其编入索引。

这意味着与“已发现 - 当前未编入索引”下的页面相比,“已发现 - 当前未编入索引”下的页面对 Google 的重要性较低。

Google Search Console 中的“已抓取 – 当前未编入索引”状态类型可能不会提供太多事后信息,但它确实有助于确定 Google 似乎忽略了我们网站的哪些部分。这为我们 SEO 提供了更多优化机会。同样重要的是要注意,除非在此处找到你的重要页面,否则此状态不需要立即采取措施。请记住确保下次 Google 抓取该网页时,你给 Google 一个理由将该网页编入索引并在搜索结果中对其进行排名。

没有评论:

Blogger 提供支持.