什么是Google的“优质内容”？为什么以及如何评估它？

发表于 2019年7 月21日星期日上午 7:11:32

什么是优质内容？搜索引擎机器人可以依赖哪些具体元素？搜索引擎如何衡量内容质量以转换用户感知？上游，决定探索一些页面与否？应评估哪些具体标准以确保网站满足质量期望？优化的潜在杠杆在哪里？

人和机器人感知的品质

我们制作的内容适合人类观众。但这就是搜索引擎翻译人类感知的方式，并将质量概念整合到他们的操作中，以构建他们的索引，这将决定网站在其结果页面中的表现。因此，质量概念会在几个层面上影响搜索引擎的行为。

搜索引擎首先通过分析他们的行为来直接检测互联网用户的感知质量。例如，如果人们在搜索结果中找到该页面，请点击该链接但不要停留在该页面上，Google会知道。他可以衡量反弹率，推断出内容没有吸引力或对请求反应不佳，并考虑到人工反馈来修改其结果。

在显示在结果页面中之前，搜索引擎必须搜索并索引页面。然而，机器人所感知的质量将影响页面将被探索的事实。如果网站的页面甚至整个部分质量较差，搜索引擎可能会决定在其爬网算法中为它们分配一个非常低的优先级，从而为它们提供很少或没有爬网预算。如果未抓取该页面，则无法对其编制索引。当用户提出页面可能回答的问题时，它不会出现在结果中。

由于页面内容的质量对网站的有机流量有如此强烈的影响，因此必须像搜索引擎那样分析网站内容的质量。问题变成：我们还可以测量哪些元素，搜索引擎可以基于评估内容的质量？

如何在可衡量的元素中剖析质量？

我们知道，必要的是基于两个标准：页面内容的大小（用户或搜索引擎必须有东西放在牙齿中），以及内容的重复率（是与其他人相比，页面带来了新信息。任何SEO经理都在寻找精简内容和重复内容。重要的是衡量评估这些标准的相关性。对于内容的大小，简单，只需计算单词的数量。

在重复级别，事情会变得更糟。完整的副本，即真正完全相同的页面，只是冰山一角。它们通常易于检测，例如通过标题，H1或元描述标签共同。它们经常被识别并使用规范标签处理，这些标签告诉搜索引擎页面是变体的内容的主要版本是什么。

还必须确定的是一种更为阴险的现象，即仅表示同一事物的一部分的页面。具有部分叠加的页面通常比完全重复的页面多得多。搜索引擎在这个级别上非常有效，因为它是其功能的核心，即索引信息，以便知道哪些是新的。他必须优化他的勘探资源，并把所有机会放在他身边，以发现新的信息，而不是他已有的股票。

让我们暂停一下信息的概念。信息最终是一系列单词：单个单词表达有限的含义，并且可以根据上下文改变;当人们考虑表达时，它会立即在围绕它的少数词语中更有意义。为了评估网站内页面内容的重复率，我们可以评估在其他页面中找到的小词序列的比例 – 以及其他页面的数量。

这不是试图理解信息含义的问题，我们不涉及语义分析。但是，我们将有效地反映用户的看法，他们会说，从一个页面移动到另一个页面，“它说的大致相同”，即使内容不完全相同。这纯粹是信息复制加密货币。内容的语义研究是另一个分析轴，这里没有解决这个问题，它提供了互补的照明，例如通过链接链接的页面之间的主题接近度，用户可以使用将是敏感的（“它与我之前看到的无关”）并且引擎也会分析。

我们想要评估页面内容的重复大小和速度。但它还不够有用。在提取这些关键指标之前，有必要将页面的全部内容传递给筛选：当我们查看页面时，屏幕上只有部分内容对应于此页面所说的内容。其余的都是穿衣服。

绝对先决条件：“真实”内容在哪里，而不是模板？

搜索引擎能够识别页面的“真实”内容。也就是说，他们知道如何将页面的特定部分与对应于模板的部分分开，即导航元素和其他页面共有的相关信息（页眉和页脚，菜单和导航栏）小部件，最新消息或该部分中的热门产品等）。

进行这种区分是任何名副其实的内容分析的先决条件，因为Google会根据页面的核心内容对页面编制索引并将其显示在结果中：用户会将其视为到达页面的内容，他要找的东西。

（标题：“真实”内容为绿色，模板为红色）

如果我们评估页面的整个内容而不分离模板的“真实”内容，或者如果分离与人类感知不同步，那么内容的大小和唯一性指标将不相关：我们可以认为页面的内容大小很大，而对于用户来说，它几乎是空的;或者一个页面有很多重复的内容，当涉及到用户不会注意的模板元素时。

页面中模板的权重本身通常不是要优化的元素。这是一种由业务需求决定的事态。如果对模板的分析很重要，那么最重要的是能够消除它并仅评估“真实”内容，重点关注以下几点。

并非所有网站都在同一页面上

一旦您获得了网站页面真实内容的大小和唯一性，您可以得出什么结论？

搜索引擎对所有类型的网站或所有类型的网页都没有相同的期望。因为用户也是。通常情况下，网页的典型内容因行业，主题，最重要的是，页面的目的而异，这与用户的意图相对应：查询，购买，……例如，如果商家网站具有有限的产品信息，则产品页面可能具有很少的内容。对于用户来说，这是可以接受的。对于网站分类广告来说，这一点更为明显，通常很短，甚至是电报风格。另一方面，期望编辑类型的站点基本上包含丰富的页面，并且具有主要的原始内容（在“站点上的唯一”的意义上，例如，对于页面来说将更少。产品）。

因此，无法定义通用的良好实践，在内容的大小或唯一性方面是理想的。因为Google知道用户的期望因网站类型和查询类型而异，因为他当然也知道将商家网站与信息网站区分开来。该网站的声誉也可以影响谷歌的期望：如果该网站非常受欢迎，它是一个参考网站 – 用户选择结果中的大多数 – 谷歌知道这是用户想要去的地方，甚至如果其他网站在纯粹质量方面更好。简而言之，有效的配方在所有网站上都不一样。

没有什么可以阻止我们为自己设置足够低的目标：例如，对于旨在生成有机流量的页面，验证那些至少有100个单词且不超过其他地方一半内容的页面。但是，如果不考虑网站的特殊性，对最小联盟感到满意，就会错过真正的价格和优化机会。充分利用这些信息的关键在于了解Google对我们网站的期望。

“太少”的内容，多少钱？

要了解Google在我们网站上放置栏的位置以及每种类型的页面，有必要将内容质量指标与SEO性能指标相互交叉。最简单的方法当然是查看有机访问量：与未收到访问权限的页面相比，生成访问权限的页面大小是多少？

以下是一个编辑网站的示例，其中提供的文章越多，他们带来的流量就越多：

（标题：活动页面是在过去30天内生成有机流量的页面 – 无论成交量如何。显示的维度（条形）是页面模板外的单词数）

这是一个广告网站，我们观察一个200字的级别，低于该级别，广告列表的页面效果要差得多：

（标题：活动页面是在过去30天内生成有机流量的页面 – 无论成交量如何。显示的维度（条形）是页面模板外的单词数）

我们还可以比简单的问题“页面是否产生流量？”更进一步。并根据内容的大小查看每页的访问量。对于第一个例子，编辑网站的例子，它给出：

（标题：颜色显示单词页面内容（不包括模板）的大小显示的尺寸（条形）是每页收到的Google的有机访问次数）

我们注意到，除了产生更多流量之外，具有大量内容的页面也会产生更多的访问量。

如果您有关于抓取Google的信息（通过服务器日志分析，它可以让您知道搜索引擎搜索了哪些页面），那么我们也可以将内容质量指标映射到行为Google Exploration：我们将了解“典型配置文件”已抓取页面与已忽略的页面。如果我们在Google的结果页面中也有位置和展示信息（Google Search Console提供的信息），我们会更加了解页面无法生成的原因交通：甚至没有探索，探索，但从未在结果中呈现;在结果中显示但从未点击过。

Google可以容忍多少重复内容？

与内容的大小一样，我们可以观察到页面重复率和SEO性能指标之间的相关性。下图显示，在广告网站上，列表页面仅在不超过2个相似页面时生成有机流量。

（活动页面是在过去30天内生成有机流量的页面 – 无论成交量如何。）显示的尺寸（条形）是具有高叠加的页面组中的页面数。也就是说，至少有75％的非模板内容是共同的。）

实用提示：在测量内容叠加之前排除几乎空白的页面：如果内容非常少，则共同的百分比可能会非常快，这可能会掩盖真正的教训。无论如何，谷歌可能已经忽略了这些内容大小的标准。

低质量的网页会“污染”网站的战略区域吗？

由于Google使用内容质量标准来确定网站的哪些区域作为优先事项进行探索，因此还必须考虑低质量网页是否不会损害具有高潜力的网站。

如果网站的某个部分具有高质量的战略页面，但受到大量低质量页面的污染，总体而言，该区域将只是中等程度令人满意。搜索引擎必须决定在站点级别进行爬网，才能为整体分配中等优先级。因此，与只有高质量的网页相比，该区域的探索性较差，Google可能会错过具有高流量潜力的网页。如果我们消除低质量的页面，该区域将立即变得更具吸引力。

请注意，删除这些页面并不一定意味着从网站中删除它们。这一切都取决于它们是否对浏览网站的用户有用。如果它们是，那只是让搜索引擎不探索它们的问题（禁止它们或通过使指向它们的链接不可抓取）。

通过中心化该区域的质量，好处很多：Google将不再在不值得的页面上浪费预算爬行;他将倾向于进一步探索该地区;由于它将提供更中心化的内容（每页更多独特内容或更多内容），搜索引擎将通过相同的抓取预算检索更多信息。该网站将立即在搜索结果中显示更多卡片：它可能会定位于更广泛的查询。

内容有变化吗？

内容分析中经常被忽视的一个方面是对变化的分析。让我们假设在网站上产生大量有机流量的网页，看到它们的内容在一夜之间彻底改变。如果用户不再寻找，那么有机流量就会急剧下跌。

这就是为什么良好的内容分析也可以很早地检测到变化，最好是在它们产生损害之前。特别是因为在更基本的SEO分析中，页面中的某些变化很容易被忽视，特别是当内容的大小，机器人的HTML标签（H1，标题，元描述）和导致页面没有改变。

这与检测两个页面之间的内容重叠的方法完全相同：您只需比较同一页面的两个版本。

但要注意虚假警报，我们只想指出什么是异常：如果我们期望列出产品的类别页面在目录发展时看到其内容发生变化，预计产品页面的内容不会完全改变。我们回到需要按页面类型进行所有这些分析。

要记住什么

对内容质量的分析是SEO的关键点。我们不能反对用户和搜索引擎机器人所感知的质量标准，因为后者的目标是匹配前者。但是机器人检测到的质量标准的影响超出了这个范围，因为它们只规定了结果页面中的位置，它们也与搜索引擎作为信息管理者的操作有着内在的联系。

相关内容，内容质量分析需要两件事：

相关的内容质量指标，可通过专业工具进行衡量，反映搜索引擎的工作方式，

一种严格的方法论方法，按页面类型（类别页面，产品）剖析这些质量指标，并将它们与有机绩效指标（有机交通，搜索引擎的探索）进行比较，以得出具体的结论。现场，从而确定增长的杠杆。

资讯来源：由0x资讯编译自JOURNALDUNET，原文：https://www.journaldunet.com/solutions/expert/71468/qu-est-ce-qu-un–contenu-de-qualite–pour-google—pourquoi-et-comment-l-evaluer.shtml，版权归作者所有，未经许可，不得转载