所有分类
  • 所有分类
  • 后端开发

谷歌SEO优化:Google搜索的运作方式进阶指南

在上面的文章中,我们分享了“谷歌SEO优化:了解谷歌搜索运营模式的基本知识”,并学习了谷歌SEO优化的一些基本知识点。今天,我们将继续深入学习。开始吧~~~

进行网站调试和预测 Google 了解搜索行为 Google 搜索如何掌握内容,将内容纳入索引并呈现内容是非常重要的。

抓取

抓取是指 Googlebot 访问新网页并添加到更新后的网页中 Google 索引中的过程。

我们使用大量的计算机提取网络上的数十亿个网页(即“抓取”)。执行抓取任务的程序称为 Googlebot(又称漫游器或“蜘蛛”程序)。Googlebot 使用算法流程确定要从每个网站抓取的网站、频率和数量。

Google 首先,它的捕获过程将根据网站列表开始。该列表是在之前的捕获过程中生成的,并随着网站所有者提供的网站地图数据的增加而扩展。Googlebot 访问网页时,会在网页上找到链接,并将这些链接添加到要抓取的网页列表中。它将记录新建立的网站、现有网站的更改和无效链接,并相应更新 Google 索引。

在抓取过程中,Google 会使用 Chrome 网页的最新版本。在呈现过程中,它将运行所有找到的网页脚本。如果您的网站使用动态内容,请务必遵循 JavaScriptSEO 基础知识页面上的要求。

Google 如何知道哪些网页不需要抓取?

  • 系统不会抓取 robots.txt 网页被屏蔽,但如果有其他网页链接到这些网页,系统仍然可以将其编入索引。Google 网页内容可以通过指向相应网页的链接来推断,并在不分析其内容的情况下将网页编入索引。

  • Google 匿名用户无法访问的网页无法捕获。因此,任何登录或其他授权保护措施都将被阻止 Google 抓取网页。

  • Google 以前被捕获并被视为与其他网页重复的网页不会被频繁捕获。

提高抓取质量

使用以下技能帮助帮助使用这些技能 Google 在你的网站上找到正确的网页:

  • 提交站点地图。

  • 提交单个网页的抓取请求。

  • 使用简单易懂的逻辑网站路径,并在网站中提供清晰直接的内部链接。

  • 如果您在网站上使用网站参数进行导航,例如,如果您在全球购物网站上指出用户的国家/地区,请使用网站参数工具通知您 Google 关于重要参数的信息。

  • 谨慎使用 robots.txt:使用 robots.txt 指明您希望 Google 优先考虑或捕获哪些网页,以减少服务器负载。请勿将其作为防止内容出现 Google 索引中的方法。

  • 使用 hreflang 指向其他语言版本的网页。

  • 明确指出标准化网页和备用网页。

  • 通过“索引覆盖范围”报告查看您的抓取和索引覆盖范围。

  • 确保 Google 正确呈现网页所需的主要网页和重要资源(图片,CSS 文件,脚本)。

  • 用网站检查工具检查实际网页,确认 Google 可以正常访问并呈现您的网页。

编入索引

Googlebot 为了了解每个网页的内容,它会处理它抓取的每一个网页。 这包括文本内容的处理、关键内容的标记和属性,如 <title> 标记和 Alt 属性、图片、视频等。Googlebot 它可以处理各种类型的内容,但并非所有类型的内容都可以处理。例如,我们不能处理一些富媒体文件的内容。

在捕获和编入索引的间隙中,Google 将确定网页是否是另一个网页的重复网页或标准网页。假如网页被视为重复网页,Google 它不会经常被抓住。类似的网页将被列入一个文档,列出一个或多个网页,包括标准网页(这组网页中最具代表性的网页)和所有重复的网页(可能只是同一页面的备用网站,或移动版本或桌面页面)。

请注意,Google 不会将包含 noindex 指令(标头或标记)网页编入索引。但前提是 Google 如果网页被看到,必须能够看到指令; robots.txt 即使文件、登录页或其他设备被屏蔽, Google 未访问该网页,也可将其编入索引!

提高编入索引的效果

你可以通过各种技能使你能够使用 Google 更多了解您的网页内容:

  • 使用 noindex 标记阻止 Google 抓取或找到你想要隐藏的网页。请勿正确 robots.txt 添加“屏蔽网页”noindex“标记;如果这样做,Google 将看不见 noindex 并且仍有可能将该网页编入索引。

  • 使用结构化数据。

  • 遵循 Google 网站站长指南。

什么是“文档”?

Google 将网页内部表示为大量文档。每个文档都表示一个或多个网页。这些网页完全相同或非常相似,但本质上内容相同,可以通过不同的网站访问。文档中的不同网站可能指向完全相同的网页(例如,example.com/dresses/summer/1234 和 example.com?product=1234 对于不同设备的用户,可能会显示相同的网页)或指向相同的网页(例如,example.com/mypage 适用于桌面设备用户,m.example.com/mypage 适用于移动设备用户)。

Google 将其中一个网站从文档中选择,并将其定义为文档的标准网站。标准网站的文档是 Google 索引网站最常被捕获和编辑;其他网站将被视为重复网站或备用网站,可能偶尔被捕获,或根据用户要求呈现为结果。例如,如果文档的标准网站是移动网站,Google 桌面(备用)网站仍有可能为用桌面设备搜索的用户提供。

Search Console 报告的大部分数据来自文档的标准网站。一些工具(如网站检查工具)支持测试备用网站,但检查标准网站也将提供备用网站的信息。

您可以告知 Google 您希望哪个网站是标准化的网站,但是 Google 由于种种原因,仍有可能选择其他网站作为标准网站。

以下是这些术语的简要描述,以及它们在哪里 Search Console 中的使用:

  • 文档:类似网页的集合。如果您的网站有重复的网页和备用网站,则包括标准网站。文档中的网站可能来自相同或不同的组织(根域名,例如 www.google.com 中的“google”)。Google 根据平台(移动设备/桌面设备)、选择搜索结果中显示的最佳网站,用户语言或地理位置以及多个其他变量。Google 通过自然捕获或网站实现的功能(如重定向或 <link rel=alternate/canonical> 标记)在网站上找到相关的网页。其他组织的相关网页只有在您的网站通过重定向或链接标记明确代码时才会被标记为备用网页。

  • 网站:用于访问网站上指定内容的网站。

  • 网页:通过一个或多个网站访问的指定网页。根据用户的平台(移动设备、桌面设备、平板电脑等),网页可能有不同的版本。

  • 版本:网页的变体通常分为“移动版”、“桌面”和“桌面”AMP”(但 AMP 网页本身可以有移动版和桌面版)。每个版本都可以有不同的网站(例如(例如) example.com 与 m.example.com)或者同一个网站(如果您的网站动态提供内容或使用自适应设计,则同一个网站可以显示同一个网页的不同版本),这取决于您的网站配置。语言变体不被视为不同的版本,而是被视为不同的文档。

  • 规范网页或网站:Google 认为最能代表文档的网站。Google 始终抓取这个网站,偶尔在文档中抓取重复的网站。

  • 备用/重复网页或网站:Google 文档网站可能偶尔会被捕获。如果这些网站适合用户和请求,Google 这些网站也会出现(例如,它们将为桌面设备用户提供备用网站,而不是标准化移动网站)。

  • 网站 (Site):通常用作网站(website,一组与概念相关的网页)的同义词,但有时也可以用作 Search Console 资源的同义词实际上可以定义为网站的一部分。如果网站可以跨越多个子网络域, AMP 如果网页关联正确,甚至可以跨越多个网域。

呈现结果

当用户输入查询时,我们的机器将在索引中搜索匹配的网页,并返回我们认为与用户搜索内容最相关的结果。相关性由数百个因素决定,我们一直在努力改进算法。Google 在选择结果和排名时,会考虑用户体验,所以请确保您的网页能够快速加载并适合移动设备。

改进内容呈现

你可以通过多种方式改进 Google 呈现网页内容的方式:

  • 如果您希望搜索结果针对特定地点或语言的用户,可以通知您 Google 您的偏好。

  • 确保您的网页能够快速加载并适用于移动设备。

  • 遵循网站管理员的指南,避免常见的潜在问题,提高网站排名。

  • 考虑为您的网站实施搜索结果功能,如食谱卡或文章卡。

  • 实施 AMP,加快移动设备上网页的加载速度。一些 AMP 网页还可以使用其他搜索功能,如“焦点新闻”轮播界面。

  • Google 算法一直在改进。我们不建议您尝试猜测算法并根据算法设计网页。我们建议您遵循我们的指南,努力创建符合用户需求的精彩内容。

原文链接:https://www.icz.com/technicalinformation/web/seo/2023/05/9744.html,转载请注明出处~~~
0
注意:请收藏好网址www.icz.com,防止失联!站内免费资源持续上传中…!赞助我们
显示验证码
没有账号?注册  忘记密码?