当我们的网站开发完成后,我们需要制作一个网站地图,以便搜索引擎能够清楚地了解您网站的内容分布。那么什么是网站地图sitemap呢?它有什么用?接下来,让我们一起探索吧!
Sitemapp网站地图
Sitemap 网站管理员可以很容易地通知搜索引擎他们的网站上有哪些网页可以捕获。最简单的 Sitemap 形式,就是XML 文件列出了网站中的网站和每个网站的其他元数据(上次更新的时间、频率以及与网站上其他网站相比的重要性),以便搜索引擎能够更智能地捕获网站。
Sitemap 常见的格式
对百度而言,支持以下三种Sitemap格式:
-
txt文本格式
-
xml格式
-
Sitemap索引格式格式
txt文本格式
打开sitemapp.网站地图文件txt格式,大致如下:
-
https://www.xxx.com/robots-mislead-seo.html
-
https://www.xxx.com/search-engine.html
-
https://ww.xxx.com/robots-seo.html
本文件应遵循以下规则:
-
每行文本文件必须有一个网站。网站上不能有换行。
-
网站列表以外的任何信息都不应包括在内。
-
你必须写一个完整的网站,包括 http。
-
每个文本文件最多可以包含 50,000 一个网站,超过部分,然后新建一个文本文件。 需要使用文本文件 UTF-8 编码。
xml格式
xml格式有两种,一种是谷歌sitemap,另一种是百度sitemap
谷歌sitemap格式如下:
<urlset xmlns=“网页列表地址”> <url> <loc>网址</loc> <lastmod>2021-1-01T00:00-08:00</lastmod> <changefreq>always</changefreq> <priority>1.0</priority> </url> <url> <loc>网址</loc> <lastmod>2021-01-02T20:20:36Z</lastmod> <changefreq>daily</changefreq> <priority>0.8</priority> </url> </urlset>
百度sitemap格式如下:
<?xml version="1.0" encoding="UTF-8"?> <urlset> <url> <loc>网页地址</loc> <lastmod>2021-01-01</lastmod> <changefreq>daily</changefreq> <priority>1.0</priority> </url> </urlset>
谷歌的sitemap看起来比百度的sitemap复杂,但实际上是一样的。让我们来看看xml中的几个重要标签。
changefreq:更新页面内容的频率。
lastmod:最后修改页面的时间(ISO 8601)
loc:页面永久链接地址
priority:与其他页面相比,优先权
其中changefreq
更重要的是,它会告诉搜索引擎爬虫,这个界面更新多久,这样爬虫就可以尽可能及时地爬上网站更新的内容,并且可以通过。”always“、 “hourly”、 “daily”、 “weekly”、 “monthly”、 “yearly”、 “never“用几个单词来描述,具体含义就不单独解释了,看单词的意思应该很清楚,有不懂的留言。
Sitemap索引格式格式
当网站内容不断丰富时,会有多个sitemap文件。如果一个一个的文件提交到站长平台,会很麻烦。还有一种更方便的方法来包装和提交所有sitemap文件,如下格式:
<?xml version="1.0" encoding="utf-8"?> <!-- XML文件需要utf-8编码--> <sitemapindex> <!--必填,以 <sitemapindex> 开始标记作为开始,以 </sitemapindex> 结束标记为结束--> <sitemap> <!--必填,以<sitemap>提交一个子sitemap文件--> <loc>http://example.com/sitemap.xml</loc> <!--必填,识别sitemap的位置--> <lastmod>2021-1-1</lastmod> <!--选择填写,识别相对于sitemap文件的修改时间--> </sitemap> <!--选择填写,识别相对于sitemap文件的修改时间--> </sitemap> <!--必填,封闭标签--> </sitemapindex> <!--必填,封闭标签-->
只要复制<sitemap>
标签,添加更多的sitemap文件路径,最后提交单个sitemap索引文件。