sitemap.xml格式網站地圖的制作

首先來簡要的了解下什么是sitemap.xml文件:sitemap.xml文件是嚴格按照xml語言編寫的網站地圖,用來引導搜索蜘蛛對本站點文章等內容的索引,它是由google提出來的概念,目前yahoo,bing等已經公 開聲明支持這種格式,百度雖然沒有明確支持,但使用sitemap.xml文件已經是大勢所趨。

所以像blog這樣的博客系統都會自帶 sitesmap.xml文件,它是向眾多搜索引擎提供站點信息的一個非常好的方式。如果沒有sitemap.xml文件,那么搜索引擎就會對你的網站一 頁一頁的抓去,效率不高且不友好。

Google提供了詳細的sitemap.xml的寫法,站點的網站地圖樣例如下:

<urlset?xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

<url>

<loc>http://www.whmyzs.cn</loc>

<lastmod>2018-04-19?</lastmod>

<changefreq>always</changefreq>

<priority>1.0</priority>

</url>

<url>

<loc>http://www.whmyzs.cn/about/</loc>

<changefreq>daily</changefreq>

<priority>0.8</priority>

</url>

<url>

<loc>http://www.whmyzs.cn/hdp/75.html</loc>

<lastmod>2017-01-10</lastmod>

<changefreq>weekly</changefreq><priority>0.6</priority>

</url>

</urlset>

語法很簡單。其中priority是指相對于其他頁面的優先權,changefreq則是指內容更新的頻率。有了這些設置,就等于告訴搜索引擎機器人,你的網站的更新情況如何,以及希望搜索引擎優先收錄哪些內容。

XML地圖格式說明

1、首尾格式

如下:

<?xml version="1.0"?>
<urlset xmlns="http://www.sitemaps.org/schemas/sitemap/0.9">

這兩句代碼類似Html標簽是死的。照抄即可。文件最后會有</urlset>

2、<loc></loc>

這兩個標簽中間的地址必填。格式為:http://www.sbfilu.live,此網址應以協議開始(例如:http)并以斜線結尾。此值應少于 2048 個字符。

3、<lastmod>

可選標簽? 標簽含義:該文件上次修改的日期。此日期應采用 W3C Datetime 格式。如果需要的話,此格式允許省略時間部分,而僅使用 YYYY-MM-DD。 列子:2014-07-16。

一 般來說這個很重要。Google的機器人會在索引此鏈接前先和上次索引記錄的最后更新時間進行 比較,如果時間一樣就會跳過不再索引。所以如果你的鏈接內容基于上次Google索引時的內容有所改變,應該更新該時間,讓Google下次索引時會重新 對該鏈接內容進行分析和提取關鍵字。

4、<changefreq>

可選標簽 標簽含義:頁面可能發生更改的頻率。此值為搜索引擎提供一般性信息,可能與搜索引擎抓取頁面的頻率不完全相關。有效值為:

always 
hourly 
daily 
weekly 
monthly 
yearly 
never

值“always”應當用于描述每次訪問時都會改變的文檔。而值“never”應當用于描述已存檔網址。

5、<priority>

可 選標簽 此網址的優先級與您網站上其他網址的優先級相關。有效值范圍從 0.0 到 1.0。此值不會影響您的網頁與其他網站上網頁的比較結果,只是告訴搜索引擎您認為您的那個網頁最重要,從而它們對您頁面的抓取可以按照您最喜歡的方式進 行排序。一個網頁的默認優先級為 0.6。

xml文件必須是utf-8的編碼格式,可以用記事本打開xml然后另存為時選擇編碼(或轉換器)為UTF-8。了解這些標簽的作用我們就可以根據自己網站的情況做出適合自己站點sitemap.xml。

通過以上的知識我們可以知道:如果要想添加的站點地圖的話,需要增加如下代碼即可:

<url>
<loc>http://www.whmyzs.cn/hdp/75.html</loc>
<lastmod>2017-01-10</lastmod>
<changefreq>weekly</changefreq>
<priority>0.6</priority>
</url>

提交Sitemap.xml

Sitemap.xml制作完成后,就需要將xml文件提交到相關搜索引擎。

Google提交網址:http://www.google.com/webmasters/sitemaps/?hl=zh-CN

Yahoo提交網址:http://sitemap.cn.yahoo.com/

提交后,一般在幾個小時之內,系統就開始下載處理了。

Sitemap.xml的校驗

至于你的網站地圖是否符合標準,最方便有效的手段就是使用google的管理員工具了。

在 google搜索引擎接收你的sitemap.xml后幾天內,google的管理員工具就會將詳細的分析結果反饋回來,包括:sitemap.xml中 包含了多少地址,google已將多少地址加入索引,sitemap.xml中出現了哪些錯誤,甚至蜘蛛采集過程中遇到的各種問題,比如哪些網頁有 404,500錯誤都會詳細的羅列出來,非常方便。

如果你提交的xml文件一切無誤,那么接下來,你就是等著讓它的搜索蜘蛛來爬了,sitemap的文件告知了文件更新的頻率,這樣搜索蜘蛛來得更勤快,頁面被收錄當然也就更快。

avatar

發表評論

:?: :razz: :sad: :evil: :!: :smile: :oops: :grin: :eek: :shock: :???: :cool: :lol: :mad: :twisted: :roll: :wink: :idea: :arrow: :neutral: :cry: :mrgreen: