月光博客 » 搜索引擎 » Google Sitemaps使用指南

Google Sitemaps使用指南

  Google Sitemaps是Google的一个和网站管理员相关的工具,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通知”Google,方便Google进行索引。

  初步使用了一下Google Sitemaps,用法非常简单。

  首先在自己网站根目录上上建立一个名为GOOGLE11e5844324b7354e.html,文件本身可为空。然后在Google Sitemaps主页上单击验证按钮。Google会验证这一文件。如果验证通过,Google会显示一个已验证状态,并提供一个指向用户网站统计信息的链接。经过验证后,用户随时可以通过单击“网站概述”页上的链接来查看自己网站的统计信息。

  接下来,建立Sitemaps文件。Sitemaps文件是XML格式的,Google建议使用Sitemaps协议格式的文件。不过使用BLOG的RSS甚至纯文本文件也都可以。XML Sitemaps 格式其实也很简单,建议多花几分钟转换为XML Sitemaps 格式后再提交Google。Sitemaps协议是XML的变种,用于概括与Web抓取工具相关的Sitemaps信息。对于每个网址,都可以加入抓取“提示”(如最后修改日期和近似更改频率)。Sitemaps协议以 <urlset> 开始标记开始,以 </urlset> 结束标记结束。 每个网址包含一个作为父标记的 <url> 条目。 每一个 <url> 父标记包括一个 <loc> 子标记条目。<loc>是网页文件的网址。此网址应以http开始并少于2048个字符。 <lastmod>表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。其他的可选项可以不加。

  最后,在Google Sitemaps的提交页面填写你生成的Sitemap地址(比如我的是https://www.williamlong.info/sitemap.xml),并提交即可。

  过了几个小时后,再登录Google Sitemaps,可以看到功能菜单。

  Google Sitemaps还提供了Google Spider对用户网站访问情况的说明报告,如:查询统计信息、抓取统计信息、网页分析、索引统计信息等信息。“查询统计信息”中,有列出几个进入你网站的热门搜索关键字。在“抓取统计信息”中,可以看到Google Spider抓取网站的概要统计和抓取错误的地址。实现了网站主和Google Spider的信息交互。

  Google Sitemaps的访问地址是:http://www.google.com/webmasters/sitemaps/ 。
 

Google Sitemaps使用指南

顶一下 ▲()   踩一下 ▼()

相关文章

  1. 1
    非主流   说道:
    上次用了 很不错~
    支持(11反对(6回复
  1. 2
    rojoro   说道:
    月光,我从google来,谢谢你这篇文章。建站这么久了我也该设置一下Google Sitemaps了。
    支持(15反对(11回复
  1. 3
    K   说道:
    可以加我的msn吗?
    支持(14反对(11回复
  1. 4
    夜蜘蛛   说道:
    感觉好像没有明显的效果。
    支持(14反对(11回复
  1. 5
    zwchunk   说道:
    已提交的网址 200个
    已编入索引的网址数量 25个
    为什么编入索引的那么少 ?
    支持(10反对(8回复
  1. 6
    大象   说道:
    不错,试试看,谢谢~ google的搜索和百度的搜索应该差别比较大吧。
    支持(10反对(8回复
  1. 7
    liuxing   说道:
    Sitemaps 或 Sitemaps 索引有什么实用性区别吗?
    支持(9反对(8回复
  1. 8
    小宇   说道:
    非常感谢博主
    支持(14反对(13回复
  1. 9
    飞月   说道:
    比官方提供的东西好懂多了
    支持(13反对(12回复
  1. 10
    佬9   说道:
    呵呵!俺今天就学习这个,谢谢博主!
    支持(12反对(11回复
  1. 11
    xiaolang   说道:
    我没做明白,最后是提交了一个文本文件,英文不好,
    支持(12反对(12回复
  1. 12
    ben   说道:
    感觉好像没有明显的效果。
    支持(11反对(11回复
  1. 13
    乱炒不看图   说道:
    路过,这个插件是不是很耗CPU占用率
    支持(10反对(10回复
  1. 14
    专利转让网   说道:
    讲得挺清楚。
    支持(4反对(4回复
  1. 15
    HongXiaowan   说道:
    google sitemap、百度新闻协议和搜索引擎2.0
    http://www.hongxiaowan.com/2006/11/18/google-sitemap-baidu-news-protocol-and-search-engin-20-chinese/
    支持(6反对(7回复
  1. 16
    茶盘   说道:
    嗯,已经按照这个制作上传了,呵呵
    支持(10反对(11回复
  1. 17
    火眼金睛   说道:
    在此谢谢了!对我很有帮助。
    支持(14反对(15回复
  1. 18
    飞龙   说道:
    如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,哈哈有趣哦。
    支持(11反对(14回复
  1. 19
    liuxing   说道:
    弄明白sitemap和其索引的区别了,请问你是通过什么程序制作的sitemap呢?google提供的生成器我看不懂 更别提如何用了,我自己直接手工制作了一个sitemap文件放了上去,不知有用不。
    支持(14反对(18回复
  1. 20
    firefox   说道:
    GOOD
    支持(10反对(14回复
  1. 21
    nihaoinfo   说道:
    很好,谢谢了
    支持(10反对(14回复
  1. 22
    K   说道:
    执行python sitemap_gen.py --config=config.xml

    出现提示
    [WARNING] Discarded URL for not starting with the base_url: http://www.163.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.hao123.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.yahoo.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.google.com/
    [WARNING] Discarded URL for not starting with the base_url: http://search.yahoo.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.cernet.edu.cn/
    [WARNING] Discarded URL for not starting with the base_url: http://www.baidu.com/
    支持(8反对(13回复
  1. 23
    xami   说道:

    feediy 欢迎使用在线网站地图生成工具
    支持(10反对(16回复
  1. 24
    首佳软件   说道:
    sitemaps.xml的有效性的验证,我觉得最简单的办法就是用IE打开XML看看能不能有没有出错,不能通过的肯定要被GOOGLE打回来的,从出错开始的网址GOOGLE都不会再抓下去了。
    用ASP写的网页,参数超过1个(比如中间带一个&符号的网址)的网址都不算是有效网址
    支持(6反对(14回复
  1. 25
    nigel   说道:
    谢谢,虽然还不是很清楚,继续研究一下
    支持(6反对(15回复
  1. 26
    还我牛   说道:
    GOOGLE SiteMaps 用在线生成工具就行了
    http://www.5h6.com/create_sitemaps.php
    (中文版)国内的朋友做的,
    支持(7反对(17回复
  1. 27
    rab63   说道:
    拜读...谢过!
    支持(9反对(24回复

发表留言