青青子衿, 悠悠我心, 但为君故, 沉吟至今
« 知识分子如何发现和预防过劳死站长必去的十个编程网站 »

Google Sitemaps使用指南

  Google Sitemaps是Google的一个和网站管理员相关的工具,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通知”Google,方便Google进行索引。

  初步使用了一下Google Sitemaps,用法非常简单。

  首先在自己网站根目录上上建立一个名为GOOGLE11e5844324b7354e.html,文件本身可为空。然后在Google Sitemaps主页上单击验证按钮。Google会验证这一文件。如果验证通过,Google会显示一个已验证状态,并提供一个指向用户网站统计信息的链接。经过验证后,用户随时可以通过单击“网站概述”页上的链接来查看自己网站的统计信息。

  接下来,建立Sitemaps文件。Sitemaps文件是XML格式的,Google建议使用Sitemaps协议格式的文件。不过使用BLOG的RSS甚至纯文本文件也都可以。XML Sitemaps 格式其实也很简单,建议多花几分钟转换为XML Sitemaps 格式后再提交Google。Sitemaps协议是XML的变种,用于概括与Web抓取工具相关的Sitemaps信息。对于每个网址,都可以加入抓取“提示”(如最后修改日期和近似更改频率)。Sitemaps协议以 <urlset> 开始标记开始,以 </urlset> 结束标记结束。 每个网址包含一个作为父标记的 <url> 条目。 每一个 <url> 父标记包括一个 <loc> 子标记条目。<loc>是网页文件的网址。此网址应以http开始并少于2048个字符。 <lastmod>表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。其他的可选项可以不加。

  最后,在Google Sitemaps的提交页面填写你生成的Sitemap地址(比如我的是http://www.williamlong.info/sitemap.xml),并提交即可。

  过了几个小时后,再登录Google Sitemaps,可以看到功能菜单。

  Google Sitemaps还提供了Google Spider对用户网站访问情况的说明报告,如:查询统计信息、抓取统计信息、网页分析、索引统计信息等信息。“查询统计信息”中,有列出几个进入你网站的热门搜索关键字。在“抓取统计信息”中,可以看到Google Spider抓取网站的概要统计和抓取错误的地址。实现了网站主和Google Spider的信息交互。

  Google Sitemaps的访问地址是:http://www.google.com/webmasters/sitemaps/ 。
 



  除非注明,月光博客文章均为原创,转载请以链接形式标明本文地址

  本文地址:http://www.williamlong.info/archives/327.html
  • 文章排行:
  • 2.rojoro
  • 月光,我从google来,谢谢你这篇文章。建站这么久了我也该设置一下Google Sitemaps了。
  • 2007/2/24 23:28:52   支持(15)反对(11) 回复
  • 4.夜蜘蛛
  • 感觉好像没有明显的效果。
  • 2010/6/3 10:15:46   支持(14)反对(11) 回复
  • 5.zwchunk
  • 已提交的网址 200个
    已编入索引的网址数量 25个
    为什么编入索引的那么少 ?
  • 2010/6/13 19:16:58   支持(10)反对(8) 回复
  • 6.大象
  • 不错,试试看,谢谢~ google的搜索和百度的搜索应该差别比较大吧。
  • 2011/4/23 19:31:07   支持(10)反对(8) 回复
  • 7.liuxing
  • Sitemaps 或 Sitemaps 索引有什么实用性区别吗?
  • 2006/1/10 13:58:53   支持(9)反对(8) 回复
  • 9.飞月
  • 比官方提供的东西好懂多了
  • 2007/12/30 1:54:08   支持(13)反对(12) 回复
  • 10.佬9
  • 呵呵!俺今天就学习这个,谢谢博主!
  • 2010/11/22 15:24:29   支持(12)反对(11) 回复
  • 11.xiaolang
  • 我没做明白,最后是提交了一个文本文件,英文不好,
  • 2006/5/28 4:16:58   支持(12)反对(12) 回复
  • 13.乱炒不看图
  • 路过,这个插件是不是很耗CPU占用率
  • 2010/8/19 14:07:34   支持(10)反对(10) 回复
  • 15.HongXiaowan
  • google sitemap、百度新闻协议和搜索引擎2.0
    http://www.hongxiaowan.com/2006/11/18/google-sitemap-baidu-news-protocol-and-search-engin-20-chinese/
  • 2006/11/18 23:47:56   支持(6)反对(7) 回复
  • 16.茶盘
  • 嗯,已经按照这个制作上传了,呵呵
  • 2010/5/26 11:10:11   支持(10)反对(11) 回复
  • 17.火眼金睛
  • 在此谢谢了!对我很有帮助。
  • 2010/10/8 20:55:31   支持(14)反对(15) 回复
  • 18.飞龙
  • 如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,哈哈有趣哦。
  • 2007/9/4 22:22:36   支持(11)反对(14) 回复
  • 19.liuxing
  • 弄明白sitemap和其索引的区别了,请问你是通过什么程序制作的sitemap呢?google提供的生成器我看不懂 更别提如何用了,我自己直接手工制作了一个sitemap文件放了上去,不知有用不。
  • 2006/1/10 14:25:00   支持(14)反对(18) 回复
  • 22.K
  • 执行python sitemap_gen.py --config=config.xml

    出现提示
    [WARNING] Discarded URL for not starting with the base_url: http://www.163.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.hao123.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.yahoo.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.google.com/
    [WARNING] Discarded URL for not starting with the base_url: http://search.yahoo.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.cernet.edu.cn/
    [WARNING] Discarded URL for not starting with the base_url: http://www.baidu.com/
  • 2005/12/27 18:54:24   支持(8)反对(13) 回复
  • 23.xami

  • feediy 欢迎使用在线网站地图生成工具
  • 2011/8/30 21:49:50   支持(10)反对(16) 回复
  • 24.首佳软件
  • sitemaps.xml的有效性的验证,我觉得最简单的办法就是用IE打开XML看看能不能有没有出错,不能通过的肯定要被GOOGLE打回来的,从出错开始的网址GOOGLE都不会再抓下去了。
    用ASP写的网页,参数超过1个(比如中间带一个&符号的网址)的网址都不算是有效网址
  • 2007/1/4 12:29:20   支持(6)反对(14) 回复
  • 25.nigel
  • 谢谢,虽然还不是很清楚,继续研究一下
  • 2006/5/27 22:14:41   支持(6)反对(15) 回复
  • 26.还我牛
  • GOOGLE SiteMaps 用在线生成工具就行了
    http://www.5h6.com/create_sitemaps.php
    (中文版)国内的朋友做的,
  • 2007/1/12 11:54:08   支持(7)反对(17) 回复

发表评论:

 请勿发送垃圾信息、广告、推广信息或链接,这样的信息将会被直接删除。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 关注新浪微博:关注新浪微博
  • 关注腾讯微博:关注腾讯微博
  • 关注认证空间:关注QQ空间
  • 通过电子邮件订阅
  • 通过QQ邮件订阅

站内搜索

热文排行


月度排行

本站采用创作共用版权协议, 要求署名、非商业用途和相同方式共享. 转载本站内容必须也遵循“署名-非商业用途-相同方式共享”的创作共用协议.
This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 3.0 License.