月光博客

青青子衿, 悠悠我心, 但为君故, 沉吟至今

« 知识分子如何发现和预防过劳死站长必去的十个编程网站 »

Google Sitemaps使用指南

  Google Sitemaps是Google的一个和网站管理员相关的工具,有点象BLOG的RSS功能,是一个方便自己的服务,如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,任何一个站点,只要有更新,便会自动“通知”Google,方便Google进行索引。

  初步使用了一下Google Sitemaps,用法非常简单。

  首先在自己网站根目录上上建立一个名为GOOGLE11e5844324b7354e.html,文件本身可为空。然后在Google Sitemaps主页上单击验证按钮。Google会验证这一文件。如果验证通过,Google会显示一个已验证状态,并提供一个指向用户网站统计信息的链接。经过验证后,用户随时可以通过单击“网站概述”页上的链接来查看自己网站的统计信息。

  接下来,建立Sitemaps文件。Sitemaps文件是XML格式的,Google建议使用Sitemaps协议格式的文件。不过使用BLOG的RSS甚至纯文本文件也都可以。XML Sitemaps 格式其实也很简单,建议多花几分钟转换为XML Sitemaps 格式后再提交Google。Sitemaps协议是XML的变种,用于概括与Web抓取工具相关的Sitemaps信息。对于每个网址,都可以加入抓取“提示”(如最后修改日期和近似更改频率)。Sitemaps协议以 <urlset> 开始标记开始,以 </urlset> 结束标记结束。 每个网址包含一个作为父标记的 <url> 条目。 每一个 <url> 父标记包括一个 <loc> 子标记条目。<loc>是网页文件的网址。此网址应以http开始并少于2048个字符。 <lastmod>表示该文件上次修改的日期。此日期允许删除时间部分,例如YYYY-MM-DD。其他的可选项可以不加。

  最后,在Google Sitemaps的提交页面填写你生成的Sitemap地址(比如我的是http://www.williamlong.info/sitemap.xml),并提交即可。

  过了几个小时后,再登录Google Sitemaps,可以看到功能菜单。

  Google Sitemaps还提供了Google Spider对用户网站访问情况的说明报告,如:查询统计信息、抓取统计信息、网页分析、索引统计信息等信息。“查询统计信息”中,有列出几个进入你网站的热门搜索关键字。在“抓取统计信息”中,可以看到Google Spider抓取网站的概要统计和抓取错误的地址。实现了网站主和Google Spider的信息交互。

  Google Sitemaps的访问地址是:http://www.google.com/webmasters/sitemaps/ 。
 



原创文章如转载,请注明:转载自月光博客 [ http://www.williamlong.info/ ]

本文链接地址:http://www.williamlong.info/archives/327.html
  • 文章排行:
  • 2.K
  • 执行python sitemap_gen.py --config=config.xml

    出现提示
    [WARNING] Discarded URL for not starting with the base_url: http://www.163.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.hao123.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.yahoo.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.google.com/
    [WARNING] Discarded URL for not starting with the base_url: http://search.yahoo.com/
    [WARNING] Discarded URL for not starting with the base_url: http://www.cernet.edu.cn/
    [WARNING] Discarded URL for not starting with the base_url: http://www.baidu.com/
  • 2005-12-27 18:54:24   回复该留言
  • 5.liuxing
  • sscc.cc
  • 弄明白sitemap和其索引的区别了,请问你是通过什么程序制作的sitemap呢?google提供的生成器我看不懂 更别提如何用了,我自己直接手工制作了一个sitemap文件放了上去,不知有用不。
  • 2006-1-10 14:25:00   回复该留言
  • 6.limd
  • 这里有一个ASP的共享的Sitemap文件生成器,可以自动生成sitemap文件:
    http://lysoft.lz169.com/kingron/Stuff/sitemap.asp
    这样不用手动生成sitemap文件了,而且只要更新后可以自动生成。
    如果需要动态数据库的支持,则需要修改一下原代码即可。
  • 2006-2-18 13:41:19   回复该留言
  • 7.nigel
  • 谢谢,虽然还不是很清楚,继续研究一下
  • 2006-5-27 22:14:41   回复该留言
  • 9.可以试试mysitemap生成工具

  • http://www.mysitemap.net

    支持验证sitemaps.xml的有效性

    支持生成 主页的sitemaps

    支持生成整个网站的sitemaps

    支持生成sitemaps的索引文件
    支持yahoo 站点地图
    邮件通知
  • 2006-9-15 20:55:22   回复该留言
  • 10.HongXiaowan
  • google sitemap、百度新闻协议和搜索引擎2.0
    http://www.hongxiaowan.com/2006/11/18/google-sitemap-baidu-news-protocol-and-search-engin-20-chinese/
  • 2006-11-18 23:47:56   回复该留言
  • 11.海天如镜
  • http://www.htsanguo.com
    不知道为什么,我的站用生成工具只能生成七条索引,郁闷……
  • 2006-12-21 17:11:33   回复该留言
  • 12.首佳软件
  • sitemaps.xml的有效性的验证,我觉得最简单的办法就是用IE打开XML看看能不能有没有出错,不能通过的肯定要被GOOGLE打回来的,从出错开始的网址GOOGLE都不会再抓下去了。
    用ASP写的网页,参数超过1个(比如中间带一个&符号的网址)的网址都不算是有效网址
  • 2007-1-4 12:29:20   回复该留言
  • 13.还我牛
  • GOOGLE SiteMaps 用在线生成工具就行了
    http://www.5h6.com/create_sitemaps.php
    (中文版)国内的朋友做的,
  • 2007-1-12 11:54:08   回复该留言
  • 15.rojoro
  • 月光,我从google来,谢谢你这篇文章。建站这么久了我也该设置一下Google Sitemaps了。
  • 2007-2-24 23:28:52   回复该留言
  • 17.飞龙
  • 如果大家(互联网上所有的信息源)都采用了这种方式提交自己的更新的话,Google就再也不用派出那么多爬虫辛辛苦苦的到处乱窜了,哈哈有趣哦。
  • 2007-9-4 22:22:36   回复该留言
  • 18.请大家试一下我做的sitemap生成器
  • 中文版 www.vtalkback.com/site-map
    英文版 www.vtalkback.com/sitemap
    提供源代码,用asp编写,中文注释,支持utf-8和gb2312文件名

    sourceforge项目注册地址
    sourceforge.net/projects/g-sitemap/
    考虑到服务器的承受能力,测试是限制了1000个页面
    如果要超过1000,可以改一下LimitUrl变量

    测试http://www.htsanguo.com, 1级url 能找到96个页面
    希望大家多提点意见
  • 2007-11-27 0:43:24   回复该留言
  • 22.文件加密
  • 说起AnyView网络警,各位网管或是对国内监控软件略有了解的同仁们都不陌生,这是由一款2000年面市的mailspy(邮件侦探)、2004年升级为AnySpy(网络警察)、2005年正式定名为AnyView(网络警)的专业的企业级监控软件。它内外网功能兼具,适合各种网络环境,服务了国内成千上万家的企业、政府、学校等用户,隶属国内监控软件第一军团,享有很高的知名度及美誉度。
    2008年6月,继AnyView网络警之后,厦门天锐科技研发人员历经半年的潜心开发,并总结了市面上各种加密软件的技术特点,推出了绿盾信息管理安全管理软件,它将文件的透明加密及企业的内网信息管理很好的结合在一起。主要功能如下:
    1、 文件加密模块:系统在不改变用户原有工作流程和文件使用习惯的前提下,对需要保护的文件进行强制加密保护,并对文件的使用进行全程监控。对需要外发的文件、出差或在家办公的笔记本电脑可采取文件外发策略及离线策略,即文件只能在企业局域网内部查看,离开局域网即为密文,可有效消除资料外泄的各种渠道。
    2、 内网安全模块:支持屏幕监视、聊天内容监视、设备限制、应用程序限制、资产管理等计算机操作行为的管理及监控。
    绿盾软件于6-16正式发布,在官方网站(www.ldsafe.com, www.ldsafe.cn )及各大软件下载网站(如天空、华军、天极等)均可免费下载试用。
    有什么问题,随时联系:厦门天锐科技有限公司:小王:0592-5761010
  • 2008-6-28 14:33:33   回复该留言

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

订阅博客

  • 订阅我的博客:订阅我的博客
  • 通过Google订阅本站
  • 通过鲜果订阅本站
  • 通过电子邮件订阅本站

站内搜索

热文排行

最新评论及回复

最近发表

网站收藏

本站采用创作共用版权协议, 要求署名、非商业用途和保持一致. 转载本站内容必须也遵循“署名-非商业用途-保持一致”的创作共用协议.

This site is licensed under a Creative Commons Attribution-NonCommercial-ShareAlike 2.5 License.