拥抱博客

壁立千仞,无欲则刚

如何开启WinXP的IIS服务把z-blog安装到本地W3C验证通过有何意义

怎样写z-blog1.8版的robots.txt

在使用Google网站管理员工具时发现自己的z-blog没有设置robots.txt文件,感觉还是创建一个的好。创建 robots.txt 文件,可以指定你不想让哪些搜索引擎的蜘蛛抓取你的网站,或是规定某些文件或目录不让它们抓取。对于网站来说并非抓取的目录和文件越多越好,因为不是所有的文件都是需要被搜索引擎抓取的。

下面是z-blog1.8版本的写法和注释,Disallow代表禁止抓取

User-agent:*
#Directories(目录)
Disallow:/ADMIN/ //后台管理文件
Disallow:/SCRIPT/ //调用的SCRIPT文件,即使搜索引擎抓到了,也不读取
Disallow:/PLUGIN/ //插件目录
Disallow:/FUNCTION/ //不需抓取
Disallow:/DATA/ //数据库目录
Disallow:/CACHE/ //Zblog生成静态页的缓存目录,和正常文章基本一致,高重复
Disallow:/TEMPLATE/ //模板目录
Disallow:/CSS/ //CSS的一些调用文件目录
Disallow:/LANGUAGE/ //语言目录,不必抓取
#Files(文件)
Disallow:/login.asp //登录后台文件
Disallow:/cmd.asp? //这个是供别人引用通知时产生的页面
Disallow:/search.asp //搜索页,无人使用的时候,就是一个空页
Disallow:/atom.xml //支持ATOM的FEED页,高重复。
Disallow:/rss.xml //支持RSS的FEED页,高重复。
Disallow:/view.asp? //后台预览文章时生成的页面

使用方法是代码复制到文本文档,去掉注释内容以及注释//前面的空格,另存为robots.txt,上传至博客根目录下就可以了。

下面这个是月光博客的robots.txt写法,也可以研究和参考一下。

#
# robots.txt for williamlong
# Version 4.0.0
#
User-agent: *
Disallow: /ads/
Disallow: /function/
Disallow: /FCKeditor/
Disallow: /CACHE/
Disallow: /SCRIPT/
Disallow: /ADMIN/
Disallow: /google/ADMIN/
Disallow: /google/CACHE/
Disallow: /google/function/
Disallow: /blog/function/
Disallow: /wap.asp
Disallow: /cmd.asp
Disallow: /google/wap.asp
Disallow: /google/cmd.asp
Sitemap: http://www.williamlong.info/sitemap.xml

关于sitemap其实我们也可以用Google的网站管理员工具提交一下。

看过之后相信你也后根据自己的情况,制作出自己的robots.txt了。


转载请注明文章转载自:拥抱博客 [ http://www.90me.com/ ]
本文链接地址:http://www.90me.com/post/z-blog-robots.html
  • quote 2.互联网实用经验
  • http://www.dikeyao.cn
  • 请高手帮忙分析seo错误导致网站收录下降的原因
    最近发现分享与发现的流量大部分来至百度,来至google流量相当少,而且很长时间才收录一次,收录首页,一直没找到网站收录下降原因为何,不知道是不是因为seo错误操作所导致。

    这是google最近一次收录

    这是 Google 对 http://www.dikeyao.cn/ 的缓存。 这是该网页在 2008年12月10日 12:45:39 GMT 的快照。

    这是倒数第二次收录
    这是 Google 对 http://www.dikeyao.cn/Search.asp 的缓存。 这是该网页在 2008年11月26日 07:28:31 GMT 的快照。

    两次结果表明网站收录下降很励害间隔约15天。
    仔细对分享与发现分析以后,找到以下问题,不知道哪些是最直接的原因导致网站收录下降
    最近网站问题:
    用google的网站管理员工具查了一下,发现几个google错误:
    1.内容分析元标重复网页4,元标记太短16。
    2.HTTP 错误 ‎(0)‎ Sitemap 中的网址错误 ‎(0)‎ 找不到 ‎(5)‎ 无法访问的网址 ‎(1)
    3.我的robots一直没有设置,不知道会不会产生很多的相似网页。
    人为原因:
    1.前段时间约1月修改title三次。
    2.因为换服务器人为错误,导致网站不能访问一天
    分享与发现8月分上线的,而且大部份文章都是原创,应该网站收录不应该是这个结果。所以特别写了这个贴子到网上发布希望找到原因。谢谢高手回答
  • 2008-12-12 13:00:31 回复该留言

发表评论:

◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。

  • 网站分类

    Search

    热文排行

    随机文章

    Powered By Z-Blog

    Auto Publisher Copyright © 2008-2010 拥抱博客 All Rights Reserved | 京ICP备07023062号