hardrock 发表于 2013-11-22 14:23:30

如何写好WordPress网站的robots.txt文件?

本帖最后由 hardrock 于 2013-11-22 14:34 编辑

robots.txt文件要放在网站根目录下,最基本的检查方法就是用你的域名后面直接跟上robots.txt访问,如果能访问,那放置的位置就对了。

找到份代码,User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-admin/
Disallow: /wp-content/cache/
Disallow: /wp-content/languages/
Disallow: /wp-content/plugins/
Disallow: /wp-content/themes/
Disallow: /wp-content/upgrade/
Disallow: /wp-includes/
Disallow: /comments/
Disallow: /category/
Disallow: /tag/
Disallow: /page/
Disallow: /feed/
Disallow: /author/
Disallow: /trackback/
Disallow: /2010/
Disallow: /2011/
Disallow: /2012/
Disallow: /2013/
Disallow: /*/feed/
Disallow: /*/trackback/
Disallow: /*?
Disallow: /*/*?
Disallow: /*/*/*?
Disallow: /*.php$
Disallow: /*.js$
Disallow: /*.inc$
Disallow: /*.css$

# Google Image
User-agent: Googlebot-Image
Disallow:
Allow: /

# Google AdSense
User-agent: Mediapartners-Google*
Disallow:
Allow: /

# digg mirror
User-agent: duggmirror
Disallow: /

# Alexa archiver
User-agent: ia_archiver
Disallow: /

Sitemap:http://www.xxx.com/sitemap.xml
Sitemap:http://www.xxx.com/sitemap_baidu.xml问题是这份代码适用于中文站用于百度,我是做英文站要适用于google, 以上代码怎样改成适用英文站的?
对于代码 一窍不通...

主要疑问是31----47行的代码,既然是英文站,这几行代码应该是允许的吧?中文站才禁止抓取?




补充内容 (2013-12-22 17:43):
没这么复杂,下面的就可以了
Sitemap: hxxp://www.xxx.com/sitemap.xml
User-agent: *
Disallow: /cgi-bin/
Disallow: /wp-*

补充内容 (2013-12-27 17:17):
http://blog.csdn.net/wallacer/article/details/654289

dulun 发表于 2013-11-22 15:02:27

好像禁止了动态收录?具体听高手解答~

luguokankan 发表于 2013-11-22 21:26:40

我第一次看到这个robots.txt是在英文站.....
可以用于英文站

327949734 发表于 2013-12-10 14:14:56




和竞争对手学习呀,他们是你最好的老是

页: [1]
查看完整版本: 如何写好WordPress网站的robots.txt文件?