robots.txt文件设置方法

发布时间:2024-01-21 点击:70
由于现在免费的网站程序越来越成熟,利用网站程序一天就可以做很多个网站,大家也都喜欢在线做网站,就是直接把网站程序通过ftp工具上传到服务器空间,安装设置好后就开始添加内容,但是由于网站在规划设计阶段总还不是那么完美,一些东西还没有完全确定下来之前网站经常需要修改一些东西,而做seo的人都知道,百度或者谷歌对于经常变动的新网站通常的做法都是放入观察期,因为搜索引擎会觉得你的网站还不稳定,所以很多人就想到了设置robots.txt文件来禁止搜索引擎对于网站更新的内容进行抓取,等网站完全设计好后再进行相应的设置或者直接删除这个文件,允许搜索引擎抓取我们的网站页面。
这个文件能够帮我们很大的忙,在服务器下面没有,我们可以在本地编写好之后上传到服务器根目下,下面给大家举例它的有关功能以及编写方法。(注意我的语句大小写,大小写必须要一致,因为这个文件区分大小写。)
(允许所有搜索引擎抓取任何内容)
user-agent:*
disallow:
(禁止所有搜索引擎抓取任何内容)
user-agent:*
disallow:/
(告诉所有搜索引擎不爬行aaa跟bbb目录下的这是一个神奇的网站。。。内容和123.html文件)
user-agent:*
disallow:/aaa/
disallow:/bbb/
disallow:/这是一个神奇的网站。。。/123.html
(告诉除百度意外所有搜索引擎不准爬aaa目录下的123.htm文件)
user-agent:baiduspider
disallow:
user-agent:*
disallow:/aaa/
disallow:123.htm
(告诉搜索引擎不准爬aaa目录和文件,但是可以爬aaa目录下bbb的内容)
user-agent:*
disallow:/aaa/
allow:/aaa/bbb/
(告诉谷歌允许抓取所有.html为后缀的url,不允许百度抓取所有以.html为后缀的url,禁止所有所有搜索引擎抓取.jpg格式的文件)
user-agent:googlebot
allow:.html$
user-agent:baiduspider
disallow:.html$
user-agent:*
disallow:.jpg$
(告诉蜘蛛禁止抓取任何带.asp后缀的文件)
user-agent:*
disallow:/*.asp
以上是robots.txt文件在网站中作用,供大家借鉴。


网络营销的特点有哪些?网络营销的推广手段都有什么?
自动重新加载脚本可以对SEO产生影响吗?
如何在短时间内快速学习软文本关键字布局方法?
网站定期持续更新内容,可达到提高关键词排名的目的
提高网站收录率的方法分享
SEO生存法则:40天内百度首页排名的实践经验
这一点,很多网络营销人都忽略了!
如何让网站排名一天比一天高?