导读
想必现在有很多小伙伴对于什么是robots文件方面的知识都比较想要了解,那么今天小好小编就为大家收集了一些关于什么是robots文件方面的知...
想必现在有很多小伙伴对于什么是robots文件方面的知识都比较想要了解,那么今天小好小编就为大家收集了一些关于什么是robots文件方面的知识分享给大家,希望大家会喜欢哦。
什么是robots协议? robots协议(也称为爬虫协议、机器人协议等)的全称是“网络爬虫排除标准”(Robots Exclusion Protocol),网站通过robots协议告诉搜索引擎哪些页面可以抓取,哪些页面不能抓取。robots协议的本质是网站和搜索引擎爬虫的沟通方式,用来指导搜索引擎更好地抓取网站内容,更好的保护用户的隐私和版权信息。 大家记住,如果站内没有robots.txt文件,则表明蜘蛛可以任意抓取网站的文件。对于我们seo网站优化来说并不是所有文件都需要让蜘蛛抓取的。例如一些不重要的文件,或者网站的死链接,我们就需要使用robots.txt来屏蔽掉,不让他抓取。
robots.txt文件存放在网站的什么地方robots.txt文件存放在我们网站的根目录下,我们如何检测站点里面有没有robots.txt文件,我们只需要在网站的根域名后面输入robots.txt如图所示
robots.txt文件书写规则:• User-agent: 蜘蛛名称• Disallow: 内容名称 (禁止抓取的内容)• Allow:内容名称(允许抓取的内容)
版权归芝士回周答小网站或原作者所去白厂有
本文到此结束,希望对大家有所帮助。