博客
关于我
强烈建议你试试无所不能的chatGPT,快点击我
Robots协议
阅读量:1887 次
发布时间:2019-04-26

本文共 156 字,大约阅读时间需要 1 分钟。

Robots Exclusion Standard   网络爬虫排除标准

作用:网站告知网络爬虫哪些页面可以抓取,哪些不行

形式:在网站根目录下的robots.txt文件  

如:

网络爬虫:自动或人工识别robots.txt,再进行内容爬取

约束性:Robots协议是建议但非约束性,网络爬虫可以不遵守,但存在法律风险

转载地址:http://jawdf.baihongyu.com/

你可能感兴趣的文章
想要成为运维,想要成为后期的架构师?这些知识是必备的!
查看>>
linux 是如何 快速一键安装禅道的呐?
查看>>
运维面试基础试题(四)
查看>>
一键安装Openstack单节点 必能成功
查看>>
面试紧张怎么办
查看>>
关系型数据库 ,nosql数据库简介
查看>>
Centos 7搭建NTP时间同步服务器
查看>>
centos7 基于rsync+inotify 实现定时备份
查看>>
指定IP进行 文件的分发
查看>>
基于http搭建本地yum仓库
查看>>
常规邮件基础
查看>>
邮件基础之 -- SMTP协议
查看>>
Java设计模式--责任链模式
查看>>
OpenCV的cvLoadImage函数
查看>>
OpenCV中与matlab中相对应的函数
查看>>
C/C++中二维数组作函数形参时,调用函数时,可传递的实参类型的小结
查看>>
cvGetSubRect与cvMul用法
查看>>
opencv图像处理梯度边缘和角点
查看>>
Caffe源码中blob文件分析
查看>>
OpenCV 图像采样 插值 几何变换
查看>>