Robots协议-白红宇

强烈建议你试试无所不能的chatGPT，快点击我

Robots协议

阅读量：1887 次

发布时间：2019-04-26

本文共 156 字，大约阅读时间需要 1 分钟。

Robots Exclusion Standard 网络爬虫排除标准

作用：网站告知网络爬虫哪些页面可以抓取，哪些不行

形式：在网站根目录下的robots.txt文件

如：

网络爬虫：自动或人工识别robots.txt,再进行内容爬取

约束性：Robots协议是建议但非约束性，网络爬虫可以不遵守，但存在法律风险

转载地址：http://jawdf.baihongyu.com/

你可能感兴趣的文章

想要成为运维，想要成为后期的架构师？这些知识是必备的！

linux 是如何快速一键安装禅道的呐？

运维面试基础试题（四）

一键安装Openstack单节点必能成功

面试紧张怎么办

关系型数据库，nosql数据库简介

Centos 7搭建NTP时间同步服务器

centos7 基于rsync+inotify 实现定时备份

指定IP进行文件的分发

基于http搭建本地yum仓库

常规邮件基础

邮件基础之 -- SMTP协议

Java设计模式--责任链模式

OpenCV的cvLoadImage函数

OpenCV中与matlab中相对应的函数

C/C++中二维数组作函数形参时，调用函数时，可传递的实参类型的小结

cvGetSubRect与cvMul用法

opencv图像处理梯度边缘和角点

Caffe源码中blob文件分析

OpenCV 图像采样插值几何变换

喝酒易醉，品茶养心，人生如梦，品茶悟道，何以解忧？唯有杜康！-- 愿君每日到此一游！

当前时间: 2024-05-02 22:02:15 当前IP: 18.221.13.173 联系邮箱:javaeecc@qq.com Copyright © 2020 - 2022 baihongyu.com 京ICP备2021015314号-2

强烈建议你试试无所不能的CHAT-GPT，快点击我

强烈建议你试试无所不能的CHAT-GPT，快点击我