单选题 2 以下 Disallow 规则表示禁止所有爬虫访问:( )
A、Disallow: /
B、Disallow: *
C、Disallow: all
D、Disallow: none
单选题 2 爬虫的主要应用场景不包括:( )
A、搜索引擎索引
B、舆情监测
C、数据库备份
D、价格比较
单选题 1 Robots 协议的主要作用是:( )
A、提高爬虫效率
B、限制爬虫访问范围
C、加密网页内容
D、加速网页加载
单选题 2 状态码 500 表示:( )
A、未找到资源
B、禁止访问
C、服务器内部错误
D、请求超时
单选题 1 以下哪种爬虫类型适用于定期更新少量数据( )
A、增量式爬虫
B、聚焦爬虫
C、通用爬虫
D、深层爬虫
单选题 2 若要获取 HTML 元素的文本内容,应使用:( )
A、text
B、strin
C、C. .content
D、A 和
E、均可
单选题 1 HTTP 请求的常见方法中,用于提交表单数据的是:( )
A、GET
B、POST
C、PUT
D、DELETE
单选题 1 BeautifulSoup 中,find_all()方法返回的对象类型是:( )
A、单个 Ta
B、对象
C、列表
D、字典
E、字符串