单选题 Robots 协议通常放在网站的(  ) 目录下。 [单选题]

A、 根目录(正确答案)
B、 robots 目录
C、 pop 目录
D、 pinpai 目录
下载APP答题
由4l***qt提供 分享 举报 纠错

相关试题

单选题 用于发送 HTTP 请求的模块是(  ) 。 [单选题]

A、 urllib.request(正确答案)
B、 urllib.error
C、 urllib.parse
D、 urllib.robotparser

单选题 利用 urllib.request 模块中最基本的(  )方法,可以完成对简单网页的请求和抓取。 [单选题]

A、 urlparse
B、 urlencode
C、 urlopen(正确答案)
D、 urlunparse

单选题 使用 urllib 中 Request 类构建请求,添加请求头最常见的方法是通过修改(  )来伪装浏览器。 [单选题]

A、 Uesr-Agent(正确答案)
B、 add_header
C、 origin_req_host
D、 method

单选题 使用 urllib.request 模块中的 urlopen 方法添加 data 参数时,需要使用(  )方法将参数转化为 字节流编码格式的内容。 [单选题]

A、 quote
B、 fetchone
C、 update
D、 bytes(正确答案)

单选题 urllib.request.quote()函数的作用是(  ) 。 [单选题]

A、 对 URL 进行编码(正确答案)
B、 对 URL 进行解码
C、 对 URL 进行验证
D、 对 URL 进行分析

单选题 爬虫的工作首先是获取网页,获取网页的(  ) 。 [单选题]

A、 源代码
B、 文本
C、 图片
D、 节点

单选题 urllib 库中能用于构建一个 HTTP 请求的函数是(  ) 。 [单选题]

A、 request()(正确答案)
B、 get()
C、 urlsplit()
D、 post()

单选题 网络爬虫在向服务器发起请求之后,有一段时间必须等待服务器返回响应,这种任务属于 IO 密集型任务,就可以使用(  )来提高程序整体的执行效率。 [单选题]

A、 多进程
B、 多线程(正确答案)
C、 单线程
D、 单进程