admin 管理员组

文章数量: 1086019


2024年3月10日发(作者:web培训推荐)

数据采集与处理选择题题库

1.下列不属于常见爬虫类型的是(C)

A. 通用网络爬虫

B. 增量式网络爬虫

C. 浅层网络爬虫

D. 聚焦网络爬虫

2.下列不属于聚焦网络爬虫的常用策略的是(A)

A. 基于深度优先的爬取策略

B. 基于内容评价的爬取策略

C. 基于链接结构评价的爬取策略

D. 基于语境图的爬取策略

3.下列不属于常用反爬虫手段的是(D )

A. 访问频度

B. 验证码校验

C. 账号权限

D. 人工筛选

4.下列属于反爬虫目的的是(B)

A. 限制访问人数

B. 防止网站信息被竞争对手随意获取

C. 限制用户访问权限

D. 变换网页结构

5.下列关于Python爬虫库的功能,描述不正确的是(D)

A. 通用爬虫库-urllib 3

B. 通用爬虫库-Requests

C. 爬虫框架-Scrapy

D. HTML/XML解析器pycurl


本文标签: 爬虫 策略 爬取