南开大学23年秋学期《网络爬虫与信息提取》在线作业一

奥鹏南开大学23年秋季新学期作业参考

23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业-00001

Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题
A:s
B:c
C:d
D:r
正确答案问询微信:424329

下面代码一共执行循环多少次():
for i in range(10):
print(i ** i)
A:9
B:10
C:11#0
正确答案问询微信:424329

Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

请问按哪个键可以打开Chrome自带的开发者工具()
A:F10
B:F1
C:F11
D:F12
正确答案问询微信:424329

以下哪个命令是linux下解压缩命令()
A:curl
B:tar -zxvf
C:mkdir
D:cp
正确答案问询微信:424329

Python中若定义object="12345",则print(object[::-1])输出()
A:1
B:5
C:54321
D:程序报错
正确答案问询微信:424329

Python中若定义object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A:12
B:123
C:23
D:234
正确答案问询微信:424329

在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案问询微信:424329

下面代码一共执行循环多少次():
i=0
while i<10:
i+=1
A:9
B:10
C:11#0
正确答案问询微信:424329

Redis中往集合中读数据,使用关键字()
A:pop
B:spop
C:lpop
D:range
正确答案问询微信:424329

通过()爬取伪装成异步加载的后端渲染数据
A:正则表达式
B:Json字符串
C:JavaScript
D:Get
正确答案问询微信:424329

以下哪个命令是创建文件夹命令()
A:curl
B:tar -zxvf
C:mkdir
D:cp
正确答案问询微信:424329

通常使用()工具来模拟浏览器进行爬虫请求
A:Selenium
B:Chrome
C:ChromeDriver
D:WebDriver
正确答案问询微信:424329

打开终端,输入(),屏幕上会出现Python的路径
A:python path
B:path python
C:which python
D:python which
正确答案问询微信:424329

一般来说在页面传输登录信息都用HTTP()请求类型
A:GET
B:POST
C:PUT
D:SEND
正确答案问询微信:424329

如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

在Mac OS下安装MongoDB使用命令() install mongodb
A:brew
B:apt-get
C:sudo
D:apt
正确答案问询微信:424329

要想让Scrapy结合Redis,应该对Scrapy爬虫请求的调度算法进行修改,以下哪种修改不能完成这一任务?()
A:队列
B:栈
C:上锁
D:优先级队列
正确答案问询微信:424329

Python写CSV文件需要哪个方法()
A:CSVWriter
B:CsvWriter
C:DictWriter
D:FileWriter
正确答案问询微信:424329

requests获取get或者post请求后需要通过()属性获取文本内容
A:content
B:text
C:string
D:body
正确答案问询微信:424329

Python中一个函数可以有()个return语句
A:0
B:1
C:多个
D:2
正确答案问询微信:424329

BS4可以用来从()中提取数据
A:HTML
B:XML
C:数据库
D:JSON
正确答案问询微信:424329

HTTP常用状态码表明请求被正常处理的有()
A:200
B:301
C:302
D:204
正确答案问询微信:424329

HTTP常用状态码表明表明客户端是发生错误的原因所在的有()
A:403
B:404
C:500
D:503
正确答案问询微信:424329

如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
A:非法侵入计算机系统罪
B:非法获取计算机信息系统数据罪
C:非法获取计算机数据罪
D:非法获取系统罪
正确答案问询微信:424329

以下哪些可以独立成为Python编译器()
A:Pycharm
B:IDLE
C:Eclipse
D:Visual Studio 2010
正确答案问询微信:424329

下列说法错误的是()
A:mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用奥鹏南开大学23年秋季新学期作业参考来运行符合一定规则的Python脚本,并在Python脚本里面直接操作HTTP和HTTPS的请求,以及返回的数据包。
B:命令行中执行mitmdump -s parse_request.py即可运行python 脚本
C:使用python可以自定义返回的数据包,如 response.headers,就是返回的头部信息
D:如果返回的是JSON类型的字符串,python无法进行解析。
正确答案问询微信:424329

要使用tesseract来进行图像识别,需要安装两个第三方库
A:requests
B:beautifulsoup
C:Pillow
D:pytesseract
正确答案问询微信:424329

下列关于在IOS上配置charles的说法正确的是()
A:不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B:手机和电脑需要在同一个局域网下。
C:HTTP代理可以使用“自动”选项。
D:安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
正确答案问询微信:424329

Python中()与元组由类似的数据读取方式
A:字符串
B:列表
C:字典
D:集合
正确答案问询微信:424329

Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取
A:对
B:错
正确答案问询微信:424329

Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3
A:对
B:错
正确答案问询微信:424329

使用Charles,可以轻松截获手机App和微信小程序的数据包,从而开发出直接抓取App后台和小程序后台的爬虫。
A:对
B:错
正确答案问询微信:424329

使用UI Automatorr让屏幕向右滚动的操作是得到相应控件后使用命令scroll.horiz.forward()
A:对
B:错
正确答案问询微信:424329

Charles能截获HTTP和HTTPS的数据包,如果网站使用websocket就可以截获。
A:对
B:错
正确答案问询微信:424329

中间人爬虫就是利用了中间人攻击的原理来实现数据抓取的一种爬虫技术
A:对
B:错
正确答案问询微信:424329

process_spider_input(response, spider)是在爬虫运行yield item或者yield scrapy.Request()的时候调用
A:对
B:错
正确答案问询微信:424329

如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好。于是将数据或者分析结果出售给某基金公司,从而获得销售收入。这是合法的。
A:对
B:错
正确答案问询微信:424329

在MacOS下若要运行Redis可以运行解压以后的文件夹下面的src文件夹中的redis-server文件启动redis服务
src/redis-server
A:对
B:错
正确答案问询微信:424329

Redis中使用lrange读取数据后数据也会删除
A:对
B:错
正确答案问询微信:424329

Python中字符串切片以后的结果还是字符串
A:对
B:错
正确答案问询微信:424329

chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
A:对
B:错
正确答案问询微信:424329

微信小程序的反爬虫能力要比网页的高很多。
A:对
B:错
正确答案问询微信:424329

device.sleep()方法是使用UI Automatorr关闭屏幕的命令
A:对
B:错
正确答案问询微信:424329

虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
A:对
B:错
正确答案问询微信:424329

在有spiders何setting.py这两项的情况下,可以写出爬虫并且保存数据,items.py和pipelines.py文件是原作者的失误而导致的冗余文件。
A:对
B:错
正确答案问询微信:424329

通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
A:对
B:错
正确答案问询微信:424329

Scrapy作为一个爬虫的框架,它在单机环境下运行时就可以获得最大性能优势
A:对
B:错
正确答案问询微信:424329

Redis的列表是一个单向队列
A:对
B:错
正确答案问询微信:424329

Python中写CSV文件的writerow方法参数为包含字典的列表类型
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网