南开大学23年秋学期《网络爬虫与信息提取》在线作业三
奥鹏南开大学23年秋季新学期作业参考
23秋学期(仅限-高起专1909、专升本1909)《网络爬虫与信息提取》在线作业-00003
打开终端,输入(),屏幕上会出现Python的路径
A:python path
B:path python
C:which python
D:python which
正确答案问询微信:424329
Python中退出循环应用关键字()
A:break
B:continue
C:exit
D:return
正确答案问询微信:424329
在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案问询微信:424329
Python正则表达式模块的findall方法返回结果为()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题
A:s
B:c
C:d
D:r
正确答案问询微信:424329
查看网站请求一般在Chrome开发者模式下的()选项卡中查看
A:Console
B:Sources
C:Network
D:Performance
正确答案问询微信:424329
使用UI Automator获滚动屏幕的操作是得到相应控件后使用命令()
A:scroll
B:scroll_up
C:scroll_forword
D:scroll_back
正确答案问询微信:424329
lxml库中etree模块的()方法把Selector对象转换为bytes型的源代码数据
A:etree.tostring
B:etree.convertBytes
C:etree.toBytes
D:etree.convertstring
正确答案问询微信:424329
启动MongoDB使用命令mongod –() usr/local/etc/mongod.conf
A:config
B:install
C:start
D:begin
正确答案问询微信:424329
Scrapy自带的待爬队列是()
A:deque
B:queue
C:list
D:lqueue
正确答案问询微信:424329
Redis中读取数据语句lrange chapter 0 3,那么表示读列表中()个值
A:2
B:3
C:4
D:5
正确答案问询微信:424329
以下哪个命令是linux下解压缩命令()
A:curl
B:tar -zxvf
C:mkdir
D:cp
正确答案问询微信:424329
Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是()
A:1
B:2
C:3
D:无输出
正确答案问询微信:424329
Python并导入uiautomator来操作设备的语句是from uiautomator import ()
A:Device
B:Devices
C:Jobs
D:Job
正确答案问询微信:424329
下面Python代码输出为():
def default_para_without_trap(para=[], value=0):
if not para:
para = []
para.append(value)
return para
print('第一步:{}'.format(default_para_trap(value=100)))
print('第二步:{}'.format(default_para_trap(value=50)))
A:第一步:[100]
第二步:[100,50]
B:第一步:[100]
第二步:[50]
C:第一步:[100]
第二步:[]
D:奥鹏南开大学23年秋季新学期作业参考第一步:[100]
第二步:[100]
正确答案问询微信:424329
Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
采用以下()技术可以实现异步加载
A:HTML
B:AJAX
C:CSS
D:HTTP
正确答案问询微信:424329
下列关于mitmproxy的安装说法错误的是()
A:对于Mac OS系统,使用Homebrew安装mitmproxy,命令为:brew install mitmproxy
B:在Ubuntu中,要安装mitmproxy,首先需要保证系统的Python为Python 3.5或者更高版本
C:在windows系统中无法使用linux的命令,只能通过下载安装包来安装
D:UBUNTU中执行命令 sudo pip3 install mitmproxy 进行安装
正确答案问询微信:424329
Python中列表可以用()方法在末尾添加元素
A:add
B:append
C:plus
D:+
正确答案问询微信:424329
PyMongo中逻辑查询表示小于等于的符号是()
A:$gt
B:$lt
C:$gte$$lte
正确答案问询微信:424329
Python中通过Key来从字典object中读取对应的Value的方法有()
A:object[key]
B:object.get(key)
C:object.pop(key)
D:object.pop()
正确答案问询微信:424329
如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
A:非法侵入计算机系统罪
B:非法获取计算机信息系统数据罪
C:非法获取计算机数据罪
D:非法获取系统罪
正确答案问询微信:424329
MongoDB中获取名字为db的库的语句为()
A:client.db
B:client('db')
C:client['db']
D:client{'db'}
正确答案问询微信:424329
如果目标网站有反爬虫声明,那么对方在被爬虫爬取以后,可以根据()来起诉使用爬虫的公司
A:服务器日志
B:数据库日志记录
C:程序日志记录
D:服务器监控
正确答案问询微信:424329
网络爬虫的用途有()
A:收集数据
B:尽职调查
C:提高流量
D:攻击服务器
正确答案问询微信:424329
cookies的缺点是
A:实现自动登录
B:跟踪用户状态
C:http中明文传输
D:增加http请求的流量
正确答案问询微信:424329
以下HTTP状态码表示服务器没有正常返回结果的是
A:200
B:301
C:404
D:500
正确答案问询微信:424329
Python中()与元组由类似的数据读取方式
A:字符串
B:列表
C:字典
D:集合
正确答案问询微信:424329
Python中一个函数可以有()个return语句
A:0
B:1
C:多个
D:2
正确答案问询微信:424329
Python中()容器有推导式
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329
在默认情况下,Scrapyd可以从外网访问
A:对
B:错
正确答案问询微信:424329
网站返回的Headers中经常有Cookies,可以用mitmdump脚本使用print函数把Cookies打印出来。
A:对
B:错
正确答案问询微信:424329
需要登录的网站一般通过GET请求就可以实现登录。
A:对
B:错
正确答案问询微信:424329
打码平台都是靠机器使用OCR技术识别图片上的文字。
A:对
B:错
正确答案问询微信:424329
如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是首先把数据或者分析结果出售给某基金公司,然后自己再买被爬公司的股票。此时,涉嫌内幕交易,属于严重违法行为。
A:对
B:错
正确答案问询微信:424329
如果元组里面只有整数、浮点数、字符串、一个列表,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。
A:对
B:错
正确答案问询微信:424329
数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击
A:对
B:错
正确答案问询微信:424329
Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库
A:对
B:错
正确答案问询微信:424329
HTTP状态码503表示服务器内部故障。
A:对
B:错
正确答案问询微信:424329
HTTP状态码403表示资源禁止访问。
A:对
B:错
正确答案问询微信:424329
Redis中写数据命令lpush中l代表list
A:对
B:错
正确答案问询微信:424329
微信小程序的反爬虫能力要比网页的高很多。
A:对
B:错
正确答案问询微信:424329
在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis
A:对
B:错
正确答案问询微信:424329
设置了这个中间件以后,仍然需要输入账号密码可以成功得到登录以后才能看到的HTML
A:对
B:错
正确答案问询微信:424329
通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配
A:对
B:错
正确答案问询微信:424329
Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。
A:对
B:错
正确答案问询微信:424329
Python中字符串切片以后的结果还是字符串
A:对
B:错
正确答案问询微信:424329
操作文本难以实现自动化,而操作图形界面可以容易的实现自动化。
A:对
B:错
正确答案问询微信:424329
上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
A:对
B:错
正确答案问询微信:424329
为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面。
A:对
B:错
正确答案问询微信:424329