南开大学23年春《网络爬虫与信息提取》在线作业二

奥鹏南开大学新学期作业参考

23春学期(仅限-高起专1903、专升本1903)《网络爬虫与信息提取》在线作业-00002

Redis中读取数据语句lrange chapter 0 3,那么表示读列表中()个值
A:2
B:3
C:4
D:5
正确答案问询微信:424329

通常使用()工具来模拟浏览器进行爬虫请求
A:Selenium
B:Chrome
C:ChromeDriver
D:WebDriver
正确答案问询微信:424329

使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
A:scroll_forwad
B:scroll_up
C:scroll.forward
D:scroll.vert.forward
正确答案问询微信:424329

以下关于Charles的说法正确的是( )
A:Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包
B:Charles有Wind奥鹏南开大学新学期作业参考 代做2元一门ows 32/64版和Linux 64 版,但是目前还没有对Mac OS进行有效的支持。
C:Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。
D:在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。
正确答案问询微信:424329

启动MongoDB使用命令mongod –() usr/local/etc/mongod.conf
A:config
B:install
C:start
D:begin
正确答案问询微信:424329

当需要把Python里面的数据发送给网页时,应先将其转换成()
A:Json字符串
B:GET
C:POST
D:Request
正确答案问询微信:424329

Python中Object=(1, 2, 3, 4, 5),则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

chrome默认打开开发者工具的快捷是
A:F5
B:F11
C:F12
D:F2
正确答案问询微信:424329

一般来说在页面传输登录信息都用HTTP()请求类型
A:GET
B:POST
C:PUT
D:SEND
正确答案问询微信:424329

Python中若定义object=[1, 2, 3, 4, 5],则print(object[-4])输出()
A:NULL
B:2
C:4
D:程序报错
正确答案问询微信:424329

下面Python代码输出为():
def default_para_trap(para=[], value=0):
para.append(value)
return para

print('第一步:{}'.format(default_para_trap(value=100)))

print('第二步:{}'.format(default_para_trap(value=50)))
A:第一步:[100]
第二步:[100,50]
B:第一步:[100]
第二步:[50]
C:第一步:[100]
第二步:[]
D:第一步:[100]
第二步:[100]
正确答案问询微信:424329

Python读CSV文件需要哪个方法()
A:CSVReader
B:CsvReader
C:DictReader
D:FileReader
正确答案问询微信:424329

MongoDB中数据存储的形式类似于()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

Python并导入uiautomator来操作设备的语句是from uiautomator import ()
A:Device
B:Devices
C:Jobs
D:Job
正确答案问询微信:424329

PyMongo中查询所有age > 29的记录是()
A:collection.find({'age': {'$gt': 29}})
B:collection.find({'age'>29})
C:collection.find_all({'age': {'$gt': 29}})
D:collection.find_all({'age'>29})
正确答案问询微信:424329

PyMongo中逻辑查询表示不等于的符号是()
A:$gt
B:$lt
C:$eq
D:$ne
正确答案问询微信:424329

Redis中写数据到列表中,使用关键字()
A:push
B:append
C:lpush
D:lappend
正确答案问询微信:424329

当爬虫创建好了之后,可以使用"scrapy()" 命令运行爬虫。
A:startup
B:starwar
C:drawl
D:crawl
正确答案问询微信:424329

下列哪项不是HTTP的请求类型()
A:GET
B:POST
C:PUT
D:SET
正确答案问询微信:424329

Python中若定义object="12345",则print(object[::-1])输出()
A:1
B:5
C:54321
D:程序报错
正确答案问询微信:424329

常用的会话跟踪技术是
A:session
B:cookies
C:moonpies
D:localstorage
正确答案问询微信:424329

Python中一个函数没有返回值则可以写()
A:没有return
B:return
C:return None
D:return NULL
正确答案问询微信:424329

HTTP常用状态码表明表明服务器本身发生错误的有()
A:403
B:404
C:500
D:503
正确答案问询微信:424329

一个可行的自动更换代理的爬虫系统,应该下列哪些功能?
A:有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中
B:在发现某个请求已经被设置过代理后,什么也不做,直接返回
C:在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用
D:周期性验证数据库中的无效代理,及时将其删除
正确答案问询微信:424329

要使用tesseract来进行图像识别,需要安装两个第三方库
A:requests
B:beautifulsoup
C:Pillow
D:pytesseract
正确答案问询微信:424329

使用Selennium获取网页中元素的方法有
A:find_element_by_name
B:find_element_by_id
C:find_elements_by_name
D:find_elements_by_id
正确答案问询微信:424329

Python中一个函数可以有()个return语句
A:0
B:1
C:多个
D:2
正确答案问询微信:424329

以下哪些方法属于Python写CSV文件的方法()
A:writeheaders
B:writeheader
C:writerrows
D:writerow
正确答案问询微信:424329

Redis中的值可以支持()
A:列表
B:哈希
C:集合
D:有序集合
正确答案问询微信:424329

使用BeautifulSoup对象后可以使用()来查找内容
A:find_all
B:find
C:search
D:search_all
正确答案问询微信:424329

mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本
A:对
B:错
正确答案问询微信:424329

对Charles设置代理时,Ip可以设置为127.0.0.1,端口为8888.
A:对
B:错
正确答案问询微信:424329

下载器中间件里面的报错一般是由于外部原因引起的
A:对
B:错
正确答案问询微信:424329

使用Scrapyd,可以实现一键部署Scrapy爬虫,访问一个网址就启动/停止爬虫
A:对
B:错
正确答案问询微信:424329

使用Charles直接抓取HTTPS的数据包,就会出现大量的Method为CONNECT的请求,但是这些请求又全部都会失败,是没有安装SSL证书导致的
A:对
B:错
正确答案问询微信:424329

当Charles抓包以后,在Mac OS系统下可以按Command+F组合键,在Windows系统下按Ctrl+F组合键打开Charles进行搜索
A:对
B:错
正确答案问询微信:424329

”curl http://爬虫服务器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID“该命令的作用是启动爬虫
A:对
B:错
正确答案问询微信:424329

在中间人攻击中,攻击者可以拦截通信双方的通话,并插入新的内容或者修改原有内容
A:对
B:错
正确答案问询微信:424329

在对XPath返回的对象再次执行XPath的时候,子XPath开头需要添加斜线
A:对
B:错
正确答案问询微信:424329

Redis中列表读取数据命令lrange中l代表left,即从左侧开始读取
A:对
B:错
正确答案问询微信:424329

在请求头中设置User-Agent即可正常请求网站
A:对
B:错
正确答案问询微信:424329

安装mitmdump之前,运行sudo apt-get install python3-dev python3-pip libffi-dev libssl-dev是为了安装必要的运行环境。
A:对
B:错
正确答案问询微信:424329

HTTP状态码302表示资源永久重定向。
A:对
B:错
正确答案问询微信:424329

操作文本难以实现自动化,而操作图形界面可以容易的实现自动化。
A:对
B:错
正确答案问询微信:424329

Cookies一般包含在请求头Headers中
A:对
B:错
正确答案问询微信:424329

使用UI Automatorr操作实体键的命令为device.press.实体按键名称()
A:对
B:错
正确答案问询微信:424329

PyMongo模块是Python对MongoDB操作的接口包,能够实现对MongoDB的增删改查及排序等操作。
A:对
B:错
正确答案问询微信:424329

如果元组里面只有整数、浮点数、字符串、一个列表,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。
A:对
B:错
正确答案问询微信:424329

Scrapy的工程名字不能使用"scrapy",否则爬虫会无法运行。除此以外工程名不受限制。
A:对
B:错
正确答案问询微信:424329

scrapy与selenium结合可以实现直接处理需要异步加载的页面
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网