南开大学23年春《网络爬虫与信息提取》在线作业一

奥鹏南开大学新学期作业参考

23春学期(仅限-高起专1903、专升本1903)《网络爬虫与信息提取》在线作业-00001

用Xpathh获取第二个div标签应该是()
A:dvi(1)
B:div(2)
C:div[1]
D:div[2]
正确答案问询微信:424329

Python中以下哪个容器里的元素不能重复()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

使用UI Automatorr让屏幕向左滚动的操作是得到相应控件后使用命令()
A:scroll.left
B:scroll.horiz.left
C:scroll.forward
D:scroll.horiz.forward
正确答案问询微信:424329

Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_3','3')是()
A:1
B:2
C:3
D:无输出
正确答案问询微信:424329

浏览器用来记录用户状态信息的数据叫
A:session
B:cookies
C:moonpies
D:selenium
正确答案问询微信:424329

PyMongo中查询所有age > 29的记录是()
A:collection.find({'age': {'$gt': 29}})
B:collection.find({'age'>29})
C:collection.find_all({'age': {'$gt': 29}})
D:collection.find_all({'age'>29})
正确答案问询微信:424329

使用Xpath获取文本使用()
A:text
B:text()
C:content
D:content()
正确答案问询微信:424329

requests中post请求方法的使用为requests.post('网址', data=data)中的data为()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

一般来说在页面传输登录信息都用HTTP()请求类型
A:GET
B:POST
C:PUT
D:SEND
正确答案问询微信:424329

Redis中奥鹏南开大学新学期作业参考 代做2元一门查看一个列表长度,使用关键字()
A:len
B:length
C:llen
D:count
正确答案问询微信:424329

PyMongo中逻辑查询表示大于等于的符号是()
A:$gt
B:$lt
C:$gte
D:$lte
正确答案问询微信:424329

HTTP常用状态码表明服务器不允许访问那个资源的是()
A:500
B:503
C:403
D:405
正确答案问询微信:424329

以下表示请求正常处理的HTTP状态码为
A:200
B:301
C:404
D:500
正确答案问询微信:424329

Python中若定义object=[1, 2, 3, 4, 5],则print(object[:3])输出()
A:12
B:123
C:23
D:234
正确答案问询微信:424329

Redis若要进入交互环境,需要打开终端输入()
A:redis-cli
B:redis
C:redis-cmd
D:redis-start
正确答案问询微信:424329

以下表示请求资源重定向的HTTP状态码为
A:200
B:301
C:404
D:500
正确答案问询微信:424329

要想让Scrapy结合Redis,应该对Scrapy爬虫请求的调度算法进行修改,以下哪种修改不能完成这一任务?()
A:队列
B:栈
C:上锁
D:优先级队列
正确答案问询微信:424329

使用了RedisSpider作为爬虫的父类以后,爬虫会直接监控()中的数据,并不读取start_urls中的数据。
A:Redis
B:RedisSpider
C:Spider
D:MongoDB
正确答案问询微信:424329

Python中Object={1, 2, 3, 4, 5},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

HTTP常用状态码表明表明浏览器需要执行某些特殊的处理以正确处理请求的有()
A:200
B:301
C:302
D:204
正确答案问询微信:424329

BS4可以用来从()中提取数据
A:HTML
B:XML
C:数据库
D:JSON
正确答案问询微信:424329

自动填充验证码的方式有
A:手动识别填写
B:图像识别
C:打码网站
D:浏览器自动识别
正确答案问询微信:424329

要使用tesseract来进行图像识别,需要安装两个第三方库
A:requests
B:beautifulsoup
C:Pillow
D:pytesseract
正确答案问询微信:424329

以下哪些方法属于Python写CSV文件的方法()
A:writeheaders
B:writeheader
C:writerrows
D:writerow
正确答案问询微信:424329

Redis中的值可以支持()
A:列表
B:哈希
C:集合
D:有序集合
正确答案问询微信:424329

以下哪些可以独立成为Python编译器()
A:Pycharm
B:IDLE
C:Eclipse
D:Visual Studio 2010
正确答案问询微信:424329

Python中的容器有()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

下列说法错误的是()
A:mitmproxy的强大之处在于它还自带一个mitmdump命令。这个命令可以用来运行符合一定规则的Python脚本,并在Python脚本里面直接操作HTTP和HTTPS的请求,以及返回的数据包。
B:命令行中执行mitmdump -s parse_request.py即可运行python 脚本
C:使用python可以自定义返回的数据包,如 response.headers,就是返回的头部信息
D:如果返回的是JSON类型的字符串,python无法进行解析。
正确答案问询微信:424329

Python中哪种容器生成后可以修改内容
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

HTTP状态码503表示服务器内部故障。
A:对
B:错
正确答案问询微信:424329

使用异步加载技术的网站,被加载的内容可以在源代码中找到
A:对
B:错
正确答案问询微信:424329

Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
A:对
B:错
正确答案问询微信:424329

要实现Charles对Android抓包,其过程比iOS稍微复杂一点。这是因为不同的Andorid设备,安装证书的入口可能不一样
A:对
B:错
正确答案问询微信:424329

robots.txt是一种规范,在法律范畴内
A:对
B:错
正确答案问询微信:424329

chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
A:对
B:错
正确答案问询微信:424329

HTTP只能通过POST请求才能发送数据
A:对
B:错
正确答案问询微信:424329

device.sleep()方法是使用UI Automatorr关闭屏幕的命令
A:对
B:错
正确答案问询微信:424329

MongoDB URI的格式为:
mongodb://服务器IP或域名:端口@用户名:密码
A:对
B:错
正确答案问询微信:424329

所有的异步加载都会向后台发送请求
A:对
B:错
正确答案问询微信:424329

Scrapy每一次发起请求之前都会在这里检查网址是否重复。因此如果确实需要再一次爬取数据,在Redis中把这个Key删除即可。
A:对
B:错
正确答案问询微信:424329

通用搜索引擎大多提供基于关键字的检索,难以支持根据语义信息提出的查询。
A:对
B:错
正确答案问询微信:424329

在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。
A:对
B:错
正确答案问询微信:424329

爬虫文件无法从Pycharm运行和调试,只能通过命令行的方式运行。
A:对
B:错
正确答案问询微信:424329

Redis是遵守BSD协议、支持网络、可基于内存亦可持久化的日志型、Key-Value数据库
A:对
B:错
正确答案问询微信:424329

Python中条件语句在使用or连接的多个表达式中,只要有一个表达式为真,那么后面的表达式就不会执行。
A:对
B:错
正确答案问询微信:424329

Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。
A:对
B:错
正确答案问询微信:424329

插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1
A:对
B:错
正确答案问询微信:424329

PyMongo模块是Python对MongoDB操作的接口包,能够实现对MongoDB的增删改查及排序等操作。
A:对
B:错
正确答案问询微信:424329

通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网