南开大学23年春《网络爬虫与信息提取》在线作业三

奥鹏南开大学新学期作业参考

23春学期(仅限-高起专1903、专升本1903)《网络爬虫与信息提取》在线作业-00003

如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为集合的名字,Value就是一个()。
A:字典
B:集合的名字
C:集合
D:文档
正确答案问询微信:424329

Python操作CSV文件可通过()容器的方式操作单元格
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

使用UI Automatorr根据坐标来滑动桌面的操作是得到相应控件后使用命令()
A:swipe
B:move
C:scroll
D:fly
正确答案问询微信:424329

windows中创建定时任务的命令为
A:task
B:schtasks
C:createtasks
D:maketasks
正确答案问询微信:424329

以下HTTP状态码与302等价的是
A:301
B:303
C:304
D:307
正确答案问询微信:424329

使用UI Automatorr长按点击的操作是得到相应控件后使用命令()
A:longclick
B:long_click
C:clicklong
D:click_long
正确答案问询微信:424329

python中可以用来将图片中的文字转换为文本的第三方类库是
A:lxml
B:requests
C:beautifulsoup
D:pytesseract
正确答案问询微信:424329

Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

下列说法错误的是()
A:小程序的请求极其简单,基本上没有验证信息
B:用Python来请求小程序的后台接口从而获取数据,比请求异步加载网页的后台接口要复杂很多。
C:如果目标网站有微信小程序,那么一定要优先调查能否通过小程序的接口来抓取数据。
D:小程序的反爬虫能力比网页版的低很多。使用小程序的接口来爬数据,能极大提高爬虫的开发效率。
正确答案问询微信:424329

Python中以下哪个容器里的元素不能重复()
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

可以通过()绕过网站登录。
A:session
B:cookies
C:moonpies
D:localstorage
正确答案问询微信:424329

Python写CSV文件需要哪个方法()
A:CSVWriter
B:CsvWriter
C:DictWriter
D:FileWriter
正确答案问询微信:424329

下面Python代码输出为():
def default_para_without_trap(para=[], value=0):
if not para:
para = []
para.append(value)
return para
print('第一步:{}'.format(default_para_trap(value=100)))

print('第二步:{}'.format(default_para_trap(value=50)))
A:第一步:[100]
第二步:[100,50]
B:第一步:[100]
第二步:[50]
C:第一步:[100]
第二步:[]
D:第一步:[100]
第二步:[100]
正确答案问询微信:424329

Python中若定义object="12345",则print(object[::-1])输出()
A:1
B:5
C:54321
D:程序报错
正确答案问询微信:424329

一般来说在页面传输登录信息都用HTTP()请求类型
A:GET
B:POS奥鹏南开大学新学期作业参考 代做2元一门T
C:PUT
D:SEND
正确答案问询微信:424329

Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题
A:s
B:c
C:d
D:r
正确答案问询微信:424329

使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()
A:exist
B:exists
C:isnull
D:contains
正确答案问询微信:424329

HTTP常用状态码表明服务器正忙的是()
A:500
B:503
C:403
D:404
正确答案问询微信:424329

Python中若定义object=(1, 2, 3, 4, 5),则print(object[:3])输出()
A:345
B:34
C:45
D:123
正确答案问询微信:424329

如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个大字典,大字典里面的每一个键值对都对应了一个集合,Key为(),Value就是一个集合。
A:字典
B:集合的名字
C:集合
D:文档
正确答案问询微信:424329

Python中()容器有推导式
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

如果爬虫爬取的是商业网站,并且目标网站使用了反爬虫机制,那么强行突破反爬虫机制可能构成()
A:非法侵入计算机系统罪
B:非法获取计算机信息系统数据罪
C:非法获取计算机数据罪
D:非法获取系统罪
正确答案问询微信:424329

Python中哪种容器生成后可以修改内容
A:列表
B:元组
C:字典
D:集合
正确答案问询微信:424329

下载器中间件的作用有哪些?
A:更换代理IP
B:更换Cookies
C:更换User-Agent
D:自动重试
正确答案问询微信:424329

Python中有哪些实现多线程方法()
A:multiprocess.dummy
B:threading.Thread
C:process
D:PyMongoDB
正确答案问询微信:424329

Python中一个函数可以有()个return语句
A:0
B:1
C:多个
D:2
正确答案问询微信:424329

下列关于在IOS上配置charles的说法正确的是()
A:不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
B:手机和电脑需要在同一个局域网下。
C:HTTP代理可以使用“自动”选项。
D:安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
正确答案问询微信:424329

在配置ios使用Charles的操作中,正确的有()
A:对于苹果设备,首先要保证计算机和苹果设备联在同一个Wi-Fi上。
B:选择“HTTP代理”下面的“手动”选项卡,在“服务器”处输入计算机的IP地址,在“端口”处输入8888
C:输入完成代理以后按下苹果设备的Home键,设置就会自动保存。
D:安装完成证书以后,在设置中打开“关于本机”,找到最下面的“证书信任设置”,并在里面启动对Charles证书的完全信任
正确答案问询微信:424329

以下HTTP状态码表示服务器没有正常返回结果的是
A:200
B:301
C:404
D:500
正确答案问询微信:424329

下列关于mitmproxy的使用说法正确的是()
A:mitmproxy的端口为8080端口。
B:设置好代理以后,在手机上打开一个App或者打开一个网页,可以看到mitmproxy上面有数据滚动。
C:用鼠标在终端窗口上单击其中的任意一个请求,可以显示这个数据包的详情信息。
D:如果要访问HTTPS网站,还需要安装mitmproxy的证书
正确答案问询微信:424329

Python正则表达式中“.*?”是非贪婪模式,获取最短的能满足条件的字符串。
A:对
B:错
正确答案问询微信:424329

chrome开发者工具没法对数据进行搜索。如果想知道一个特定的异步加载内容来自哪个请求,必须在“Network”选项卡里面一个请求一个请求地进行查看.
A:对
B:错
正确答案问询微信:424329

如果MongoDB运行在所在的计算机上,MONGODB_HOST应该写成"192.168.0.1"
A:对
B:错
正确答案问询微信:424329

虽然MongoDB相比于MySQL来说,速度快了很多,但是频繁读写MongoDB还是会严重拖慢程序的执行速度。
A:对
B:错
正确答案问询微信:424329

网站返回的Headers中经常有Cookies,可以用mitmdump脚本使用print函数把Cookies打印出来。
A:对
B:错
正确答案问询微信:424329

在默认情况下,Scrapyd可以从外网访问
A:对
B:错
正确答案问询微信:424329

下载器中间件里面的报错一般是由于外部原因引起的
A:对
B:错
正确答案问询微信:424329

Python中写CSV文件的writerows方法参数为字典类型
A:对
B:错
正确答案问询微信:424329

设置了这个中间件以后,仍然需要输入账号密码可以成功得到登录以后才能看到的HTML
A:对
B:错
正确答案问询微信:424329

HTTP状态码503表示服务器内部故障。
A:对
B:错
正确答案问询微信:424329

Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
A:对
B:错
正确答案问询微信:424329

requests中get请求方法的使用为requests.get('网址', data=data)
A:对
B:错
正确答案问询微信:424329

requests中post请求方法的使用为requests.post('网址', data=data)
A:对
B:错
正确答案问询微信:424329

Python中相比于findall方法,search方法对于从超级大的文本里面只找第1个数据特别有用,可以大大提高程序的运行效率。
A:对
B:错
正确答案问询微信:424329

需要登录的网站一般通过GET请求就可以实现登录。
A:对
B:错
正确答案问询微信:424329

为了保证数据插入效率,在内存允许的情况下,应该一次性把数据读入内存,尽量减少对MongoDB的读取操作。
A:对
B:错
正确答案问询微信:424329

robots.txt是一种规范,在法律范畴内
A:对
B:错
正确答案问询微信:424329

Python中直接对浮点数进行计算有print(0.1+0.2),则结果为0.3
A:对
B:错
正确答案问询微信:424329

Python可以将列表或字典转换成Json字符串
A:对
B:错
正确答案问询微信:424329

MongoDB URI的格式为:
mongodb://服务器IP或域名:端口@用户名:密码
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网