南开大学22秋学期《网络爬虫与信息提取》在线作业一

奥鹏教育南开大学平时作业

南开大学22秋学期《网络爬虫与信息提取》在线作业一插图

22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00001

Python在Windows路径字符串左引号的左边加()符号来避免反斜杠问题
A:s
B:c
C:d
D:r
正确答案获取微信:424329

使用UI Automator获取屏幕上显示的文本内容的操作是得到相应控件后使用命令()
A:content
B:text
C:title
D:body
正确答案获取微信:424329

Python中Object={1, 2, 3, 4, 5},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329

使用UI Automatorr让屏幕向左滚动的操作是得到相应控件后使用命令()
A:scroll.left
B:scroll.horiz.left
C:scroll.forward
D:scroll.horiz.forward
正确答案获取微信:424329

chrome默认打开开发者工具的快捷是
A:F5
B:F11
C:F12
D:F2
正确答案获取微信:424329

Python中把列表转换为集合需要使用##函数
A:set
B:list
C:convert
D:change
正确答案获取微信:424329

Python中跳过本次循环应用关键字()
A:break
B:continue
C:exit
D:return
正确答案获取微信:424329

PyMongo中逻辑查询表示大于等于的符号是()
A:$gt
B:$lt
C:$gte
D:$lte
正确答案获取微信:424329

PyMongo中逻辑查询表示小于的符号是()
A:$gt
B:$lt
C:$gte$$lte
正确答案获取微信:424329

可以通过()绕过网站登录。
A:session
B:cookies
C:moonpies
D:localstorage
正确答案获取微信:424329

requests中post请求方法的使用为requests.post('网址', data=data)中的data为()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329

在Linux中哪个命令是添加权限的()
A:奥鹏教育南开大学平时作业chmod
B:sudo
C:cp
D:mkdir
正确答案获取微信:424329

在Scrapy的目录下,哪个文件负责存放爬虫文件?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案获取微信:424329

Python中退出循环应用关键字()
A:break
B:continue
C:exit
D:return
正确答案获取微信:424329

Python中专门用来处理图像的第三方库是
A:lxml
B:Pillow
C:beautifulsoup
D:pytesseract
正确答案获取微信:424329

Python中Object={'obj_1':'1','obj_2':'2'},则Objcet.get('boj_1','3')是()
A:1
B:2
C:3
D:无输出
正确答案获取微信:424329

使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()
A:exist
B:exists
C:isnull
D:contains
正确答案获取微信:424329

使用UI Automator使屏幕向上滚动一屏的操作是得到相应控件后使用命令()
A:scroll_forwad
B:scroll_up
C:scroll.forward
D:scroll.vert.forward
正确答案获取微信:424329

如果使用Python的数据结构来做类比的话,MongoDB中文档相当于一个()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329

当需要把Python里面的数据发送给网页时,应先将其转换成()
A:Json字符串
B:GET
C:POST
D:Request
正确答案获取微信:424329

Python中的容器有()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329

Python中()容器有推导式
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329

MongoDB中获取名字为db的库的语句为()
A:client.db
B:client('db')
C:client['db']
D:client{'db'}
正确答案获取微信:424329

以下HTTP状态码表示服务器本身发生错误的是
A:400
B:503
C:302
D:500
正确答案获取微信:424329

cookies的缺点是
A:实现自动登录
B:跟踪用户状态
C:http中明文传输
D:增加http请求的流量
正确答案获取微信:424329

requests中post请求方法的第二个参数可以为()
A:字典
B:列表
C:json数据
D:字符串
正确答案获取微信:424329

以下哪些可以独立成为Python编译器()
A:Pycharm
B:IDLE
C:Eclipse
D:Visual Studio 2010
正确答案获取微信:424329

一个可行的自动更换代理的爬虫系统,应该下列哪些功能?
A:有一个小爬虫ProxySpider去各大代理网站爬取免费代理并验证,将可以使用的代理IP保存到数据库中
B:在发现某个请求已经被设置过代理后,什么也不做,直接返回
C:在ProxyMiddlerware的process_request中,每次从数据库里面随机选择一条代理IP地址使用
D:周期性验证数据库中的无效代理,及时将其删除
正确答案获取微信:424329

HTTP常用状态码表明请求被正常处理的有()
A:200
B:301
C:302
D:204
正确答案获取微信:424329

Python中一个函数可以有()个return语句
A:0
B:1
C:多个
D:2
正确答案获取微信:424329

如果通过爬虫抓取某公司网站的公开数据,分析以后发现这个公司业绩非常好,于是买入该公司股票并赚了一笔钱。这是合法的。
A:对
B:错
正确答案获取微信:424329

一般来说在页面都通过GET将用户登录信息传递到服务器端。
A:对
B:错
正确答案获取微信:424329

MongoDB是一个关系数据库产品
A:对
B:错
正确答案获取微信:424329

PyMongoDB中排序方法sort第二个参数-1表示升序
A:对
B:错
正确答案获取微信:424329

Python正则表达式中“.*”是贪婪模式,获取最长的满足条件的字符串。
A:对
B:错
正确答案获取微信:424329

上课传纸条。A要把纸条传给B,但是A与B距离太远,于是让C来转交纸条。此时,C先篡改纸条的内容再传给B,这是一种类似抓包的方式。
A:对
B:错
正确答案获取微信:424329

Charles是一个收费软件,如果没有注册,安装以后的前30天可以正常使用。30天以后,虽然功能不会缩水,但每过30分钟Charles会自动关闭一次
A:对
B:错
正确答案获取微信:424329

使用AJAX技术,可以在不刷新网页的情况下更新网页数据
A:对
B:错
正确答案获取微信:424329

Redis中使用lrange读取数据后数据也会删除
A:对
B:错
正确答案获取微信:424329

Selenium必须加载对应的webdriver才能模拟浏览器访问
A:对
B:错
正确答案获取微信:424329

Redis插入数据都是插入到列表右侧,因此读取数据也是从右侧读取
A:对
B:错
正确答案获取微信:424329

Redis中查询列表长度命令llen中l代表left,即从左侧开始数
A:对
B:错
正确答案获取微信:424329

Python中函数返回值的个数可以是多个
A:对
B:错
正确答案获取微信:424329

使用Charles直接抓取HTTPS的数据包,就会出现大量的Method为CONNECT的请求,但是这些请求又全部都会失败,是没有安装SSL证书导致的
A:对
B:错
正确答案获取微信:424329

Python中元组生成以后还可以往里面继续添加数据,也可以从里面删除数据;
A:对
B:错
正确答案获取微信:424329

UI Automator Viewer与Python uiautomator可以同时使用
A:对
B:错
正确答案获取微信:424329

为了在安卓手机上安装证书,需要先发送证书到手机里面。在Charles中选择“Help”-“SSL Proxying”-“Save Charles Root Certificate”命令,可以将Charles的证书保存到计算机桌面。
A:对
B:错
正确答案获取微信:424329

运行MongoDB以后,不会在终端打印任何Log
A:对
B:错
正确答案获取微信:424329

在Linux的终端使用apt-get命令安装一系列依赖库时,其中如果存在有已经安装的库,会覆盖掉之前的库重新安装
A:对
B:错
正确答案获取微信:424329

”curl http://爬虫服务器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID“该命令的作用是启动爬虫
A:对
B:错
正确答案获取微信:424329

提供优质的教育资源

公众号: 超前自学网