南开大学22秋学期《网络爬虫技术》在线作业二
奥鹏教育南开大学平时作业
22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫技术》在线作业-00002
MongoDB中可以将()数据结构插入集合中
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
以下哪个HTML标签表示定义 HTML 表格中的标准单元格()
A:
B:
C:
D:
正确答案获取微信:424329
Python中open函数中模式参数的常用值哪个表示读模式()
A:r
B:w
C:a
D:b
正确答案获取微信:424329
Python中定义函数关键字为()
A:def
B:define
C:func
D:function
正确答案获取微信:424329
Python中以下语句结果为()
a = '***python *is *good***'
print(a.strip('*!'))
A:***python *is *good***
B:*** python *is *good
C:python *is *good***
D:python *is *good
E:pthon is good
正确答案获取微信:424329
Python中Object={1, 2, 3, 4, 5},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
PyMongo中逻辑查询表示小于等于的符号是()
A:$gt
B:$lt
C:$gte
D:$lte
正确答案获取微信:424329
在Scrapy的目录下,哪个文件负责定义需要爬取的数据?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案获取微信:424329
使用Xpath构造相同字符串开头的路径采用()方法
A:starts-with
B:starts
C:begin
D:begin-with
正确答案获取微信:424329
Python写CSV文件需要哪个方法()
A:CSVWriter
B:CsvWriter
C:DictWriter
D:FileWriter
正确答案获取微信:424329
Python中for循环表达式
for item in iterable:
do
里item表示元素,iterable是()
A:表达式
B:结果
C:循环
D:集合
正确答案获取微信:424329
xpath中extract方法返回值类型是()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
Requests显式抛出的异常都继承自()
A:requests.exceptions.RequestException
B:request.exceptions.RequestException
C:request.exception.RequestException
D:requests.exception.RequestException
正确答案获取微信:424329
Chrome的开发者工具中哪个选项可以查找到cookies()
A:Elements
B:Sources
C:Network
D:Peformance
正确答案获取微信:424329
Python中若定义object=[1, 2, 3, 4, 5],则print(object[-4])输出()
A:NULL
B:2
C:4
D:程序报F
正确答案获取微信:424329
Python中若定义object=(1, 2, 3, 4, 5),则print(object[1:3])输出()
A:12
B:123
C:23
D:234
正确答案获取微信:424329
Python中使用Lxml库解析数据etree.HTM()返回的位()T象
A:Element
B:HTML
C:XML
D:JSON
正确答案获取微信:424329
在Scrapy的目录下,哪个文件负责存放爬虫文件?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案获取微信:424329
Python中将字符串a,b相加的方法是()
A:a.add(b)
B:a.plus(b)
C:a.append(b)
D:a+b
正确答案获取微信:424329
下面Python代码输出为():
de奥鹏教育南开大学平时作业f default_para_without_trap(para=[], value=0):
if not para:
para = []
para.append(value)
return para
print('第一步:{}'.format(default_para_trap(value=100)))
print('第二步:{}'.format(default_para_trap(value=50)))
A:第一步:[100]
第二步:[100,50]
B:第一步:[100]
第二步:[50]
C:第一步:[100]
第二步:[]
D:第一步:[100]
第二步:[100]
正确答案获取微信:424329
PyMongo更新操作有()
A:update
B:update_all
C:update_one
D:update_many
正确答案获取微信:424329
Python中split方法如果没有提供任何分隔符,程序会把()作为分隔符
A:逗号
B:空格
C:制表
D:换行
正确答案获取微信:424329
常用的会话跟踪技术是()
A:session
B:cookies
C:moonpies
D:localstorage
正确答案获取微信:424329
BeautifulSoup 库支持()解析器
A:Python标准库
B:lxml HTML解析器
C:lxml XML解析器
D:html5lib
正确答案获取微信:424329
Python中正则表达式预定义字符集包括()
A:d
B:D
C:s
D:S
正确答案获取微信:424329
Python中正则表达式数量词包括()
A:*
B:d
C:+
D:?
正确答案获取微信:424329
Python中一个函数可以有()个return语句
A:0
B:1
C:多个
D:2
正确答案获取微信:424329
以下哪种方法是MongoDB的查找方法()
A:find
B:find_one
C:finds
D:find_all
正确答案获取微信:424329
使用BeautifulSoupT象后可以使用()来查找内容
A:find_all
B:find
C:search
D:search_all
正确答案获取微信:424329
Selenium的Webdriver支持的浏览器有()
A:phantomjs
B:safari
C:chrome
D:ie
正确答案获取微信:424329
Python中写CSV文件的writerow方法参数为包含字典的列表类型
A:对
B:错
正确答案获取微信:424329
Python中将字符串a,b相加的方法是a+b
A:对
B:错
正确答案获取微信:424329
通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配
A:对
B:错
正确答案获取微信:424329
Python中正则表达式预定义字符d表示匹配一个数字字符,等价于 [0-9]
A:对
B:错
正确答案获取微信:424329
在有spiders何setting.py这两项的情况下,可以写出爬虫并且保存数据,items.py和pipelines.py文件是原作者的失误而导致的冗余文件。
A:对
B:错
正确答案获取微信:424329
Xpath中路径表达式base/user表示选取属于base的子元素中所有user元素
A:对
B:错
正确答案获取微信:424329
在使用多线程处理问题时,线程池设置越大越好
A:对
B:错
正确答案获取微信:424329
MySQL是一个关系型数据库管理系统
A:对
B:错
正确答案获取微信:424329
Python可以将列表或字典转换成Json字符串
A:对
B:错
正确答案获取微信:424329
cookies在http请求中是明文传输的。
A:对
B:错
正确答案获取微信:424329
HTTP请求中GET方法就是填写表单或提交信息时所做的事情,如登录一个网址,使用的便是GET 方法。
A:对
B:错
正确答案获取微信:424329
通用网络爬虫通常采用串行工作方式
A:对
B:错
正确答案获取微信:424329
通过在后台与服务器进行少量数据交换,AJAX可以使网页实现异步更新。
A:对
B:错
正确答案获取微信:424329
需要登录的网站一般通过GET请求就可以实现登录。
A:对
B:错
正确答案获取微信:424329
Python中re模块的修饰符re.I表示使匹配T大小写不敏感
A:对
B:错
正确答案获取微信:424329
MongoDB支持T查询到的结果进行排序。排序的方法为sort()。它的格式为:
handler.find().sort('列名', 1或-1或0)
A:对
B:错
正确答案获取微信:424329
NoSQL数据库的产生就是为了解决大规模数据集合多重数据种类带来的挑战,尤其是大数据应用难题。
A:对
B:错
正确答案获取微信:424329
Python中正则表达式预定义字符W表示匹配包括下划线的任何单词字符,等价于'[A-Za-z0-9_]'
A:对
B:错
正确答案获取微信:424329
PyMongoDB中排序方法sort第二个参数1表示降序
A:对
B:错
正确答案获取微信:424329
在请求头中设置User-Agent即可正常请求网站
A:对
B:错
正确答案获取微信:424329