南开大学22秋学期《网络爬虫技术》在线作业三
奥鹏教育南开大学平时作业
22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫技术》在线作业-00003
下面代码一共执行循环多少次():
for i in range(10):
print(i ** i)
A:9
B:10
C:11
D:0
正确答案获取微信:424329
启动MongoDB使用命令mongod –() usr/local/etc/mongod.conf
A:config
B:install
C:start
D:begin
正确答案获取微信:424329
Python中Object={'obj_1':'1','obj_2':'2'},则Objcet是()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
在Scrapy的目录下,哪个文件负责数据抓取以后的处理工作?()
A:spiders文件夹
B:item.py
C:pipeline.py
D:settings.py
正确答案获取微信:424329
Python运行以下代码结果为一次输出():
for i in range(3,6):
print(i)
A:3到7
B:3到6
C:3到5
D:4到5
正确答案获取微信:424329
使用xpath方法的返回类型是()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
Xpath中()个路径表达式表示选取元素user的所有子节点
A:user
B:/user
C:///user
D://user
正确答案获取微信:424329
请补充pyhon判断语句
if condition:
do
()
do
else:
do
A:elseif condition
B:elseif condition:
C:elif condition:
D:elif condition
正确答案获取微信:424329
进入了Python交互式环境后输入()并按回车可以退出交互界面
A:exit()
B:quit()
C:q!
D:esc
正确答案获取微信:424329
使用Selenium获取多个元素的方法find_elements_by_id返回的数据结构为()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
Pyhon中()方法是字符串格式化符
A:aplit
B:replace
C:strip
D:format
正确答案获取微信:424329
Python中的()库用于发送网络请求
A:web
B:reque奥鹏教育南开大学平时作业st
C:requests
D:javascript
正确答案获取微信:424329
Python读CSV文件需要哪个方法()
A:CSVReader
B:CsvReader
C:DictReader
D:FileReader
正确答案获取微信:424329
Python中列表可以用()方法在末尾添加元素
A:add
B:append
C:plus
D:+
正确答案获取微信:424329
MongoDB中可以将()数据结构插入集合中
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
以下哪个命令是创建文件夹命令()
A:curl
B:tar -zxvf
C:mkdir
D:cp
正确答案获取微信:424329
以下哪个是定义一个输入直角边就能返回出直角三角形的面积函数()
A:def function(a,b):
return '1/2*a*b'
B:def function(a,b):
print(1/2*a*b)
C:def function a,b:
return '1/2*a*b'
D:def function a,b:
print(1/2*a*b)
正确答案获取微信:424329
如果使用Python的数据结构来做类比的话,MongoDB中集合相当于一个()
A:列表
B:元组
C:字典
D:集合
正确答案获取微信:424329
Chrome的开发者工具中哪个选项可以查找到cookies()
A:Elements
B:Sources
C:Network
D:Peformance
正确答案获取微信:424329
Selenium和PhantomJS的配合使用可以完全模拟用户在浏览器上的操作有()
A:输入框内容填写
B:单击
C:截屏
D:下滑
正确答案获取微信:424329
以下哪些方法属于Python写CSV文件的方法()
A:writeheaders
B:writeheader
C:writerrows
D:writerow
正确答案获取微信:424329
网络爬虫的用途有()
A:收集数据
B:尽职调查
C:提高流量
D:攻击服务器
正确答案获取微信:424329
Xpath中路径表达式包括()字符
A:/
B://
C:.
D:@
正确答案获取微信:424329
Python中re模块的修饰符有()
A:re.I
B:re.N
C:re.M
D:re.S
正确答案获取微信:424329
MySQL中可以退出的命令有()
A:exit
B:quit
C:q
D:/q
正确答案获取微信:424329
最常见的HTTP请求类型有()
A:GET
B:POST
C:SEND
D:RECEIVE
正确答案获取微信:424329
Python中正则表达式预定义字符集包括()
A:d
B:D
C:s
D:S
正确答案获取微信:424329
Python中通过Key来从字典object中读取T应的Value的方法有()
A:object[key]
B:object.get(key)
C:object.pop(key)
D:object.pop()
正确答案获取微信:424329
常用的会话跟踪技术是()
A:session
B:cookies
C:moonpies
D:localstorage
正确答案获取微信:424329
Lxml中etree库可以通过parse方法读取HTML文件
A:对
B:错
正确答案获取微信:424329
Python中正则表达式边界匹配$表示匹配字符串开头
A:对
B:错
正确答案获取微信:424329
BS4的find()方法与find_all()方法返回类型相同
A:对
B:错
正确答案获取微信:424329
类中的变量称为类的变量,专业术语为类的属性
A:对
B:错
正确答案获取微信:424329
插入数据时,MongoDB会自动添加一列“_id”,也就是自增ID,每次自动加1
A:对
B:错
正确答案获取微信:424329
Selenium必须加载T应的webdriver才能模拟浏览器访问
A:对
B:错
正确答案获取微信:424329
Python中re模块的修饰符re.L表示多行匹配,影响 ^ 和 $
A:对
B:错
正确答案获取微信:424329
已经创建好的Scrapy爬虫*.py文件可以直接通过Python来运行
A:对
B:错
正确答案获取微信:424329
如果元组里面只有整数、浮点数、字符串、一个列表,就既不能添加数据,也不能删除数据,还不能修改里面数据的值。
A:对
B:错
正确答案获取微信:424329
T于需要登录的网站,用户可以通过Selenium和PhantomJS的配合就不需要通过构造表单或提交cookie信息来登录网站
A:对
B:错
正确答案获取微信:424329
Xpath中路径表达式base//user表示选取属于base的子元素中所有user元素
A:对
B:错
正确答案获取微信:424329
HTTP只能通过POST请求才能发送数据
A:对
B:错
正确答案获取微信:424329
使用异步加载技术的网站,被加载的内容可以在源代码中找到
A:对
B:错
正确答案获取微信:424329
在有spiders何setting.py这两项的情况下,可以写出爬虫并且保存数据,items.py和pipelines.py文件是原作者的失误而导致的冗余文件。
A:对
B:错
正确答案获取微信:424329
在使用多线程处理问题时,线程池设置越大越好
A:对
B:错
正确答案获取微信:424329
selenium使用driver.get()方法请求过后的网页源代码中有异步加载的信息
A:对
B:错
正确答案获取微信:424329
通用搜索引擎的目标是尽可能大的网络覆盖率,搜索引擎服务器资源与网络数据资源互相匹配
A:对
B:错
正确答案获取微信:424329
运行MongoDB以后,不会在终端打印任何Log
A:对
B:错
正确答案获取微信:424329
Python的判断语句格式如下:
if condition:
do
else:
do
A:对
B:错
正确答案获取微信:424329
通用网络爬虫通常采用串行工作方式
A:对
B:错
正确答案获取微信:424329