南开大学22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业三

奥鹏南开在线作业满分答案参考

22秋学期(高起本1709-1803、全层次1809-2103)《网络爬虫与信息提取》在线作业-00003

1.Scrapy自带的待爬队列是()
选项A:deque
选项B:queue
选项C:list
选项D:lqueue
满分答案问询微信:424329

2.Python正则表达式模块的findall方法提取内容包含多个,则返回结果的列表中会包含()
选项A:列表
选项B:元组
选项C:字典
选项D:集合
满分答案问询微信:424329

3.Redis是一个开源的使用()语言编写
选项A:ANSI C
选项B:C++
选项C:JAVA
选项D:Python
满分答案问询微信:424329

4.Python写CSV文件需要哪个方法()
选项A:CSVWriter
选项B:CsvWriter
选项C:DictWriter
选项D:FileWriter
满分答案问询微信:424329

5.使用Xpath构造属性值包含相同字符串的路径采用()方法
选项A:contain
选项B:contains
选项C:include
选项D:includes
满分答案问询微信:424329

6.以下关于Charles的说法正确的是( )
选项A:Charles是一个跨平台的HTTP抓包工具,可以截取HTTP或者HTTPS请求的数据包
选项B:Charles有Windows 32/64版和Linux 64 版,但是目前还没有对Mac OS进行有效的支持。
选项C:Charles上面滚动的数据就是目前计算机发起的数据包。单击工具栏上面的黄色笤帚图标,可以清停止抓包。
选项D:在Charles启动时,系统自带浏览器的部分HTTP流量不会经过Charles。
满分答案问询微信:424329

7.Redis中写数据到列表中,使用关键字()
选项A:push
选项B:append
选项C:lpush
选项D:lappend
满分答案问询微信:424329

8.打开终端,输入(),屏幕上会出现Python的路径
选项A:python path
选项B:path python
选项C:which python
选项D:python which
满分答案问询微信:424329

9.Python中跳过本次循环应用关键字()
选项A:break
选项B:continue
选项C:exit
选项D:return
满分答案问询微信:424329

10.Chrome的开发者工具中哪个选项可以查找到cookies
选项A:Elements
选项B:Sources
选项C:Network
选项D:Peformance
满分答案问询微信:424329

11.下列哪项不是HTTP的请求类型()
选项A:GET
选项B:POST
选项C:PUT
选项D:SET
满分答案问询微信:424329

12.通常使用()工具来模拟浏览器进行爬虫请求
选项A:Selenium
选项B:Chrome
选项C:ChromeDriver
选项D:WebDriver
满分答案问询微信:424329

13.chrome默认打开开发者工具的快捷是
选项A:F5
选项B:F11
选项C:F12
选项D:F2
满分答案问询微信:424329

14.Python中专门用来处理图像的第三方库是
选项A:lxml
选项B:Pillow
选项C:beautifulsoup
选项D:pytesseract
满分答案问询微信:424329

15.要想让Scrapy结合Redis,应该对Scrapy爬虫请求的调度算法进行修改,以下哪种修改不能完成这一任务?()
选项A:队列
选项B:栈
选项C:上锁
选项D:优先级队列
满分答案问询微信:424329

16.以下表示请求资源重定向的HTTP状态码为
选项A:200
选项B:301
选项C:404
选项D:500
满分答案问询微信:424329

17.请问按哪个键可以打开Chrome自带的开发者工具()
选项A:F10
选项B:F1
选项C:F11
选项D:F12
满分答案问询微信:424329

18.如果使用Python的数据结构来做类比的话,MongoDB中库相当于一个()
选项A:列表
选项B:元组
选项C:字典
选项D:集合
满分答案问询微信:424329

19.执行下面代码,结果为():
name_list = []
if name_list and name_list[100] == '张三':
print('OK')
选项A:程序报错
选项B:OK
选项C:NULL
选项D:无输出
满分答案问询微信:424329

20.使用UI Automatorr判断元素是否存在的操作是得到相应控件后使用命令()
选项A:exist
选项B:exists
选项C:isnull
选项D:contains
满分答案问询微信:424329

21.为了解决爬虫代码本身的错误引起的异常,可以采用下列哪些方法
选项A:仔细检查代码
选项B:开发爬虫中间件
选项C:开发下载器中间件
选项D:等待
满分答案问询微信:424329

22.使用BeautifulSoup对象后可以使用()来查找内容
选项A:find_all
选项B:find
选项C:search
选项D:search_all
满分答案问询微信:424329

23.MongoDB中获取名字为set1的集合的语句为()
选项A:database.set1
选项B:database('set1')
选项C:database['set1']
选项D:database{'set1'}
满分答案问询微信:424329

24.以下哪些可以独立成为Python编译器()
选项A:Pycharm
选项B:IDLE
选项C:Eclipse
选项D:Visual Studio 2010
满分答案问询微信:424329

25.使用Selennium获取网页中元素的方法有
选项A:find_element_by_name
选项B:find_element_by_id
选项C:find_elements_by_name
选项D:find_elements_by_id
满分答案问询微信:424329

26.下列关于在IOS上配置charles的说法正确的是()
选项A:不同ios设备之间会有比较大的差别,所以配置的时候需要找到对应的安装证书的入口。
选项B:手机和电脑需要在同一个局域网下。
选项C:HTTP代理可以使用“自动”选项。
选项D:安装好证书以后,打开iOS设备上的任何一个App,可以看到Charles中有数据包在流动
满分答案问询微信:424329

27.网络爬虫的用途有()
选项A:收集数据
选项B:尽职调查
选项C:提高流量
选项D:攻击服务器
满分答案问询微信:424329

28.PyMongo删除操作有()
选项A:delete
选项B:delete_all
选项C:delete_one
选项D:delete_many
满分答案问询微信:424329

29.PyMongo更新操作有()
选项A:update
选项B:update_all
选项C:update_one
选项D:update_many
满分答案问询微信:424329

30.BS4可以用来从()中提取数据
选项A:HTML
选项B:XML
选项C:数据库
选项D:JSON
满分答案问询微信:424329

31.在charles中使用CTRL+F搜索,JSON里面的中文是可以直接搜索到的。
选项A:对
选项B:错
满分答案问询微信:424329

32.使用UI Automatorr操作实体键的命令为device.press.实体按键名称()
选项A:对
选项B:错
满分答案问询微信:424329

33.代理中间件的可用代理列表一定要写在settings.py里面
选项A:对
选项B:错
满分答案问询微信:424329

34.引用中间件时后面的数字代表的是中间件的执行顺序,例如 'AdvanceSpider.middlewares.ProxyMiddleware': 543 中的543
选项A:对
选项B:错
满分答案问询微信:424329

35.如果把网络上发送与接收的数据包理解为快递包裹,那么在快递运输的过程中取出查看更改里面的内容,就是类似抓包的过程
选项A:对
选项B:错
满分答案问询微信:424329

36.对Charles设置代理时,Ip可以设置为127.0.0.1,端口为8888.
选项A:对
选项B:错
满分答案问询微信:424329

37.Scrapy每一次发起请求之前都会在这里检查网址是否重复。因此如果确实需要再一次爬取数据,在Redis中把这个Key删除即可。
选项A:对
选项B:错
满分答案问询微信:424329

38.使用异步加载技术的网站,被加载的内容可以在源代码中找到
选项A:对
选项B:错
满分答案问询微信:424329

39.”curl http://爬虫服务器IP地址:6800/cancel.json -d project=工程名 -d job=爬虫JOBID“该命令的作用是启动爬虫
选项A:对
选项B:错
满分答案问询微信:424329

40.Redis中使用lrange读取数据后数据也会删除
选项A:对
选项B:错
满分答案问询微信:424329

41.在Ubuntu下若要运行Redis可以使用CMD进入解压以后的文件夹并运行命令redis-server.exe redis.windows.conf启动Redis
选项A:对
选项B:错
满分答案问询微信:424329

42.需要登录的网站一般通过GET请求就可以实现登录。
选项A:对
选项B:错
满分答案问询微信:424329

43.爬虫中间件的激活需要另外写一个文件来进行
选项A:对
选项B:错
满分答案问询微信:424329

44.requests中post请求方法的使用为requests.post('网址&#03奥鹏南开在线作业满分答案参考9;, data=data)
选项A:对
选项B:错
满分答案问询微信:424329

45.数据抓包就是中间人爬虫的一个简单应用。所以使用Charles也是一种中间人攻击
选项A:对
选项B:错
满分答案问询微信:424329

46.数据在MongoDB中是按照“库(Database)”—“集合(Collections)”—“文档(Document)”的层级关系来存储的。
选项A:对
选项B:错
满分答案问询微信:424329

47.如果目标网站本身就是提供公众查询服务的网站,那么使用爬虫是合法合规的。
选项A:对
选项B:错
满分答案问询微信:424329

48.HTTP状态码中303状态码明确表示客户端应当采用POST方法获取资源
选项A:对
选项B:错
满分答案问询微信:424329

49.MongoDB是一个关系数据库产品
选项A:对
选项B:错
满分答案问询微信:424329

50.HTTP状态码302与307完全同义。
选项A:对
选项B:错
满分答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网