南开23春学期(高起专1903、专升本1903)《大数据开发技术(二)》在线作业一

奥鹏南开大学新学期作业参考

南开23春学期(高起专1903、专升本1903)《大数据开发技术(二)》在线作业一插图

南开大学23春学期(高起专1903、专升本1903)《大数据开发技术(二)》在线作业

1.GraphX中()方法可以查询顶点信息
选项A:numVertices
选项B:numEdges
选项C:vertices
选项D:edges
正确答案问询微信:424329

2.以下哪个函数可以对RDD进行去重()
选项A:sortBy
选项B:filter
选项C:distinct
选项D:intersection
正确答案问询微信:424329

3.请问RDD的()操作用于将相同键的数据聚合
选项A:join
选项B:zip
选项C:combineByKey
选项D:collect
正确答案问询微信:424329

4.Spark中DataFrame的()方法是进行条件查询
选项A:where
选项B:join
选项C:limit
选项D:apply
正确答案问询微信:424329

5.PairRDD可以通过()获得仅包含键的RDD
选项A:key
选项B:keys
选项C:value
选项D:values
正确答案问询微信:424329

6.请问RDD的()操作是将两个RDD组合成Key/Value形式的RDD
选项A:join
选项B:zip
选项C:combineByKey
选项D:collect
正确答案问询微信:424329

7.Scala函数组合器可以通过一个函数重新计算列表中所有元素,并且返回一个相同数目元素的新列表的方法是()
选项A:map
选项B:foreach
选项C:flatten
选项D:flatmap
正确答案问询微信:424329

8.图结构中如果任意两个顶点之间都存在有向边,那么称之为()
选项A:完全图
选项B:有向完全图
选项C:无向图
选项D:简单图
正确答案问询微信:424329

9.Mllib中metrics.precisionByThreshold表示()指标
选项A:准确度
选项B:召回率
选项C:F值
选项D:ROC曲线
正确答案问询微信:424329

10.图的结构通常表示为:G(V,E),其中,V是图G中()
选项A:顶点
选项B:顶点的集合
选项C:边
选项D:边的集合
正确答案问询微信:424329

11.()可以解决图计算问题
选项A:Spark Core
选项B:BlinkDB
选项C:GraphX
选项D:Mllib
正确答案问询微信:424329

12.GraphX中()方法可以释放边缓存
选项A:cache
选项B:presist
选项C:unpersistVertices
选项D:edges.unpersist
正确答案问询微信:424329

13.Dstream窗口操作中()方法返回基于滑动窗口的DStream中的元素的数量
选项A:window
选项B:countByWindow
选项C:reduceByWindow
选项D:reduceByKeyAndWindow
正确答案问询微信:424329

14.以下哪个方法可以从外部存储中创建RDD()
选项A:parallelize
选项B:makeRDD
选项C:textFile
选项D:loadFile
正确答案问询微信:424329

15.Scala中哪个函数可以创建区间数组()
选项A:concat
选项B:ofDim
选项C:fill
选项D:range
正确答案问询微信:424329

16.Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符()代替参数。
选项A:井号
选项B:下划线
选项C:斜杠
选项D:逗号
正确答案问询微信:424329

17.Spark GraphX中类Graph的joinVertices方法可以()
选项A:收集邻居顶点的顶点Id和顶点属性
选项B:收集邻居顶点的顶点Id
选项C:向指定顶点发送信息并聚合信息
选项D:将顶点信息更新到图中
正确答案问询微信:424329

18.以下哪个函数可以对两个RDD进行合并()
选项A:union
选项B:substract
选项C:intersection
选项D:cartesian
正确答案问询微信:424329

19.Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
选项A:filter
选项B:foreach
选项C:map
选项D:mkString
正确答案问询微信:424329

20.图的结构通常表示为:G(V,E),其中,G表示()
选项A:图
选项B:子图
选项C:顶点
选项D:边
正确答案问询微信:424329

21.Mllib中metrics.recallByThreshold
表示()指标
选项A:准确度
选项B:召回率
选项C:F值
选项D:ROC曲线
正确答案问询微信:424329

22.Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
选项A:window
选项B:countByWindow
选项C:reduceByWindow
选项D:reduceByKeyAndWindow
正确答案问询微信:424329

23.以下哪个不是Scala的数据类型()
选项A:Int
选项B:Short Int
选项C:Long
选项D:Any
正确答案问询微信:424329

24.PairRDD中()函数可以对具有相同键的值进行分组
选项A:mapValues
选项B:groupBy
选项C:groupByKey
选项D:reduceByKe奥鹏南开大学新学期作业参考y
正确答案问询微信:424329

25.GraphX中EdgeRDD继承自()
选项A:EdgeRDD
选项B:RDD[Edge]
选项C:VertexRDD[VD]
选项D:RDD[(VertexId,VD)]
正确答案问询微信:424329

26.Spark DataFrame中()方法可以获取若干行数据
选项A:first
选项B:head
选项C:take
选项D:collect
正确答案问询微信:424329

27.Spark Core包含的功能有()
选项A:任务调度
选项B:内存管理
选项C:SQL查询
选项D:容错机制
正确答案问询微信:424329

28.Spark DataFrame中()方法可以返回一个List
选项A:collect
选项B:take
选项C:takeAsList
选项D:collectAsList
正确答案问询微信:424329

29.以下算法中属于监督学习算法的是()
选项A:KNN算法
选项B:逻辑回归
选项C:随机森林
选项D:Kmeans
正确答案问询微信:424329

30.Spark中的RDD的说法正确的是()
选项A:弹性分布式数据集
选项B:是Spark中最基本的数据抽象
选项C:代表一个可变的集合
选项D:代表的集合里面的元素可并行计算
正确答案问询微信:424329

31.MLBase包括()
选项A:Mllib
选项B:MLI
选项C:SparkR
选项D:GraphX
正确答案问询微信:424329

32.Spark包含的高级工具有()
选项A:Spark SQL
选项B:Mllib
选项C:GraphX
选项D:park Streaming
正确答案问询微信:424329

33.Scala支持()
选项A:匿名函数
选项B:高阶函数
选项C:函数嵌套
选项D:柯里化
正确答案问询微信:424329

34.以下哪个是Scala的数据类型()
选项A:Any
选项B:NULL
选项C:Nothing
选项D:AnyRef
正确答案问询微信:424329

35.以下哪个方法可以实现Spark SQL对数据的查询()
选项A:SqlContext
选项B:MySQLContext
选项C:HiveContext
选项D:context
正确答案问询微信:424329

36.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
选项A:对
选项B:错
正确答案问询微信:424329

37.Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
选项A:对
选项B:错
正确答案问询微信:424329

38.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
选项A:对
选项B:错
正确答案问询微信:424329

39.Scala中Map的isEmpty函数在Map为空时返回false
选项A:对
选项B:错
正确答案问询微信:424329

40.MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
选项A:对
选项B:错
正确答案问询微信:424329

41.RDD中join操作最后只返回两个RDD 都存在的键的连接结果。
选项A:对
选项B:错
正确答案问询微信:424329

42.RDD的filter过滤会将返回值为true的过滤掉
选项A:对
选项B:错
正确答案问询微信:424329

43.Scala在子类中重写超类的抽象方法时,需要使用override关键字
选项A:对
选项B:错
正确答案问询微信:424329

44.Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作
选项A:对
选项B:错
正确答案问询微信:424329

45.RDD中join操作根据键对两个RDD进行内连接,将两个RDD 中键相同的数据的值相加。
选项A:对
选项B:错
正确答案问询微信:424329

46.Scala中数组的第一个元素索引为1
选项A:对
选项B:错
正确答案问询微信:424329

47.Scala中创建一个方法时经常用void表示该方法无返回值
选项A:对
选项B:错
正确答案问询微信:424329

48.如果其中有一个节点因为某种原因出现故障时, Spark 需要用到缓存数据时不会重算丢失的分区,因此不需要计算所有的分区。
选项A:对
选项B:错
正确答案问询微信:424329

49.Scala中Map的isEmpty函数在Map为空时返回true
选项A:对
选项B:错
正确答案问询微信:424329

50.Spark SQL仅仅包括基本的SQL语法
选项A:对
选项B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网