南开23春学期（高起本：1709-2103、专升本高起专：1903-2103）《大数据开发技术（二）》在线作业三

奥鹏南开大学新学期作业参考

南开大学23春学期（高起本：1709-2103、专升本/高起专：1903-2103）《大数据开发技术（二）》在线作业

1.Spark GraphX中类Graph的mask方法可以（）
选项A：反转图中所有边的方向
选项B：按照设定条件取出子图
选项C：取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性
选项D：合并边相同的属性
正确答案问询微信：424329

2.Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
选项A：第一个
选项B：所有
选项C：前10个
选项D：前100个
正确答案问询微信：424329

3.Graph类中如果根据边数据创建图，数据需要转换成RDD[Edge[ED]类型，应该用（）方法
选项A：Graph(vertices,edges, defaultVertexAttr)
选项B：Graph.fromEdges(RDD[Edge[ED]], defaultValue)
选项C：Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
选项D：GraphLoader.edgeListFile(sc,filename)
正确答案问询微信：424329

4.Mllib中metrics.recallByThreshold
表示（）指标
选项A：准确度
选项B：召回率
选项C：F值
选项D：ROC曲线
正确答案问询微信：424329

5.Scala列表方法中获取列表的第一个元素的方法是（）
选项A：drop
选项B：head
选项C：filter
选项D：init
正确答案问询微信：424329

6.（）可以解决图计算问题
选项A：Spark Core
选项B：BlinkDB
选项C：GraphX
选项D：Mllib
正确答案问询微信：424329

7.Mllib中metrics.precisionByThreshold表示（）指标
选项A：准确度
选项B：召回率
选项C：F值
选项D：ROC曲线
正确答案问询微信：424329

8.spark-submit配置项中（）表示Driver程序使用的内存大小
选项A：–driver-memory MEM
选项B：–executor-memory MEM
选项C：–total-executor-cores NUM
选项D：–executor-coures NUM
正确答案问询微信：424329

9.Spark Streming中（）函数可以对源DStream的每个元素通过函数func被映射出0或者更多的输出元素
选项A：map
选项B：flatMap
选项C：filter
选项D：union
正确答案问询微信：424329

10.Dstream输出操作中（）方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存
选项A：print
选项B：saveAsTextFiles
选项C：saveAsObjectFiles
选项D：saveAsHadoopFiles
正确答案问询微信：424329

11.Scala中（）方法返回一个列表，包含除了第一个元素之外的其他元素
选项A：head
选项B：init
选项C：tail
选项D：last
正确答案问询微信：424329

12.Mllib中metrics.roc
表示（）指标
选项A：准确度
选项B：召回率
选项C：F值
选项D：ROC曲线
正确答案问询微信：424329

13.Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是（）
选项A：filter
选项B：foreach
选项C：map
选项D：mkString
正确答案问询微信：424329

14.Scala列表方法中通过给定的方法将所有元素重新计算的方法是（）
选项A：filter
选项B：foreach
选项C：map
选项D：mkString
正确答案问询微信：424329

15.Scala中哪个函数可以创建区间数组（）
选项A：concat
选项B：ofDim
选项C：fill
选项D：range
正确答案问询微信：424329

16.图的结构通常表示为：G(V,E)，其中，V是图G中()
选项A：顶点
选项B：顶点的集合
选项C：边
选项D：边的集合
正确答案问询微信：424329

17.PairRDD中（）函数可以合并具有相同键的值
选项A：mapValues
选项B：groupBy
选项C：groupByKey
选项D：reduceByKey
正确答案问询微信：424329

18.GraphX中（）方法可以查询边信息
选项A：numVertices
选项B：numEdges
选项C：vertices
选项D：edges
正确答案问询微信：424329

19.以下哪个函数可以对两个RDD进行合并（）
选项A：union
选项B：substract
选项C：intersection
选项D：cartesian
正确答案问询微信：424329

20.以下算法中属于聚类算法的是（）
选项A：KNN算法
选项B：逻辑回归
选项C：随机森林
选项D：Kmeans
正确答案问询微信：424329

21.Dstream窗口操作中（）方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的Dstream
选项A：window
选项B：countByWindow
选项C：reduceByWindow
选项D：reduceByKeyAndWindow
正确答案问询微信：424329

22.GraphX中（）方法可以释放顶点缓存
选项A：cache
选项B：presist
选项C：unpersistVertices
选项D：edges.unpersist
正确答案问询微信：424329

23.Spark Streming中（）函数当被调用的两个DStream分别含有(K, V) 和(K, W)键值对时,返回一个(K, Seq[V], Seq[W])类型的新的DStream。
选项A：union
选项B：reduce
选项C：join
选项D：cogroup
正确答案问询微信：424329

24.Scala列表方法中返回所有元素，除了最后一个的方法是（）
选项A：drop
选项B：head
选项C：filter
选项D：init
正确答案问询微信：424329

25.Scala中重写一个非抽象方法必须使用（）修饰符。
选项A：extends
选项B：override
选项C：extend
选项D：overrides
正确答案问询微信：424329

26.Spark SQL可以处理（）
选项A：RDD
选项B：Parquet文件
选项C：JSON文件
选项D：Hive表
正确答案问询微信：424329

27.Spark的RDD持久化操作有()方式
选项A：cache
选项B：presist
选项C：storage
选项D：long
正确答案问询微信：424329

28.Scala中使用（）方法来连接两个集合
选项A：append
选项B：++
选项C：concat
选项D：Set.++()
正确答案问询微信：424329

29.Spark DataFrame中（）方法可以返回一个List
选项A：collect
选项B：take
选项C：takeAsList
选项D：collectAsList
正确答案问询微信：424329

30.Spark是一个（）计算框架
选项A：快速
选项B：分布式
选项C：可扩展
选项D：容错
正确答案问询微信：424329

31.Scala中可以用（）方法来连接两个或多个列表
选项A：::
选项B：#:::
选项C：List.:::()
选项D：List.concat()
正确答案问询微信：424329

32.Spark可以从（）分布式文件系统中读取数据
选项A：HDFS
选项B：Hbase
选项C：Hive
选项D：Tachyon
正确答案问询微信：424329

33.以下哪个是Scala的数据类型（）
选项A：Any
选项B：NULL
选项C：Nothing
选项D：AnyRef
正确答案问询微信：424329

34.Spark Streaming能够处理来自（）的数据
选项A：Kafka
选项B：Flume
选项C：Twitter
选项D：ZeroMQ
正确答案问询微信：424329

35.以下哪个方法可以实现Spark SQL对数据的查询（）
选项A：SqlContext
选项B：MySQLContext
选项C：HiveContext
选项D：context
正确答案问询微信：424329

36.Scala可以通过“val” 来定义变量，通过“var” 关键字来定义常量
选项A：对
选项B：错
正确答案问询微信：424329

37.RDD的map操作不会改变RDD的分区数目
选项A：对
选项B：错
正确答案问询微信：424329

38.Scala中++i和i++表示变量i自增1
选项A：对
选项B：错
正确答案问询微信：424329

39.Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括函数式编程的特性。
选项A：对
选项B：错
正确答案问询微信：424329

40.Scala函数组合器中foreach和map类似，有返回值
选项A：对
选项B：错
正确答案问询微信：424329

41.RDD的sortBy函数包含参数numPartitions，该参数决定排序后的RDD的分区个数，默认排序后的分区个数和排序之前的个数相等，即为this.partitions.size。
选项A：对
选项B：错
正确答案问询微信：424329

42.Spark在同一个应用中不能同时使用Spark SQL和Mllib
选项A：对
选项B：错
正确答案问询微信：424329

43.Scala可以通过“var” 来定义变量，通过“val” 关键字来定义常量
选项A：对
选项B：错
正确答案问询微信：424329

44.Spark是Apache基金会的顶级项目
选项A：对
选项B：错
正确答案问询微信：424329

45.Scala函数组合器中flatmap结合了map和flatten的功能，接收一个可以处理嵌套列表的函数，然后把返回结果连接起来
选项A：对
选项B：错
正确答案问询微信：424329

46.Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是要集成面向对象编程和函数式编程的各种特性。
选项A：对
选项B：错
正确答案问询微信：424329

47.Spark取代Hadoop仅仅是取代MapReduce这种计算框架，Spark可以取代HDFS吗
选项A：对
选项B：错
正确答案问询微信：424329

48.RDD的转换操作是用于触发转换操作的操作，这个时候才会真正开始进行计算。
选项A：对
选项B：错
奥鹏南开大学新学期作业参考正确答案问询微信：424329

49.图（Graph）是一种复杂的非线性结构
选项A：对
选项B：错
正确答案问询微信：424329

50.键值对RDD由一组组的键值对组成，这些RDD被称为PairRDD。
选项A：对
选项B：错
正确答案问询微信：424329

提供优质的教育资源