南开大学22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（二）》在线作业二

奥鹏南开在线作业满分答案参考

22秋学期（高起本1709-1803、全层次1809-2103）《大数据开发技术（二）》在线作业-00002

1.Spark中DataFrame的（）方法是进行连接查询
选项A：where
选项B：join
选项C：limit
选项D：apply
满分答案问询微信：424329

2.在图结构中，每个元素都可以有（）前驱
选项A：至少一个
选项B：零个或多个
选项C：一个
选项D：零个
满分答案问询微信：424329

3.Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以（）
选项A：收集邻居顶点的顶点Id和顶点属性
选项B：收集邻居顶点的顶点Id
选项C：向指定顶点发送信息并聚合信息
选项D：将顶点信息更新到图中
满分答案问询微信：424329

4.PairRDD中（）函数可以对具有相同键的值进行分组
选项A：mapValues
选项B：groupBy
选项C：groupByKey
选项D：reduceByKey
满分答案问询微信：424329

5.Spark中DataFrame的（）方法是进行条件查询
选项A：where
选项B：join
选项C：limit
选项D：apply
满分答案问询微信：424329

6.Scala函数组合器可以对集合中的元素进行分组操作，结果得到的是一个Map的方法是（）
选项A：filter
选项B：flatten
选项C：grouby
选项D：flatmap
满分答案问询微信：424329

7.在MLlib中，逻辑回归算法的输入值为（）类型
选项A：Double
选项B：LabledPoint
选项C：Point
选项D：SGB
满分答案问询微信：424329

8.Scala列表方法中丢弃前n个元素，并返回新列表的方法是（）
选项A：drop
选项B：head
选项C：filter
选项D：init
满分答案问询微信：424329

9.Graph类中如果要根据边数据创建图，边数据需要加载为二元组，可以选择是否对边分区，应该用（）方法
选项A：Graph(vertices,edges, defaultVertexAttr)
选项B：Graph.fromEdges(RDD[Edge[ED]], defaultValue)
选项C：Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
选项D：GraphLoader.edgeListFile(sc,filename)
满分答案问询微信：424329

10.Scala函数组合器可以把一个二维的列表展开成一个一维的列表的方法是（）
选项A：filter
选项B：flatten
选项C：grouby
选项D：flatmap
满分答案问询微信：424329

11.以下算法中属于聚类算法的是（）
选项A：KNN算法
选项B：逻辑回归
选项C：随机森林
选项D：Kmeans
满分答案问询微信：424329

12.Scala通过（）来定义常量
选项A：val
选项B：val
选项C：define
选项D：def
满分答案问询微信：424329

13.Dstream窗口操作中（）方法返回基于滑动窗口的DStream中的元素的数量
选项A：window
选项B：countByWindow
选项C：reduceByWindow
选项D：reduceByKeyAndWindow
满分答案问询微信：424329

14.GraphX中graph.triplets可以得到（）
选项A：顶点视图
选项B：边视图
选项C：顶点与边的三元组整体视图
选项D：有向图
满分答案问询微信：424329

15.PairRDD的（）方法，可以把两个RDD中键相同的元素组合在一起，合并为一个RDD。
选项A：join
选项B：union
选项C：substract
选项D：intersection
满分答案问询微信：424329

16.当需要将一个普通的RDD转化为一个PairRDD时可以使用（）函数来进行操作
选项A：transfer
选项B：change
选项C：map
选项D：build
满分答案问询微信：424329

17.Spark Streming中（）函数可以合并两个DStream，生成一个包含两个DStream中所有元素的新DStream对象
选项A：map
选项B：flatMap
选项C：filter
选项D：union
满分答案问询微信：424329

18.MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法（）训练分类树
选项A：trainClassifier
选项B：trainRegressor
选项C：LogisticRegressionModel
选项D：LabeledPoint
满分答案问询微信：424329

19.请问RDD的（）操作用来计算RDD中所有元素个数
选项A：count
选项B：num
选项C：length
选项D：number
满分答案问询微信：424329

20.Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
选项A：第一个
选项B：所有
选项C：前10个
选项D：前100个
满分答案问询微信：424329

21.一般情况下，对于迭代次数较多的应用程序，Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的（）多倍
选项A：2
选项B：10
选项C：100
选项D：1000
满分答案问询微信：424329

22.递归函数意味着函数可以调用它（）
选项A：其他函数
选项B：主函数
选项C：子函数
选项D：自身
满分答案问询微信：424329

23.Mllib中metrics.fMeasureByThreshold
表示（）指标
选项A：准确度
选项B：召回率
选项C：F值
选项D：ROC曲线
满分答案问询微信：424329

24.Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是（）
选项A：filter
选项B：flatten
选项C：grouby
选项D：flatmap
满分答案问询微信：424329

25.GraphX中graph.edges可以得到（）
选项A：顶点视图
选项B：边视图
选项C：顶点与边的三元组整体视图
选项D：有向图
满分答案问询微信：424329

26.Spark SQL可以处理（）
选项A：RDD
选项B：Parquet文件
选项C：JSON文件
选项D：Hive表
满分答案问询微信：424329

27.Scala中使用（）方法来查看两个集合的交集元素
选项A：Set.concat
选项B：Set.&
选项C：Set.&&
选项D：Set.intersect
满分答案问询微信：424329

28.以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区（）
选项A：resetpartition
选项B：repartiton
选项C：Partition
选项D：coalesce
满分答案问询微信：424329

29.Scala支持（）
选项A：显式参数
选项B：隐式参数
选项C：转换
选项D：多态方法
满分答案问询微信：424329

30.Spark DataFrame中（）方法可以获取若干行数据
选项A：first
选项B：head
选项C：take
选项D：collect
满分答案问询微信：424329

31.Spark Streaming支持实时流式数据，包括（）
选项A：Web服务器日志文件
选项B：社交网络数据
选项C：实时交易数据
选项D：类似Kafka的信息数据
满分答案问询微信：424329

32.以下哪个方法可以创建RDD（）
选项A：parallelize
选项B：makeRDD
选项C：textFile
选项D：loadFile
满分答案问询微信：424329

33.MLlib中用于线性回归算法的包主要有（）
选项A：LinearRegressionWithSGD
选项B：RidgeRegressionWithSGD
选项C：LassoWithSGD
选项D：LeftRegression
满分答案问询微信：424329

34.Scala中使用（）方法来连接两个集合
选项A：append
选项B：++
选项C：concat
选项D：Set.++()
满分答案问询微信：424329

35.Spark DataFrame中（）方法可以返回一个List
选项A：collect
选项B：take
选项C：takeAsList
选项D：collectAsList
满分答案问询微信：424329

36.Spark SQL包括基本的SQL语法和HiveQL语法
选项A：对
选项B：错
满分答案问询微信：424329

37.RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD ，但是转换操作是懒操作，不会立刻执行计算。
选项A：对
选项B：错
满分答案问询微信：424329

38.Scala 配备了一种表现型的系统，它以静态的方式进行抽象，以安全和连贯的方式进行使用。
选项A：对
选项B：错
满分奥鹏南开在线作业满分答案参考答案问询微信：424329

39.Scala中高阶函数可以产生新的函数，并将新的函数作为返回值。
选项A：对
选项B：错
满分答案问询微信：424329

40.Spark只有键值对类型的RDD才能设置分区方式
选项A：对
选项B：错
满分答案问询微信：424329

41.Scala中++i和i++表示变量i自增1
选项A：对
选项B：错
满分答案问询微信：424329

42.Scala是一种纯面向对象的语言，每个值都是对象。
选项A：对
选项B：错
满分答案问询微信：424329

43.Spark Streming中DStream可以通过外部数据源（Kafka，Flume，Twitter等）来获取，也可以通过现有DStream的高级操作（Transformation操作）获得
选项A：对
选项B：错
满分答案问询微信：424329

44.Scala是不可扩展的
选项A：对
选项B：错
满分答案问询微信：424329

45.RDD是一个可读写的数据结构
选项A：对
选项B：错
满分答案问询微信：424329

46.Scala中Map 合并时会移除重复的 key
选项A：对
选项B：错
满分答案问询微信：424329

47.Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括面向对象编程的特性。
选项A：对
选项B：错
满分答案问询微信：424329

48.RDD中combineByKey不允许返回类型与输入数据类型不同的返回值
选项A：对
选项B：错
满分答案问询微信：424329

49.Scala中列表是可变的
选项A：对
选项B：错
满分答案问询微信：424329

50.Scala可以通过“var” 来定义变量，通过“val” 关键字来定义常量
选项A：对
选项B：错
满分答案问询微信：424329

提供优质的教育资源