南开大学22秋学期(高起本1709-1803、全层次1809-2103)《大数据开发技术(二)》在线作业二
奥鹏南开在线作业满分答案参考
22秋学期(高起本1709-1803、全层次1809-2103)《大数据开发技术(二)》在线作业-00002
1.Spark中DataFrame的()方法是进行连接查询
选项A:where
选项B:join
选项C:limit
选项D:apply
满分答案问询微信:424329
2.在图结构中,每个元素都可以有()前驱
选项A:至少一个
选项B:零个或多个
选项C:一个
选项D:零个
满分答案问询微信:424329
3.Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以()
选项A:收集邻居顶点的顶点Id和顶点属性
选项B:收集邻居顶点的顶点Id
选项C:向指定顶点发送信息并聚合信息
选项D:将顶点信息更新到图中
满分答案问询微信:424329
4.PairRDD中()函数可以对具有相同键的值进行分组
选项A:mapValues
选项B:groupBy
选项C:groupByKey
选项D:reduceByKey
满分答案问询微信:424329
5.Spark中DataFrame的()方法是进行条件查询
选项A:where
选项B:join
选项C:limit
选项D:apply
满分答案问询微信:424329
6.Scala函数组合器可以对集合中的元素进行分组操作,结果得到的是一个Map的方法是()
选项A:filter
选项B:flatten
选项C:grouby
选项D:flatmap
满分答案问询微信:424329
7.在MLlib中,逻辑回归算法的输入值为()类型
选项A:Double
选项B:LabledPoint
选项C:Point
选项D:SGB
满分答案问询微信:424329
8.Scala列表方法中丢弃前n个元素,并返回新列表的方法是()
选项A:drop
选项B:head
选项C:filter
选项D:init
满分答案问询微信:424329
9.Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法
选项A:Graph(vertices,edges, defaultVertexAttr)
选项B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
选项C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
选项D:GraphLoader.edgeListFile(sc,filename)
满分答案问询微信:424329
10.Scala函数组合器可以把一个二维的列表展开成一个一维的列表的方法是()
选项A:filter
选项B:flatten
选项C:grouby
选项D:flatmap
满分答案问询微信:424329
11.以下算法中属于聚类算法的是()
选项A:KNN算法
选项B:逻辑回归
选项C:随机森林
选项D:Kmeans
满分答案问询微信:424329
12.Scala通过()来定义常量
选项A:val
选项B:val
选项C:define
选项D:def
满分答案问询微信:424329
13.Dstream窗口操作中()方法返回基于滑动窗口的DStream中的元素的数量
选项A:window
选项B:countByWindow
选项C:reduceByWindow
选项D:reduceByKeyAndWindow
满分答案问询微信:424329
14.GraphX中graph.triplets可以得到()
选项A:顶点视图
选项B:边视图
选项C:顶点与边的三元组整体视图
选项D:有向图
满分答案问询微信:424329
15.PairRDD的()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。
选项A:join
选项B:union
选项C:substract
选项D:intersection
满分答案问询微信:424329
16.当需要将一个普通的RDD转化为一个PairRDD时可以使用()函数来进行操作
选项A:transfer
选项B:change
选项C:map
选项D:build
满分答案问询微信:424329
17.Spark Streming中()函数可以合并两个DStream,生成一个包含两个DStream中所有元素的新DStream对象
选项A:map
选项B:flatMap
选项C:filter
选项D:union
满分答案问询微信:424329
18.MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练分类树
选项A:trainClassifier
选项B:trainRegressor
选项C:LogisticRegressionModel
选项D:LabeledPoint
满分答案问询微信:424329
19.请问RDD的()操作用来计算RDD中所有元素个数
选项A:count
选项B:num
选项C:length
选项D:number
满分答案问询微信:424329
20.Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
选项A:第一个
选项B:所有
选项C:前10个
选项D:前100个
满分答案问询微信:424329
21.一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的()多倍
选项A:2
选项B:10
选项C:100
选项D:1000
满分答案问询微信:424329
22.递归函数意味着函数可以调用它()
选项A:其他函数
选项B:主函数
选项C:子函数
选项D:自身
满分答案问询微信:424329
23.Mllib中metrics.fMeasureByThreshold
表示()指标
选项A:准确度
选项B:召回率
选项C:F值
选项D:ROC曲线
满分答案问询微信:424329
24.Scala函数组合器可以过滤移除使得传入的函数的返回值为false的元素的方法是()
选项A:filter
选项B:flatten
选项C:grouby
选项D:flatmap
满分答案问询微信:424329
25.GraphX中graph.edges可以得到()
选项A:顶点视图
选项B:边视图
选项C:顶点与边的三元组整体视图
选项D:有向图
满分答案问询微信:424329
26.Spark SQL可以处理()
选项A:RDD
选项B:Parquet文件
选项C:JSON文件
选项D:Hive表
满分答案问询微信:424329
27.Scala中使用()方法来查看两个集合的交集元素
选项A:Set.concat
选项B:Set.&
选项C:Set.&&
选项D:Set.intersect
满分答案问询微信:424329
28.以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区()
选项A:resetpartition
选项B:repartiton
选项C:Partition
选项D:coalesce
满分答案问询微信:424329
29.Scala支持()
选项A:显式参数
选项B:隐式参数
选项C:转换
选项D:多态方法
满分答案问询微信:424329
30.Spark DataFrame中()方法可以获取若干行数据
选项A:first
选项B:head
选项C:take
选项D:collect
满分答案问询微信:424329
31.Spark Streaming支持实时流式数据,包括()
选项A:Web服务器日志文件
选项B:社交网络数据
选项C:实时交易数据
选项D:类似Kafka的信息数据
满分答案问询微信:424329
32.以下哪个方法可以创建RDD()
选项A:parallelize
选项B:makeRDD
选项C:textFile
选项D:loadFile
满分答案问询微信:424329
33.MLlib中用于线性回归算法的包主要有()
选项A:LinearRegressionWithSGD
选项B:RidgeRegressionWithSGD
选项C:LassoWithSGD
选项D:LeftRegression
满分答案问询微信:424329
34.Scala中使用() 方法来连接两个集合
选项A:append
选项B:++
选项C:concat
选项D:Set.++()
满分答案问询微信:424329
35.Spark DataFrame中()方法可以返回一个List
选项A:collect
选项B:take
选项C:takeAsList
选项D:collectAsList
满分答案问询微信:424329
36.Spark SQL包括基本的SQL语法和HiveQL语法
选项A:对
选项B:错
满分答案问询微信:424329
37.RDD的行动操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
选项A:对
选项B:错
满分答案问询微信:424329
38.Scala 配备了一种表现型的系统,它以静态的方式进行抽象,以安全和连贯的方式进行使用。
选项A:对
选项B:错
满分奥鹏南开在线作业满分答案参考答案问询微信:424329
39.Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。
选项A:对
选项B:错
满分答案问询微信:424329
40.Spark只有键值对类型的RDD才能设置分区方式
选项A:对
选项B:错
满分答案问询微信:424329
41.Scala中++i和i++表示变量i自增1
选项A:对
选项B:错
满分答案问询微信:424329
42.Scala是一种纯面向对象的语言,每个值都是对象。
选项A:对
选项B:错
满分答案问询微信:424329
43.Spark Streming中DStream可以通过外部数据源(Kafka,Flume,Twitter等)来获取,也可以通过现有DStream的高级操作(Transformation操作)获得
选项A:对
选项B:错
满分答案问询微信:424329
44.Scala是不可扩展的
选项A:对
选项B:错
满分答案问询微信:424329
45.RDD是一个可读写的数据结构
选项A:对
选项B:错
满分答案问询微信:424329
46.Scala中Map 合并时会移除重复的 key
选项A:对
选项B:错
满分答案问询微信:424329
47.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
选项A:对
选项B:错
满分答案问询微信:424329
48.RDD中combineByKey不允许返回类型与输入数据类型不同的返回值
选项A:对
选项B:错
满分答案问询微信:424329
49.Scala中列表是可变的
选项A:对
选项B:错
满分答案问询微信:424329
50.Scala可以通过“var” 来定义变量,通过“val” 关键字来定义常量
选项A:对
选项B:错
满分答案问询微信:424329