南开大学23年春学期《大数据开发技术（二）》在线作业二

奥鹏南开大学新学期作业参考

23春学期（高起本：1709-2103、专升本/高起专：1903-2103）《大数据开发技术（二）》在线作业-00002

以下哪个函数可以求两个RDD的笛卡尔积（）
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信：424329

（）是AMPLab发布的一个R开发包，使得R摆脱单机运行的命运，可以作为奥鹏南开大学新学期作业参考代做2元一门Spark的Job运行在集群上
A:SparkR
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信：424329

RDD的（）操作通常用来划分单词
A:filter
B:union
C:flatmap
D:mapPartitions
正确答案问询微信：424329

以下哪个不是Scala的数据类型（）
A:AnyRef
B:Anything
C:NULL
D:Nothing
正确答案问询微信：424329

Spark GraphX中类Graph的reverse方法可以（）
A:反转图中所有边的方向
B:按照设定条件取出子图
C:取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性
D:合并边相同的属性
正确答案问询微信：424329

图结构中如果任意两个顶点之间都存在边，那么称之为（）
A:完全图
B:有向完全图
C:无向图
D:简单图
正确答案问询微信：424329

Spark中DataFrame的（）方法是进行条件查询
A:where
B:join
C:limit
D:apply
正确答案问询微信：424329

Scala中（）方法返回一个列表，包含除了最后一个元素之外的其他元素
A:head
B:init
C:tail
D:last
正确答案问询微信：424329

var a=10;
for(a-1 until 20){
println(a);
}
共循环了（）次
A:10
B:11
C:20
D:19
正确答案问询微信：424329

以下哪个函数可以求两个RDD差集（）
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信：424329

以下哪个函数可以对两个RDD进行合并（）
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信：424329

Graph类中如果要根据边数据创建图，边数据需要加载为二元组，可以选择是否对边分区，应该用（）方法
A:Graph(vertices,edges, defaultVertexAttr)
B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D:GraphLoader.edgeListFile(sc,filename)
正确答案问询微信：424329

Scala中（）方法返回Map所有的value
A:key
B:keys
C:value
D:values
正确答案问询微信：424329

GraphX中graph.vertices可以得到（）
A:顶点视图
B:边视图
C:顶点与边的三元组整体视图
D:有向图
正确答案问询微信：424329

GraphX中（）是完整提供边的各种操作类
A:RDD[Edge]
B:EdgeRDD
C:RDD[(VertexId,VD)]
D:VertexRDD
正确答案问询微信：424329

GraphX中（）是存放着存放顶点的RDD
A:RDD[Edge]
B:EdgeRDD
C:RDD[(VertexId,VD)]
D:VertexRDD
正确答案问询微信：424329

Spark GraphX中类Graph的collectNeighbors(edgeDirection: EdgeDirection)方法可以（）
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案问询微信：424329

在MLlib中，逻辑回归算法的输入值为（）类型
A:Double
B:LabledPoint
C:Point
D:SGB
正确答案问询微信：424329

Graph类中如果根据边数据创建图，数据需要转换成RDD[Edge[ED]类型，应该用（）方法
A:Graph(vertices,edges, defaultVertexAttr)
B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D:GraphLoader.edgeListFile(sc,filename)
正确答案问询微信：424329

（）是Spark的数据挖掘算法库
A:Spark Core
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信：424329

Spark Streming中（）函数可以使用func将源DStream中的每个元素进行聚合操作，返回一个内部所包含的RDD只有一个元素的新DStream
A:union
B:reduce
C:join
D:cogroup
正确答案问询微信：424329

Scala函数组合器可以通过一个函数重新计算列表中所有元素，并且返回一个相同数目元素的新列表的方法是（）
A:map
B:foreach
C:flatten
D:flatmap
正确答案问询微信：424329

Mllib中线性会馆算法中的参数numIterations表示（）
A:要运行的迭代次数
B:梯度下降的步长
C:是否给数据加干扰特征或者偏差特征
D:Lasso 和ridge 的正规化参数
正确答案问询微信：424329

Scala列表方法中获取列表的第一个元素的方法是（）
A:drop
B:head
C:filter
D:init
正确答案问询微信：424329

Spark Streming中（）函数可以对源DStream的每个元素通过函数func返回一个新的DStream
A:map
B:flatMap
C:filter
D:union
正确答案问询微信：424329

以下是机器学习的常用算法的是（）
A:回归算法
B:聚类算法
C:降维算法
D:分类算法
正确答案问询微信：424329

TF-IDF中IDF指的是（）
A:词频
B:词在文档中出现的次数
C:逆文档概率
D:词在文档集中出现的概率
E:词在文档集中出现的概率
正确答案问询微信：424329

Spark Streaming能够和（）无缝集成
A:Hadoop
B:Spark SQL
C:Mllib
D:GraphX
正确答案问询微信：424329

RDD是一个（）的数据结构
A:可读写
B:只读的
C:容错的
D:可进行并行操作的
正确答案问询微信：424329

Spark DataFrame中（）方法可以返回一个Array对象
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案问询微信：424329

以下算法中属于监督学习算法的是（）
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案问询微信：424329

Scala函数支持（）
A:递归函数
B:高阶函数
C:柯里化
D:匿名函数
正确答案问询微信：424329

MLlib中进行数据标准化的方式有（）
A:Normalizer
B:Standard
C:StandardScaleer
D:MinMaxScaler
正确答案问询微信：424329

Spark Core包含的功能有（）
A:任务调度
B:内存管理
C:SQL查询
D:容错机制
正确答案问询微信：424329

Scala中使用（）方法来查看两个集合的交集元素
A:对
B:错
正确答案问询微信：424329

Scala中默认情况下使用的是可变的Map
A:对
B:错
正确答案问询微信：424329

提供优质的教育资源