南开大学23年春学期《大数据开发技术(二)》在线作业二
奥鹏南开大学新学期作业参考
23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(二)》在线作业-00002
以下哪个函数可以求两个RDD的笛卡尔积()
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信:424329
()是AMPLab发布的一个R开发包,使得R摆脱单机运行的命运,可以作为奥鹏南开大学新学期作业参考 代做2元一门Spark的Job运行在集群上
A:SparkR
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信:424329
RDD的()操作通常用来划分单词
A:filter
B:union
C:flatmap
D:mapPartitions
正确答案问询微信:424329
以下哪个不是Scala的数据类型()
A:AnyRef
B:Anything
C:NULL
D:Nothing
正确答案问询微信:424329
Spark GraphX中类Graph的reverse方法可以()
A:反转图中所有边的方向
B:按照设定条件取出子图
C:取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D:合并边相同的属性
正确答案问询微信:424329
图结构中如果任意两个顶点之间都存在边,那么称之为()
A:完全图
B:有向完全图
C:无向图
D:简单图
正确答案问询微信:424329
Spark中DataFrame的()方法是进行条件查询
A:where
B:join
C:limit
D:apply
正确答案问询微信:424329
Scala中()方法返回一个列表,包含除了最后一个元素之外的其他元素
A:head
B:init
C:tail
D:last
正确答案问询微信:424329
var a=10;
for(a-1 until 20){
println(a);
}
共循环了()次
A:10
B:11
C:20
D:19
正确答案问询微信:424329
以下哪个函数可以求两个RDD差集 ()
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信:424329
以下哪个函数可以对两个RDD进行合并()
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信:424329
Graph类中如果要根据边数据创建图,边数据需要加载为二元组,可以选择是否对边分区,应该用()方法
A:Graph(vertices,edges, defaultVertexAttr)
B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D:GraphLoader.edgeListFile(sc,filename)
正确答案问询微信:424329
Scala中()方法返回Map所有的value
A:key
B:keys
C:value
D:values
正确答案问询微信:424329
GraphX中graph.vertices可以得到()
A:顶点视图
B:边视图
C:顶点与边的三元组整体视图
D:有向图
正确答案问询微信:424329
GraphX中()是完整提供边的各种操作类
A:RDD[Edge]
B:EdgeRDD
C:RDD[(VertexId,VD)]
D:VertexRDD
正确答案问询微信:424329
GraphX中()是存放着存放顶点的RDD
A:RDD[Edge]
B:EdgeRDD
C:RDD[(VertexId,VD)]
D:VertexRDD
正确答案问询微信:424329
Spark GraphX中类Graph的collectNeighbors(edgeDirection: EdgeDirection)方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案问询微信:424329
在MLlib中,逻辑回归算法的输入值为()类型
A:Double
B:LabledPoint
C:Point
D:SGB
正确答案问询微信:424329
Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法
A:Graph(vertices,edges, defaultVertexAttr)
B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D:GraphLoader.edgeListFile(sc,filename)
正确答案问询微信:424329
()是Spark的数据挖掘算法库
A:Spark Core
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信:424329
Spark Streming中()函数可以使用func将源DStream中的每个元素进行聚合操作,返回一个内部所包含的RDD只有一个元素的新DStream
A:union
B:reduce
C:join
D:cogroup
正确答案问询微信:424329
Scala函数组合器可以通过一个函数重新计算列表中所有元素,并且返回一个相同数目元素的新列表的方法是()
A:map
B:foreach
C:flatten
D:flatmap
正确答案问询微信:424329
Mllib中线性会馆算法中的参数numIterations表示()
A:要运行的迭代次数
B:梯度下降的步长
C:是否给数据加干扰特征或者偏差特征
D:Lasso 和ridge 的正规化参数
正确答案问询微信:424329
Scala列表方法中获取列表的第一个元素的方法是()
A:drop
B:head
C:filter
D:init
正确答案问询微信:424329
Spark Streming中()函数可以对源DStream的每个元素通过函数func返回一个新的DStream
A:map
B:flatMap
C:filter
D:union
正确答案问询微信:424329
以下是机器学习的常用算法的是()
A:回归算法
B:聚类算法
C:降维算法
D:分类算法
正确答案问询微信:424329
TF-IDF中IDF指的是()
A:词频
B:词在文档中出现的次数
C:逆文档概率
D:词在文档集中出现的概率
E:词在文档集中出现的概率
正确答案问询微信:424329
Spark Streaming能够和()无缝集成
A:Hadoop
B:Spark SQL
C:Mllib
D:GraphX
正确答案问询微信:424329
RDD是一个()的数据结构
A:可读写
B:只读的
C:容错的
D:可进行并行操作的
正确答案问询微信:424329
Spark DataFrame中()方法可以返回一个Array对象
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案问询微信:424329
以下算法中属于监督学习算法的是()
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案问询微信:424329
Scala函数支持()
A:递归函数
B:高阶函数
C:柯里化
D:匿名函数
正确答案问询微信:424329
MLlib中进行数据标准化的方式有()
A:Normalizer
B:Standard
C:StandardScaleer
D:MinMaxScaler
正确答案问询微信:424329
Spark Core包含的功能有()
A:任务调度
B:内存管理
C:SQL查询
D:容错机制
正确答案问询微信:424329
Scala中使用()方法来查看两个集合的交集元素
A:对
B:错
正确答案问询微信:424329
Scala中默认情况下使用的是可变的Map
A:对
B:错
正确答案问询微信:424329