南开大学23年秋学期《大数据开发技术(二)》在线作业一
奥鹏南开大学23年秋季新学期作业参考
23秋学期(仅限-高起专1909、专升本1909)《大数据开发技术(二)》在线作业-00001
Scala中合并两个数组的方法是()
A:line
B:add
C:append
D:concat
正确答案问询微信:424329
MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练分类树
A:trainClassifier
B:trainRegressor
C:LogisticRegressionModel
D:LabeledPoint
正确答案问询微信:424329
GraphX中()是存放着Edg对象的RDD
A:RDD[Edge]
B:EdgeRDD
C:RDD[(VertexId,VD)]
D:VertexRDD
正确答案问询微信:424329
()可以解决图计算问题
A:Spark Core
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信:424329
Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案问询微信:424329
Scala 使用 () 关键字来继承一个类
A:extends
B:override
C:extend
D:overrides
正确答案问奥鹏南开大学23年秋季新学期作业参考询微信:424329
在图结构中,每个元素都可以有()前驱
A:至少一个
B:零个或多个
C:一个
D:零个
正确答案问询微信:424329
GraphX中()方法可以释放边缓存
A:cache
B:presist
C:unpersistVertices
D:edges.unpersist
正确答案问询微信:424329
RDD的()操作通常用来划分单词
A:filter
B:union
C:flatmap
D:mapPartitions
正确答案问询微信:424329
GraphX中()方法可以查询顶点个数
A:numVertices
B:numEdges
C:vertices
D:edges
正确答案问询微信:424329
GraphX中()是完整提供边的各种操作类
A:RDD[Edge]
B:EdgeRDD
C:RDD[(VertexId,VD)]
D:VertexRDD
正确答案问询微信:424329
如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()
A:[0,numPartitions]
B:[0,numPartitions-1]
C:[1,numPartitions-1]
D:[1,numPartitions]
正确答案问询微信:424329
Spark GraphX中类Graph的mapReduceTriplets方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案问询微信:424329
PairRDD中()函数可以对具有相同键的值进行分组
A:mapValues
B:groupBy
C:groupByKey
D:reduceByKey
正确答案问询微信:424329
PairRDD可以通过()获得仅包含键的RDD
A:key
B:keys
C:value
D:values
正确答案问询微信:424329
Mllib中线性会馆算法中的参数intercept表示()
A:要运行的迭代次数
B:梯度下降的步长
C:是否给数据加干扰特征或者偏差特征
D:Lasso 和ridge 的正规化参数
正确答案问询微信:424329
请问RDD的()操作是根据键对两个RDD进行内连接
A:join
B:zip
C:combineByKey
D:collect
正确答案问询微信:424329
Dstream输出操作中()方法将DStream中的内容以文本的形式保存为文本文件
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案问询微信:424329
下列Scala代码应输出():
var a=0;
var b=0
var sum=0;
for(a-1 until 3; b-1 until 3) {
sum+=a+b;
}
println(sum);
A:36
B:35
C:11
D:12
正确答案问询微信:424329
递归函数意味着函数可以调用它()
A:其他函数
B:主函数
C:子函数
D:自身
正确答案问询微信:424329
MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树
A:trainClassifier
B:trainRegressor
C:LogisticRegressionModel
D:LabeledPoint
正确答案问询微信:424329
Spark Streming中DStream的每个RDD都是由()分割开来的数据集
A:分区
B:一小段时间
C:数据量
D:随机
正确答案问询微信:424329
Spark GraphX中类Graph的collectNeighbors(edgeDirection: EdgeDirection)方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案问询微信:424329
图结构中如果任意两个顶点之间都存在边,那么称之为()
A:完全图
B:有向完全图
C:无向图
D:简单图
正确答案问询微信:424329
GraphX中graph.triplets可以得到()
A:顶点视图
B:边视图
C:顶点与边的三元组整体视图
D:有向图
正确答案问询微信:424329
Scala中使用()方法来查看两个集合的交集元素
A:Set.concat
B:Set.&
C:Set.&&
D:Set.intersect
正确答案问询微信:424329
TF-IDF中TF指的是()
A:词频
B:词在文档中出现的次数
C:逆文档概率
D:词在文档集中出现的概率
E:词在文档集中出现的概率
正确答案问询微信:424329
Spark Core包含的功能有()
A:任务调度
B:内存管理
C:SQL查询
D:容错机制
正确答案问询微信:424329
Spark SQL可以处理()
A:RDD
B:Parquet文件
C:JSON文件
D:Hive表
正确答案问询微信:424329
以下哪个方法可以创建RDD()
A:parallelize
B:makeRDD
C:textFile
D:loadFile
正确答案问询微信:424329
以下哪个方法可以从集合中创建RDD()
A:parallelize
B:makeRDD
C:textFile
D:loadFile
正确答案问询微信:424329
MapReudce不适合()任务
A:大数据计算
B:迭代
C:交互式
D:离线分析
正确答案问询微信:424329
Spark包含的高级工具有()
A:Spark SQL
B:Mllib
C:GraphX
D:park Streaming
正确答案问询微信:424329
Spark DataFrame中()方法可以返回一个List
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案问询微信:424329
Spark可以通过哪些外部存储创建RDD()
A:文本文件
B:目录
C:压缩文件
D:通配符匹配的文件
正确答案问询微信:424329
Scala中Map的isEmpty函数在Map为空时返回false
A:对
B:错
正确答案问询微信:424329
Dstream输出操作中foreachRDD的正确用法是使用rdd.foreachPartition方法创建一个单独的连接对象,然后使用该连接对象输出所有RDD分区中的数据到外部系统
A:对
B:错
正确答案问询微信:424329
DataFrame是一个分布式的Row对象的数据集合
A:对
B:错
正确答案问询微信:424329
RDD的map操作不会改变RDD的分区数目
A:对
B:错
正确答案问询微信:424329
Spark系统是根据一个针对键的函数对元素进行分区的,虽然不能控制每个键具体划分到哪个节点,但是可以控制相同的键落在同一个分区
A:对
B:错
正确答案问询微信:424329
Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗
A:对
B:错
正确答案问询微信:424329
Spark中DataFrame 的查询操作也是一个懒操作, 仅仅生成一个查询计划, 只有触发Action 操作才会进行计算并返回查询结果。
A:对
B:错
正确答案问询微信:424329
Spark SQL仅仅包括基本的SQL语法
A:对
B:错
正确答案问询微信:424329
PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。
A:对
B:错
正确答案问询微信:424329
Scala是一种纯面向对象的语言,每个值都是对象。
A:对
B:错
正确答案问询微信:424329
用户可以在Hadoop YARN上运行Spark
A:对
B:错
正确答案问询微信:424329
Scala中列表是可变的
A:对
B:错
正确答案问询微信:424329
Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。
A:对
B:错
正确答案问询微信:424329
RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。
A:对
B:错
正确答案问询微信:424329
RDD的转换操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
A:对
B:错
正确答案问询微信:424329