南开大学23年秋学期《大数据开发技术(二)》在线作业二
奥鹏南开大学23年秋季新学期作业参考
23秋学期(仅限-高起专1909、专升本1909)《大数据开发技术(二)》在线作业-00002
GraphX中()方法可以查询边信息
A:numVertices
B:numEdges
C:vertices
D:edges
正确答案问询微信:424329
以下哪个不是Scala的数据类型()
A:AnyRef
B:Anything
C:NULL
D:Nothing
正确答案问询微信:424329
在图结构中,每个元素都可以有()前驱
A:至少一个
B:零个或多个
C:一个
D:零个
正确答案问询微信:424329
Scala函数组合器可以通过一个函数重新计算列表中所有元素,但是没有返回值的方法是()
A:map
B:foreac奥鹏南开大学23年秋季新学期作业参考h
C:flatten
D:flatmap
正确答案问询微信:424329
以下哪个函数可以求两个RDD差集 ()
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信:424329
spark-submit配置项中()表示Driver程序使用的内存大小
A:–driver-memory MEM
B:–executor-memory MEM
C:–total-executor-cores NUM
D:–executor-coures NUM
正确答案问询微信:424329
Spark GraphX中类Graph的collectNeighborIds(edgeDirection: EdgeDirection)方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案问询微信:424329
()是Spark的核心,提供底层框架及核心支持
A:Spark Core
B:Spark SQL
C:Spark Streaming
D:Mllib
正确答案问询微信:424329
一般情况下,对于迭代次数较多的应用程序,Spark程序在内存中的运行速度是Hadoop MapReduce运行速度的()多倍
A:2
B:10
C:100
D:1000
正确答案问询微信:424329
GraphX中()方法可以查询度数
A:degrees
B:degree
C:vertices
D:edges
正确答案问询微信:424329
请问RDD的()操作把RDD 所有元素转换成数组并返回到Driver 端
A:join
B:zip
C:combineByKey
D:collect
正确答案问询微信:424329
Spark GraphX中类Graph的groupEdges方法可以()
A:反转图中所有边的方向
B:按照设定条件取出子图
C:取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D:合并边相同的属性
正确答案问询微信:424329
spark-submit配置项中()表示executor使用的总核数
A:–num-executors NUM
B:–executor-memory MEM
C:–total-executor-cores NUM
D:–executor-coures NUM
正确答案问询微信:424329
GraphX中()是存放着Edg对象的RDD
A:RDD[Edge]
B:EdgeRDD
C:RDD[(VertexId,VD)]
D:VertexRDD
正确答案问询微信:424329
Mllib中metrics.roc
表示()指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信:424329
图的结构通常表示为:G(V,E),其中,E是图G中()
A:顶点
B:顶点的集合
C:边
D:边的集合
正确答案问询微信:424329
Dstream输出操作中()方法在Driver中打印出DStream中数据的前12个元素。
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案问询微信:424329
Spark GraphX中类Graph的reverse方法可以()
A:反转图中所有边的方向
B:按照设定条件取出子图
C:取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D:合并边相同的属性
正确答案问询微信:424329
如果numPartitions是分区个数,那么Spark每个RDD的分区ID范围是()
A:[0,numPartitions]
B:[0,numPartitions-1]
C:[1,numPartitions-1]
D:[1,numPartitions]
正确答案问询微信:424329
Scala中如果函数无返回值,则函数返回类型为()
A:NULL
B:Void
C:Nothing
D:Unit
正确答案问询微信:424329
Dstream输出操作中()方法在Driver中打印出DStream中数据的前10个元素。
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案问询微信:424329
Spark Streming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。
A:transform
B:reduce
C:join
D:cogroup
正确答案问询微信:424329
Mllib中线性会馆算法中的参数intercept表示()
A:要运行的迭代次数
B:梯度下降的步长
C:是否给数据加干扰特征或者偏差特征
D:Lasso 和ridge 的正规化参数
正确答案问询微信:424329
Dstream输出操作中()方法将DStream中的内容以文本的形式保存为文本文件
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案问询微信:424329
Dstream窗口操作中()方法基于滑动窗口对(K,V)键值对类型的DStream中的值按K使用聚合函数func进行聚合操作,得到一个新的Dstream
A:window
B:countByWindow
C:reduceByWindow
D:reduceByKeyAndWindow
正确答案问询微信:424329
MLBase包括()
A:Mllib
B:MLI
C:SparkR
D:GraphX
正确答案问询微信:424329
Scala函数支持()
A:递归函数
B:高阶函数
C:柯里化
D:匿名函数
正确答案问询微信:424329
Spark DataFrame中()方法可以返回一个List
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案问询微信:424329
以下算法中属于监督学习算法的是()
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案问询微信:424329
以下哪个方法可以从集合中创建RDD()
A:parallelize
B:makeRDD
C:textFile
D:loadFile
正确答案问询微信:424329
Spark DataFrame中()方法可以获取若干行数据
A:first
B:head
C:take
D:collect
正确答案问询微信:424329
Scala系统支持()作为对象成员
A:通用类
B:内部类
C:抽象类
D:复合类
正确答案问询微信:424329
以下哪个方法可以创建RDD()
A:parallelize
B:makeRDD
C:textFile
D:loadFile
正确答案问询微信:424329
GraphX中Edge边对象存有()字段
A:srcId
B:dstId
C:attr
D:val
正确答案问询微信:424329
Spark创建DataFrame对象方式有()
A:结构化数据文件
B:外部数据库
C:RDD
D:Hive中的表
正确答案问询微信:424329
Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
A:对
B:错
正确答案问询微信:424329
图(Graph)是一种复杂的非线性结构
A:对
B:错
正确答案问询微信:424329
Scala中集合连接时如果元素有重复的就会移除重复的元素
A:对
B:错
正确答案问询微信:424329
RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。
A:对
B:错
正确答案问询微信:424329
Scala中高阶函数可以产生新的函数,并将新的函数作为返回值。
A:对
B:错
正确答案问询微信:424329
Scala中元组是是一种可迭代的键值对(key/value)结构。
A:对
B:错
正确答案问询微信:424329
Scala中数组的第一个元素索引为1
A:对
B:错
正确答案问询微信:424329
MLlib中Normalizer是一个转换器,它可以将多行向量输入转化为统一的形式。
A:对
B:错
正确答案问询微信:424329
Spark是Apache基金会的顶级项目
A:对
B:错
正确答案问询微信:424329
PairRDD中groupBy(func)func返回key,传入的RDD的各个元素根据这个key进行分组。
A:对
B:错
正确答案问询微信:424329
RDD中的collect 函数是一个行动操作,把RDD 所有元素转换成数组并返回到Driver 端,适用于大数据处理后的返回。
A:对
B:错
正确答案问询微信:424329
Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
A:对
B:错
正确答案问询微信:424329
Scala中创建一个方法时经常用void表示该方法无返回值
A:对
B:错
正确答案问询微信:424329
Scala其函数不能当成值来使用
A:对
B:错
正确答案问询微信:424329
Scala 配备了一种表现型的系统,它以动态的方式进行抽象,以安全和连贯的方式进行使用。
A:对
B:错
正确答案问询微信:424329