南开大学23年春学期《大数据开发技术（二）》在线作业三

奥鹏南开大学新学期作业参考

23春学期（高起本：1709-2103、专升本/高起专：1903-2103）《大数据开发技术（二）》在线作业-00003

Spark GraphX中类Graph的mask方法可以（）
A:反转图中所有边的方向
B:按照设定条件取出子图
C:取两个图的公共顶点和边作为新图，并保持前一个图顶点与边的属性
D:合并边相同的属性
正确答案问询微信：424329

Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
A:第一个
B:所有
C:前10个
D:前100个
正确答案问询微信：424329

Graph类中如果根据边数据创建图，数据需要转换成RDD[Edge[ED]类型，应该用（）方法
A:Graph(vertices,edges, defaultVertexAttr)
B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D:GraphLoader.edgeListFile(sc,filename)
正确答案问询微信：424329

Mllib中metrics.recallByThreshold
表示（）指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信：424329

Scala列表方法中获取列表的第一个元素的方法是（）
A:drop
B:head
C:filter
D:init
正确答案问询微信：424329

（）可以解决图计算问题
A:Spark Core
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信：424329

Mllib中metrics.precisionByThreshold表示（）指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信：424329

spark-submit配置项中（）表示Driver程序使用的内存大小
A:–driver-memory MEM
B:–executor-memory MEM
C:–total-executor-cores NUM
D:–executor-coures NUM
正确答案问询微信：424329

Spark Streming中（）函数可以对源DStream的每个元素通过函数func被映射出0或者更多的输出元素
A:map
B:flatMap
C:filter
D:union
正确答案问询微信：424329

Dstream输出操作中（）方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案问询微信：424329

Scala中（）方法返回一个列表，包含除了第一个元素之外的其他元素
A:head
B:init
C:tail
D:last
正确答案问询微信：424329

Mllib中metrics.roc
表示（）指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信：424329

Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是（）
A:filter
B:foreach
C:map
D:mkString
正确答案问询微信：424329

Scala列表方法中通过给定的方法将所有元素重新计算的方法是（）
A:filter
B:foreach
C:map
D:mkString
正确答案问询微信：424329

Scala中哪个函数可以创建区间数组（）
A:concat
B:ofDim
C:fill
D:range
正确答案问询微信：424329

图的结构通常表示为：G(V,E)，其中，V是图G中()
A:顶点
B:顶点的集合
C:边
D:边的集合
正确答案问询微信：424329

PairRDD中（）函数可以合并具有相同键的值
A:mapValues
B:groupBy
C:groupByKey
D:reduceByKey
正确答案问询微信：424329

GraphX中（）方法可以查询边信息
A:numVertices
B:numEdges
C:vertices
D:edges
正确答案问询微信：424329

以下哪个函数可以对两个RDD进行合并（）
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信：424329

以下算法中属于聚类算法的是（）
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案问询微信：424329

Dstream窗口操作中（）方法基于滑动窗口对源DStream中的元素进行聚合操作，得到一个新的Dstream
A:window
B:countByWindow
C:reduceByWindow
D:reduceByKeyAndWindow
正确答案问询微信：424329

GraphX中（）方法可以释放顶点缓存
A:cache
B:presist
C:unpersistVertices
D:edges.unpersist
正确答案问询微信：424329

Spark Streming中（）函数当被调用的两个DStream分别含有(K, V) 和(K, W)键值对时,返回一个(K, Seq[V], Seq[W])类型的新的DStream。
A:union
B:reduce
C:join
D:cogroup
正确答案问询微信：424329

Scala列表方法中返回所有元素，除了最后一个的方法是（）
A:drop
B:head
C:filter
D:init
正确答案问询微信：424329

Scala中重写一个非抽象方法必须使用（）修饰符。
A:extends
B:override
C:extend
D:overrides
正确答案问询微信：424329

Spark SQL可以处理（）
A:RDD
B:Parquet文件
C:JSON文件
D:Hive表
正确答案问询微信：424329

Spark的RDD持久化操作有()方式
A:cache
B:presist
C:storage
D:long
正确答案问询微信：424329

Scala中使用（）方法来连接两个集合
A:append
B:++
C:concat
D:Set.++()
正确答案问询微信：424329

Spark DataFrame中（）方法可以返回一个List
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案问询微信：424329

Spark是一个（）计算框架
A:快速
B:分布式
C:可扩展
D:容错
正确答案问询微信：424329

Scala中可以用（）方法来连接两个或多个列表
A:::
B:#:::
C:List.:::()
D:List.concat()
正确答案问询微信：424329

Spark可以从（）分布式文件系统中读取数据
A:HDFS
B:Hbase
C:Hive
D:Tachyon
正确答案问询微信：424329

以下哪个是Scala的数据类型（）
A:Any
B:NULL
C:Nothing
D:AnyRef
正确答案问询微信：424329

Spark Streaming能够处理来自（）的数据
A:Kafka
B:Flume
C:Twitter
D:ZeroMQ
正确答案问询微信：424329

以下哪个方法可以实现Spark SQL对数据的查询（）
A:SqlContext
B:MySQLContext
C:HiveContext
D:context
正确答案问询微信：424329

Scala可以通过“val” 来定义变量，通过“var” 关键字来定义常量
A:对
B:错
正确答案问询微信：424329

RDD的map操作不会改变RDD的分区数目
A:对
B:错
正确答案问询微信：424329

Scala中++i和i++表示变量i自增1
A:对
B:错
正确答案问询微信：424329

Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括函数式编程的特性。
A:对
B:错
正确答案问询微信：424329

Scala函数组合器中foreach和map类似，有返回值
A:对
B:错
正确答案问询微信：424329

RDD的sortBy函数包含参数numPartitions，该参数决定排序后的RDD的分区个数，默认排序后的分区个数和排序之前的个数相等，即为this.partitions.size。
A:对
B:错
正确答案问询微信：424329

Spark在同一个应用中不能同时使用Spark SQL和Mllib
A:对
B:错
正确答案问询微信：424329

Scala可以通过“var” 来定义变量，通过“val” 关键字来定义常量
A:对
B:错
正确答案问询微信：424329

Spark是Apache基金会的顶级项奥鹏南开大学新学期作业参考代做2元一门目
A:对
B:错
正确答案问询微信：424329

Scala函数组合器中flatmap结合了map和flatten的功能，接收一个可以处理嵌套列表的函数，然后把返回结果连接起来
A:对
B:错
正确答案问询微信：424329

Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是要集成面向对象编程和函数式编程的各种特性。
A:对
B:错
正确答案问询微信：424329

Spark取代Hadoop仅仅是取代MapReduce这种计算框架，Spark可以取代HDFS吗
A:对
B:错
正确答案问询微信：424329

RDD的转换操作是用于触发转换操作的操作，这个时候才会真正开始进行计算。
A:对
B:错
正确答案问询微信：424329

图（Graph）是一种复杂的非线性结构
A:对
B:错
正确答案问询微信：424329

键值对RDD由一组组的键值对组成，这些RDD被称为PairRDD。
A:对
B:错
正确答案问询微信：424329

提供优质的教育资源