南开大学23年春学期《大数据开发技术(二)》在线作业三

奥鹏南开大学新学期作业参考

23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(二)》在线作业-00003

Spark GraphX中类Graph的mask方法可以()
A:反转图中所有边的方向
B:按照设定条件取出子图
C:取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
D:合并边相同的属性
正确答案问询微信:424329

Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
A:第一个
B:所有
C:前10个
D:前100个
正确答案问询微信:424329

Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法
A:Graph(vertices,edges, defaultVertexAttr)
B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
D:GraphLoader.edgeListFile(sc,filename)
正确答案问询微信:424329

Mllib中metrics.recallByThreshold
表示()指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信:424329

Scala列表方法中获取列表的第一个元素的方法是()
A:drop
B:head
C:filter
D:init
正确答案问询微信:424329

()可以解决图计算问题
A:Spark Core
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信:424329

Mllib中metrics.precisionByThreshold表示()指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信:424329

spark-submit配置项中()表示Driver程序使用的内存大小
A:–driver-memory MEM
B:–executor-memory MEM
C:–total-executor-cores NUM
D:–executor-coures NUM
正确答案问询微信:424329

Spark Streming中()函数可以对源DStream的每个元素通过函数func被映射出0或者更多的输出元素
A:map
B:flatMap
C:filter
D:union
正确答案问询微信:424329

Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存
A:print
B:saveAsTextFiles
C:saveAsObjectFiles
D:saveAsHadoopFiles
正确答案问询微信:424329

Scala中()方法返回一个列表,包含除了第一个元素之外的其他元素
A:head
B:init
C:tail
D:last
正确答案问询微信:424329

Mllib中metrics.roc
表示()指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信:424329

Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
A:filter
B:foreach
C:map
D:mkString
正确答案问询微信:424329

Scala列表方法中通过给定的方法将所有元素重新计算的方法是()
A:filter
B:foreach
C:map
D:mkString
正确答案问询微信:424329

Scala中哪个函数可以创建区间数组()
A:concat
B:ofDim
C:fill
D:range
正确答案问询微信:424329

图的结构通常表示为:G(V,E),其中,V是图G中()
A:顶点
B:顶点的集合
C:边
D:边的集合
正确答案问询微信:424329

PairRDD中()函数可以合并具有相同键的值
A:mapValues
B:groupBy
C:groupByKey
D:reduceByKey
正确答案问询微信:424329

GraphX中()方法可以查询边信息
A:numVertices
B:numEdges
C:vertices
D:edges
正确答案问询微信:424329

以下哪个函数可以对两个RDD进行合并()
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信:424329

以下算法中属于聚类算法的是()
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案问询微信:424329

Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
A:window
B:countByWindow
C:reduceByWindow
D:reduceByKeyAndWindow
正确答案问询微信:424329

GraphX中()方法可以释放顶点缓存
A:cache
B:presist
C:unpersistVertices
D:edges.unpersist
正确答案问询微信:424329

Spark Streming中()函数当被调用的两个DStream分别含有(K, V) 和(K, W)键值对时,返回一个(K, Seq[V], Seq[W])类型的新的DStream。
A:union
B:reduce
C:join
D:cogroup
正确答案问询微信:424329

Scala列表方法中返回所有元素,除了最后一个的方法是()
A:drop
B:head
C:filter
D:init
正确答案问询微信:424329

Scala中重写一个非抽象方法必须使用()修饰符。
A:extends
B:override
C:extend
D:overrides
正确答案问询微信:424329

Spark SQL可以处理()
A:RDD
B:Parquet文件
C:JSON文件
D:Hive表
正确答案问询微信:424329

Spark的RDD持久化操作有()方式
A:cache
B:presist
C:storage
D:long
正确答案问询微信:424329

Scala中使用() 方法来连接两个集合
A:append
B:++
C:concat
D:Set.++()
正确答案问询微信:424329

Spark DataFrame中()方法可以返回一个List
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案问询微信:424329

Spark是一个()计算框架
A:快速
B:分布式
C:可扩展
D:容错
正确答案问询微信:424329

Scala中可以用()方法来连接两个或多个列表
A:::
B:#:::
C:List.:::()
D:List.concat()
正确答案问询微信:424329

Spark可以从()分布式文件系统中读取数据
A:HDFS
B:Hbase
C:Hive
D:Tachyon
正确答案问询微信:424329

以下哪个是Scala的数据类型()
A:Any
B:NULL
C:Nothing
D:AnyRef
正确答案问询微信:424329

Spark Streaming能够处理来自()的数据
A:Kafka
B:Flume
C:Twitter
D:ZeroMQ
正确答案问询微信:424329

以下哪个方法可以实现Spark SQL对数据的查询()
A:SqlContext
B:MySQLContext
C:HiveContext
D:context
正确答案问询微信:424329

Scala可以通过“val” 来定义变量,通过“var” 关键字来定义常量
A:对
B:错
正确答案问询微信:424329

RDD的map操作不会改变RDD的分区数目
A:对
B:错
正确答案问询微信:424329

Scala中++i和i++表示变量i自增1
A:对
B:错
正确答案问询微信:424329

Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括函数式编程的特性。
A:对
B:错
正确答案问询微信:424329

Scala函数组合器中foreach和map类似,有返回值
A:对
B:错
正确答案问询微信:424329

RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。
A:对
B:错
正确答案问询微信:424329

Spark在同一个应用中不能同时使用Spark SQL和Mllib
A:对
B:错
正确答案问询微信:424329

Scala可以通过“var” 来定义变量,通过“val” 关键字来定义常量
A:对
B:错
正确答案问询微信:424329

Spark是Apache基金会的顶级项奥鹏南开大学新学期作业参考 代做2元一门目
A:对
B:错
正确答案问询微信:424329

Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来
A:对
B:错
正确答案问询微信:424329

Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
A:对
B:错
正确答案问询微信:424329

Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗
A:对
B:错
正确答案问询微信:424329

RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。
A:对
B:错
正确答案问询微信:424329

图(Graph)是一种复杂的非线性结构
A:对
B:错
正确答案问询微信:424329

键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网