南开大学23年春《大数据开发技术(二)》在线作业一

奥鹏南开大学新学期作业参考

23春学期(仅限-高起专1903、专升本1903)《大数据开发技术(二)》在线作业-00001

GraphX中()方法可以查询顶点信息
A:numVertices
B:numEdges
C:vertices
D:edges
正确答案问询微信:424329

以下哪个函数可以对RDD进行去重()
A:sortBy
B:filter
C:distinct
D:intersection
正确答案问询微信:424329

请问RDD的()操作用于将相同键的数据聚合
A:join
B:zip
C:combineByKey
D:collect
正确答案问询微信:424329

Spark中DataFrame的()方法是进行条件查询
A:where
B:join
C:limit
D:apply
正确答案问询微信:424329

PairRDD可以通过()获得仅包含键的RDD
A:key
B:keys
C:value
D:values
正确答案问询微信:424329

请问RDD的()操作是将两个RDD组合成Key/Value形式的RDD
A:join
B:zip
C:combineByKey
D:collect
正确答案问询微信:424329

Scala函数组合器可以通过一个函数重新计算列表中所有元素,并且返回一个相同数目元素的新列表的方法是()
A:map
B:foreach
C:flatten
D:flatmap
正确答案问询微信:424329

图结构中如果任意两个顶点之间都存在有向边,那么称之为()
A:完全图
B:有向完全图
C:无向图
D:简单图
正确答案问询微信:424329

Mllib中metrics.precisionByThreshold表示()指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信:424329

图的结构通常表示为:G(V,E),其中,V是图G中()
A:顶点
B:顶点的集合
C:边
D:边的集合
正确答案问询微信:424329

()可以解决图计算问题
A:Spark Core
B:BlinkDB
C:GraphX
D:Mllib
正确答案问询微信:424329

GraphX中()方法可以释放边缓存
A:cache
B:presist
C:unpersistVertices
D:edges.unpersist
正确答案问询微信:424329

Dstream窗口操作中()方法返回基于滑动窗口的DStream中的元素的数量
A:window
B:countByWindow
C:reduceByWindow
D:reduceByKeyAndWindow
正确答案问询微信:424329

以下哪个方法可以从外部存储中创建RDD()
A:parallelize
B:makeRDD
C:textFile
D:loadFile
正确答案问询微信:424329

Scala中哪个函数可以创建区间数组()
A:concat
B:ofDim
C:fill
D:range
正确答案问询微信:424329

Scala中如果函数中的每个参数在函数中最多只出现一次,则可以使用占位符()代替参数。
A:井号
B:下划线
C:斜杠
D:逗号
正确答案问询微信:424329

Spark GraphX中类Graph的joinVertices方法可以()
A:收集邻居顶点的顶点Id和顶点属性
B:收集邻居顶点的顶点Id
C:向指定顶点发送信息并聚合信息
D:将顶点信息更新到图中
正确答案问询微信:424329

以下哪个函数可以对两个RDD进行合并()
A:union
B:substract
C:intersection
D:cartesian
正确答案问询微信:424329

Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
A:filter
B:foreach
C:map
D:mkString
正确答案问询微信:424329

图的结构通常表示为:G(V,E),其中,G表示()
A:图
B:子图
C:顶点
D:边
正确答案问询微信:424329

Mllib中metrics.recallByThreshold
表示()指标
A:准确度
B:召回率
C:F值
D:ROC曲线
正确答案问询微信:424329

Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
A:window
B:countByWindow
C:reduceByWindow
D:reduceByKeyAndWindow
正确答案问询微信:424329

以下哪个不是Scala的数据类型()
A:Int
B:Short Int
C:Long
D:Any
正确答案问询微信:424329

PairRDD中()函数可以对具有相同键的值进行分组
A:mapValues
B:groupBy
C:groupByKey
D:reduceByKey
正确答案问询微信:424329

GraphX中EdgeRDD继承自()
A:EdgeRDD
B:RDD[Edge]
C:VertexRDD[VD]
D:RDD[(VertexId,VD)]
正确答案问询微信:424329

Spark DataFrame中()方法可以获取若干行数据
A:first
B:head
C:take
D:collect
正确答案问询微信:424329

Spark Core包含的功能有()
A:任务调度
B:内存管理
C:SQL查询
D:容错机制
正确答案问询微信:424329

Spark DataFrame中()方法可以返回一个List
A:collect
B:take
C:takeAsList
D:collectAsList
正确答案问询微信:424329

以下算法中属于监督学习算法的是()
A:KNN算法
B:逻辑回归
C:随机森林
D:Kmeans
正确答案问询微信:424329

Spark中的RDD的说法正确的是()
A:弹性分布式数据集
B:是Spark中最基本的数据抽象
C:代表一个可变的集合
D:代表的集合里面的元素可并行计算
正确答案问询微信:424329

MLBase包括()
A:Mllib
B:MLI
C:SparkR
D:GraphX
正确答案问询微信:424329

Spark包含的高级工具有()
A:Spark SQL
B:Mllib
C:GraphX
D:park Streaming
正确答案问询微信:424329

Scala支持()
A:匿名函数
B:高阶函数
C:函数嵌套
D:柯里化
正确答案问询微信:424329

以下哪个是Scala的数据类型()
A:Any
B:NULL
C:Nothing
D:AnyRef
正确答案问询微信:424329

以下哪个方法可以实现Spark SQL对数据的查询()
A:SqlContext
B:MySQLContext
C:HiveContext
D:context
正确答案问询微信:424329

Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
A:对
B:错
正确答案问询微信:424329

Scala列表中last返回一个列表,包含除了第一个元素之外的其他元素
A:对
B:错
正确答案问询微信:424329

Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括面向对象编程的特性。
A:对
B:错
正确答案问询微信:424329

Scala中Map的isEmpty函数在Map为空时返回false
A:对
B:错
正确答案问询微信:424329

MLlib由一些通用的学习算法和工具组成,包括分类、回归、聚类、协同过滤、降维等,同时还包括底层的优化原语和高层的管道API。
A:对
B:错
正确答案问询微信:424329

RDD中join操作最后只返回两个RDD 都存在的键的连接结果。
A:对
B:错
正确答案问询微信:424329

RDD的filter过滤会将返回值为true的过滤掉
A:对
B:错
正确答案问询微信:424329

Scala在子类中重写超类的抽象方法时,需要使用override关键字
A:对
B:错
正确答案问询微信:424329

Spark Streming中对DStream的任何操作都会转化成对底层RDDs的操作
A:对
B:错
正确答案问询微信:424329

RDD中join操作根据键对两个RDD进行内连接,将两个RDD 中键相同的数据的值相加。
A:对
B:错
正确答案问询微信:424329

Scala中数组的第一个元素索引为1
A:对
B:错
正确答案问询微信:424329

Scala中创建一个方法时经常用void表示该方法无返回值
A:对
B:错
正确答案问询微信:424329

如果其中有一个节点因为某种原因出现故障时, Spark 需要用到缓存数据时奥鹏南开大学新学期作业参考 代做2元一门不会重算丢失的分区,因此不需要计算所有的分区。
A:对
B:错
正确答案问询微信:424329

Scala中Map的isEmpty函数在Map为空时返回true
A:对
B:错
正确答案问询微信:424329

Spark SQL仅仅包括基本的SQL语法
A:对
B:错
正确答案问询微信:424329

提供优质的教育资源

公众号: 超前自学网