南开23春学期(高起本:1709-2103、专升本高起专:1903-2103)《大数据开发技术(二)》在线作业三
奥鹏南开大学新学期作业参考

南开大学23春学期(高起本:1709-2103、专升本/高起专:1903-2103)《大数据开发技术(二)》在线作业
1.Spark GraphX中类Graph的mask方法可以()
选项A:反转图中所有边的方向
选项B:按照设定条件取出子图
选项C:取两个图的公共顶点和边作为新图,并保持前一个图顶点与边的属性
选项D:合并边相同的属性
正确答案问询微信:424329
2.Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
选项A:第一个
选项B:所有
选项C:前10个
选项D:前100个
正确答案问询微信:424329
3.Graph类中如果根据边数据创建图,数据需要转换成RDD[Edge[ED]类型,应该用()方法
选项A:Graph(vertices,edges, defaultVertexAttr)
选项B:Graph.fromEdges(RDD[Edge[ED]], defaultValue)
选项C:Graph.fromEdgeTuples(rawEdges: RDD[(VertexId, VertexId)], defaultValue,)
选项D:GraphLoader.edgeListFile(sc,filename)
正确答案问询微信:424329
4.Mllib中metrics.recallByThreshold
表示()指标
选项A:准确度
选项B:召回率
选项C:F值
选项D:ROC曲线
正确答案问询微信:424329
5.Scala列表方法中获取列表的第一个元素的方法是()
选项A:drop
选项B:head
选项C:filter
选项D:init
正确答案问询微信:424329
6.()可以解决图计算问题
选项A:Spark Core
选项B:BlinkDB
选项C:GraphX
选项D:Mllib
正确答案问询微信:424329
7.Mllib中metrics.precisionByThreshold表示()指标
选项A:准确度
选项B:召回率
选项C:F值
选项D:ROC曲线
正确答案问询微信:424329
8.spark-submit配置项中()表示Driver程序使用的内存大小
选项A:–driver-memory MEM
选项B:–executor-memory MEM
选项C:–total-executor-cores NUM
选项D:–executor-coures NUM
正确答案问询微信:424329
9.Spark Streming中()函数可以对源DStream的每个元素通过函数func被映射出0或者更多的输出元素
选项A:map
选项B:flatMap
选项C:filter
选项D:union
正确答案问询微信:424329
10.Dstream输出操作中()方法将DStream中的内容按对象序列化并且以SequenceFile的格式保存
选项A:print
选项B:saveAsTextFiles
选项C:saveAsObjectFiles
选项D:saveAsHadoopFiles
正确答案问询微信:424329
11.Scala中()方法返回一个列表,包含除了第一个元素之外的其他元素
选项A:head
选项B:init
选项C:tail
选项D:last
正确答案问询微信:424329
12.Mllib中metrics.roc
表示()指标
选项A:准确度
选项B:召回率
选项C:F值
选项D:ROC曲线
正确答案问询微信:424329
13.Scala列表方法中使用分隔符将列表所有元素作为字符串显示的方法是()
选项A:filter
选项B:foreach
选项C:map
选项D:mkString
正确答案问询微信:424329
14.Scala列表方法中通过给定的方法将所有元素重新计算的方法是()
选项A:filter
选项B:foreach
选项C:map
选项D:mkString
正确答案问询微信:424329
15.Scala中哪个函数可以创建区间数组()
选项A:concat
选项B:ofDim
选项C:fill
选项D:range
正确答案问询微信:424329
16.图的结构通常表示为:G(V,E),其中,V是图G中()
选项A:顶点
选项B:顶点的集合
选项C:边
选项D:边的集合
正确答案问询微信:424329
17.PairRDD中()函数可以合并具有相同键的值
选项A:mapValues
选项B:groupBy
选项C:groupByKey
选项D:reduceByKey
正确答案问询微信:424329
18.GraphX中()方法可以查询边信息
选项A:numVertices
选项B:numEdges
选项C:vertices
选项D:edges
正确答案问询微信:424329
19.以下哪个函数可以对两个RDD进行合并()
选项A:union
选项B:substract
选项C:intersection
选项D:cartesian
正确答案问询微信:424329
20.以下算法中属于聚类算法的是()
选项A:KNN算法
选项B:逻辑回归
选项C:随机森林
选项D:Kmeans
正确答案问询微信:424329
21.Dstream窗口操作中()方法基于滑动窗口对源DStream中的元素进行聚合操作,得到一个新的Dstream
选项A:window
选项B:countByWindow
选项C:reduceByWindow
选项D:reduceByKeyAndWindow
正确答案问询微信:424329
22.GraphX中()方法可以释放顶点缓存
选项A:cache
选项B:presist
选项C:unpersistVertices
选项D:edges.unpersist
正确答案问询微信:424329
23.Spark Streming中()函数当被调用的两个DStream分别含有(K, V) 和(K, W)键值对时,返回一个(K, Seq[V], Seq[W])类型的新的DStream。
选项A:union
选项B:reduce
选项C:join
选项D:cogroup
正确答案问询微信:424329
24.Scala列表方法中返回所有元素,除了最后一个的方法是()
选项A:drop
选项B:head
选项C:filter
选项D:init
正确答案问询微信:424329
25.Scala中重写一个非抽象方法必须使用()修饰符。
选项A:extends
选项B:override
选项C:extend
选项D:overrides
正确答案问询微信:424329
26.Spark SQL可以处理()
选项A:RDD
选项B:Parquet文件
选项C:JSON文件
选项D:Hive表
正确答案问询微信:424329
27.Spark的RDD持久化操作有()方式
选项A:cache
选项B:presist
选项C:storage
选项D:long
正确答案问询微信:424329
28.Scala中使用() 方法来连接两个集合
选项A:append
选项B:++
选项C:concat
选项D:Set.++()
正确答案问询微信:424329
29.Spark DataFrame中()方法可以返回一个List
选项A:collect
选项B:take
选项C:takeAsList
选项D:collectAsList
正确答案问询微信:424329
30.Spark是一个()计算框架
选项A:快速
选项B:分布式
选项C:可扩展
选项D:容错
正确答案问询微信:424329
31.Scala中可以用()方法来连接两个或多个列表
选项A:::
选项B:#:::
选项C:List.:::()
选项D:List.concat()
正确答案问询微信:424329
32.Spark可以从()分布式文件系统中读取数据
选项A:HDFS
选项B:Hbase
选项C:Hive
选项D:Tachyon
正确答案问询微信:424329
33.以下哪个是Scala的数据类型()
选项A:Any
选项B:NULL
选项C:Nothing
选项D:AnyRef
正确答案问询微信:424329
34.Spark Streaming能够处理来自()的数据
选项A:Kafka
选项B:Flume
选项C:Twitter
选项D:ZeroMQ
正确答案问询微信:424329
35.以下哪个方法可以实现Spark SQL对数据的查询()
选项A:SqlContext
选项B:MySQLContext
选项C:HiveContext
选项D:context
正确答案问询微信:424329
36.Scala可以通过“val” 来定义变量,通过“var” 关键字来定义常量
选项A:对
选项B:错
正确答案问询微信:424329
37.RDD的map操作不会改变RDD的分区数目
选项A:对
选项B:错
正确答案问询微信:424329
38.Scala中++i和i++表示变量i自增1
选项A:对
选项B:错
正确答案问询微信:424329
39.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括函数式编程的特性。
选项A:对
选项B:错
正确答案问询微信:424329
40.Scala函数组合器中foreach和map类似,有返回值
选项A:对
选项B:错
正确答案问询微信:424329
41.RDD的sortBy函数包含参数numPartitions,该参数决定排序后的RDD的分区个数,默认排序后的分区个数和排序之前的个数相等,即为this.partitions.size。
选项A:对
选项B:错
正确答案问询微信:424329
42.Spark在同一个应用中不能同时使用Spark SQL和Mllib
选项A:对
选项B:错
正确答案问询微信:424329
43.Scala可以通过“var” 来定义变量,通过“val” 关键字来定义常量
选项A:对
选项B:错
正确答案问询微信:424329
44.Spark是Apache基金会的顶级项目
选项A:对
选项B:错
正确答案问询微信:424329
45.Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来
选项A:对
选项B:错
正确答案问询微信:424329
46.Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是要集成面向对象编程和函数式编程的各种特性。
选项A:对
选项B:错
正确答案问询微信:424329
47.Spark取代Hadoop仅仅是取代MapReduce这种计算框架,Spark可以取代HDFS吗
选项A:对
选项B:错
正确答案问询微信:424329
48.RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。
选项A:对
选项B:错
奥鹏南开大学新学期作业参考正确答案问询微信:424329
49.图(Graph)是一种复杂的非线性结构
选项A:对
选项B:错
正确答案问询微信:424329
50.键值对RDD由一组组的键值对组成,这些RDD被称为PairRDD。
选项A:对
选项B:错
正确答案问询微信:424329