南开21秋学期《大数据开发技术（二）》在线作业答案

(单选题)1: GraphX中（）方法可以缓存整个图，并指定存储级别
A: cache
B: presist
C: unpersistVertices
D: edges.unpersist

(单选题)2: var a=10; for(a<-1 until 20){ println(a); } 共循环了（）次
A: 10
B: 11
C: 20
D: 19

(单选题)3: MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法（）训练回归树
A: trainClassifier
B: trainRegressor
C: LogisticRegressionModel
D: LabeledPoint

(单选题)4: 图的结构通常表示为：G(V,E)，其中，V是图G中()
A: 顶点
B: 顶点的集合
C: 边
D: 边的集合

(单选题)5: Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
A: 第一个
B: 所有
C: 前10个
D: 前100个

(单选题)6: Spark Streming中（）函数可以对统计DStream中每个RDD包含的元素的个数，得到一个新的DStream
A: count
B: union
C: length
D: reduce

(单选题)7: 以下哪个函数可以对两个RDD进行合并（）
A: union
B: substract
C: intersection
D: cartesian

(单选题)8: Spark中DataFrame的（）方法是进行排序查询
A: order by
B: group by
C: select by
D: sort by

(单选题)9: 图结构中如果任意两个顶点之间都存在边，那么称之为（）
A: 完全图
B: 有向完全图
C: 无向图
D: 简单图

(单选题)10: Mllib中线性会馆算法中的参数numIterations表示（）
A: 要运行的迭代次数
B: 梯度下降的步长
C: 是否给数据加干扰特征或者偏差特征
D: Lasso 和ridge 的正规化参数

(单选题)11: GraphX中VertexRDD[VD]继承自（）
A: EdgeRDD
B: RDD[Edge]
C: VertexRDD[VD]
D: RDD[(VertexId，VD)]

(单选题)12: GraphX中（）是完整提供边的各种操作类
A: RDD[Edge]
B: EdgeRDD
C: RDD[(VertexId,VD)]
D: VertexRDD

(单选题)13: Scala元组的值是通过将单个的值包含在（）中构成的
A: 小括号
B: 中括号
C: 大括号
D: 尖括号

(单选题)14: 下列Scala代码应输出（）： var a=0; var b=0 var sum=0; for(a<-1 until 3; b<-1 until 3) { sum+=a+b; } println(sum);
A: 36
B: 35
C: 11
D: 12

(单选题)15: Scala函数组合器可以通过一个函数重新计算列表中所有元素，但是没有返回值的方法是（）
A: map
B: foreach
C: flatten
D: flatmap

(单选题)16: PairRDD的（）方法，可以把两个RDD中键相同的元素组合在一起，合并为一个RDD。
A: join
B: union
C: substract
D: intersection

(单选题)17: PairRDD可以通过（）获得仅包含值的RDD
A: key
B: keys
C: value
D: values

(单选题)18: Spark Streming中（）函数可以对源DStream中的每一个元素应用func方法进行计算，如果func函数返回结果为true，则保留该元素，否则丢弃该元素，返回一个新的Dstream
A: map
B: flatMap
C: filter
D: union

(单选题)19: 请问RDD的（）操作是将两个RDD组合成Key/Value形式的RDD
A: join
B: zip
C: combineByKey
D: collect

(单选题)20: Mllib中metrics.precisionByThreshold表示（）指标
A: 准确度
B: 召回率
C: F值
D: ROC曲线

(单选题)21: Scala类通过子类化和基于灵活的混合类来进行扩展，作为##的一个可靠性解决方案
A: 多态
B: 虚函数
C: 派生
D: 多重继承

(单选题)22: PairRDD中（）函数可以对具有相同键的值进行分组
A: mapValues
B: groupBy
C: groupByKey
D: reduceByKey

(单选题)23: Spark Streming中（）函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream，这可以用来在DStream做任意RDD操作。
A: transform
B: reduce
C: join
D: cogroup

(单选题)24: Mllib中metrics.recallByThreshold 表示（）指标
A: 准确度
B: 召回率
C: F值
D: ROC曲线

(单选题)25: Scala通过（）来定义变量
A: val
B: val
C: define
D: def

(多选题)26: Spark支持使用（）语言编写应用
A: Scala
B: Python
C: Java
D: R

(多选题)27: 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区（）
A: resetpartition
B: repartiton
C: Partition
D: coalesce

(多选题)28: 以下算法中属于分类算法的是（）
A: KNN算法
B: 逻辑回归
C: 随机森林
D: Kmeans

(多选题)29: Spark是一个（）计算框架
A: 快速
B: 分布式
C: 可扩展
D: 容错

(多选题)30: 以下哪个方法可以创建RDD（）
A: parallelize
B: makeRDD
C: textFile
D: loadFile

(多选题)31: Spark Core包含的功能有（）
A: 任务调度
B: 内存管理
C: SQL查询
D: 容错机制

(多选题)32: MapReudce不适合（）任务
A: 大数据计算
B: 迭代
C: 交互式
D: 离线分析

(多选题)33: Spark支持的文件格式包括（）
A: 文本文件
B: JSON
C: CSV
D: SequenceFile

(多选题)34: Spark DataFrame中（）方法可以获取若干行数据
A: first
B: head
C: take
D: collect

(多选题)35: TF-IDF中TF指的是（）
A: 词频
B: 词在文档中出现的次数
C: 逆文档概率
D: 词在文档集中出现的概率
E: 词在文档集中出现的概率

(判断题)36: 默认情况下，Scala 使用的是可变集合
A: 对
B: 错

(判断题)37: Spark SQL仅仅包括基本的SQL语法
A: 对
B: 错

(判断题)38: Scala函数组合器中flatmap结合了map和flatten的功能，接收一个可以处理嵌套列表的函数，然后把返回结果连接起来
A: 对
B: 错

(判断题)39: Scala 语言中提供的数组是用来存储动态大小的同类型元素
A: 对
B: 错

(判断题)40: Scala在子类中重写超类的抽象方法时，需要使用override关键字
A: 对
B: 错

(判断题)41: RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
A: 对
B: 错

(判断题)42: SparkContext类中parallelize方法可将单机数据创建为分布式RDD
A: 对
B: 错

(判断题)43: MLlib中StandardScaler处理的对象是每一列，也就是每一维特征，将特征标准化为单位标准差或是0均值，或是0均值单位标准差。
A: 对
B: 错

(判断题)44: RDD的转换操作通过某种函数将一个RDD 转换为一个新的RDD ，但是转换操作是懒操作，不会立刻执行计算。
A: 对
B: 错

(判断题)45: Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素
A: 对
B: 错

(判断题)46: RDD的转换操作是用于触发转换操作的操作，这个时候才会真正开始进行计算。
A: 对
B: 错

(判断题)47: RDD的intersection方法用于求出两个RDD 的共同元素
A: 对
B: 错

(判断题)48: 用户可以在Apache Mesos上运行Spark
A: 对
B: 错

(判断题)49: Spark Streaming中时间片也可称为批处理时间间隔(batch interval)，时间片是人为地对数据进行定量的标准，作为拆分数据的依据，一个时间片的数据对应一个RDD 实例。
A: 对
B: 错

(判断题)50: Scala是Scalable Language的简写，是一门多范式的编程语言，设计初衷是不包括函数式编程的特性。
A: 对
B: 错

(责任编辑：admin)要这答案加QQ：800020900 或加微信：vq800020900 获取

搜索

热门标签:

南开21秋学期《大数据开发技术（二）》在线作业答案

提示信息×