奥鹏作业答案 - 分忧网!奥鹏作业答案,奥鹏在线作业答案,奥鹏作业答案及毕业论文分忧

奥鹏作业答案,奥鹏在线作业答案,奥鹏在线考核_分忧网

当前位置: 主页 > 论文范文 >

南开21秋学期《大数据开发技术(二)》在线作业答案

时间:2021-12-23 18:51来源:未知 作者:admin 点击:
(单选题)1: GraphX中()方法可以缓存整个图,并指定存储级别 A: cache B: presist C: unpersistVertices D: edges.unpersist 正确答案: B (单选题)2: var a=10; for(a-1 until 20){ println(a); }共循环了()次 A: 10 B: 11 C: 20 D: 19 正确答案: D (单选
(单选题)1: GraphX中()方法可以缓存整个图,并指定存储级别
A: cache
B: presist
C: unpersistVertices
D: edges.unpersist


(单选题)2: var a=10; for(a<-1 until 20){ println(a); } 共循环了()次
A: 10
B: 11
C: 20
D: 19


(单选题)3: MLlib 中可以调用mllib.tree.DecisionTree 类中的静态方法()训练回归树
A: trainClassifier
B: trainRegressor
C: LogisticRegressionModel
D: LabeledPoint


(单选题)4: 图的结构通常表示为:G(V,E),其中,V是图G中()
A: 顶点
B: 顶点的集合
C: 边
D: 边的集合


(单选题)5: Dstream输出操作中print方法在Driver中打印出DStream中数据的()元素。
A: 第一个
B: 所有
C: 前10个
D: 前100个


(单选题)6: Spark Streming中()函数可以对统计DStream中每个RDD包含的元素的个数,得到一个新的DStream
A: count
B: union
C: length
D: reduce


(单选题)7: 以下哪个函数可以对两个RDD进行合并()
A: union
B: substract
C: intersection
D: cartesian


(单选题)8: Spark中DataFrame的()方法是进行排序查询
A: order by
B: group by
C: select by
D: sort by


(单选题)9: 图结构中如果任意两个顶点之间都存在边,那么称之为()
A: 完全图
B: 有向完全图
C: 无向图
D: 简单图


(单选题)10: Mllib中线性会馆算法中的参数numIterations表示()
A: 要运行的迭代次数
B: 梯度下降的步长
C: 是否给数据加干扰特征或者偏差特征
D: Lasso 和ridge 的正规化参数


(单选题)11: GraphX中VertexRDD[VD]继承自()
A: EdgeRDD
B: RDD[Edge]
C: VertexRDD[VD]
D: RDD[(VertexId,VD)]


(单选题)12: GraphX中()是完整提供边的各种操作类
A: RDD[Edge]
B: EdgeRDD
C: RDD[(VertexId,VD)]
D: VertexRDD


(单选题)13: Scala元组的值是通过将单个的值包含在()中构成的
A: 小括号
B: 中括号
C: 大括号
D: 尖括号


(单选题)14: 下列Scala代码应输出(): var a=0; var b=0 var sum=0; for(a<-1 until 3; b<-1 until 3) { sum+=a+b; } println(sum);
A: 36
B: 35
C: 11
D: 12


(单选题)15: Scala函数组合器可以通过一个函数重新计算列表中所有元素,但是没有返回值的方法是()
A: map
B: foreach
C: flatten
D: flatmap


(单选题)16: PairRDD的()方法,可以把两个RDD中键相同的元素组合在一起,合并为一个RDD。
A: join
B: union
C: substract
D: intersection


(单选题)17: PairRDD可以通过()获得仅包含值的RDD
A: key
B: keys
C: value
D: values


(单选题)18: Spark Streming中()函数可以对源DStream中的每一个元素应用func方法进行计算,如果func函数返回结果为true,则保留该元素,否则丢弃该元素,返回一个新的Dstream
A: map
B: flatMap
C: filter
D: union


(单选题)19: 请问RDD的()操作是将两个RDD组合成Key/Value形式的RDD
A: join
B: zip
C: combineByKey
D: collect


(单选题)20: Mllib中metrics.precisionByThreshold表示()指标
A: 准确度
B: 召回率
C: F值
D: ROC曲线


(单选题)21: Scala类通过子类化和基于灵活的混合类来进行扩展,作为##的一个可靠性解决方案
A: 多态
B: 虚函数
C: 派生
D: 多重继承


(单选题)22: PairRDD中()函数可以对具有相同键的值进行分组
A: mapValues
B: groupBy
C: groupByKey
D: reduceByKey


(单选题)23: Spark Streming中()函数可以通过对源DStream的每RDD应用RDD-to-RDD函数返回一个新的DStream,这可以用来在DStream做任意RDD操作。
A: transform
B: reduce
C: join
D: cogroup


(单选题)24: Mllib中metrics.recallByThreshold 表示()指标
A: 准确度
B: 召回率
C: F值
D: ROC曲线


(单选题)25: Scala通过()来定义变量
A: val
B: val
C: define
D: def


(多选题)26: Spark支持使用()语言编写应用
A: Scala
B: Python
C: Java
D: R


(多选题)27: 以下哪种方法可以让Spark不自定义分区也能对任何类型RDD 简单重分区()
A: resetpartition
B: repartiton
C: Partition
D: coalesce


(多选题)28: 以下算法中属于分类算法的是()
A: KNN算法
B: 逻辑回归
C: 随机森林
D: Kmeans


(多选题)29: Spark是一个()计算框架
A: 快速
B: 分布式
C: 可扩展
D: 容错


(多选题)30: 以下哪个方法可以创建RDD()
A: parallelize
B: makeRDD
C: textFile
D: loadFile


(多选题)31: Spark Core包含的功能有()
A: 任务调度
B: 内存管理
C: SQL查询
D: 容错机制


(多选题)32: MapReudce不适合()任务
A: 大数据计算
B: 迭代
C: 交互式
D: 离线分析


(多选题)33: Spark支持的文件格式包括()
A: 文本文件
B: JSON
C: CSV
D: SequenceFile


(多选题)34: Spark DataFrame中()方法可以获取若干行数据
A: first
B: head
C: take
D: collect


(多选题)35: TF-IDF中TF指的是()
A: 词频
B: 词在文档中出现的次数
C: 逆文档概率
D: 词在文档集中出现的概率
E: 词在文档集中出现的概率


(判断题)36: 默认情况下,Scala 使用的是可变集合
A: 对
B: 错


(判断题)37: Spark SQL仅仅包括基本的SQL语法
A: 对
B: 错


(判断题)38: Scala函数组合器中flatmap结合了map和flatten的功能,接收一个可以处理嵌套列表的函数,然后把返回结果连接起来
A: 对
B: 错


(判断题)39: Scala 语言中提供的数组是用来存储动态大小的同类型元素
A: 对
B: 错


(判断题)40: Scala在子类中重写超类的抽象方法时,需要使用override关键字
A: 对
B: 错


(判断题)41: RDD的union函数会将两个RDD元素合并成一个并且去处重复元素
A: 对
B: 错


(判断题)42: SparkContext类中parallelize方法可将单机数据创建为分布式RDD
A: 对
B: 错


(判断题)43: MLlib中StandardScaler处理的对象是每一列,也就是每一维特征,将特征标准化为单位标准差或是0均值,或是0均值单位标准差。
A: 对
B: 错


(判断题)44: RDD的转换操作通过某种函数将一个RDD 转换为一个新的RDD , 但是转换操作是懒操作,不会立刻执行计算。
A: 对
B: 错


(判断题)45: Scala函数组合器中filter过滤移除使得传入的函数的返回值为true的元素
A: 对
B: 错


(判断题)46: RDD的转换操作是用于触发转换操作的操作,这个时候才会真正开始进行计算。
A: 对
B: 错


(判断题)47: RDD的intersection方法用于求出两个RDD 的共同元素
A: 对
B: 错


(判断题)48: 用户可以在Apache Mesos上运行Spark
A: 对
B: 错


(判断题)49: Spark Streaming中时间片也可称为批处理时间间隔(batch interval),时间片是人为地对数据进行定量的标准,作为拆分数据的依据,一个时间片的数据对应一个RDD 实例。
A: 对
B: 错


(判断题)50: Scala是Scalable Language的简写,是一门多范式的编程语言,设计初衷是不包括函数式编程的特性。
A: 对
B: 错

(责任编辑:admin)要这答案加QQ:800020900 或加微信:vq800020900 获取
顶一下
(0)
0%
踩一下
(0)
0%
------分隔线----------------------------
猜您喜欢

提示信息×