您的当前位置:首页大数据测试题

大数据测试题

2020-09-08 来源:乌哈旅游
文档

光环国际大数据测试题

考试范围 考试时间 Java、Python、云计算、大数据 120分钟 满分: 出卷人: 100分 姓名_______ 成绩________

一、单选题(每题2分,共15题)

1、当前大数据技术的基础是由( )首先提出的

A. 微软 B. 百度 C. 谷歌 D. 阿里巴巴 2、大数据的起源是( )

A. 金融 B. 电信 C. 互联网 D. 公共管理 3、( )反映数据的精细化程度,越细化的数据,价值越高。

A. 规模 B. 活性 C. 关联度 D. 颗粒度

4、数据清洗的方法不包括( )

A. 缺失值处理 C. 一致性检查

B. 噪声数据清除 D. 重复数据记录处理

5、当程序经过编译或者汇编以后,形成了一种由机器指令组成的集合,被称为( )

A. 源程序 B. 目标程序 C. 可执行程序 D. 非执行程序 6、大数据的核心就是( )

文档

A. 告知与许可 B. 预测 C. 匿名化 D. 规模化

7、大数据不是要教机器像人一样思考。相反,它是( )

A. 把数学算法运用到海量的数据上来预测事情发生的可能性。 B. 被视为人工智能的一部分 C. 被视为一种机器学习 D. 预测与惩罚

8、当前社会中,最为突出的大数据环境是( )

A.互联网

B.物联网

C.综合国力

D.自然资源

9、以下哪些技术为大数据常用框架或技术(多选)( )。

A.Hadoop

B.Spark

C.Hbase

D.Linux

10、云计算按照服务类型大致可分为以下类(多选)( )

A.IaaS

B.PaaS

C.SaaS

D.效用计算

11、下列哪个语句在Python中是非法的?( )

A.x=y=z=1 C.x,y=y,x

B.x=(y=z+1) D.x+=y

12、关于数据的潜在价值,说法正确的是(多选)( )

A. 数据的真实价值就像漂浮在海洋中的冰山,第一眼只能看到冰山一角,

而绝大部分则隐藏在表面之下。

B. 判断数据的价值需要考虑到未来它可能被使用的各种方式,而非仅仅考虑其目前的用途。

C. 在基本用途完成后,数据的价值仍然存在,只是处于休眠状态 D. 数据的价值是其所有可能用途的总和 13、下列不是Java语言面向对象的特点( )

文档

A. 封装 B.继承 C.跨平台 D.多态

14、大数据人才整体上需要具备(多选)( )等核心知识

A. 数学与统计知识 B. 计算机相关知识 C. 马克思主义哲学知识 D. 市场运营管理知识 15、观察下图,其中问号选择()

16、在Python中,下列哪种说法是错误的 ( D )

A、除字典类型外,所有标准对象均可以用于布尔测试 B、空字符串的布尔值是False C、空列表对象的布尔值是False

D、值为0的任何数字对象的布尔值是False 17、ArrayList类的底层数据结构是( A )

A、数组结构 B、链表结构 C、哈希表结构 D、红黑树结构

18、Java中覆盖与重载的关系是:( A )。

A、覆盖只有发生在父类与子类之间,而重载可以发生在同一个类中 B、覆盖方法可以不同名,而重载方法必须同名 C、final修饰的方法可以被覆盖,但不能被重载

文档

D、覆盖与重载是同一回事

19、下面关于进程、线程的说法不正确的是( C )。

A、进程是程序的一次动态执行过程。一个进程在其执行过程中,可以产生 多个线程——多线程,形成多条执行线索。

B、线程是比进程更小的执行单位,是在一个进程中独立的控制流,即程序 内部的控制流。线程本身不能自动运行,栖身于某个进程之中,由进程 启动执行。

C、Java多线程的运行与平台无关。

D、 对于单处理器系统,多个线程分时间片获取CPU或其他系统资源来运行。 对于多处理器系统,线程可以分配到多个处理器中,从而真正的并发执 行多任务。

20、请问下列哪些类是定义在java.io包中的抽象类( ABD ) (多选)

A. InputStream B. OutputStream C. PrintStream D. Reader

E. FileInputStream F. FileWriter

二、填空题(共10题,每题2分)

16、数据库的三大范式______、______、______

17、Linux下__________________命令把某一个文件下的所有的文件分发到其他的机器上。

18、Linux用_______命令查看cpu,硬盘,内存的信息。 19、Java的三大体系分别是______、______、______

20、Java中的变量可分为两种数据类型,分别是______和______。

21、在java中,byte类型数组占_____个字节,short类型数据占____个字节,int类型数据占____个字节,long类型数据占____个字节

22、Python中的可变数据类型有_______,不可变数据类 型有_________ 。 23、Python提供了两个对象身份比较操作符_____和______来测试两个变量是否指向同一个对象,也可以通过内建函数_______来测试对象的类型。 24、队列的实现是_______,消费的顺序是________。

25、hadoop的角色中_______负责管理元数据信息、________做namenode冷备

文档

份、________主要做储存数据的、_________管理任务、_________执行任务。

三、判断题(每题1分,共10题)

26、数据化就是数字化,是相互等同的关系。( )

27、即使数据用于基本用途的价值会减少,但潜在价值却依然强大。( ) 28、对于大型、中等、小型规模的公司而言,大数据对中等规模的公司帮助最大。( )

29、大数据的核心思想就是用规模剧增来改变现状。( )

30、一般而言,分布式数据库是指物理上分散在不同地点,但在逻辑上是统一的 数据库。因此分布式数据库具有物理上的独立性、逻辑上的一体性、性能上 的可扩展性等特点。( )

31、对于大数据而言,最基本、最重要的要求就是减少错误、保证质量。因此, 大数据收集的信息量要尽量精确。( )

32、简单随机抽样,是从总体N个对象中任意抽取n个对象作为样本,最终以这 些样本作为调查对象。在抽取样本时,总体中每个对象被抽中为调查样本的

概率可能会有差异。( )

33、大数据预测能够分析和挖掘出人们不知道或没有注意到的模式,确定判断事 件必然会发生。( )

34、Java 和 c都是面向对象的程序设计语言。( ) 35、Hadoop 支持数据的随机读写。( )

36、Java 静态初始化器是在其所属的类对象实例化时由系统自动调用执行。 ( F )

37、Java 线程间通信可通过共享数据使线程互相交流,也可通过线程控制方法使线程互相等待。 ( T )

38、在Python中除字典类型外,所有标准对象均可以用于布尔测试 ( T ) 39、40XL是Python合法的标识符( F )

40、Java中map集合的value值可以重复 ( T )

文档

四、问答题(每题10分,共4题)

36、简述大数据技术的特点。

37、说下你理解的大数据,以及知道的大数据相关的一些技术和框架;谈谈你对hadoop 的一些理解,包括哪些组件。

38、明一家过一座桥,过桥时是黑夜,所以必须有灯。现在小明过桥要1秒,小明的弟弟要3秒,小明的爸爸要6秒,小明的妈妈要8秒,小明的爷爷要12秒。每次此桥最多可过两人,而过桥的速度依过桥最慢者而定,而且灯在点燃后30秒就会熄灭。问:小明一家如何过桥

39、有7克、2克砝码各一个,天平一只,如何只用这些物品三次将140克的盐分成50、90克各一份?

40、多线程实现交替打印1到20?

41、写出你所知道的所有能遍历list和map集合的方法

42、一行把[1,2,3,1,2,3] 中的重复元素剔除。

文档

因篇幅问题不能全部显示,请点此查看更多更全内容