第一章单元测试
1、问题:以下哪个是大数据的特点()。
A:数据体量巨大
B:数据类型单一
C:价值密度高
D:数据变化慢
答案:【数据体量巨大】
2、问题:下列关于大数据作用的叙述中()是错误的。
A:对于大量消费者提供产品或服务的企业可以利用大数据进行精准营销
B:大数据时代科学研究的方法和手段将发生重大改变
C:大数据利用将成为核心竞争力的关键因素
D:大数据分析依赖复杂算法的设计
答案:【大数据分析依赖复杂算法的设计】
3、问题:移动互联网、物联网以及云计算等热点崛起在很大程度上是()产生的原因。
A:网络
B:智能时代
C:农业物联网
D:大数据
答案:【大数据】
4、问题:以下不是农业大数据的主要应用领域的是()。
A:生产过程
B:食品安全管理
C:智能家居
D:各种科研活动
答案:【智能家居】
5、问题:分布式处理技术、云技术、存储技术都是大数据时代的技术支撑。()
A:对
B:错
答案:【对】
6、问题:根据IDC的定义大数据至少要有超过100GB的可供分析的数据。()
A:对
B:错
答案:【对】
7、问题:大数据为云计算提供了技术基础,云计算为大数据提供用武之地。()
A:对
B:错
答案:【错】
8、问题:数据库的数据属于结构化数据。()
A:对
B:错
答案:【对】
9、问题:大数据面临的挑战中包括加大隐私泄露风险。()
A:对
B:错
答案:【对】
第二章单元测试
1、问题:Hadoop生态系统中负责计算模式管理和调度器模块名称是()。
A:YARN
B:Zookeeper
C:Hbase
D:Hive
答案:【YARN】
2、问题:在关于Hadoop的叙述中,“Hadoop按块存储和处理数据的能力值得人们信赖。因为它假设计算元素和存储会失败,因此它维护多个工作数据副本,确保能针对失败的节点重新分布处理。”属于()。
A:高容错性
B:高可靠性
C:高扩展性
D:高性能
答案:【高可靠性】
3、问题:HDFS一般拓扑结构中,由NameNode、DataNode和SecondaryNameNode组成,其中,NameNode的个数为()。
A:1
B:2
C:3
D:不限
答案:【1】
4、问题:在HDFS中,元数据保存在()。
A:NameNode
B:从节点
C:Slave
答案:【NameNode】
5、问题:以下关于HDFS存储数据策略的叙述中错误的是()。
A:第一个副本放置在一台磁盘不太满、CPU不太忙的节节点上
B:第二个副本放置在与第一个副本不同机架的节点上
C:第三个副本放置在与第一副本相同机架的其它节点上
D:更多副本放置在随机节点上
答案:【第一个副本放置在一台磁盘不太满、CPU不太忙的节节点上】
第三章单元测试
1、问题:从数据的加工程度对数据进行了分类,以下不属于该分类的是()。
A:信息和价值
B:裸数据
C:半结构化数据
D:专家数据
答案:【半结构化数据】
2、问题:按()分,把数据采集分类为静态数据采集、低频数据采集和高频数据采集。
A:数据结构
B:采集频率
C:内容
D:采集方式
答案:【采集频率】
3、问题:数据采集工具不包括()。
A:Flume
B:KalKa
C:HBase
D:Sqoop
答案:【HBase】
4、问题:关于缺失数据处理,()是不合适的。
A:当缺失数据较多时直接删除相应样本
B:对缺失数据进行插补
C:多重查补法
D:决策树
答案:【决策树】
5、问题:当缺失数据较少时直接删除相应样本,删除缺失数据样本,其前提是缺失数据的比例较少,而且缺失数据是随机出现的,这样删除缺失数据后对分析结果影响不大。()
A:对
B:错
答案:【对】
6、问题:异常值(离群点)是指测量数据中的随机错误或偏差造成其偏离均值的孤立点。在数据处理中,异常值不会极大地影响回归或分类的效果。()
A:对
B:错
答案:【错】
7、问题:所谓数据的中心化是指数据集中的各项数据减去数据集的方差。()
A:对
B:错
答案:【错】
8、问题:Python爬虫架构主要由五个部分组成,分别是搜索引擎、调度器、URL管理器、网页下载器和网页解析器。()
A:对
B:错
答案:【错】
第四章单元测试
1、问题:以下哪个不属于大数据库的是()。
A:虚拟化技术
B:关系型数据库
C:NewSQL
D:NoSQL
答案:【虚拟化技术】
2、问题:()不是NoSQL特征。
A:需要预定义模式
B:无共享架构
C:弹性可扩展
D:异步复制
答案:【需要预定义模式】
3、问题:以下()不是NoSQL数据库。
A:键值对数据库
B:文档数据库
C:图数据库
D:MySQL
答案:【MySQL】
4、问题:以下()是图数据库产品。
A:Redis
B:Neo4J
C:Hbase
D:MongoDB
答案:【Neo4J】
5、问题:为了在Hbase中确定一个具体数据,需要()个参数。。
A:1
B:2
C:3
D:4
答案:【4】
第五章单元测试
1、问题:交叉分析是基于()横向地组合交叉。
A:同一维度
B:不同维度
C:同一方向
D:不同方向
答案:【不同维度】
2、问题:以下不属于数据分析时用到的方法是()
A:相关分析
B:比较分析
C:高低分析
D:细分分析
答案:【高低分析】
3、问题:
利用历史数据预测公司将来的股价。“属于数据挖掘任务范畴。
A:对
B:错
答案:【对】
4、问题:
数据挖掘的主要任务是从数据中发现潜在的规则,从而能更好的完成描述数据、预测数据等任务。
A:对
B:错
答案:【对】
5、问题:
下列关于分类和聚类的描述中正确的是?
A:
分类和聚类都是有指导的学习
B:
分类和聚类都是无指导的学习
C:
分类是有指导的学习,聚类是无指导的学习
D:
分类是无指导的学习,聚类是有指导的学习
答案:【
分类是有指导的学习,聚类是无指导的学习
】
6、问题:
下列描述中哪一项属于数据挖掘任务?
A:
根据顾客喜好摆放商品位置
B:
监测地震活动的地震波
C:
监测病人心率的异常变化
D:
按商品价格高低查看
答案:【
根据顾客喜好摆放商品位置
】
第六章单元测试
1、问题:在Python中____表示空类型()。
A:Nan
B:None
C:Null
D:Nul
答案:【None】
2、问题:关于Python内存管理,下列说法错误的是()。
A:变量不必事先声明
B:变量无须指定类型
C:变量无须先创建和赋值而直接使用
D:可以使用del释放资源
答案:【变量无须先创建和赋值而直接使用】
3、问题:在自然语言处理中,把句子拆分成一个个词语的过程被称为()。
A:分解
B:分词
C:切片
D:索引
答案:【分词】
4、问题:语句:menu=(1,2,3,4,5)
print(menu[1:3])输出的结果为()
A:1,2,3
B:1,2
C:2,3,4
D:2,3
答案:【2,3】
5、问题:列表的元素可以修改,但元组的元素不能修改。()
A:对
B:错
答案:【对】
第七章单元测试
1、问题:对于大数据技术在农产品生产环节的运用,主要的目标就是使农产品产量具有可预测性和可控性。()
A:对
B:错
答案:【对】
2、问题:依赖于大数据技术的精确农业,需要各类准确的基础数据,包括如()
A:基础空间数据
B:生长环境数据
C:作物生长过程的动态数据
D:作物DNA数据
答案:【基础空间数据
生长环境数据
作物生长过程的动态数据】
3、问题:GIS是(),它不仅能够管理各类属性的海量数据,更主要的是能够实现对空间数据深人处理分析。
A:全球定位系统
B:地理定位系统
C:地理生态系统
D:地理信息系统
答案:【地理信息系统】
4、问题:植物养分供给的盈亏对叶片形态含量有明显的影响,通过遥感植被指数与不同营养素(N、P、K、Ca、Mg等)数学模型,可估测作物营养素供给状态。()
A:对
B:错
答案:【错】
5、问题:从生产端入手,借助大数据技术使农产品生产端的生产变得可预测,才是最终解决农产品价格过度波动问题的关键,这需要对需求端进行精准预测。()
A:对
B:错
答案:【对】
6、问题:大数据分析方式的基本步骤和基本思路如下:
第一步,数据收集过程。
第二步,数据清洗和整理工作。
第三步,()。
A:数据存储
B:数据分析和模型的选择
C:数据可视化
D:数据ETL
答案:【数据分析和模型的选择】
7、问题:由于数据非结构化,格式的统一和数据类型的整理,以及数据错误和遗漏的处理都是需要大量人力和时间投人,所以数据采集工作这一步骤是最复杂繁琐的一项工作。()
A:对
B:错
答案:【错】
8、问题:农产品物流体系的完善具有重要意义,根本原因是农产品流通作为农产品价值实现的中间环节,链接着农产品的生产端和需求端,是农产品市场价值实现的不可或缺环节。()
A:对
B:错
答案:【对】
9、问题:实现流通环节各个主体的()是农产品物流体系完善的一个前提条件,建立合理的利益分配机制是农产品流通体系建设的内在要求和核心。
A:技术标准的建设
B:现代化信息化建设
C:利益平衡原则
D:冷链物流建设
答案:【利益平衡原则】
10、问题:运用大数据技术的强大信息收集和分析功能,可以跨行业跨平台的收集各类信息,并进行分析处理,可以完善期货市场参与者对不同类信息收集和分析能力的不足,对于优化期货市场价格形成机制具有重要意义。()
A:对
B:错
答案:【对】
第八章单元测试
1、问题:所谓的购物篮分析(MarketBasketAnalysis)就是通过这些购物篮子所显示的信息来研究顾客的购买行为。()
A:对
B:错
答案:【对】
2、问题:购物篮分析的结果会对商品在卖场中的陈列产生重大的影响,由于很多具有相关性的商品属于不同的部门管理,因此必然会产生商品的交叉陈列问题。()
A:对
B:错
答案:【对】
3、问题:SAP和农夫山泉开始共同开发基于“饮用水”这个产业形态中,最为重要的数据场景是()。
A:运输环境分析
B:生产环境分析
C:销售环境分析
D:竞品分析
答案:【运输环境分析】
4、问题:高德路况信息有多个数据来源,其中()的占比最高。
A:街景实采拍摄
B:UGC公众数据
C:数据供应商
D:行业浮动车数据
答案:【UGC公众数据】
5、问题:UGC数据通过与出租车、物流以及长途客运等行业合作,以置换和购买的方式,获得相关行业车辆的GPS数据。()
A:对
B:错
答案:【错】
6、问题:高德地图的大数据处理与挖掘平台采用层状搭建结构。其底层为实时日志采集,主要通过Flume工具将诸如定位、导航、开放平台等生产服务器上产生的日志导入Hadoop的分布式文件存储系统HDFS上。()
A:对
B:错
答案:【对】
7、问题:道路的拥堵延时指数越高表示该道路拥堵时更加耗时。()
A:对
B:错
答案:【对】
8、问题:高德地图根据在线与离线的不同需要,采用两套不同的框架对数据进行处理和挖掘,即Spark/Storm模式的离线数据处理系统和Map/Reduce的在线数据处理系统。()
A:对
B:错
答案:【错】
9、问题:回龙观是北京较大的居住社区之一,常住人口约达30万人。它附近高峰期造成交通拥堵的主要原因是大量通勤需求与单一路线中有限的车流容量存在较大落差。()
A:对
B:错
答案:【对】
10、问题:从数据中多角度挖掘分析得到的出行趋势,将对()产生强有力的支撑。例如,根据数据分析,上海限外政策后,城市高峰期拥堵延时指数总体下降了约3%
A:城市交通治理政策
B:用户行为深度分析
C:城市拥堵模式分析
D:绘制拥堵地图
答案:【城市交通治理政策】
还木有评论哦,快来抢沙发吧~