还剩15页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
数据分析及应用题库含参考答案
一、单选题共40题,每题1分,共40分
1、np.arangel,10,
1.reshape[3,3][1:,2:]=A、A
[89]B、B
[69]C、C[
[6]
[9]]D、D抛异常正确答案C
2、归并排序的时间复杂度A、A0logNB、B0N*logNC、C0ND、D0M2正确答案B
3、以下代码执行的结果为arr=np.array[banana,cherry,apple,Python]print np.sortarrA、A[Python apple banana cherry]B、B[applebananacherry Python]C、C[cherry bananaapple Python]D D[Pythoncherry bananaapple]正确答案A
4、pandas提供了对各种格式数据文件的读取和写入工具,其中不包括哪种?A、A CSV文件B、B文本文件C、C工作簿文件D、D EXE文件正确答案D
5、算法应该是oA、A程序B、B问题求解步骤的描述C、C要满足五个基本特性D、D A和C正确答案B正确答案ABD
8、Python3交互模式下,执行如下代码LI=[1,2,3]L2=[L1,4,5]L3=L2L4=L
3.copyO Ll[l]=10L3[l]=40L4
[2]=50以下说法正确的是?A、A L3的值为[[1,10,3],40,5]B、B L2的值为[[1,10,3],40,5]C、C L4的值为[[1,10,3],4,50]D、D L4的值为[[1,2,3],4,50]正确答案ABC
9、下列Python表达式返回为False的是?A A53==TrueB538C、C bool〃〃D、D boolNone正确答案AD
10、专家系统知识表示的方法主要有哪些A、A逻辑表示法(谓词表示法)B、B框架C、C产生式D、D语义网络正确答案ABCD
11、以下合法的十六进制数是()A、A OxffBB OXabcC、C0x01D、D0X9X正确答案BCD
12、以下语句可以正确执行的是?()纠错收藏A、A print(〃小明〃今年,20,岁)B、B print(〃小明〃+今年+20+岁)C、C print(〃%s今年%d岁〃%(〃小明〃,20))D、D print(〃%s今年%d岁〃%〃小明〃,20)正确答案AC
13、下列哪些属于算法的复杂度纠错收藏A、A时间复杂度B、B空间复杂度C、C对数复杂度D、D指数复杂度正确答案ABC
14、若a,b,c,d都是int型变量且初值为0,以下选项中正确的赋值语句是A、A a=b=c=d=100B、B d++C、C.c+bD、D d=C=22-b++正确答案ABD
15、有字符串s=TarenaPython,下列正确并且结果非空的是?A、A s
[2]=B、B s[-5-2-l]C、C s++sD、D s[-5:-2:_正确答案CD
16、下列与标准化方法有关的说法中正确的的A、A离差标准化简单易懂,对最大值和最小值敏感度不高B、B常用的标准化方法,又名零一均值标准化C、C小数定标标准化实质上就是将数据按照一定的比例缩小D、D多个特征的数据的KMeans聚类不需要对数据进行标准化正确答案BCD
17、以下说法正确的是纠错收藏A、A实例方法只能用实例来调用B、B类方法用实例和类都可以调用C、C静态方法只能用类来调用D、D静态方法用实例和类都可以调用正确答案BD
18、数据质量包含的要素有纠错收藏A、A准确性、完整性B、B一致性、可解释性C、C时效性、可信性D、D无错性、兼容性正确答案ABC
19、下列选项中不符合Python语言变量命名规则的是()A、A TempStrB、B*1C、C3_1D、D-AI正确答案BCD
20、下列哪一项是Python的数据类型:纠错收藏A、A stringB、B floatC C rationalD、D int正确答案ABD
21、下列关于数据分析流程的说法正确的是()A、A需求分析是数据分析最重要的一部分B、B数据预处理是能够建模的前提C、C分析与建模时只能够使用数值型数据D、D模型评价能够评价模型的优劣正确答案ABD
22、下面说法正确的是()纠错收藏A、A算法原地工作的含义是指不需要任何额外的辅助空间B、B在相同的规模n下,复杂度0(n)的算法在时间上总是优于复杂度0(2n)的算法C、C所谓时间复杂度是指最坏情况下,估算算法执行时间的一个上界D、D同一个算法,实现语言的级别越高,执行效率就越低正确答案BCD
23、机器学习的实现过程,包括数据收集、()等环节A、A数据分析处理B、B算法选择C、C训练模型D、D模型调整正确答案ABCD
24、下列是Python语言关键字得是?纠错收藏A、A openB、B ifC、C lambdaD D finally正确答案BCD
25、Python中函数是对象,以下描述正确的选项有A、A函数可以作为元素添加到集合对象中B、B函数可以赋值给一个变量C、C函数可以当做函数的返回值D、D函数可以作为参数值传递给其他函数正确答案ABCD
26、Numpy库中生成瑞利分布的随机数组,2行3歹U,以下代码不正确的是纠错收藏A、A x=random,normalsize=2,3B、B x=random.zipfa=2,size=2,3C、C x=random.chisquaredf=2,size=2,3D、D x=random.rayleighscale=2,size=2,3正确答案ABCD
27、下列关于分组聚合的说法正确的是A、A pandas提供的分组和聚合函数分别只有一个B、B pandas分组聚合能够实现组内标准化C、C pandas聚合时能够使用agg、apply、transform方法D、D pandas分组函数只有一个groupby正确答案BCD
28、Pandas函数包含下面那几种?纠错收藏A、A MemoryusageB、B InferobjectsC、C ExplodeD、D Melt正确答案ABCD
29、下列关于数据和数据分析的说法错误的是A、A数据就是数据库中的表格B、B文字、声音、图像这些都是数据C、C数据分析不可能预测未来几天的天气变化D、D数据分析的数据只能是结构化的正确答案ACD
30、下列关于模型评价与优化的说法错误的是纠错收藏A、A模型构建完成就可以使用B、B模型评价的目的是为了确认模型的有效性C、C模型评价结果良好,模型一定可用,不需要重构D、D所有的模型评价方法相同正确答案ACD
三、判断题共20题,每题1分,共20分
1、在任何时刻相同的值在内存中都只保留一份A、正确B、错误正确答案B
2、当通过布尔数组索引操作数组时,返回的数据是布尔数组中False对应位置的值A、正确B、错误正确答案B
3、在Python
3.5中运算符+不仅可以实现数值的相加、字符串连接,还可以实现列表、元组的合并和集合的并集运算A、正确B、错误正确答案B
4、numpy库,使用语句dt=np.1inspace20,30,num=5创建的数组,包含数值30A、正确B、错误正确答案A
5、Python标准库os中的方法isdir可以用来测试给定的路径是否为文件夹A、正确B、错误正确答案A
6、Python标准库os中的方法listdir返回包含指定路径中所有文件和文件夹名称的列表A、正确B、错误正确答案A
7、Python代码的注释只有一种方式,那就是使用#符号A、正确B、错误正确答案B
8、扩展库os中的方法remove可以删除带有只读属性的文件A、正确B、错误正确答案B
9、在数理统计中,把所研究的对象的全体称为总体A、正确B、错误正确答案A
10、Matplotlib是Pyplot的子库,提供了和MATLAB类似的绘图APIA、正确B、错误正确答案B
11、df2=df.iloc[::]df
2.name!=df.name A、正确B、错误正确答案B
12、在Python
3.x中语句print*[1,2,3]不能正确执行A、正确B、错误正确答案B
13、Python集合不支持使用下标访问其中的元素A、正确B、错误正确答案A
14、merge是pandas中用来合并数据的函数,和concat函数一样,是按照某行或某列来合并数据A、正确B、错误正确答案B
15、异常处理结构中的finally块中代码仍然有可能出错从而再次引发异常A、正确B、错误正确答案A
16、Python集合中的元素可以是元组A、正确B、错误正确答案A17df=pd.DataFramenp.arange
20.reshape4,5,columns=list abcdetypedf[[a]]为Series A、正确B、错误正确答案B18np.ptp arra,axis二0表示沿0轴返回峰峰值A、正确B、错误正确答案A
19、pandas的applymap可实现元素级函数应用,即对DataFrame中所有的元素不包括索引应用函数处理A、正确B、错误正确答案A
20、模型的具体化就是预测公式,公式可以产生与观察值有相似结构的输出,这就是预测值A、正确B、错误正确答案A
6、已知df为DataFrame对象,提取Pulse列中值大于100并且Calories列中值小于400的行,代码是A、A printdf[df Calories300]df[Calories-B、B printdf[df[Pulse]100df[Calories]C、C printdf[df[Pulse]100and df[Calories_D、D printdf[df[Pulse]100df[Calories]正确答案D
7、假设12个销售价格记录组已经排序如下:5,10,11,13,15,35,50,55,72,92,204,215使用如下每种方法将它们划分成四个箱等频等深划分时,15在第几个箱子内?A、A第一个B、B第二个C、C第三个D、D第四个正确答案B
8、Numpy.random模块中用于对一个序列进行随机排序的函数是A、A uniformB、B shuffleC、C permutationD、D normal正确答案B
9、set{l:ll,2:22,3:33}=A、A{1,2,3}B、B{11,22,33C、C{1,11,2,22,3,33}D、D{1,11,2,22,3,33}正确答案A
10、以下代码执行的输出结果为import numpyas nparr=np.array[[1,2,3,4,5],[6,7,8,9,10]]print arr[0:2,2]A、A randintB、B randC C ranD、D ERROR15正确答案A
11、有二元联合概率分布函数Fx,y,那么F3,3-Fl,l表示为P1A、A PlB、B P1C、C PxD、D P1正确答案A
12、Python定义私有变量得方式是?A、A使用.private关键字B、B使用public关键字C、C使用—xxx—定义变量名D、D使用—xxx定义变量名正确答案D
13、for iin range10,T,循环如果自然结束将执行循环内语句?次A、A10B、B9C、C1D、D0正确答案D
14、使用pd.Series数据.to_frame方法将生成A、A Dataframe数据B、B一个可转为Dataframe的中间对象C、C Series无此方法D、D列表正确答案A
15、关于异常值的说法,下列选项中描述错误的是A、A异常值是指样本中明显偏离其余观测值的个别值B、B可以使用3原则检测异常值C、C可以使用Pandas中的箱线图检测异常值D、D异常值可以使用其它的值来替换正确答案A
16、以下代码执行的结果为arr=np.array[banana,cherry,apple,Python]printnp.sortarrA、A
0.1B、B
0.2C、C
0.3D、D
0.4正确答案A
17、将原始数据进行集成、变换、维度规约、数值规约是在以下哪个步骤的任务?A、A%cB、B%fC、C%dD、D%s正确答案B18假设有命令import numpyas npArray1=np.1inspace1,5,3,dtype=int printArray1则,执行结果是A、A30B、B20C、C[
[710]
[1522]]D D[
[58]
[1522]]正确答案A
19、采用分治法计算最大子段和时间复杂度为A、A0lognB B0nlognC、C OrT2D、D0n正确答案B
20、下列字符串表示plot线条颜色、点的形状和类型为红色五角星点短虚线的是A、A bs-B、B go-.C、Cr+.D、D r*:正确答案D
21、下面选项中t不是s的子序列的是A、A s=t=B、B s=t=C Cs=t=D、D s=t=正确答案c
22、以下代码执行的输出结果为import numpyas nparr np.array[1,2,3,4,5,6,7]print arr[-3:-l]A、A x=random.randint1,5,size=5,3B、B x=random.choice[1,2,3,4,5],size=3,5C、C x=random.randint1,5,size=3,5D、D x=random.choice[1,2,3,4,5],size=5,3正确答案B
23、lenrange10返回值为A、A10B、B9C、C1D、D程序报错正确答案A
24、下面不属于需求分析阶段工作的是oA、A需求获取B、B需求分析C、C撰写软件需求规格说明书D、D可行性研究正确答案D
25、a=[3,4]b=[l,a,5,7]c=b将执行?A、A变量c指向对b进行浅拷贝形成的对象B、B变量c指向对b进行深拷贝形成的对象C、C变量c指向列表b所指向的对象D、D将c作为b的别名正确答案C
26、安装一个库的命令格式是A、A pipuninstallB、B pip-hC、C pipinstallD、D ipdownload正确答案D
27、有个苦逼的上班族,他每天忘记定闹钟的概率为
0.2,上班堵车的概率为
0.5,如果他既没定闹钟上班又堵车那他迟到的概率为
1.0,如果他定了闹钟但是上班堵车那他迟到的概率为
0.8,如果他没定闹钟但是上班不堵车他迟到的概率为
0.9,如果他既定了闹钟上班又不堵车那他迟到的概率为
0.0,那么求出他在60天里上班迟到的期望A、A
30.6B、B
40.1C、C
25.8D、D
36.8正确答案A
28、一棵完全二叉树共有360个结点,则在该二叉树中度为1的结点个数为oA、A0B、B1C、C180D、D181正确答案B
29、np.arange1,10,
1.reshape[3,3][:2,1::]==A、A[
[45]
[78]]B、B[
[47]
[58]]C C[
[23]
[56]]D、D[
[25]
[36]]正确答案C
30、标有不同编号的红色球和白色球各四个,任取两个红色球和一个白色球,共有种不同的取法A、A10B、B15C、C20D、D24正确答案D
31、a=l,2,3,4,5print a将输出A、A抛异常B、B1C、C5D、D1,2,3,4,5正确答案D
32、某二叉树共有150个结点,其中有50个度为1的结点,则A、A不存在这样的二叉树B、B该二叉树有49个叶子结点C、C该二叉树有50个叶子结点D、D该二叉树有51个叶子结点正确答案A
33、使用链表而非结构体数组的优势不包含A、A可以动态使用内存空间B、B可以快速完成插入和删除节点C、C可以在常数时间内查找第N个节点D、D可以不占用连续内存空间正确答案C
34、在结构化程序设计中,模块划分的原则是A、A各模块应包括尽量多的功能B、B各模块的规模应尽量大C、C各模块之间的联系应尽量紧密D、D模块内具有高内聚度、模块间具有低耦合度正确答案Dnp.array2,3,4,5],[6,7,8,9,10]]printarr[0:2,[[1,1:4]A A[
[234]
[789]]B、B[
[123]
[678]]C C[2347D89]D
[123678]正确答案A35>以下代码执行的输出结果为import numpyas nparr
36、代码print\n的执行结果是A、A\n,B、B\\n\,C、C、\\n\\nD、D报错正确答案A37import pandasas pddf=pd.DataFrame{a:list〃〃opq〃〃b:[3,2,1]},index=[e,f,g]以下说法错误的是A、A df[0:1]返回第0行的数据B、B df[0:1]返回第0列的数据C、C df[O]会报错D Ddf[e]会报错正确答案B
38、下列哪种说法是错误的A、A除字典类型外,所有标准对象均可以用于布尔测试B、B空字符串的布尔值是FalseC、C空列表对象的布尔值是FalseD、D值为0的任何数字对象的布尔值是False正确答案A39x=np arange1,10,
1.reshape[3,3]x*x二二・A A[
[123]
[456]
[789]]B[
[149]
[162536]
[496481]]C C[
[303642]
[668196]
[102126150]]D D[
[1821]
[82548]
[214881]]正确答案B
40、Numpy库中,生成均匀分布的随机数,使用函数A、A uniformBB randnCCrandint DD random正确答案A
二、多选题共30题,每题1分,共30分
1、下列关于分组聚合的说法正确的是纠错收藏A、A pandas提供的分组和聚合函数分别只有一个B、B pandas分组聚合能够实现组内标准化C、C pandas聚合时能够使用agg、apply、transform方法DDpandas分组函数只有一个groupby正确答案BCD
2、以下不会出现错误的是纠错收藏A、A北京.encode B、B北京.decode C、C北京.encode.decode D、I以上都不会错误正确答案ACD
3、数据预处理方法主要有纠错收藏A、A数据清洗B、B数据集成C、C数据变换D、D数据归约正确答案ABCD
4、人工智能研究的对象是A、A人B、B机器C、C计算机I、D阿尔法狗正确答案AB
5、下列说法正确的是A、A算法原地工作的含义是指不需要任何额外的辅助空间B、B在相同的规模n下,复杂度0n的算法在时间上总是优于复杂度02n的算法C、C所谓时间复杂度是指最坏情况下,估算算法执行时间的一个上界D、D同一个算法,实现语言的级别越高,执行效率就越低正确答案BCD
6、下列与标准化方法有关的说法中正确的的纠错收藏A、A离差标准化简单易懂,对最大值和最小值敏感度不高B、B常用的标准化方法,又名零一均值标准化C、C小数定标标准化实质上就是将数据按照一定的比例缩小D、D多个特征的数据的KMeans聚类不需要对数据进行标准化正确答案BCD
7、关于递归函数的描述,以下选项中不正确的是纠错收藏A、A包含一个循环结构B、B函数比较复杂C、C函数内部包含对本函数的再次调用D、D函数名称作为返回值。
个人认证
优秀文档
获得点赞 0