还剩13页未读,继续阅读
本资源只提供10页预览,全部文档请下载后查看!喜欢就下载吧,查找使用更方便
文本内容:
数据分析师面试题和答案
一、基础概念题(本题型共15题,每题1分,共15分)
1.数据分析师最核心的职责是什么?(选项A.编写代码B.数据清洗与分析,为业务决策提供支持C.服务器维护D.产品设计)
2.以下哪项不属于数据分析师的基本技能?(选项A.SQL B.产品原型设计C.Excel D.统计学基础)
3.数据的基本类型包括哪些?(选项A.数值型、分类型、时间序列型B.整数型、字符串型、布尔型C.结构化数据、非结构化数据、半结构化数据D.以上都是)
4.数据处理的基本流程不包括以下哪个步骤?(选项A.数据收集B.数据清洗C.数据建模D.数据备份)
4.以下哪种数据属于结构化数据?(选项A.社交媒体评论B.订单表(包含订单号、用户ID、金额、日期等字段)C.图片文件D.音频文件)
5.数据分析师在分析前需要明确的核心问题是什么?(选项A.分析工具B.数据来源C.分析目标与业务背景D.数据量大小)
6.以下哪项是描述性数据分析的主要目的?(选项A.预测未来趋势B.解释数据中的规律或异常C.总结数据的基本特征(如均值、中位数、分布等)D.建立预测模型)
7.数据质量的核心维度不包括以下哪项?(选项A.准确性B.完整性C.一致性D.数据量)
8.数据分析师与数据科学家的主要区别在于(选项A.数据科学家更擅长编程,分析师不擅长B.数据分析师更关注业务应用,数据科学家更关注算法与模型构建C.数据分析师不需要数学基础,数据科第1页共15页学家需要D.数据分析师只处理结构化数据,数据科学家只处理非结构化数据)
9.以下哪项属于数据可视化的主要作用?(选项A.存储原始数据B.提高数据处理速度C.直观展示数据特征和趋势,辅助决策D.减少数据量)
10.在数据类型中,“用户性别”属于哪种数据类型?(选项A.数值型B.分类型(定类数据)C.分类型(定序数据)D.时间序列数据)
11.数据清洗中,处理缺失值的常见方法不包括?(选项A.删除记录B.用均值/中位数填充C.用众数填充D.直接忽略缺失值)
12.以下哪项是数据分析师常用的统计量?(选项A.方差B.标准差C.标准误D.以上都是)
13.数据驱动决策的基本步骤不包括?(选项A.明确业务目标B.收集与分析数据C得出结论并提出行动建议D.直接根据数据做决策无需业务沟通)
14.以下哪种工具不属于数据可视化工具?(选项A.Tableau B.Excel C.Python(Matplotlib)D.SQL Server)
二、SQL基础及查询题(本题型共15题,每题2分,共30分)
1.以下哪个SQL语句用于从表“sales”中查询所有字段的数据?(选项A.SELECT*FROM salesB.SELECT sales.*FROM*C.GET*FROM salesD.FIND*FROM sales)
2.要查询“users”表中用户ID为1001且年龄大于30的用户,正确的SQL条件是?(选项A.WHERE user_id=1001AND age30B.WHERE user_id=1001OR age30C.SELECT user_id,age FROM第2页共15页users WHERE user_id=1001OR age30D.SELECT*FROM usersWHERE user_id=1001AND age30)
3.要查询“orders”表中订单金额(amount)的总和,正确的SQL语句是?(选项A.SELECT SUMamount FROM ordersB.SELECTSUMamount AStotal_amount FROM orders C.SELECTtotal_amount=SUMamount FROM orders D.A和B都正确)
4.要查询“products”表中所有产品名称(name)和对应的类别ID(category_id),并按类别ID升序排列,正确的SQL语句是?(选项A.SELECT name,category_id FROMproducts ORDER BYcategory_id ASC B.SELECT name,category_id FROMproductsORDER BYcategory_id DESC C.SELECT name,category_id FROMproductsSORT BYcategory_id ASCD.SELECT name,category_idFROM productsSORT BYcategory_id DESC)
5.要查询“users”表中用户注册日期(register_date)在2025年1月1日至2025年12月31日之间的用户,正确的条件是?(选项A.WHERE register_date BETWEEN2025-01-01AND2025-12_31B.WHERE register_date=2025-01-01OR register_date=2025-12-31C.WHERE register_date IN2025-01-01,2025-12-31D.WHERE register_date LIKE2025-%)
6.要查询“sales”表中每个产品类别(product_category)的平均销售额及销售数量,正确的SQL语句是?(选项A.SELECTproduct_category,AVGsales_amount ASavg_sales,SUMquantity AStotal_quantity FROMsales GROUP BYproduct_category B.SELECT product_category,AVGsales_amount,SUMquantity FROMsales GROUP BY第3页共15页product_category C.SELECT product_category,AVGsales_amountAS avg_sales,SUMquantity AStotal_quantity FROMsalesORDER BYproduct_category D.A和B都正确)
7.以下哪个函数用于计算数据集中的最大值?(选项A.MAX B.MIN C.AVG D.SUM)
8.要查询“orders”表中订单金额(amount)大于1000的订单,并按订单日期(order_date)降序排列,正确的SQL语句是?(选项A.SELECT*FROM ordersWHERE amount1000ORDER BYorder_dateDESC B.SELECT*FROM ordersWHERE amount1000ORDER BYorder_date ASC C.SELECT*FROMordersWHERE amount1000SORTBY order_date DESCD.SELECT*FROMordersWHERE amount1000ORDER BYorder_date)
9.要将“sales”表中的“amount”字段四舍五入保留两位小数,正确SQL函数是?(选项A.ROUNDamount,2B.ROUNDamount,2C.ROUNDamount,2,0D.ROUNDamount,2,1)
10.要查询“users”表中用户年龄(age)为空值(NULL)的记录,正确的条件是?(选项A.WHERE ageIS NULLB.WHERE age=NULL C.WHERE age=D.WHERE age=0)
11.要查询“products”表中产品名称包含“手机”的产品,正确的条件是?(选项A.WHERE nameLIKE%手机%B.WHERE nameLIKE手机%C.WHERE nameLIKE%手机D.WHERE name=手机)
12.要计算“orders”表中每个用户(user_id)的订单总金额,并按总金额降序排列,正确的SQL语句是?(选项A.SELECT user_id,SUMamount AStotal_amount FROMorders GROUP BY user_id第4页共15页ORDERBY total_amount DESC B.SELECT user_id,SUMamount AStotal_amount FROMorders ORDERBYtotal_amount DESCC.SELECTuser_id,SUMamount FROMorders GROUPBY user_id ORDERBYtotal_amount DESCD.SELECT user_id,SUMamount AStotal_amountFROMorders GROUPBY user_id ORDERBYtotal_amount)
13.以下哪个SQL语句用于创建一个新表?(选项A.CREATE TABLEnew_table ASSELECT*FROM old_table B.CREATE new_table ASSELECT*FROM old_table C.INSERT INTOnew_table SELECT*FROM old_table D.ALTER TABLEnew_table ADD COLUMNcolumn_name)
14.要查询“sales”表中2025年每月的销售额总和,正确的SQL语句是?(选项A.SELECT MONTHorder_date ASmonth,SUMamount ASmonthly_sales FROMsales WHEREYEARorder_date=2025GROUPBYmonth B.SELECTYEARorder_date ASyear,MONTHorder_date ASmonth,SUMamount ASmonthly_sales FROMsales WHEREYEARorder_date=2025GROUPBYyear,month C.A和B都正确D.SELECT DATE_FORMATorder_date,%Y-%m ASmonth,SUMamount ASmonthly_sales FROMsales WHEREYEARorder_date=2025GROUPBYmonth)
15.要查询“users”表中用户ID为
1001、
1002、1003的用户名,正确的SQL条件是?(选项A.WHERE user_id IN1001,1002,1003B.WHEREuser_id BETWEENA ANDCC.WHEREuser_id=1001OR user_id=1002OR user_id=1003D.A和C都正确)第5页共15页
三、Excel操作与函数题(本题型共15题每题2分,共30分)
1.Excel中,以下哪个函数用于在一个区域中查找指定值并返回其对应的行号?(选项A.VLOOKUP B.HLOOKUP C.INDEX D.MATCH)
2.要计算A1到A100单元格中数值的总和,正确的公式是?(选项A.SUMA1:A100B.SUMA1,A100C.ADDA1:A100D.A1+A100)
3.Excel中,要将“2025-10-05”格式的日期转换为“月份-年份”(如“10月-2025”),可使用哪个函数?(选项A.TEXT B.DATE C.MONTH D.YEAR)
4.要判断B2单元格中的数值是否大于100,正确的条件格式公式是?(选项A.=B2100B.IFB2100,大于100,小于等于100C.B2100D.以上都对)
5.Excel中,以下哪个操作可以快速筛选出“性别”列中“男”的所有数据?(选项A.点击“性别”列的筛选按钮,选择“男”B.选中“性别”列,使用快捷键Ctrl+F,输入“男”C.直接在“性别”列手动查找“男”D.以上都是)
6.要计算C列中数值的平均值,且忽略文本数据,正确的公式是?(选项A.AVERAGEC:CB.AVERAGEAC:CC.AVERAGEIFC:C,*D.AVERAGEIFC:C,*)
7.Excel数据透视表中,以下哪个区域用于放置“行”字段?(选项A.筛选区域B.行区域C.列区域D.值区域)
8.要将“成绩”列中60分以下的标记为“不及格”,60-70分为“及格”,70分以上为“优秀”,应使用哪个函数?(选项A.VLOOKUPB.IF C.IFERROR D.CHOOSE)第6页共15页
9.Excel中,以下哪个函数用于计算数据区域中不重复值的数量?(选项A.COUNT B.COUNTA C.COUNTUNIQUE D.UNIQUE)
10.要将A列中的文本字符串按空格拆分为两列,正确的操作是?(选项A.使用“数据”选项卡中的“分列”功能B.使用TRIM函数C.使用MID函数D.使用FIND函数)
11.Excel中,以下哪个快捷键用于快速填充当前单元格上方或左侧的内容到下方或右侧?(选项A.Ctrl+CB.Ctrl+DC.Ctrl+R D.B和C都正确)
12.要计算D列中“产品A”的销售数量总和,正确的公式是?(选项A.SUMIFA:A,产品A,D:D B.SUMIFD:D,产品A,A:A C.SUMIFA:D,产品A,D:D D.SUMIFD:A,产品A,D:D)
13.Excel中,要冻结首行和首列,应在“视图”选项卡中使用哪个功能?(选项A.冻结窗格B.拆分窗口C.新建窗口D.全部重排)
14.要将单元格中的“20251005”格式的字符串转换为日期格式“2025-10月-05日”,可使用哪个函数?(选项A.DATEVALUE B.TEXT C.DATE D.以上都不对)
15.Excel中,以下哪个函数用于返回指定单元格区域中的最小数值?(选项A.MIN B.MINUTE C.MINUS D.MINIFS)
四、数据分析方法与逻辑题(本题型共15题,每题2分,共30分)
1.数据分析师在分析用户留存率时,如果发现第7天留存率远低于第1天留存率,应该考虑的是?(选项A.优化产品功能B.检查数据计算是否有误C.增加用户激励活动D.忽略该现象,因为留存率随时间下降是正常的)第7页共15页
2.以下哪项属于描述性数据分析的输出结果?(选项A.用户流失率预测模型B.本月销售额较上月增长20%的结论C.各产品类别的销售占比饼图D.A和C都正确)
3.在分析“用户活跃度”指标时,如果用户活跃度与产品付费率呈正相关,这说明?(选项A.活跃度是付费的必要条件B.需要进一步分析相关性是否为因果关系C.活跃度高的用户一定付费D.付费率与活跃度无关联)
4.数据分析师在构建分析框架时,需要明确是?(选项A.收集数据的渠道B.分析工具的选择C.分析目标与业务背景D.数据清洗方法)
5.以下哪项属于“诊断性分析”的典型应用场景?(选项A:通过历史数据预测未来季度销售额B:分析用户流失的具体原因(如功能问题、价格问题等)C:计算本月各产品的销售数据D:用折线图展示近一年的销售额趋势)
6.在数据指标定义中,“日活跃用户数(DAU)”通常定义为?(选项A.当天登录过APP的用户总数B.当天使用过APP的用户总数C.当天使用APP超过3次的用户总数D.A和B都正确,取决于具体业务定义)
7.当发现“产品A的销量在3月15日突然下降”,数据分析师的第一步应该是?(选项A.直接归因于市场竞争加剧B.检查数据是否存在异常(如统计错误、数据缺失)C.调整产品A的定价D.增加A的促销活动)
8.以下哪项属于“预测性分析”的典型应用?(选项A.分析过去6个月的用户增长趋势B.根据历史销售数据预测下季度各产品的销量第8页共15页C.计算用户满意度评分的平均值D.找出销量最高的10个用户特征)
9.在分析“转化率”指标时,分子是“完成购买的用户数”,分母是“访问产品详情页的用户数”,则该转化率定义为?(选项A.详情页到购买的转化率B.点击到购买的转化率C.访问到购买的转化率D.浏览到购买的转化率)
10.数据分析师在进行多维度交叉分析时,如果发现“年轻用户(18_25岁)在一线城市购买产品B的比例最高”,这属于?(选项A:单维度分析B:两维度交叉分析C:三维度交叉分析D:多维度关联分析)
11.在数据逻辑关系中,“用户注册时间”与“首次消费时间”之间的时间差属于?(选项A.绝对时间B.相对时间C.时间戳D.时间区间)
12.以下哪项属于“探索性分析”的特点?(选项A.有明确的假设和目标B.通过数据发现未知的规律或异常C.主要用于验证已有结论D.输出结构化的分析报告)
13.数据分析师在评估数据质量时,发现某列数据中存在大量重复值,最可能的原因是?(选项A.数据采集时重复录入B.数据清洗不彻底C.数据接口返回错误D.以上都有可能)
14.在分析“用户复购率”时,正确的计算逻辑是?(选项A.本月购买用户数/上月注册新用户数×100%B.本月重复购买用户数/上月购买用户数×100%C.本月购买用户数/上月总用户数×100%D.本月重复购买用户数/本月总用户数×100%)第9页共15页
15.数据分析师发现“产品价格”与“销量”呈负相关,以下哪项结论最合理?(选项A.价格越高,销量越高B.价格越低,销量越高C.价格上升可能导致销量下降D.价格与销量无关联五数据可视化题(本题型共10题,每题3分,共30分)
1.要展示“2025-2025年各季度销售额占比”,最适合的图表类型是?(选项A.折线图B.饼图C.柱状图D.面积图)
2.要展示“某产品在过去12个月的月度销售额变化趋势”,最适合的图表类型是?(选项A.饼图B.折线图C.柱状图D.散点图)
2.要比较“A.B.C三个区域的季度销售额”最适合图表类型是?(选项A.饼图B.柱状图C.雷达图D.漏斗图)
3.要展示“用户年龄分布(如18-25岁、26-35岁等)的具体人数”,最适合的图表类型是?(选项A.直方图B.折线图C.散点图D.热力图)
4.要展示“不同产品类别(手机、电脑、平板)的用户满意度评分”,最适合的图表类型式?(选项A.柱状图B.条形图C.雷达图D.箱线图)
5.要展示“用户在APP内各功能模块点击次数占比”,最适合的图表类型是?选项A.饼图B.Doughnut图C.漏斗图D.以上都可以
6.要展示“两个变量(如用户年龄与消费金额)之间相关性”,最适合的图表类型是?(选项A.散点图B.折线图C.热力图D.箱线图)
7.要展示“某地区各城市的销售额对比,且需要突出最大值和最小值”,最适合的图表类型是?(选项A.柱状图B.条形图C.气泡图D.地图(地理热力图)第10页共15页
8.要展示“某产品不同渠道销售数据随时间变化”最适合的图表类型式?(选项A.折线图B.面积图C.堆叠柱状图D.雷达图)
9.以下哪种图表不适合用于展示“数据的分布特征”?(选项A.直方图B.箱线图C.散点图D.密度图)
六、业务理解与案例分析题(本题型共10题每题5分,共50分)
1.某电商平台想提升“新用户首单转化率”,作为数据分析师,你会如何分析并提出优化建议?(选项A.分析新用户行为路径,找出转化瓶颈B.直接提升新用户注册奖励C.优化产品详情页D.以上都是)
2.某APP运营团队发现“用户次日留存率下降”,作为数据分析师,你需要从哪些维度排查原因?(选项A.检查是否有新版本上线,新功能是否影响用户体验B.检查用户反馈是否有集中问题C.分析新用户的获取渠道是否变化D.A、B、C都需要排查)
3.某奶茶店想通过数据分析优化产品定价,你会建议他们收集哪些数据?(选项A.不同价格带的销量数据B.顾客对不同口味的偏好数据C.成本数据D.A、B、C都需要)
4.某教育机构想分析“课程续费率低”的原因,作为数据分析师,你会重点关注哪些指标或维度?(选项A.课程内容质量(通过用户评价数据)B.讲师水平(通过评分数据)C.价格合理性(通过价格与满意度交叉分析)D.以上都是)
5.某APP想通过数据分析提升“广告点击率”(CTR),你认为最关键的分析步骤应该是?(选项A.分析不同广告位的CTR差异,找出高潜力位置B.分析不同广告素材(图片/视频/文案)的CTR差异C.A和B都需,再结合用户画像分析D.直接更换所有广告素材)第11页共15页
6.某零售企业发现“周末销售额远高于工作日”,但数据显示“周末客流量与工作日客流量差异不大”时,可能的原因是?(选项A.“周末客单价更高”B.“周末促销活动更多”C.“周末的商品库存更充足”D.A、B、C都可能)
7.某APP用户投诉“无法完成支付”,作为数据分析师,你需要分析哪些数据来定位问题?(选项A.支付流程各环节的用户流失率数据B.用户支付时的错误提示日志C.支付渠道接口返回数据D.A、B、C都需要)
8.某餐饮连锁品牌想通过数据分析优化门店选址,你认为需要哪些核心数据支持决策?(选项A.各区域人口密度、消费能力数据B.周边竞争对手分布及门店数量C.区域交通便利性数据D.A、B、C都需要)
9.某电商平台想分析“用户购物车放弃率高”的原因,以下哪项数据最不可能帮助定位问题?(选项A.购物车商品数量与放弃率的关系B.支付页面的加载速度数据C.用户评价中提到的购物车相关问题D.商品详情页停留时间)
10.某APP想通过数据分析提升“会员转化率”,作为数据分析师,你会建议从哪些方面入手分析?(选项A.非会员用户的权益感知度(通过问卷或访谈)B.会员权益与非会员权益的对比数据C.非会员用户的行为路径中是否有转化节点缺失D.A、B、C都需要)
七、Python基础及库应用题(本题型共15题,每题2分,共30分)
1.Python中以下哪个库用于数据可视化?(选项A.Pandas B.NumPy C.Matplotlib D.Scikit-learn)第12页共15页
2.要读取Excel文件中的数据,Pandas库中使用的函数是?(选项A.pd.read_csv B.pd.read_excel C.pd.read_table D.pd.read_json)
3.以下哪个Python语句可以创建包含10个0到1之间随机数的数组?(选项A.np.random.rand10B.np.random.randn10C.np.random.randint0,1,size=10D.np.random.choice10,size=10)
4.在Pandas中以下哪个方法用于删除DataFrame中的缺失值?(选项A.df.dropna B.df.fillna C.df.replace D.df.drop_duplicates)
5.要计算DataFrame中“销售额”列总和,正确的代码是?(选项A.df[销售额].sum B.df.sum销售额C.df[销售额].sumaxis=1D.sumdf[销售额])
6.Python中以下哪个库用于数据统计分析?(选项A.Pandas BNumPy C.Scipy D.Scikit-learn)
7.要筛选DataFrame中“用户年龄”大于30且“性别”为女的行,正确的条件表达式是?(选项A.df[年龄]30df[性别]==女B.df[年龄]30and df[性别]==女C.df[年龄]30df[性别]==女D.df[年龄]30or df[性别]==女)
8.以下哪个函数用于对DataFrame分组计算每组某个列的平均值?(选项A.df.groupby分组列[数值列].mean B.df.groupby分组列.mean C.A和B都正确D.df.avg数值列.groupby分组列)第13页共15页
9.Python中以下哪个库用于机器学习模型构建?(选项A.Pandas B.NumPy C.Scikit-learn D.Matplotlib)
10.要将DataFrame中的“日期”列转换为datetime类型,正确的代码是?(选项A.pd.to_datetimedf[日期]B.df[日期].astypedatetime64C.A和B都正确D.df[日期].convert_dtypedatetime
6411.以下哪个Python语句可以创建一个Series?(选项A.pd.Series[1,2,3,4]B.pd.DataFrame[1,2,3,4]C.np.array[1,2,3,4]D.list[1,2,3,4])
12.要计算DataFrame中两列(A和B)的相关系数,正确的方法是?(选项A.df[A].corrdf[B]B.df.corr C.A和B都正确D.df[A].corrwithdf[B])
13.Python中以下哪个库用于数据处理和分析的核心库?(选项A.Pandas B.NumPyC.Matplotlib D.Scipy)
14.要对DataFrame按“用户ID”进行去重,保留最新的记录,正确的代码是?(选项A.df.drop_duplicatessubset=用户ID,keep=last B.df.drop_duplicatessubset=用户ID,keep=first C.df.drop_duplicatessubset=用户ID D.A和B都正确)
15.以下哪个Python语句可以打印出DataFrame的前5行数据?(选项A.df.head5B.df.tail5C.df.show5D.printdf[:5])答案汇总
一、基础概念题答案
1.B
2.B
3.D
4.D
5.B
6.C
7.C
8.D
9.B
10.C
11.B
12.D
13.D
14.D
15.D第14页共15页
二、SQL基础及查询题答案
1.A
2.A
3.D
4.A
5.A
6.A
7.A
8.A
9.A
10.A
11.A
12.A
13.A
14.C
15.D
三、Excel操作与函数题答案
1.D
2.A
3.A
4.A
5.A
6.A
7.B
8.B
9.C
10.A
11.D
12.A
13.A
14.B
15.A
四、数据分析方法与逻辑题答案
1.B
2.C
3.B
4.C
5.B
6.D
7.B
8.B
9.A
10.B
11.B
12.B
13.D
14.B
15.C
五、数据可视化题答案
1.B
2.B
3.B
4.A
5.B
6.A
7.A
8.D
9.C
10.C
六、业务理解与案例分析题答案
1.A
2.D
3.D
4.D
5.C
6.D
7.D
8.D
9.D
10.D
七、Python基础及库应用题答案
1.C
2.B
3.A
4.A
5.A
6.C
7.A
8.A
9.C
10.C
11.A
12.C
13.A
14.A
15.A第15页共15页。
个人认证
优秀文档
获得点赞 0