数据科学面试学习指南
像其他技术面试一样,数据科学技术面试也需要大量准备。为了确保您准备好接受数据科学面试,需要涵盖许多主题。
在我们开始之前。我们想指出一些技巧。
我们注意到的一件事是数据科学访谈有几种类型。
一些数据科学访谈非常注重产品和指标。这些采访更多地中心化在询问产品问题,例如您将使用哪种度量标准来表明您应该对产品进行哪些改进。这些通常与SQL和一些Python问题搭配使用。
数据科学面试的另一种类型往往是编程和机器学习的结合。
我们建议您询问招聘人员是否没有提供任何提示。一些公司非常擅长保持面试的一致性,但即使如此,团队有时还是会根据自己的需求而偏离。以下是一些有关一些公司进行数据科学采访的案例。
Airbnb —重磅产品,度量标准诊断,度量标准创建,A / B测试,大量行为问题并带回家。
Netflix —产品感问题,A / B测试,实验设计,度量设计
微软-编程重载,二叉树遍历,SQL,机器学习
Expedia —产品,编程,sql,产品意义,关于SVM的机器学习问题,回归和决策树
为了跟踪您的进度,我们整理了一份学习清单以帮助您
下载数据科学面试清单
首先让我们确保您可以解释基本的数据科学算法。
机器学习算法
- Logistic回归—视频
- A / B测试? – – 视频
- 决策树—发布
- SVM —发布
- 如何SVM —视频
- 主成分分析:PCA — post
- 主成分分析—视频
- Adaboost —发布
- AdaBoost —视频
- 机器学习梯度提升算法的简要介绍
- 梯度提升第1部分:回归主要思想—视频
-
K-均值聚类—智能数学—视频
-
贝叶斯网络—邮政
-
神经网络—发布
-
降维算法—帖子
-
kNN算法如何工作—视频
概率统计
您可能会在FAANG公司和其他技术公司中遇到一个常见问题,即偶发概率或统计问题。这些问题不一定需要复杂的数学运算。但是,如果您暂时没有考虑过独立概率和依存概率。回顾一下设置基本公式是一件好事。
概率视频
- 相依概率介绍
- 独立概率
- 独立问题
- 有条件的问题文章
概率测验
- 概率与统计— Set 6
- 概率与统计— Set 2
- 独立概率
- 相依概率
概率面试题
这些问题大多数与我们所提出的问题类似,或者直接从glassdoor.com获得。
- 骰子滚动两次。在第一成交量上显示3并在第二成交量上显示奇数的概率是多少?
- 在任何15分钟的间隔内,您将有20%的概率看到至少一颗流星。您在一小时内看到至少一颗流星的概率是多少?
- 爱丽丝有2个孩子,其中一个是女孩。另一个孩子也是女孩的几率是多少?您可以假设世界上的男性和女性人数相等。
- 您将乘飞机去西雅图。你要知道
- 您可以通过多少种方式将12个人分成3个4人的团队?
统计预测
- 数据科学概率统计14
统计概念
统计学是一个广义的概念,因此不要对每个视频的细节都感到困惑。相反,只要确保您可以在表面上解释每个概念。
- 偏差偏差权衡
- 混淆矩阵
- ROC曲线
- 正态分布
- P值
-
皮尔逊·斯皮尔曼
-
正态分布问题:z分数(来自ck12.org)
-
连续概率分布
-
标准化正态分布的随机变量(快速版本)
-
统计信息101:简单线性回归,非常基础
-
统计101:线性回归,离群值和有影响的观察
-
统计101:ANOVA,直观介绍
-
统计101:多元回归,非常基础
-
统计:人口差异|概率统计|可汗学院
-
期望值:E(X)
-
大数定律|概率统计|可汗学院
-
中心极限定理|推论统计|概率统计|可汗学院
-
错误1的余量|推论统计|概率统计|可汗学院
-
错误容限2 |推论统计|概率统计|可汗学院
-
假设检验和p值|推论统计|概率统计|可汗学院
-
一尾和二尾测试|推论统计|概率统计|可汗学院
-
类型1错误|推论统计|概率统计|可汗学院
-
大样本比例假设检验|概率统计|可汗学院
-
提振和装袋
统计后测验
- 数据科学概率统计17
面试准备价格
准备数据科学面试的另一种好方法是参加面试价格。通常,这些价格可能会在10到200美元之间。取决于您使用的站点,更重要的是,这还取决于udemy算法的工作方式。有时udemy会为同一价格收取$10的费用,之后可能会收取$200的费用
- 数据科学职业指南-面试准备($10- $200,具体取决于算法的计算结果)
- 数据科学面试准备-职业指南($10- $200,具体取决于算法的计算结果
产品和实验设计
产品感是数据科学家的一项重要技能。知道要对新产品进行衡量的原因以及为什么可以帮助确定产品是否表现良好。有趣的是,有时指标按照您希望的方式发展可能并不总是很好。有时,人们在您的网站上花费更多时间的原因是因为网页可能需要更长的时间才能加载或出现其他类似问题。这就是为什么度量标准很棘手,而您的度量很重要的原因。
产品和实验设计概念
- 用户参与度指标
- 数据科学家工具箱:实验设计-视频
- A / B测试指南
- 6个指标主题
产品和指标问题
- 一个重要的指标下跌了,您将如何找出原因?
- 您将使用什么指标来量化youtube广告的成功(也可以扩展到其他产品,例如Snapchat过滤器,Twitter实时流式传输,Fort-nite新功能等)
- 您如何衡量产品/产品功能的成功或失败
- Google发布了他们的搜索算法的新版本,并对其进行了A / B测试。在测试过程中,工程师意识到新算法未正确实施,因此返回的相关性较小。测试期间发生了两件事:
- 与对照组相比,治疗组中的人执行的查询更多。
- 治疗组的广告收入也较高。
治疗组中的人比对照组进行更多搜索的原因可能是什么?这里有不同的可能答案。
问题4是从Zarantech借来的;我们真的很喜欢它,并认为这是事情可能出错的一个很好的例子。
程式设计
仅仅因为数据科学并不总是需要繁重的编程,并不意味着访问者不会要求您遍历二叉树。因此,请确保您询问面试官会有什么期望。不要被这些问题吓到。选择一些要做的事,这样您就不会在面试中感到惊讶。
视频前问题
- 嘶嘶声
- 查找数组中第K个最小/最大整数
- 第N斐波那契
算法和数据结构
学习前问题在学习有关数据结构和算法的视频内容之前。考虑在下面尝试这些问题。看看您是否可以回答。这将帮助您知道要重点关注的内容。
- 985.查询后的偶数总数
- 657.机器人归原点
- 961. 2N数组中的N个重复元素
- 110.平衡二叉树
算法和数据结构视频
数据结构
- 数据结构和算法#1 —什么是数据结构?
- 多点昏暗(视频)
- 数据结构:链表
- 核心链接列表与数组(视频)
- 数据结构:树
- 数据结构:堆
- 数据结构:哈希表
- 数据结构:堆栈和队列
演算法
- 面试的Python算法
- 算法:图搜索,DFS和BFS
- BFS(深度优先搜索)和DFS(深度优先搜索)(视频)
- 算法:二进制搜索
- 二叉搜索树评测(视频)
- 算法:递归
- 算法:冒泡排序
- 算法:合并排序
- 算法:Quicksort
字符串操作
- 编码面试问答:最长连续字符
- Sedgewick — Substring搜索(视频)
的SQL
研究后问题
现在您已经学习了一段时间,并观看了一些视频。让我们再尝试一些问题
- 更大越大
- 6. ZigZag转换
- 7.反向整数
- 40.组合和II
- 43.相乘字符串
- 拉里的阵
- 霍林回文
- 65.有效数字
- 越大越好
- 完整计数排序
- 莉莉的作业
SQL —问题
通常,至少会有一次针对SQL的访谈。此外,访问员可能会引导您完成产品开发的整个过程,一个指标,然后进行查询以衡量该指标的有效性。
- 262.旅行和用户
- 601.体育场的人口贩运
- 185.学系前三名的薪水
- 626.交易所座位
- 黑客rank报告
- 177.最高薪水
- 对称对
- 职业
- 刊登位置
- 奥利凡德的股票
SQL —视频
- IQ15:6个SQL查询面试问题
- 了解ROW_NUMBER和分析功能
- 解析功能的高级实现
- 解析功能的高级实现第2部分
- 明智的猫头鹰SQL视频
发布SQL问题
- 二叉树节点
- 气象观测站18
- 挑战性
- 打印素数
- 595.大国
- 626.交易所座位
- SQL面试问题:3个技术筛选练习(针对数据分析师)
价格
如果您已完成上述所有问题和视频,但仍然需要复习,请考虑参加以下价格。他们将帮助您获得一些新观点。事实是,这些价格几乎涵盖了我们提供的视频中涵盖的相同概念。但是,有时候,从多个来源收听相同的信息会有所帮助。
- 数据科学职业指南-面试准备
- 编码面试训练营:算法+数据结构
- 数据仓库概念:基础到高级概念
技术面试可能很难。无论是软件工程师,数据工程师还是数据科学家。我们希望这份学习指南能帮助您跟踪进度
如果您认为缺少主题,请告诉我们。谢谢
如果您喜欢这篇有关数据科学的文章,那么也请考虑这些文章
数据科学家必须具备的4种技能
算法如何变得不道德和偏见
在数据科学中使用敏捷方法
142个掌握编码面试的资源
解决平衡括号问题的数据科学家是什么