字节机器学习算法一面

部门背景：跨境电商
title：智能供应链算法工程师
date：Jan 10th，2022
time：3.00-4.00p.m.

面试官：很和蔼，我有很多不会，他木有嘲笑我。
半小时项目中技术问答，半小时做一道算法题
1.首先自我介绍
2.特征为啥不考虑设备本身的工作时长、状态、属性，故障记录等信息？
3.为啥没用频域特征？
4.有木有考虑前1分钟的、前1小时的、前1天的等不同维度的这几个特征值？
5.LSTM的三个门？结构？
6.LSTM为啥用了tanh激活函数外还要再用sigmoid激活函数？
sigmoid用在了各种gate上，产生0~1之间的值，这个使用sigmoid最直接，相当于要么是1则记住要么是0则忘掉。tanh用在了状态和输出上，是对数据的处理，这个也可以用其他激活函数。
7.为啥sigmoid函数要把输出限定在0到1范围内？为啥tanh激活函数输出限制在-1到1？
（1）对于深度神经网络，中间的隐层的输出必须有一个激活函数。否则多个隐层的作用和没有隐层相同。这个激活函数不一定是sigmoid，常见的有sigmoid、tanh、relu等。
（2）对于二分类问题，输出层是sigmoid函数。这是因为sigmoid函数可以把实数域光滑的映射到[0,1]空间。函数值恰好可以解释为属于正类的概率（概率的取值范围是0~1）。另外，sigmoid函数单调递增，连续可导，导数形式非常简单，是一个比较合适的函数
（3）对于多分类问题，输出层就必须是softmax函数了。softmax函数是sigmoid函数的推广
8.LSTM如何解决梯度消失和梯度爆炸问题？
9.XGB和GBDT的区别？
10.XGB的工程实现体现在哪里？为啥可以在内存和计算速度等方面有提升？
11.GBDT如何实现特征权重的？
12.bagging和boosting的区别？
13.随机森林的随机性体现在哪里？
样本选择、特征是随机的
14.随机森林对于缺失值是怎么处理的？
15.为啥XGB要对代价函数做二阶泰勒展开？要用导数做啥？
16.讲一下分支定界的原理
17.讲一下单纯形法的原理
18.bagging和boosting 方差偏差？
19.有没有用过什么启发式算法？
20.为什么选LSTM？
21.有没有做过CV NLP？
还有好多问题我记不得了。问了好多非常深的问题，自己确实平时没有思考那么深。面试官给我的建议是选定一个职业发展方向，然后要往深了钻研，谢谢面试官。确实要多问几个为什么。

算法题：
leetcode简单难度
剑指 Offer 42. 连续子数组的最大和
https://leetcode-cn.com/problems/lian-xu-zi-shu-zu-de-zui-da-he-lcof/
我做出来了，但是用的笨方法，我向面试官承认了这一点，面试官安慰我说没事，没限制你的时空复杂度。

部门背景介绍：
跨境电商仓储物流等。
算法方向：CV，NLP，ML，运筹优化。面试官除了CV其他三个方向都做，好厉害。
算法团队4个方向加起来共20人。
部门2021年下半年成立。
常用算法：
ML：树模型
运筹优化：启发式算法、整数规划、随机优化

字节机器学习算法一面

猜你喜欢