字节机器学习算法一面

部门背景:跨境电商
title:智能供应链算法工程师
date:Jan 10th,2022
time:3.00-4.00p.m.

面试官:很和蔼,我有很多不会,他木有嘲笑我。
半小时项目中技术问答,半小时做一道算法题
1.首先自我介绍
2.特征为啥不考虑设备本身的工作时长、状态、属性,故障记录等信息?
3.为啥没用频域特征?
4.有木有考虑前1分钟的、前1小时的、前1天的等不同维度的这几个特征值?
5.LSTM的三个门?结构?
6.LSTM为啥用了tanh激活函数外还要再用sigmoid激活函数?
sigmoid用在了各种gate上,产生0~1之间的值,这个使用sigmoid最直接,相当于要么是1则记住要么是0则忘掉。tanh用在了状态和输出上,是对数据的处理,这个也可以用其他激活函数。
7.为啥sigmoid函数要把输出限定在0到1范围内?为啥tanh激活函数输出限制在-1到1?
(1)对于深度神经网络,中间的隐层的输出必须有一个激活函数。否则多个隐层的作用和没有隐层相同。这个激活函数不一定是sigmoid,常见的有sigmoid、tanh、relu等。
(2)对于二分类问题,输出层是sigmoid函数。这是因为sigmoid函数可以把实数域光滑的映射到[0,1]空间。函数值恰好可以解释为属于正类的概率(概率的取值范围是0~1)。另外,sigmoid函数单调递增,连续可导,导数形式非常简单,是一个比较合适的函数
(3)对于多分类问题,输出层就必须是softmax函数了。softmax函数是sigmoid函数的推广
8.LSTM如何解决梯度消失和梯度爆炸问题?
9.XGB和GBDT的区别?
10.XGB的工程实现体现在哪里?为啥可以在内存和计算速度等方面有提升?
11.GBDT如何实现特征权重的?
12.bagging和boosting的区别?
13.随机森林的随机性体现在哪里?
样本选择、特征是随机的
14.随机森林对于缺失值是怎么处理的?
15.为啥XGB要对代价函数做二阶泰勒展开?要用导数做啥?
16.讲一下分支定界的原理
17.讲一下单纯形法的原理
18.bagging和boosting 方差偏差?
19.有没有用过什么启发式算法?
20.为什么选LSTM?
21.有没有做过CV NLP?
还有好多问题我记不得了。问了好多非常深的问题,自己确实平时没有思考那么深。面试官给我的建议是选定一个职业发展方向,然后要往深了钻研,谢谢面试官。确实要多问几个为什么。

算法题:
leetcode简单难度
剑指 Offer 42. 连续子数组的最大和
https://leetcode-cn.com/problems/lian-xu-zi-shu-zu-de-zui-da-he-lcof/
我做出来了,但是用的笨方法,我向面试官承认了这一点,面试官安慰我说没事,没限制你的时空复杂度。

部门背景介绍:
跨境电商仓储物流等。
算法方向:CV,NLP,ML,运筹优化。面试官除了CV其他三个方向都做,好厉害。
算法团队4个方向加起来共20人。
部门2021年下半年成立。
常用算法:
ML:树模型
运筹优化:启发式算法、整数规划、随机优化

猜你喜欢

转载自blog.csdn.net/weixin_46870583/article/details/122412913