思谋面试准备

title：机器学习算法

一面：
https://blog.csdn.net/weixin_42486139/article/details/111841428
1.Tensorflow如何输出某一层卷积结果？
tf.Print
2.bagging 与boosting区别
3.分类网络常用backbone
https://blog.csdn.net/m0_59787404/article/details/121458616
主干网络，用来做特征提取的网络，代表网络的一部分，一般是用于前端提取图片信息，生成特征图feature map,供后面的网络使用。通常用VGGNet还有你说的Resnet，因为这些backbone特征提取能力是很强，并且可以加载官方在大型数据集(Pascal 、Imagenet)上训练好的模型参数，然后接自己的网络，进行微调finetune即可。

4.python 中 if name == ‘main’ 作用
在python的类中没有真正的私有属性或方法，没有真正的私有化。
但为了编程的需要，我们常常需要区分私有方法和共有方法以方便管理和调用。那么在Python中如何做呢？
一般Python约定加了下划线 _ 的属性和方法为私有方法或属性，以提示该属性和方法不应在外部调用，也不会被from ModuleA import * 导入。如果真的调用了也不会出错,但不符合规范。
https://www.jb51.net/article/160280.htm
一个python文件通常有两种使用方法，第一是作为脚本直接执行，第二是 import 到其他的 python 脚本中被调用（模块重用）执行。因此 if name == ‘main’: 的作用就是控制这两种情况执行代码的过程，在 if name == ‘main’: 下的代码只有在第一种情况下（即文件作为脚本直接执行）才会被执行，而 import 到其他脚本中是不会被执行的。
https://blog.csdn.net/heqiang525/article/details/89879056

5.介绍python垃圾回收机制
https://www.cnblogs.com/pinganzi/p/6646742.html

6.权重衰减的作用
权重衰减即l2正则, 使学到的模型参数值尽可能小，增加模型鲁棒性，解决过拟合

7.介绍k-means流程，实现k-means更新簇的过程叫什么算法？
流程：略（面试高频问题，不清楚的自行百度）
算法名称：最大期望算法 EM
https://ac.nowcoder.com/discuss/817777

8.数据库三大范式
第一范式（1NF）:列不可再分
第二范式（2NF）属性完全依赖于主键
第三范式（3NF）属性不依赖于其它非主属性属性直接依赖于主键

9.mysql中给查询语句分组用哪个关键字
group by

10.时序算法有哪些：
https://blog.csdn.net/yunqiinsight/article/details/79741483
方法 1 –以简单的方式开始
方法2 – 简单平均数
方法3 – 移动平均数
方法 4 –指数平滑法
方法5 – Holt线性趋势法
方法6 – Holt冬季季节法
方法7 –综合自回归移动平均法（ARIMA）
https://zhuanlan.zhihu.com/p/67832773
1.时间序列基本规则法-周期因子法
2.线性回归-利用时间特征做线性回归
3.传统时序建模方法，ARMA/ARIMA等线性模型
4.时间序列分解，使用加法模型或乘法模型将原始序列拆分为4部分：长期趋势变动T、季节变动S(显式周期，固定幅度、长度的周期波动)、循环变动C(隐式周期，周期长不具严格规则的波动)和不规则变动I。
5.特征工程着手，时间滑窗改变数据的组织方式，使用xgboost/LSTM模型/时间卷积网络等
6. 转化为监督学习数据集，使用xgboot/LSTM模型/时间卷积网络/seq2seq(attention_based_model)。
7. Facebook-prophet，类似于STL分解思路，在控制程度和可解释性上比传统时序模型更有优势
8.深度学习网络，结合CNN+RNN+Attention，作用各不相同互相配合。
9.将时间序列转化为图像，再应用基于卷积神经网络的模型做分析

11.解释算法原理：kmeans，EM，LSTM，SVM, ARIMA

二面coding：
1.1695. 删除子数组的最大得分
https://leetcode-cn.com/problems/maximum-erasure-value/
2.200. 岛屿数量
https://leetcode-cn.com/problems/number-of-islands/
3.判断一棵树是另一颗树的子树

https://blog.csdn.net/wjl_zyl_1314/article/details/105036333
4.编程题：实现求根函数，有没有效率更高的方法。
5.编程题：用堆求前k大
6.编程题：0，1组成的n*m表格，一个人站在起始点，这个人只能经过与他脚底数字相同的地方（只有上下左右四个方向），输出这个人所有可以走到的点。

三面leader：
1.
介绍项目，介绍项目亮点，深挖项目中用到的network。
举例：任务中用到HED，ok，面试官问HED是如何解决正负样本不平衡的问题的？损失函数使用类平衡交叉熵。类平衡交叉熵的动态系数阿尔法是怎么得到的？除了类平衡交叉熵还有哪些解决正负样本不均衡的损失函数？focal loss。解释focal loss中的alpha系数、gamma系数，以及他们的作用，以及他们是如何起到作用的。这种解决正负样本不均衡的方式和OHEM的区别是什么？
bn在哪种情况下会出问题？听说过gn吗？ bn在batchsize=1的时候效果不好, gn group normalization
2.介绍一篇最近看的好的技术文章

猜你喜欢