阿里达摩院(研究型实习生)

技术面四面:

一面:全部问项目基础内容

二面:项目(会基于具体项目做扩展)+在线编程:深度优先搜索的一个题

三面:项目(也问了我如何解决目标检测中的物体尺度大小不一的问题)+编程:给一组数字添加正负号使他们的和为0

四面:基于项目开展,会提出他们当时在做的场景问题,因为我的方向和他们挺符合的,所以四面的部门主管挺想让我过去的。

交叉面:不难为人,先介绍项目,然后提问。感觉面试官是做人脸的


一面


60分钟左右,聊得最开心的一位面试官,感觉二面没有挂掉应该是他给的评价比较好吧。

谈一下论文主要思想
介绍论文里不平衡分类马尔科夫决策过程的状态、动作、回报函数设计以及状态转移过程
针对状态转移的有效性、合理性和严谨性讨论了很久
讨论强化学习解决分类问题和监督学习下的神经网通分类器的异同
谈谈传统不平衡分类算法(上采样、下采样、混合采样、代价敏感矩阵、调整分类器阈值)以及最新深度学习不平衡分类算法
分析论文所提算法对比其他方法的优劣点
谈一下外汇自动交易项目的主要工作
介绍外汇自动交易项目里马尔科夫决策过程的状态、动作、回报函数设计以及状态转移过程
Q-网络的结构如何设计
LSTM和CNN提取时序价格数据特征的异同点
模型性能如何评价
在真正外汇环境里算法表现得怎么样(训练数据上效果很好,在未知的现实数据中还是难以捕捉市场规律)
讲一下DQN算法以及几种改进版本(Rainbow)
DQN算法与策略梯度算法的差别
REINFORCE算法存在问

猜你喜欢

转载自blog.csdn.net/ccsss22/article/details/126693246