【2019校招中信银行信用卡中心】数据挖掘及分析工程师面试总结

我的个人微信公众号:Microstrong

微信公众号ID:MicrostrongAI

微信公众号介绍:Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!

知乎专栏:https://zhuanlan.zhihu.com/Microstrong

Github:https://github.com/Microstrong0305

个人博客:https://blog.csdn.net/program_developer

20181012一面:

1. 面试官:请简单自我介绍。

2. 都是围绕着简历中的项目展开的,问的很仔细,所以简历中自己项目一定要很熟悉。

3. 面试官:数学中一个函数的泰勒展开公式是什么?

我:这个写不出来公式。

补充:

泰勒中值定理:

如果函数f(x)在含有x_{0}的某个开区间(a,b)内具有直到(n + 1)阶的导数,则对任一x\epsilon (a,b),有:

f(x) = f(x_{0})+f^{'}(x_{0})(x-x_{0})+ \frac{f^{''}(x_{0})}{2!}(x-x_{0})^{2}+\cdots + \frac{f^{(n)}(x_{0})}{n!}(x-x_{0})^{n}

(1)面试官:泰勒展开公式在机器学习、深度学习中都有哪些应用?

我:GBDT用到的是泰勒展开式中的一阶信息,XGBoost用到的是泰勒展开式中的二阶信息。

4. 面试官: Java中HashSet了解么?讲一下!

我:这个不是太熟,很少用。

补充:

Hashset简介:

1)HashSet是一个没有重复元素的集合。

2)HashSet是由HashMap实现的,不保证元素的顺序,而且HashSet允许使用null元素。

3)HashSet是非同步的。

5. 面试官:Java中Map接口了解么?下面实现类都有什么?

我: 分别讲了HashMap、TreeMap、LinkedHashMap之间的区别和底层实现。

我:自己又多嘴说HashMap是线程不安全的。

面试官:你是如何解决HashMap的线程不安全情况?

我:通常用concurrentHashMap。

面试官:那concurrentHashMap是如何保证线程安全的呢?

我:加锁机制。

面试官:详细讲解一下加锁机制?

我:很久之前看的,忘了。

补充:concurrentHashMap的加锁机制。

1)HashMap是线程不安全的。因为多线程环境下,使用HashMap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap。

2)HashTable容器使用synchronized来保证线程安全,但在线程竞争激烈的情况下HashTable的效率非常低下。因为当一个线程访问HashTable的同步方法时,其他线程访问HashTable的同步方法时,可能会进入阻塞或轮询状态。如线程1使用put进行添加元素,线程2不但不能使用put方法添加元素,并且也不能使用get方法来获取元素,所以竞争越激烈效率越低。

3)concurrentHashMap的锁分段技术

 HashTable容器在竞争激烈的并发环境下表现出效率低下的原因,是因为所有访问HashTable的线程都必须竞争同一把锁,那假如容器里有多把锁,每一把锁用于锁容器其中一部分数据,那么当多线程访问容器里不同数据段的数据时,线程间就不会存在锁竞争,从而可以有效的提高并发访问效率,这就是ConcurrentHashMap所使用的锁分段技术,首先将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问。

Reference:https://www.cnblogs.com/ITtangtang/p/3948786.html

6. 面试官:了解过JVM和GC么?

我:了解过。很久之前看的。就没有多问了。

7. 面试官:常用的数据库有哪些?

我:MySQL和SQL Server。

8. 面试官:在建表的过程中,一般都有什么步骤?

这个我就把数据库建表时候的步骤过程说了一下。

9. 面试官:mysqldump备份和mysqlhotcopy备份区别?

我:......。

9. 面试官:知道数据库中悲观锁和乐观锁么?

我:......。

10. 面试官:简单讲解一下随机森林算法?

我:简单讲了一下。

面试官:随机森林的缺点是什么?

我:随机森林对噪点比较敏感。

二面:

面完一面就是二面,一个上午搞定中信信用卡中心的面试。

二面没什么可讲的,就是问你为什么不打kaggle、阿里天池比赛啥的,还有你导师是谁,你如何看待数据挖掘和数据标注工作之间的差别等等吧!

发布了285 篇原创文章 · 获赞 892 · 访问量 111万+

猜你喜欢

转载自blog.csdn.net/program_developer/article/details/83048650