我的个人微信公众号:Microstrong
微信公众号ID:MicrostrongAI
微信公众号介绍:Microstrong(小强)同学主要研究机器学习、深度学习、计算机视觉、智能对话系统相关内容,分享在学习过程中的读书笔记!期待您的关注,欢迎一起学习交流进步!
知乎专栏:https://zhuanlan.zhihu.com/Microstrong
Github:https://github.com/Microstrong0305
个人博客:https://blog.csdn.net/program_developer
20181012一面:
1. 面试官:请简单自我介绍。
2. 都是围绕着简历中的项目展开的,问的很仔细,所以简历中自己项目一定要很熟悉。
3. 面试官:数学中一个函数的泰勒展开公式是什么?
我:这个写不出来公式。
补充:
泰勒中值定理:
如果函数f(x)在含有的某个开区间(a,b)内具有直到(n + 1)阶的导数,则对任一,有:
(1)面试官:泰勒展开公式在机器学习、深度学习中都有哪些应用?
我:GBDT用到的是泰勒展开式中的一阶信息,XGBoost用到的是泰勒展开式中的二阶信息。
4. 面试官: Java中HashSet了解么?讲一下!
我:这个不是太熟,很少用。
补充:
Hashset简介:
1)HashSet是一个没有重复元素的集合。
2)HashSet是由HashMap实现的,不保证元素的顺序,而且HashSet允许使用null元素。
3)HashSet是非同步的。
5. 面试官:Java中Map接口了解么?下面实现类都有什么?
我: 分别讲了HashMap、TreeMap、LinkedHashMap之间的区别和底层实现。
我:自己又多嘴说HashMap是线程不安全的。
面试官:你是如何解决HashMap的线程不安全情况?
我:通常用concurrentHashMap。
面试官:那concurrentHashMap是如何保证线程安全的呢?
我:加锁机制。
面试官:详细讲解一下加锁机制?
我:很久之前看的,忘了。
补充:concurrentHashMap的加锁机制。
1)HashMap是线程不安全的。因为多线程环境下,使用HashMap进行put操作会引起死循环,导致CPU利用率接近100%,所以在并发情况下不能使用HashMap。
2)HashTable容器使用synchronized来保证线程安全,但在线程竞争激烈的情况下HashTable的效率非常低下。因为当一个线程访问HashTable的同步方法时,其他线程访问HashTable的同步方法时,可能会进入阻塞或轮询状态。如线程1使用put进行添加元素,线程2不但不能使用put方法添加元素,并且也不能使用get方法来获取元素,所以竞争越激烈效率越低。
3)concurrentHashMap的锁分段技术
HashTable容器在竞争激烈的并发环境下表现出效率低下的原因,是因为所有访问HashTable的线程都必须竞争同一把锁,那假如容器里有多把锁,每一把锁用于锁容器其中一部分数据,那么当多线程访问容器里不同数据段的数据时,线程间就不会存在锁竞争,从而可以有效的提高并发访问效率,这就是ConcurrentHashMap所使用的锁分段技术,首先将数据分成一段一段的存储,然后给每一段数据配一把锁,当一个线程占用锁访问其中一个段数据的时候,其他段的数据也能被其他线程访问。
Reference:https://www.cnblogs.com/ITtangtang/p/3948786.html
6. 面试官:了解过JVM和GC么?
我:了解过。很久之前看的。就没有多问了。
7. 面试官:常用的数据库有哪些?
我:MySQL和SQL Server。
8. 面试官:在建表的过程中,一般都有什么步骤?
这个我就把数据库建表时候的步骤过程说了一下。
9. 面试官:mysqldump备份和mysqlhotcopy备份区别?
我:......。
9. 面试官:知道数据库中悲观锁和乐观锁么?
我:......。
10. 面试官:简单讲解一下随机森林算法?
我:简单讲了一下。
面试官:随机森林的缺点是什么?
我:随机森林对噪点比较敏感。
二面:
面完一面就是二面,一个上午搞定中信信用卡中心的面试。
二面没什么可讲的,就是问你为什么不打kaggle、阿里天池比赛啥的,还有你导师是谁,你如何看待数据挖掘和数据标注工作之间的差别等等吧!