前期准备
2021/6/11记:距离2021/6/19开营还有9天,而19号当天就有一个笔试。如何利用这九天?上科大面经不多,大致分为四个方向:数学基础知识、专业课复习、英语+项目经历的整理、提前联系导师并做项目。
计划6/18日之前复习完一轮,6/18是二轮。
正式入营
6/19VDIC中心笔试
一共是十六个选择题,8个单选、8个多选,有些忘了。
单选:
第一题(正交):给定一组两两正交的向量组v1,v2,…vn,x = (λ1v1, λ2v2, … λnvn),问:怎样求得λi?
第二题(算法时间复杂度):给了四个时间复杂度的等式,问其中有几个是对的。记得一个式子是 e 100 = O ( n ) e^{100}=O(n) e100=O(n),还有 ( l o g n ) n 、 ( l o g n ) ( l o g n ) 、 2 n (logn)^n、(logn)^{(logn)}、2^{\sqrt n} (logn)n、(logn)(logn)、2n等式子,记不清了。
第三题(贝叶斯):一个人活到70岁的概率是P1,一个人患癌症的条件下活到70岁的概率是P2,一个人患癌症的概率是P3,求一个人活到70岁的条件下患癌症的概率。
答案:贝叶斯
第四题:有五个小球:1,2,3,4,5和一个栈,对其中的每一个小球都完成一次push和pop,已知:push小球的顺序是:1,2,3,4,5, 小球3是第一个pop出来的,问:下面哪一个是不可能被第5个pop出来的?
第五题:给定一棵满二叉树,从0开始编号,第i号结点的父亲结点是几号?选项有:floor((i-1)/2)、ceil((i-1)/2)啥的。
多选:
第一题:关于对称矩阵。记得有一个选项是:如果A和B都是对称矩阵,问你AB=BA是否就成立。
第二题:给定一组样本(x1,x2,…xn),独立,且同满足正态分布 ( μ , α 2 ) (μ,α^2) (μ,α2),给定下面哪些式子,可以求出 μ μ μ和 α 2 α^2 α2。
第三题:给定一颗完全二叉树,有10层(根节点算0层,,emmm也就是有11层),问:下面哪些节点个数是可能的?选项有2047啥的
第四题:一个矩阵的秩为r,问下面哪些选项是和它等价的?有一个选项是线性无关组的个数为r
第五题:题目没怎么看懂。给定一个对称矩阵Q,且 Q 2 = Q Q^2=Q Q2=Q,为下面的各个选项是否成立?(由于是英文题目,原题大概是 a symmetric matrix Q such that Q 2 = Q Q^2=Q Q2=Q)。 有一个选项是Q是奇异矩阵,还有一个选项是trace(Q)=rank(Q)。
第六题:给定一个图,V={2,3,4,5,6},E={(v1,v2) if v1和v2互质},问:如果对这个图进行深度优先搜索,下面可能的路径是那几条?
6/20导师面谈
大致分为三块儿:1. 算法 2. 论文内容 3. 闲聊
算法:
老师说昨天的笔试考得还不错,所以不问笔试相关了(哭,我多么想让他给我讲错题,然后我只要点头表示赞同就可以糊弄过去了)。由于昨天的笔试只涉及到了线代、概统、数据结构,没有涉及到算法,所以老师说要问我算法相关的(哭,我算法没有复习啊)。
第一问: 给定三个矩阵,大小分别为 axb, bxc, cxd,问连乘的时间复杂度?
我愣是想了七八分钟,期间说了很多错误的答案,后来用笔推了推,才知道是“abc+acd”。
第二问(接着第一问):现在给定n个矩阵,假设它们可以从左到右进行连乘,问算法的时间复杂度如何最优?
我愣是想了十来分钟。。。经过老师的帮助,,,才想到用“动态规划”,以及对应的“递推公式”。
论文内容:
第一问:我看你发表了一篇论文,给我讲讲它的内容?
“balabala”
第二问(接着第一问):你论文中用到了transformer,你对它应该很熟悉?
“balabala”(漏了position embedding)
第三问(接着第二问):transformer中丢失了单词的位置信息,该怎么办?
“用position embedding”
第四问(接着第三问):如何改进postion embedding?
”把position embedding换成可以学习的参数“
第五问(接着第四问):如果有两个句子,它们中有相同的一个词、或者是一个词组,但出现的绝对位置不一样,这时候如何改进position embedding?
“利用相对位置信息”(但具体怎么弄我不知道啊…僵持了大概10分钟,最后跟老师说我不知道怎么做,老师就转而问别的问题了)
第六问(接着第一问):你论文中用到了word2vec,你对它应该很熟悉?
“有两种,一种是中间词预测周围词,一种是周围词预测中间词。中间词预测周围词具体的就是,定义一个窗口,然后就会有中间词和周围词这样的pair,用中间词经过网络,得到一个词表大小的向量,经过softmax来预测”(别的我一时想不起来了。上面这些也不是一下子说出来的,是老师帮忙了才想起来的)
第七问(接着第六问):词表大小太大怎么办?
我愣是想了十分钟,最后憋出一个“负例采样”,但具体怎么做我说不出。。。啊啊啊,,,后来发现这其实是word2vec里面最最最基础的知识了。
闲聊:
第一问:你为什么不留在苏大做NLP?
“我觉得上科大的人均资源比较多。综合地理、资源。。。”(乱答了一通,感觉由于自己说的不流利,老师不是特别理解)
第二问:今后的打算?
“看我的研究生成绩怎么样,如果paper多,那继续读博。想过那种能够把自己的兴趣爱好和自己的工作结合起来的事情,把继续深造放在第一位”
最后老师说,通过邮件发一个paper list,在其中选择一篇论文,读完了再联系他,他好做最终的决定。
6/21VDIC面试
彻底崩盘,从没经历过英语面试的我,面对英语问题,直接崩溃,一道题也没有答出来。由于听力也很差,下面的题不一定对。
-
Ax=b,A的列向量组是线性相关的,问该线性方程组是否有解
-
我听你英文自我介绍中说你擅长python,那你说说python和C++在运行程序的时候的区别
-
python的解释器是用来干嘛的
-
我听你英文自我介绍中说你擅长操作系统,那你说说操作系统中的虚拟化体现在哪些方面
-
给你一个列表和一个字典,你要去找到一个元素,各自的时间是多少?
-
有一颗树,你以数组存储、还是以指针存储,访问树中的某个元素会更快?
-
介绍一下你的论文
6/22结果
其实正式结果还没有出,但联系的导师邮件联系我了:“你昨天的面试表现很不好,我也无能为力”。
总结
半年之前就联系的导师,就在6/22,宣布失败了。说实在的,实在有些恍惚。但时间又不允许我一蹶不振…
接下来的方向:
- 进一步巩固数学
- 专业课如:操作系统、python等的复习
- 自然语言处理中的word2vec、transformer中的细节
- 算法导论
- showmanship
哎…拜拜了,希望大家能够取得好的成绩。