一个思维误区与百度、腾讯、阿里、字节跳动的NLP方向的社招工作要求分析 - 代码天地

一个思维误区与百度、腾讯、阿里、字节跳动的NLP方向的社招工作要求分析

编程语言 2019-03-26 15:33:50 阅读次数: 0

马上就要进入工作岗位了，今天看到一个牛人分享说，不要把多学点东西当做目标，这是一个有点学生式的思维误区。

说白了就和写论文一样，你找到了一个方向，会议论文是对这个方向的初步挖掘，期刊论文就是对这个方向的深入探索，最后的毕业大论文就顺理成章是对这个方向的分析研究。反观我的研究生阶段，带我们科研的导师思维方式比较跳跃，总是有一些奇思妙想和想把她所接受到的一切新鲜的、听起来很火很厉害的东西落地到我们的研究中，导致我大四和研一做的是当时老师说很火现在实验室已经完全放弃了的一个点，研二是我自己喜欢的一个点但是老师说和实验室没关系后来被毙了，研三写论文又是和之前积累的完全不同的东西，因为没有相关的成果支撑，写大论文就写得很忐忑。

我偏偏又是个很焦虑的人，因为自己不是计算机科班出生，总是觉得有很多东西要学，比如爬虫、C++、设计模式、框架、Hadoop/Spark等等。今天看了这位牛人说得这段话醍醐灌顶：

多学东西，可以促成自身的成长。如果是新人，因为未来无论走哪条路，基本的能力是必备的，把多学东西当做目标，在初期是可以的。但如果已经工作了一段时间，目标就不是多学东西了，因为成长不是目标，成长是一个过程，是达成目标的手段。

成为技术专家，成为业务专家，进入管理层。。。这些才是目标。

在工作过程中选择的项目，应该是互相递进，升级的关系，而不是平铺的关系。这样项目经验就会是相乘的关系，而不是相加的关系。

因此，一开始就应该具备明确的目标，不是见到好的项目就跳过去，而是根据自己的情况和目标去选择项目，而不是机械式的累加项目经验。

因此，这篇博客将分析一下百度、腾讯、阿里和字节跳动在NLP方向的社招的岗位要求来确定自己在工作中应该积累和自学的能力。

另外一个就是社招的时候因为目标更精确，是瞄准某个部门去的，而不同的部门因为场景不同，做的NLP的事也不一样。有的需要问答、对话，有的需要文本挖掘、知识图谱构建。可以发现自己的兴趣在哪，然后进行某个小方向上的项目积累。

总结一下：

1. 在NLP方面系统和深刻的认识。

2.海量的数据，并行计算。在工作中编程一定要时刻注意效率！！！

总结一下要求如下：

语言：

1.C++，因为腾讯是C++大厂，整个研发都面向C++的较多。

2.Python，这个我目前用的多，但做到精通还需要下很大功夫。提高编程效率，也是最近很有感悟的一件事情。做到精通：数据结构、基本算法都要熟悉。

3.Linux，这个服务器开发上都会用到，且熟悉Linux指令真的可以提高工作效率，除外，还应该掌握vim/awk/sed这些Linux上的文件工具。

4.Scala，分布式中常会用到的，需要熟悉一下。

框架：

1.TensorFlow，因为Keras更简单，之前都是用Keras多一点，但是掌握主流的框架才是王道！

NLP方面：

1.理论基础与实战经验，这个就只有自己不断刷和积累了。尤其注意实战经验的积累，注意分析算法为什么好，哪些tricks

可以使得效果好等。遇到一个问题要能把重点和难点快速抽取并解决。

2.文本处理经验与技巧。数据是问题的核心，需要什么样的数据，如何获取相关数据，如何快速清洗数据，这些都是要积累的东西。

3.主动跟进学术界或业界最新成果。像最近新出来的BERT，这些里程碑式的方法应该尽快掌握。需要有敏锐的嗅觉。

和腾讯的没什么大的差别，阿里用Java用的多一点，Java我之前学过一些，语言这种东西触类旁通，就是要努力做到精通啊！！！

不要太专注于某些类和包里面太细节的东西，而是要对整体的编程思想进行掌握。比如面向对象、继承、一些设计模式等。因为语言更新换代太快了，如果只注重太琐碎的东西，犹如过度钻研某个产品的使用说明书。应该注重对一些经典的、不会淘汰的、适用各种语言的思想和框架进行积累。

字节跳动也是将NLP领域分得很细。

目前我还存在一个问题就是，分词、实体抽取等我调包调得比较多，但如果项目中要遇到的是特定某个领域的分词与命名实体识别，此时调包就不能解决问题了。因此，还需要对NLP基础任务经验进行积累，哪怕调包也去看下库的源码。

不知道头条社招还有没有笔试，一上来4道还是5道编程题是真的有难度啊！！！

看完这几个大厂的岗位要求，总结一下之后要着重积累的点有：

1. NLP方面：

完整和深刻的知识体系，NLP的基本任务和常用的方法，这些方法的原理和使用经验。

工作中遇到的项目的一些经验总结和反思。

文本处理和海量数据方面需要积累经验，提高效率。

有关注NLP前沿方向的习惯，在看论文时能迅速get到重点，最重要的是要想如何落地。

2. 算法方面：

框架方面学习TensorFlow，对训练、调参和可视化的经验进行积累。

强化学习虽然目前没看到相关的岗位要求，但是在文本生成方面，很多都有加入强化学习来提高模型效果的。所以相关的原理和代码实现也应该掌握。

知识图谱和NLP其实挺交织的，可以理解为知识图谱就是给电脑先验知识，这方面的基础知识也应该掌握。

3. 语言方面：

Linux，常用指令和文件系统。

C++，基础的语法掌握之后，重点是要对面向对象、继承、设计模式、数据结构、常用算法等方面进行深刻理解和积累。

Python，重点要掌握的东西其实和C++差不多，注意能提高工作效率的脚本积累，注意代码运行效率提升的技巧积累。

Spark，分布式结构的掌握。上手一遍练练。

猜你喜欢

转载自blog.csdn.net/baidu_33718858/article/details/88818053

一个思维误区与百度、腾讯、阿里、字节跳动的NLP方向的社招工作要求分析

字节跳动社招面试记录，年末阿里百度等大厂技术面试题汇总，社招面试心得

2020年阿里，腾讯，字节跳动，美图，百度等大厂技术线职级和薪资一览表

腾讯、阿里、百度、字节跳动最新复工时间，最晚3月2日回公司上班

《Android性能优化项目实战》合集，（包含腾讯、字节跳动、阿里巴巴、百度、网易、爱奇艺等）

字节跳动、阿里、腾讯、百度、快手等大厂常考的软件测试面试题

工作三年终于社招进字节跳动！字节跳动，阿里，腾讯Java岗面试经验汇总

来自一个十年 Java开发者百度、阿里、腾讯的面试心经

一个二本本科生如何才能进入腾讯，阿里，百度这些大厂？

Redis高频面试题（来自字节跳动，腾讯，百度面试题总结）

三年面试腾讯、阿里、美团、字节跳动、百度、滴滴共八次，我发现大厂面试真的有“题库”！

看完了百度，阿里，腾讯，字节跳动等30家的秋招面试，总结了这170道面试真题

腾讯、字节跳动、阿里巴巴、百度等大厂Android 性能优化项目实战深入解析，将你的APP优化到极致的操作

在阿里和百度工作共七年，面试一个小公司却给挂了！

Android性能优化——腾讯、字节、阿里、百度、网易等互联网公司项目实战+案例分析（附PDF）

Offer经验分享 - 蚂蚁金服、字节跳动、PDD、百度、华为、Paypal - Java社招面经

全了！互联网大厂的薪资和职级一览！（阿里巴巴、腾讯、百度、字节跳动、华为、京东、美团、滴滴、小米 9 家）

阿里，百度，字节跳动面试同时考了它，你需要的题解来了

如何准备国内一流互联网公司面试，如百度、阿里、腾讯、字节等

《腾讯Android面试真题解析》《百度社招面试真题解析》《字节跳动Android面试历年真题解析》等十几份大厂面试真题解析助你金九银十斩获大厂Offer！

入职字节跳动一年，附上百度、字节跳动等后台面经，谈谈我的收获

ChatGPT风口下的中外“狂飙”，一文看懂微软、谷歌、百度、腾讯、华为、字节跳动们在做什么？

百度的一个bug

不要小看一个redis，腾讯，阿里、百度、美团等大厂都在用的Redis实战，不看你就亏了

年末最新整理：阿里、腾讯、字节、华为、百度等大厂Android岗面经分享！

字节，腾讯，百度，阿里，美团500多道算法面试题

阿里、腾讯、字节、京东、美团、百度......薪资职级大比拼

Android性能优化全方面总结以及实战解析（参考:阿里、腾讯、字节、百度....）

阿里腾讯百度360

多图对比在腾讯、阿里、字节跳动的工作区别?

今日推荐

中国码农的“35岁魔咒”

蘭雅 CorelDRAW 插件 2024.5.1 国际劳动节版，免费下载

Arc Browser for Windows 1.0 正式 GA

90后程序员开发视频搬运软件、不到一年获利超 700 万，结局很刑！

《美国对全球网络空间安全与发展的威胁和破坏》报告发布

周排行

Java基础复习_day13_Collection集合

2018.11.16 c语言学习经验

且看Java内置四大核心函数式接口

小程序云开发中数据库的数据分段和显示图片

python的函数

Web-JS进阶

【干货】C++常用代码积累笔记大全

Spring的ioc操作与 IOC底层原理

构建之法20191121-11 Scrum立会报告+燃尽图 07

Spring boot之Hello World访问404

每日归档

更多

2024-05-05(0)

2024-05-04(7)

2024-05-03(19)

2024-05-02(0)

2024-05-01(4)

2024-04-30(1)

2024-04-29(40)

2024-04-28(0)

2024-04-27(56)

2024-04-26(39)