联创众升大数据面试题
算法工程师面试题
1.请列出几种文本特征提取算法。
2.简述几种自然语言处理开源工具包。
3.请简述几种熟悉的分类算法。
4.请简单描述一下深度学习?主要应用范围?常见工具有哪些?
5.说明一下利用HMM实现实体识别的过程?
6.请简述文本数据结构化表示涉及技术方法。
7.如何构建一个简单的领域知识图谱。
8.以下代码是Java实现中文分词,请简述分词过程。
扫描二维码关注公众号,回复:
12009024 查看本文章
public class SplitChineseCharacter {
public static void main(String[] args) {
String input = "太好了,今天是星期六啊";
new Split(input).start();
}
}
class Split {
private String[] dictionary = { "今天", "是", "星期", "星期六" };
private String input = null;
public Split(String input) {
this.input = input;
}
public void start() {
String temp = null;
for (int i = 0; i < this.input.length(); i++) {
temp = this.input.substring(i);
if (this.isInDictionary(temp)) {
System.out.println(temp);
this.input = this.input.replaceAll(temp, "");
i = -1;
}
}
if (null != this.input && !"".equals(this.input)) {
this.input = this.input.substring(0, this.input.length() - 1);
this.start();
}
}
public boolean isInDictionary(String temp) {
for (int i = 0; i < this.dictionary.length; i++) {
if (temp.equals(this.dictionary[i])) {
return true;
}
}
return false;
}
}