LianchuangZhongshengビッグデータインタビューの質問
アルゴリズムエンジニアのインタビューの質問
1.いくつかのテキスト特徴抽出アルゴリズムをリストしてください。
2.自然言語処理用のいくつかのオープンソースツールキットについて簡単に説明します。
3.おなじみの分類アルゴリズムをいくつか簡単に説明してください。
4.ディープラーニングについて簡単に説明してください。主な応用分野は?一般的なツールは何ですか?
5.HMMを使用してエンティティ認識を実現するプロセスを説明してください。
6.テキストデータの構造化された表現に関連する技術的な方法を簡単に説明してください。
7.単純なドメイン知識グラフを作成する方法。
8.次のコードは、中国語の単語セグメンテーションのJava実装です。単語セグメンテーションプロセスについて簡単に説明してください。
public class SplitChineseCharacter {
public static void main(String[] args) {
String input = "太好了,今天是星期六啊";
new Split(input).start();
}
}
class Split {
private String[] dictionary = { "今天", "是", "星期", "星期六" };
private String input = null;
public Split(String input) {
this.input = input;
}
public void start() {
String temp = null;
for (int i = 0; i < this.input.length(); i++) {
temp = this.input.substring(i);
if (this.isInDictionary(temp)) {
System.out.println(temp);
this.input = this.input.replaceAll(temp, "");
i = -1;
}
}
if (null != this.input && !"".equals(this.input)) {
this.input = this.input.substring(0, this.input.length() - 1);
this.start();
}
}
public boolean isInDictionary(String temp) {
for (int i = 0; i < this.dictionary.length; i++) {
if (temp.equals(this.dictionary[i])) {
return true;
}
}
return false;
}
}