私のアルゴリズム インターンシップの経験の共有: 鉄はまだ硬い必要があります。

 データホエール乾物 

著者: Student W、Datawhale 優秀な学習者

前に書いてある

みなさん、こんにちは。私は西礁交通大学のクラスメート W です。私の学部も修士号もコンピューター サイエンスのクラスではありません。2023 年の春にサマー インターンシップを探していたところ、良い結果が得られました。いくつかのインターネットからオファーを受け取りました。 Alibaba、Baidu、Mihayou などの企業に応募し、最終的に Ali と夏のインターンシップを行うことに決めたので、私の経験を皆さんと共有したいと思います。

私は他の人に比べて準備期間が遅かったので、博士課程の勉強を完全に諦めて就職活動に専念し始めたのが2月頃からでした。したがって、テスト受験とクイックラーニングの観点から見ると、確かに共有できる乾物や経験がいくつかあります。しかし、長期的な蓄積という点ではまだまだ不十分ですので、方向性を提案して皆さんと一緒に頑張っていきたいと思います。この体験投稿は主に、乾いた知識と経験の共有の 2 つの部分に分かれています。

乾いた知識

多くの面接で、面接官は、インターンシップ面接の要件は秋の採用面接よりもはるかに低いというメッセージを明らかにしました。 、リコウが手で切り取らなかった場合、一部の面接官は、この質問は確かにインターンにとっては少し難しいと言うでしょう。そのため、学生は準備にあまりプレッシャーをかけず、履歴書の内容を確認するだけで投稿を始めましょう。 ML/DL の内容は完了するものではなく、途中で学習し、さらには生涯学習の準備をすることもできます。

以上の内容を踏まえると、以下の3つの乾物のうち、最も重要なのは基礎知識点の習得である乾物1であり、乾物2と乾物3はおまけとしか言えないと思います。または面接官とチャットするための情報。

乾物1:鉄はやはり硬さが必要

ジョブアルゴリズムのインターンシップに応募したい場合は、まずここに注目してください。アルゴリズム面接では、かなり頻繁に質問されるため、履歴書に書かれたプロジェクト、機械学習やディープラーニングにおける定型的な質問、実際のビジネスの理解力を問うシナリオ質問など、ある程度の知識を習得しておく必要があります。コードの質問。

よくある質問と推奨情報をいくつか紹介します。

機械学習の知識:過学習、過小学習、オプティマイザー、特徴量エンジニアリング、評価指標、一般的な ML アルゴリズム (分類/回帰/減少)、よく出題されるモデルは GBDT、XGBoost であり、アルゴリズムの原理、ツリー構築プロセス、メリット・デメリット、改善方法など。ここでは、 Baimian 機械学習Niuke.com アルゴリズム エンジニアの質問バンク、および統計学習メソッドをお勧めします

知識を深く学ぶ:試験の具体的な内容は就職面接に関連しており、昇進試験ではツインタワーモデル、単目的DIN、DIEN、多目的MMOE、ESSMについて問われます。一般的に、CNN、RNN、LSTM などの基本的な DL モデルを検討します。また、アテンション、トランスフォーマー、RL などのコンテンツも検討します。いくつかのネットワーク モデル、バックプロパゲーションについて質問します。インターンシップの面接はそれほど難しくありません。難しいです。せいぜいLRを手書きします。損失関数と勾配ですが、他の人のインタビューでSVMやCNNを手書きにすると学校採用の難易度が上がるようです。Baimianディープラーニングと古典を読むことをお勧めします面接の分野の書類

シナリオの質問: ab テスト、オンラインとオフラインの間で不一致の理由など、実際のビジネスに関連したいくつかの質問をします。また、場合によっては、面接官が現在解決している問題について説明し、いくつかの質問を提供させます。アイデアや解決策を (無償で) 調査しに来て、Datawhale の fun-rec オープン ソース チュートリアルをお勧めします。

リ・ボタン:コードを手で破るのは、基本的にすべての面接のレパートリーになっており、面接の合否を測る基準の 1 つでもあります。タグ分類、ルーチン分類、頻度の高い質問リストを使って磨くことができます アルゴリズムポストの強制ボタンはそれほど難しくなく、中くらいになります 上記の方法だと、150~くらい磨くことができます200問です。

ここで私は、準備するときにモデルを理解するだけでなく、知識のポイントを再説明するように努めることをお勧めします。これはオンラインビデオ面接であるため、面接官にこれらのモデルを押し付けるために白紙の紙を渡すことは実際にはできません。 , または 疑似コードを書くことはディクテーションのどちらかであるため、明確なアイデアを持つことと詳細であることが非常に重要です。たとえば、XGBoost を答える場合、最初に残差に基づいてツリーを構築することと貪欲であることの 2 つのポイントを答えてから、後で状況を確認するか、面接官の質問に従ってください。二次テイラーを拡張して損失​​関数を補完します。

乾物2:最先端技術の共有に注力

業界の最先端のテクノロジーを追跡できることも、アルゴリズム エンジニアが持つべき能力です。インターンシップの面接の観点から見ると、面接官は、自分が今やっていることを理解しているインターンが、いくつかのタスクを共有するのを手伝ってくれることを期待します。面接では、自分が何をしているのかについても質問します。それは彼が一番よく知っていることだからです。インターンとして、私たちは業界が何をしているのかにも注意を払う必要があります。

Meituan技術共有(pdf マニュアル)、淘宝技術共有(pdf マニュアル)、Xiaohongshu 技術共有(ステーション b のビデオ)について学びました。業界全体の一般的な方向性は、検索とプッシュの統合、さまざまなモードの統合、大まかなソートと詳細なソートの統合、および大規模なモデルのステップです。

乾物品 3: モデル間の開発コンテキストに注意を払う

これも検討ポイントの一つであり、モデルの開発軌跡である。いくつかの多目的モデル、ハードパラメータ共有、mmoe、ple、esmm、esm2 に対して、なぜこのように最適化する必要があるのですか? 実際のビジネスでは、それぞれの最適化はいくつかの問題を解決するか、実際にその中から使用することです。 、2 つの並列モデルのどちらが優れていますか。

これらの質問は比較的難しいものであり、オープンクエスチョンでもありますが、面接官と面接を受ける人の相互の話し合いのプロセスであり、これらの質問にうまく答えれば、面接官はあなたがビジネスの全体像を知っていると考えるかもしれません。そうすれば高得点が得られます。ポイントを追加してください。

経験の共有

体験1:多角投資・多面投資

どの面接でも、面接官と雑談ができるか、部門にHCがまだいるか、ポジションとマッチしているかなど不確定要素が多くあります。不確実性を完全になくすことはできません。確実性を求める方法は、複数の視点に投資し、さまざまな企業に時間を費やし、卵をさまざまなカゴに入れることです。

体験2:面接中の積極的なコミュニケーション

面接はジョブマッチングが中心であり、自己プレゼンテーションが中心となりますので、面接官と積極的にコミュニケーションをとることで、あなたの技術レベルをより理解してもらえるだけでなく、今後もスムーズに仕事ができそうだと思わせることができます。一問一答の形は避け、言葉の掴みではなく、適切な補足や例を加えるように注意しましょう。たとえば、面接官が質問 a をした場合、あなたはそれに答えることができませんが、より関連性の高い質問 b については以前に学習したことがあり、その考え方については理解でき、長所を活かして短所を避けることができます。

教訓 3: 持久戦に備える

面接プロセスは一般に先延ばしになり、1 週間以内に戦いを解決できる少数の人は早いと見なされます。この間、自分のリズムを維持し、食事、睡眠、運動をしてください。結果が芳しくない場合は、最終地点に達していないためです。粘り強く続ければ、全員にシンプルな鶏スープが 1 杯プレゼントされます。

この記事を読んだ人が何かを得られれば幸いです

ありがとう

最後に、データホエール採用チームの四男とラン・ゲハに感謝します。2023 年 3 月 12 日にデータホエールが主催した模擬面接に参加しました。退屈な固定観念を尋ねるのではなく、背景に基づいて対応する質問を提案しました。 , 正式に面接を開始する前に、多くの問題点を認識させていただき、心より感謝申し上げます。

a24f967bd9e3c52c3d7752b8aaec6db7.png

整理整頓が難しくて3好き

おすすめ

転載: blog.csdn.net/Datawhale/article/details/130633407