[インタビュー]コンテストアルゴリズムテンセントのソーシャル広告の大学二番目に大きな進歩毎週のチーム - 大根のゲーム体験を引っ張り、共有経験に

テンセント大学の決勝戦のソーシャル広告アルゴリズムコンテストの第2週
で最も改善チーム
彼女の名前は、大根を引っ張っている
。これは、1人のチームである
だけでなく、少女ああ

美しい、あなたは行儀、独立した少女の祝福
あまり話をしませんでした直接写真と
短いインタビューのための私達の進行チャンピオン周の学生の小さなシリーズ
下記のようにそこには、これを共有するために
.....


大根を引っ張っ最も改善チーム

みなさん、こんにちは、私はテンセントのゲームに参加し、Fengqianゆう上海交通大学だも学ぶための考え方を保持し、この賞を得るために幸運進行、ゲームとその成果にされている実際には、非常に満足している、多くのエントリーレベルのプレーヤーとして基本的な動作は、メモリの闘争と特徴データと抽出物の量に最も時間の戦いは非常に熟練し、準決勝ではありません大きな動きについて聞いそこから兄の多くは練習に時間がありませんでしたが、それはほんの数日です時間は、残念と言うことはできません。

もちろん、その過程で私は多くのことを学びました。このランキングでは高くないが、私は前首長が、私はモデルの特性を使用したくなかったと思っていることも見事されていることを信じて、私は単に今の私の収入についての話をしたい、と私たちはお互いを奨励します。

最初からアイデアが第一の特徴を述べた、さらなる統合後、各基本訓練モデルを再度スクリーニング、および。原因メモリに問題へのデータの量は、デバッグにも事の非常に時間のかかる作業です、多くの不合理な操作、しばしば謎のエラーがあります。そこには機能の融合はありませんが、唯一のxgboostモデルパラメータの調整は、まだ改善の余地があると感じ。

効率について1.
トレーニングの結果に関係なく、限られた時間の中で可能な限り最大の改善を得るために費やした資源の時間コストに注意を払っていないだけでは、私が実際の作業環境を信じると同じです。予選の再戦は、コードを実行するために始めた、あまりにも遅い、遅く十分なメモリ、ではないではありません。読みやすくなりましたので、本当に良いコードアーキテクチャを感じ、モジュラーあまりにも重要な特徴が抽出機能をグループに分けることができ、頻繁に使用されるデータ・セットは、エラーの後ろに、キャッシュすることができ無駄に来ることは容易ではありません。

約2で
データ分割の問題は、多くの首長が強調してきたが、しかし、ミドルまたは機能の一般的な性質を保持する可能性が全作品にフィーチャー(も怠惰)を述べ、結果は決定的な崩壊を並べます。現在使用したり、トレーニングセットの2日間、関係なく、データや業務効率の大きさの方が適切です。

3.関連する特性は
、いわゆる特性がラインを決めるの下で、このような複雑な命題は広告では特に重要ですお勧めしています。プレート制限の結果と同様に、参照モデルの移転の統合に委ね短時間の基本的な能力ので非常に速く学び、達成するために、特に良好で十分ではありません非常に重要です。単一の統計CVR、前記クロスCVR、の基本的な特性は、ベイズ平滑化を費やすことを特徴は千に提起されています。その日のリーク特性が成績が改善され、電力の最大の供給源である、もちろん、我々は交差しないように注意する必要があります。加えて、異なるカテゴリ自体の特性が行動と時間の相互作用を介して抽出することができます。最後に、分析のための2つのテーブルをインストールするために多くの時間を費やし、主にユーザーとアプリのために、抽出されますが、理想的には効果を高める想像していませんでした。

4.関連するモデル
Xgboost LGBアルゴリズムやパラメータの意味の原則を理解した上で、より良い調整、第1の粗その後、微調整パラメータ効率の一部を向上させることができることができ、フォーカス話題となっています。また、FFMモデルはまた、私は遅すぎないと思い、試してみたいと思います。

最後に、私はより多くの交流、贈り物の馬を見て学び、あなたがプロセスで何かを学ぶことを願っています。

公開された44元の記事 ウォンの賞賛0 ビュー368

おすすめ

転載: blog.csdn.net/weixin_45676602/article/details/103971083