私は8ポストの月とデータ分析の部分を練習します

 

著者:ちょうど現在ドロップで働いて、大学を卒業マスターダブル非統計、データ解析のインターンシップの経験の8ヶ月は、最終的には、製品のマネージャーになった、10の以上のデータ分析インターンをインタビューしました。

 

2つのテーマ

 

この記事の主な目的は、単に2つのテーマを含むポストのインターネット企業のデータ分析」内の情報の一部を理解し始めた一部の学生を支援することです。

 

1、インターネット企業のエントリーレベルのデータは、学生が仕事にどのように改善するか何であるかの主要なタスクを分析するには?

 

2、インターネット企業のデータ分析はどのようにインタビューです

 

あなたはこの業界の仕事を入力するかどうかを検討ヘルプへの最初の質問は、2番目の質問は、学生がインタビュアーとインタビュアーが優れているインタビューのいくつかの効率を高めるために、業界を入力するのに役立つしたいと思います。

 

いくつかのインターネット企業の仕事の経験では、著者によると、現在のデータ分析作業は、3つの一般的な方向があります。

 

1、ビジネスデータ分析

図2に示すように、現像バイアスビン数データ分析

3、データ解析アルゴリズム偏った

 

著者の制限の経験として、この記事では、コンテンツについての話にインタビューして、作業内容を再検討、この記事のほとんどの読者は、関連する作業中のデータの次の友人を決定することである考慮に入れて、「ビジネスデータ分析」ジョブの拡大に焦点を当てました。

 

データ分析はどのようにインタビューで01のインターネット企業

 

最初のSQLプログラミング必須項目です(弱いSQLの能力の学生を受け入れるためにいくつかの中小企業、彼らはエントリー後の再訓練ます)、予備的なデータ解析の主な仕事は、学生のSQL文を記述することであるから、それは面接のプロセスは、あなたが発見できるようになる一般的です書き込みされていない場合、特定のリスクがあります。このインタビューのことを、タイトルを書き、SQL。

 

終了:「付録のSQLパスを学ぶお勧めします。」

 

私はあなたが最良の側面をプレイ見たいと思っているので、国境を越えるために、SQLの能力を確認した後、主にトークインターンシップの経験に、コンテンツと引き換えに再開されたプロジェクトの経験が続き、最終的にはゲームの経験は(あなたが実際に行くことを示唆しています)仕事のためのアイデアを得た、あなたは通常、十分な場合は、この問題を取り巻く状況のために、より明確に話せるようになるだろうことを、上司とインターンシップの経験を持っている傾向がある、プロジェクトの経験は間違いなく家庭教師だけでなく、能力と関連する監督者の注目度です。ゲームの経験は、おそらくより頻繁に学生が自身の研究、エラーが発生しやすいです。

 

終了:「付録IIは、サンプルの質問のためのプロジェクトです」。

 

私は経験をインタビューしました。

 

以下のリストは、いくつかの技術関連の知識私は尋ねました。

  • 左と右のリンク、接続、および完全な接続内でのSQL接続

  • スノーフレークスターモデルとモデル

  • 出会い欠落したデータをどのように行うのモデル化

  • に対処する方法をどのようなデータスキューです

  • クラスタリング関数kmeansの長所と短所

  • カテゴリ関数kmeansクラスタの数を確認する方法

 

インターネットオフ牛によってこのような表面は、より多くの包括されてではなく、私はいくつかの要因のコアプランを取得するには、メインスピーカーだった、ここではそれらを繰り返すました:

 

最初のSQLの強固な基盤され、私はすべてのトピックSQLの牛やleetcodeに置くので、迅速な最適解を書くために、ネットワークをオフに書かれている、脳の回転が速くあり、トークインタビュープロジェクトでした見つかった場所は、それはすぐに、これは(ラウンドバック)で行われていた理由を説明する、現実的な背景を追加することができ、うまく行っていません。

 

私の面接の経験

 

これは長い、この記事の中核的なコンテンツです。

 

まず、私たちはインタビューの正しい認識を持っている必要があります:インタビュアーがチャットであ​​なたの敵、理想的なインタビューの経験、ありませんが、インタビュアーは優しく彼は分析の下でここに、このポストを満たす能力を持っていないことを証明するためにインタビュアーをリード私は、インタビュアーとして共感するのに役立ちみんなにいくつかのアイデアは、インタビューの効率を向上させます。

 

ヒ素の(A)蜂蜜のI、彼は。仲間の学生は、履歴書賞、インターンシップの経験の見事な、ほとんどの仕事とは無関係に、非常に優れています。私は、そのような名誉称号、奨学金や単に渡しさえない書き込み可能など、仕事を見つけるために彼を与えるために良い人を募集していない、人を募集する投稿することだったので、あなたの履歴書で唯一とジョブ関連の経験を記述するようにしてくださいあなたはありませんどのように良い示すために、持っているが、どのくらいあなたはこの仕事に一致する、あなたはそれがより事前話題のある、ここで、ジョブ・マッチング条件がわからない場合、彼らは起動しません。

 

(B)のノウハウとして知られている、私が知っているか分かりません。少ないインタビューの中での出会いにインタビュアーの何かを伝える:これは研究の私の分野ではない、私は知らない、何か他のものについての話を。私たちは、あなたのエネルギーが制限されて受け入れることができるすべてを行うことはできませんが、答えは真剣フィールドで少し知識のイメージに影響を与える行うので、このコンテンツは、後に詳細になります。

 

(C)に等しい対話。実際には、これはトリックの一部である、とプロのレベルでは何の関係もありませんが、それは、そのようなインタビュアーが質問をするときのように面接官の心を反映することができ、「抗殺す」波:コア要素について話しただけでなく、この問題を言及し;または "波」バー:私はあなたが何の問題も言わなかったと思うが、我々はそうしなかった状況の原因はXXです。一方で、これらは、あなたが完全に緊張し、あるいはあまり話をしたいことを、あなたの心を表示することができます。一つは私の「同僚」の状態に、あなたは離れて面接者の身元からされていることがありますされ、我々は、同じ対話。

 

私は面接の時間をお知らせすることです「オープンブックテスト」、となっている実際のインタビュー:インタビューの内容SQLプログラミングの問題や、プロジェクトを再開するには、準備をしてください。しかし、学生の90%のパーセントは、SQL問題領域で立ち往生し、過去のインターンシップやプロジェクトを渡すために、一般的なリードでないで、私は4ヶ月以上(2019.10から2020.1)がない権利生徒を見つけた募集しました。

 

以下はインタビューのプロセスであり、ここでいくつかの学生は可能性のある問題を見つけます:

 

インタビューの冒頭では、私は資格を与え、いくつかのSQL始めましょうインタビュアーが、それは少し難しいですが、書くことができれば、中難易度の最初のうち「付録IIIを、私はタイトルのうちになります各インタビューされている」;場合インタビュアーは、私は密かに、単純なトピックがぎこちない雰囲気を和らげる、ため息をついていると思いません。

 

SQL主題で話した後、私が再開されるとのインタビューの学生がプロジェクトやインターンシップの経験をおしゃべりして、私は問題があるが見つかりました:データ分析、学生は簡単として自分自身を考えることができます「ツールの男。」私は、ユーザーが、どのように各グループの試合で異なるグループを区別する場所に応じてグループ化されてくるか彼に尋ねたので、例えば、同級生は、彼がしたいさまざまなユーザーグループの人々の異なるグループへのセンドクーポンを私に言いましたクーポン?

 

彼は答えた:ビジネスの党の決定を。

 

インタビュアーの話すの観点から、この問題が明らかとなっている、と私は学生がなかったと思うので、彼自身が完全に物事を行うように頼まれたが、インタビュアーの視点から、答えは失敗しています進歩の方法を見つけ、彼は他のツールとして自分自身を見て、唯一の生活や仕事で物事が進行することはほとんど不可能です言われます。

 

それはその後、「ツール」となることを避けるために、どのように、より良い方法は、彼らの所有者の考え方を育成することです。私はここにいないよあなたに助けを与えることを、私はあなたが全体のことを得るのを助けます。

 

ここでは、プロジェクトの記述テンプレートを提供するために、あなたが見て、彼自身の経験のセットを駆動するために試みることができるか、自分の履歴プロジェクトオーナーの考え方:

 

複数のドライバ苦情の文脈では、我々はこの問題を解決するために、システムは直線に応じて、単一の(内部要因)を送信するために、この問題が発生した単一の問題(外観)を送信するために川を渡った、私たち(あなたは上の一人である場合により良い友人)(好ましくは)複数のコントラスト法で単一道路距離法を送信することを提案し、この方法の効果は、川を渡っ丘の30%を解決し、単一の問題を送信することで、苦情が50%減少し、私はを担当していますモデルがこのプロジェクトを完了するために、単一の川を送信するかどうかを判断するために設計されて、私が育ったと私は再度ない場合、それはモデルになりますので、もう一度、私は、前期とドライバを交換するだろう、より深く理解するために単一のドライバを送信しますより高速に行います。

 

、学生の限られた思考は、私は誰もが実際により行うことをお勧めします理由(社会的に早期の表情がある問題の誰もが認識して作ることは非常に困難であろうリードして何のボスが存在しない場合にのみ、より多くの再セット、考えているを理解するべきではありません殴打、ハハハハ)。

 

チャットプロジェクトを処理し、我々はより懸念している批判的思考

 

厳格な思考の例:薬物の効果を検証する際には、いくつかのグループに必要なのか?回答:医学は「食べる」と「薬物」二つに分けることができますので、三つのグループ、医学のグループは、グループは、偽の薬のいずれかの効果を持っていないグループとしての外観を食べて、食べてはいけません。---実用上の問題は同じものの、ユーザ送信5元のクーポンと商品代金5元の直接効果から生じますか?そうでない場合、それはより良いどのような影響ですか?なぜ、ビジネスは常に平均のいくつかの割引「クーポン」を送信しないのでしょうか?

 

ここで「本をお勧めします質問を掲載し、」同時にあなたの論理的思考能力を行使することができ、それはあなたのより効率的なコミュニケーションや仕事で人になりので、誰もがなることができ、「バー罰金。」

 

私は今、学生が最も難しい、これらの問題に見舞わ再開データ分析を参照してください、あなたの履歴書をより豊かにし、何かを理解していない自分自身のいくつかを記述する必要がない、「私は知らないとして、私は知らない、知っているように知っている」次のカテゴリが含まれています。

 

(A)、数学的モデリングコンテスト。これは、多くの場合、プロのインストラクターや特別な緊急時の指針と一致していないので、ここでは、このメソッドを使用する理由も賞を受賞した場合、完成品質が高くありませんが、例えば、私は1つを尋ねましたか?その答えは、学生XX論文のほとんどは、このメソッドを使用しているので、学生はほとんど実際には、私自身はので、数学的モデリングに参加したとしても、私は答えることができない問題を発見し、比較の他の可能な方法の長所と短所を伝えることはできないです時間がきつすぎる、本当に考えていませんでした。当社の戦略が与えられ、数学的モデリングのゲーム体験を書くことができますが、あなたは、限られた再生時間を尊重するために話をしている場合は、より多くの経験として、言うためのイニシアチブを取ることはありません、いくつかの場所では特に厳格ではありません。

 

アルゴリズム(b)は機械学習、深い学習。データあなたがその勾配と勾配拡散の消滅がいつも言うように、ニューラルネットワークとして、学生たちは、おそらくオンラインデモで実現多かれ少なかれポイントを学んだが、ほとんどの学生の能力がアップし、企業の要件にはないん知っている、ちなみに、活性化関数は、それを理解するために進化し、何よりも画像フィールドにおける効果は十分な理由をDNNことをCNN、CNN使用します。今、あなたの履歴書の関連コンテンツを参照してください、私はオープンチャットへのイニシアチブを取ることができない、私は与えられていた場合、理由はいくつかの時間燃える人工知能前、それはない書き込みに最高なので、良い科学ではない、寒さのフィールドをお勧めしますインタビュアーは、これはより多くの、あなたがこの権利を持っていません知っているが、それが発見された場合に学ぶことではないが、そのあなた、通常は深刻ではない学びます。

 

学生であるメインどのようなタスクの基本データ分析における02のインターネット企業

 

ストレージとデータの収集のコストの低下と、企業はしばしば増加し、他の行為を見ると、ユーザー数の動作時間を延長するために、ユーザーのすべてのクリックなど、ユーザーデータの大規模なコレクションを持って、我々はより多くのデータ記憶容量を持っています(20以上の万個受注毎日)大、データを操作することはほとんど不可能データのような大規模な量、伝統的なエクセルの条件の下で、データはSQL文を書き込むことによって処理する必要があります。

 

したがって、プライマリデータ分析は、学生は通常、SQLを記述でほとんどの時間を仕事採用は十分なデータを取った後、十分な情報がポイントと聞いて、あなたは現状とビジネスソリューションの質問をすることができ、入力されたデータ解析生徒たちは、意思決定支援データクラスメートの観点から、事業開発を知覚し、私の見解は、学生がビジネスデータを理解する必要があることをデータ分析である(私はビジネス面に直接ジャンプして?)。

 

そのため、学生のデータ分析事業の方向が自分の道を向上させる必要があり、自分がビジネスについての詳細を知るようにすることです、私は最初のインターンシップの経験で、私の上司は常にビジネスを理解するために私を強調している嬉しい、彼はあなたが与えることに行うと述べました(アクセス)を要求する前に、なぜ、この番号を尋ねるようにしてください、ビジネス面で見ると、データとビジネスの関係が10正しい需要があなたのグランドを強化することよりも、間違いをカットする必要があります方法です。スペースは、将来の仕事の経験のために制限され、この一時的に拡大し、長く希望である、後でもう一度新しい知覚の更新を持っています。

 

付録I

私のSQLの学習パスがネットレッスンを見ることです。

https://www.bilibili.com/video/av9252479?p=26

 

基本的なSQL文を学んだ後、私は質問、牛ネットオフを磨くようになりました。

https://www.nowcoder.com/ta/sql

 

宝石の記事前:

私はいくつかのSQLの質問をしました。

 

の存在leetcode:

https://leetcode-cn.com/problemset/database/

 

あなたがその日の単語を学ぶ場合は、基本的に二週間は隙間ができます。 

 

付録II 

レジュームコンテンツ:音声認識、音声パターンを抽出し、音声及びスピーカを一致させることができ、精度94%、元のオーディオのノイズ低減するために使用seganアルゴリズム、ニューラルネットワークRNN CNNの場所を使用して、98の精度を増加させます%。

 

問題:

  • 何segan原則として、ノイズ低減しているのですか?

  • 結果のノイズの影響がどのくらいある削減削減していませんか?

  • RNNはCNNとして有効であるとしてその理由は何ですか?

  • なぜrcnnまたは他のニューラルネットワークを考慮せずに、CNN、ここで使用されていますか?

  • 残りの2%は、主にだけでなく、最適化のものとして、不正確な判断された理由は何ですか?

  •  このアップグレードは、4%のユーザー値または商業的価値をもたらすとは何ですか?

 

付録III

簡単な質問

 

 

各行は、この注文のIDを表し、注文フォームドライバーのIDを完了し、受注量、受注時間には、SQLをしたい:特定の日、任意の単一のドライバが5つ以上を完了し、5つの合計場合額は$ 50以下大きい、これらの日に対応する出力ドライバID。

 

出力列名:日、drier_id

知識ポイント:サブクエリまたはスクリーニングを行うに持ちます。

 

ミディアムタイトル

 

 

各ラインは、日中のアクティブユーザは、ユーザがあまりにもあまりにも日中の活性、及び次の2〜30日後に、アクティブである場合、前例えば、テーブルのような30日間、1日のために、そのアクティブなユーザーを保持すると言われているか否かを示しますB、2019年1月3日、アクティブ、留保条件がアクティブ2019年1月1日、30日に成立しているアクティブで2019年1月1日のユーザーで、彼はこのように、30日にB 2には、アクティブがなかったですアクティブな30日間保持を満たしていません。私は、アクティブユーザとアクティブユーザー30日間保持の毎日をしたいです

 

表正しい出力

 

 

知識ポイント:文言からの接続の保持、日付書か加算と減算。

 

難しい質問:

 

 

各行はドライバーが時間(START_TIME)の再生を開始すると、ゲームは時間(END_TIME)上で、私はゲーム終了後にすべてのドライバを尋ねる表し、ゲームは平均長い時間内に最後に起動しますか?ドライバは一つだけのゲームをプレイした場合は、ドライバを計算しません。

 

表正しい出力

 

 

知識ポイント:窓関数ROW_NUMBERの使用量は、書かれたものを加算または減算。

 

ウィンドウ関数についての質問:それらTMDいくつかの一般的なデータ分析にインタビューの質問を説明します。

 

私はそれがインターンシップのオファーを取得し、その後、これらの質問を書いたことので、難易度が許容できると思います。

 

公開された363元の記事 ウォン称賛74 ビュー190 000 +

おすすめ

転載: blog.csdn.net/sinat_26811377/article/details/104663771