MA705秋2019


プロジェクト3割り当て
MA705は、2019年秋
月、2019年11月18日:割り当てられた日
、私の友人の一人(ティム・カーター、私には関係ないが)セカンドネイチャー(https://secondnature.org/)、ケンブリッジ系非の社長です正の気候アクションを容易にするために、大学と連携し-profit組織。自分の目標についての詳しい情報は、https://secondnature.org/mission/として、同社のウェブサイトから入手可能です。
彼らは、「署名」からデータを収集し、そのプログラムと自発的に状態気候行動目標に参加することを選択したとしている学校では、これらの目標に向けた進捗状況を報告します。あなたはhttp://reporting.secondnature.org/からオンラインでデータを閲覧することができますが、そこから完全なデータセットをダウンロードすることはできません。セカンドネイチャーは、Excel形式で私たちにそれを提供するために親切にされている、とあなたは私たちの黒板サイトからその形式でダウンロードすることができます。
私たちのクラスは、そのデータセットを考えると、我々はさらにそれで自分の使命をその助けそれらを見つけることを彼らに任意の洞察力を伝えるために第二の自然の博士ティム・カーターによって頼まれました。
以前の割り当てとは異なり、これは架空のシナリオではありません。第二の自然は、我々が共有する任意の洞察力に感謝しますし、積極的に地球に影響を与えるためにそれらを使用することができます。
第二の自然は、定期的に自分のデータで行わ分析を持っていません。最後の時間は、あなたがおよそ8:15から38:30まで、下記のウェビナーでその分析のレポートを見ることができます後半に2017年に中心窩(https://www.foveaservices.com/)と呼ばれる会社によってでした。中心窩は重要な洞察を提供したが、私はあなたが同様の解析を行う必要があることを示唆するために、このウェビナーを共有することはありません。むしろ、それはコンテキストを提供し、役立つ、目標志向、プロの分析ルックスが好きなものの一例をすることができます。ビデオの最初の8:15は、コンテキストのために役立ちます。
https://secondnature.org/webinars/analyzing-climate-leadership-network-progress/

このプロジェクトは個別に行う必要があることを思い出してください。学生は、互いに共有作業いけない、また自分自身のものとして誰も他の人の作品を表しています。あなたが許可されているもの不確かであれば、私に尋ねる、および/またはベントレー学術インテグリティポリシーを参照してください。あなたは、外部ソースを引用する必要があるかどうかの不確実なら、私はあなたが正しい選択を支援するためにあなたと一緒に、このような問題を議論することがうれしいです。

ここでは、このプロジェクトのための具体的な成果がある(.zipファイルにまとめて提出、またはOneDriveまたは他のクラウド・プロバイダーを使用して、講師と共有する):
Theはサードへの最後のこの文書のページ第二のためのデータインサイト」と題されています自然。」これは、データからの証拠と1ページの洞察/勧告を書き込む方法を示し、
オプションワンとの代写MA705留学生作业、代写Pythonの程序语言作业、代写Pythonの实验作业、ウェブサイト课程作业代做ページの付録。私は、これらの各呼ぶ「インサイトレポートを。」あなたは、別のページに各3つのインサイトレポートを生成する必要があります。このドキュメントの最後の2つのページ上の例を参照してください。
特に指定しUnless、私はセカンドネイチャーのチームでこれらを共有します。
グレーディングプロセスをDuring、私は、Insightレポート私は、彼らはすべての65人の学生からのすべての3つの洞察を読む時間がない場合には、最も価値があると考えている彼らのためにハイライト表示されます。
あなたは、私が第二自然とあなたのチームの仕事を共有するが、このコースでは、あなたの学年のためにそれを使用しないことを好むだろうIfあなたの仕事を提出したときに、そう教えてください。私は、もちろん、あなたの希望を尊重します。
Pythonのピクルス(の.pkl)ファイルとして、最終的なマージされたデータセットを提出するAlso。
It一意IPEDS ID、行ごとに学校によってインデックス付け次のデータセットの全てのデータを含むべきです。
Homelandインフラ基金(イン・クラスの作業、11月13日を参照してください)
USニュースランキング(イン・クラスの作業、11月13日を参照してください)
高等教育のChronicle(11月20日、イン・クラスの作業を参照してください)
Secondネイチャー(イン・クラスの作業、11月20日を参照してください)
Optionally、あなたが含めたいことを他のデータセット。例えば、一人の学生は、以下の非常に大規模なデータセットが役に立つかもしれません提案:https://collegescorecard.ed.gov/data/(!おかげで、マイケル)
マージされたデータセットIn、名前の列を次のように:
HIFデータセットからColumnsこのようHIF_name、HIF_address、HIF_city、HIF_state、HIF_zip、HIF_latitude、HIF_longitudeなどとして、HIF_は小文字で元の列名が続く名前を付ける必要があり、少なくともこれらの列に加え、他のどのようなもの、あなたが関連を見つけるを含めます。すべてのHIF列を含める必要はありません。
USNewsデータセットからColumnsはUSN_rank、USN_description、USN_tuition及び手数料、USN_in状態の授業料、USN_undergrad登録を命名する必要があります。
クロニクルデータセットからColumnsは、少なくともこれらの列を含めるなどCHR_level、CHR_student_count、CHR_fte_value、CHR_med_sat_value、CHR_endow_valueを、名前を付ける必要があり、加えてあなたは、関連する見つける他のどんなもの。すべてのCHR列を含める必要はありません。
セカンドネイチャーからColumnsはあなたが含まに関連見つける方の列を選択することができSN_xxxx、名前を付ける必要があります。すべてのSN列を含める必要はありません。
Iは(pd.read_pickleを使用してデータフレームをロードすることによって、あなたの仕事をテスト)し、その後、彼らは正しいデータが含まれているように見えることを保証するために、さまざまな列の上にいくつかのコードを実行します。あなたが送信する前に、あなた自身の仕事を確認することができるように、私は(イン・クラスの作業、11月20日を参照してください)あなたに私のテストコードの一部を提供します。
どのように等級付けされます。
:あなただけの注意を払う(20%合計)場合は、右行うことは容易である事
、この割り当てで説明したように、各1ページインサイトレポートを提出
(オプション1ページの付録付きずつ)、15%
(3×5%)の
データセットの漬物を提出この割り当てで説明した5%としてファイル
:あなたが努力(30%合計)に入れた場合、右行うのは簡単です物事
あなたの仕事は専門的に見えますが、外部のクライアントに5%をハンドオフする準備ができて
、あなたのインサイトの各の説明セクションレポートははっきりとよく書かれた15%である
(3×5%)
あなたの仕事は、我々は(例えば、フィルタリング、マージ、視覚化、シミュレートし、グループ化、帰、ピボットなど、など)その目標を達成するために私たちのクラスで学んだことを、いくつかの異なる技術を使用しています10%
ウェル(40%合計)数学/統計情報/コーディング/ビジネスを行うに手間がかかるもの:
あなたのピクルスファイル内のデータセットは、私が正しいか、それには20%で実行されますテストを渡し
、あなたのインサイトレポートの各の説明部分は、推論を使用していますが、数学、統計、および/または正確に15%のプログラミング
(3×5%)を
ご見識の少なくとも一つが、第二の自然5%にプラスの影響作ることができ
ますが、卓越性を表示するために使用できることを主観的要素(10%合計):
の少なくとも一つをあなたの洞察力は、5%のクリエイティブ/革新的な考えを示した
私は、彼らが5%感銘を受けるだろうと思うので、あなたのインサイトレポートの少なくとも一つは、私たちのクライアントにベントレーの学生の作品それは私が興奮および/または誇りに手になります
合計100%を

セカンドネイチャーのデータインサイトは
投稿者:[PLACE HEREあなたのチームメンバーの名前]
2019年12月15日

インサイト
[STATE YOUR INSIGHT、ONE BRIEF文中の。ZERO技術用語のAIM。太字フォントを使用しています。/興味があるのはTHE INSIGHT興奮READERを作ろうとしています。]

説明
[ANY DETAILS YOU FEELを追加HERE A SHORT段落を提供することは適切でWHY THE INSIGHTすべき貴重なを説明するものです。YOUR INSIGHTはTHE COMESデータからどのように明確にします。STILL技術的な詳細を避けるようにしてください。A GRAPH RELEVANT IFが含まれています。YOUR INSIGHT文がATつかんTHE READER'Sの注目を成功した場合、SO彼らはより多くを学びたいので、これは彼らがREAD NEXTどうなるかですので、マインドことKEEP。]

方法論
[あなたはINSIGHTを達成するために何をしたか計算/調査を説明します。必要に応じて専門用語は、HERE許容されます。FORの例では、あなたはどのデータYOUは、ETC.統計的手法、あなたが含まれていた変数、(もしあれば)を使用WHICH(そして、それは明白ではない場合、彼らは何を意味するか)、USEDと言うかもしれません THIS IS FOR THE READER WHO IS技術的、あなたは彼らがあなたが正しく/賢明YOUR仕事をしたことができ、あなたが上を明記結論に達し歩き回ったHOW TO KNOWを望んでいます。]

[THIS SHOULD FIT ON ONEページのすべての。YOUは、技術情報のA LOT、LIKE A LARGE表やA統計プリントアウトまたは一部の例コードを含める必要がある場合は、AN、「付録」HEADER ON THE SECOND PAGE、および使用JUST ONE THAT追加のページを作成することができます。WHEN PRINTED OUT、THE付録しまうこのページのON THE REVERSE SIDE BE。あなたには、いくつかの特に興味PYTHONのWORK、FEEL FREE TO USE THE付録TO SHOWを行った場合、IT OFF SO Iは、適切なGRADEを与えることができます。]

セカンドネイチャーのためのデータインサイト
(読み取りへのクラスの例として)ネイサン・カーター:によって提出
2019年12月15日

インサイト
第二の自然は、過去3年間で主要なサッカー選手権を獲得している大規模な、ステート大学間より多くの署名を求めるべきです。

説明は
明らかに、これは愚かな洞察力ですが、それが本当だったら、私はこのような何か言うかもしれない:サッカー選手権での機関が(7.1%18.9%の全国平均は対照的に)第二自然の署名の間で過小評価されていることをデータを示しています。そして、まだ彼らは既存の署名者と多くの共通点を持っています。総学部入学、合計寄付、および米国のニュースランキング:彼らは三つの主要なメトリックに(セカンドネイチャー署名の間で)平均値の1つの標準偏差内に座ります。その大きさは、一般的には非常に大きいので、彼らは、参加した場合に最も重要なのは、これらの学校は大きな影響を与えることができます。これらの事実は、すべて次の図にまとめられています。

方法論
データは、大学で高等教育のデータセットの国土インフラ財団、米国ニュース、およびクロニクルから抽出しました。私たちは、セカンドネイチャーから気候コミットメントデータでこれを合併し、その後、追加のスポーツデータは、彼らのPython APIを使用して、www.myfootballchamps.comから入手しました。IPEDS IDによってそのAPIインデックス機関を、我々は確実にその標準識別子を使用して、当社の既存のデータセットにそれらを一致させることができるように。

我々は次に、Pythonでデータ可視化方法を用いて、上記のグラフを生成し、参照のために、付録に示されている1925年関連するPythonコードと統計的出力にナンシー・ペロシとマライアキャリーによって発明周知GKRPZ試験を使用して傾向を確認しました。

付録
記述統計
このデータは、単純なPythonのクエリで私たちのデータセットから抽出しました。(OK、本当に、この例では、100%から構成されているが、あなたの仕事のために、あなたがそのような何かを言う可能性があるため。)
第二の自然署名パーセントとしての機関の国家の数で機関の数
サッカー選手権14と大、公立学校1 7.1%
のすべての機関7523 1422 18.9%

サッカースクールの類似性は、既存の署名者に
このデータは、単純なPythonのクエリで私たちのデータセットから抽出しました。(OK、本当に、この例では、100%から構成されているが、あなたの仕事のために、あなたがそのような何かを言う可能性があるため。)
の合計UGランキング総寄付米国のニュースを入学
平均(SN内)18951 $ 98.4M 36.1
STD。Dev。2845 $ 33.6M 12.2(SN以内)
の範囲(1 STD。平均の)16,106-21,796 $ 64.8M- $ 132.0M 23.9から48.3
分(サッカースクール)19667 $ 65.5M 35
マックス(サッカースクール)20035 $ 112.0M 48

データ可視化のためのPythonコード

(ほとんどのPythonコードは興味深いものではありませんが、あなたの重要なコードが共有する価値がある場合は、ことがあります。)

GKRPZテストのための統計ソフトウェアの出力
この例以降は完全に製作されており、実際にはそのようなテストはありません、私はここで言うことは何もありません。これが本当のテストだったら、私はそれが(このふり例では、ここで提供されていない)何を意味するのかを適切に説明して、以下の全く関係のない(しかし、現実的にオタク)の表のように、統計ソフトウェアの出力が表示される場合があります:

プロ、とても信頼できるので。必要に応じて、追加 QQ 99515681 または マイクロチャネル: codehelpを

おすすめ

転載: www.cnblogs.com/studydotnet2/p/12040075.html