Pythonの実装の決定木1(シリーズ) - 最も簡単なアルゴリズムで始まります

ツリーにタイタニック号から始まって、数千マイルは、コーディングを開始します。

1つの心

心:合計は少しフィードバックをしたいと思い、オンライン神の力を共有するために、様々な方面から恩恵を受けてきました。
マインドIIは:(SASとID3を書きましたが、常にそれが良い完了状態ではないことを感じた後に)長い良い決定木について書きたかったです。

記事の内容2

:記事のこのシリーズは、四つの部分については分割され
パート1:Kaggleの導入アン例、それはタイタニック生存/死亡率データに基づいて決定木モデルを行います。個人的に私は言っているいくつかのアイデアに同意し、これは良い例であると感じ、もちろん、最大の利点は、サンプルデータを提供することであり、そしていくつかの結果を作った、との結果が書いて確認することができます。

パートII:デシジョンツリーの基本的な考え方、そして私は決定木の処理を実現します。さらに興味深い私は常に関数型プログラミングに好むが、決定木の作成プロセスでは、突然、オブジェクト・プログラミング文言は非常に簡単です見つけ、です。

パートIII:プロセスで使用されるいくつかの機能を達成するために約20による処理について、順次、説明します。

パートIV:決定木、比較結果の自己構築されたアプリケーションを使用する方法。(決定木の後、ツリーの深さを行うには継続します)

タイタニック(Kaggle)から出発して3

デシジョンツリーの概要(タイタニックデータセット)は、
ディシジョン・ツリーデータモデリングタイタニック
最初の(Kと呼ばれる)Kaggleは、意思決定のデータの結果を発表し、全体として、決定木モデルの結果は、比較的容易に理解することです、そしてその特定のコンテンツ次回は、私はそれに手の込んだと述べました。

タイタニック号の事故の背景がフィルムを通してより良い理解を持つことができ、簡単に言えば、タスクはモデルの乗客(生き残ったかどうか)後の生存率を予測することです。絵のニーズは、映画を見てみることができます。

变量解释
sibsp:この方法でデータセット定義の家族関係...
兄弟=兄、姉、stepbrother、stepsisterの
配偶者=夫、妻(愛人とfiancésが無視された)
乾上がる:この方法でデータセット定義の家族関係...
親=の母、父
子供=娘、息子、義理、義理の息子
一部の子供たちは、彼らのために、乳母とだけので乾上がる= 0を旅しました。

リリース3元の記事 ウォンの賞賛0 ビュー44

おすすめ

転載: blog.csdn.net/yukai08008/article/details/104637469
おすすめ