01. 何の話
Pythonの+?(あなたの味覚デザートを取ります)
私たちは、Pythonの話をいくつかの時間前には、我々は印象、もう少し言及を持っているかどうかわかりません。
Pythonは、あなたが、たとえば、男性の多くを固執することができ、接着剤の言語である:+ Web開発の自動化+のPythonやPython +自動テスト、運用、保守、Pythonの+ AI、Pythonの+データ解析Pythonの... ...
一見Pythonは才能の多くを行いますが、マスターにPythonは重要であり、多くの場合、最も重要なことは、男の後ろにPythonの+を習得する方法である、唯一のPythonの場合、それだけで離れてチッピング、ガジェットについて書くことができ、自分を満たします唯一の好奇心の瞬間。
エネルギーのビジネス慣行に割り当てられたAI(大きな食事を食べるあなたを取ります)
金融では、我々は事前にローンの顧客を見つけることができれば、すべてのノウハウを行って、特に財務リスクのコントロールが悪いクライアントでありますか?あなたはそれが延滞返済するかどうかを先に来月のローン顧客を予測することができますか?これは、プラットフォームはまた、停止し、リスクを軽減します。
ソートビジネスシナリオ、機械学習の顔、私たちは何ができるのでしょうか?実は、最近私はビジネスシナリオを解決するための機械学習で、検討されている、小さな成果があります。試行錯誤のプロセスに関する簡単な要約された後、私は要約することが、また、ピットのあなたを防ぐため、フィルギャップに認知脳を埋めるもスマート白に機会を利用しなければなりません。
クルミを食べる、タイトな良い助けを座って、我々は始まりました。
02. オープンチャット
一目で、確認するために高さを立ち
自身の最近の練習と組み合わせることで、彼は延滞信用リスク管理モデルを完了するために、五つの主要なストライドに分け、簡単な図を、描きました。
データ処理。のシリーズとして保存され、その後、洗浄操作データ、重複排除、クリーニング後に無意味なフィールドの単一のテーブル、主に後半に買収完了した信用リスク管理モデル、対応するテーブルのデータがすべて保存csvファイルに実際には、必要なxx_clean.csvファイル。
データ統合。パイソンパンダ参加団体は、主xx_merge.csv、および関連した後、ファイルの重複フィールドを削除したファイルとして保存されたデータのテーブルを形成するために結合xx_clean.csvの完全なシリーズを提供するために使用されます。
特徴処理。その後、優先順位付け、その後、フィールドの機能の残りの部分は、処理値、外れ値を欠落していた、フィールドを選択した機能、経験のある人ならば、参加モデルのトレーニングをフィルタリングするフィールド経験に頼る必要があるため、このステップは、最も困難でなければなりません最適なビニングデータビニングによると、最高の場合は理想的なポイントは、その後、同じように選択ボックスを分割しない(それを理解していない問題ではない、でも成功すれば世間話で聞いた単語の次の言及、知っている猿)。
モデルのトレーニング。まず、3に従ったデータは、7テストセットは、最適なモデルを見つけるために電車にすべてのモデルを置くための練習時間を設定し、モデルにそのデータセットを訓練に分かれているビットを実行しています。
モデル評価。BOSSの1が描画さmatplotlib.pyplotを使用して、理解できるだけでなく、として、モデルの結果の評価は、製品を作るために、走りました。
どのような技術で使用されています
パンダは、 Pythonのデータ解析パッケージです。プロジェクトで主にCSVファイルを読み書きするために使用され、データフレーム2つの合成パケット間など。実際には、彼らと、アップに使用する操作のようなSQL-が、超シンプルで、機能は、超ショック効果がより強力です。あなたは、関連する運用データを持っている場合、それは使用がかかる場合があります。
Sklearnの一般的に使用されるサードパーティ製のモジュールを機械学習、一般的に使用される機械学習の方法は、高度なパッケージングした、数学の練習を機械学習の悪夢の私たちを聞かせすることができ、あなたが始めるための踏み台として、それを選択することができます。
numpyのは、ライブラリは、強力なN次元配列と関連する操作を提供し、拡張ライブラリPython言語です。
matplotlibのは、 Pythonのグラフィックライブラリである、我々はまだあなたが単調な、より直感的な分析結果を達成していないので、背の高いの毎分は、マップを描くことを言うことができます。あなたは通常、シーンのニーズの図面を持っている場合は、あなたにもあるため、この絵を使用して、実際に非常に強力なものプロジェクトを監視する前に、試してみてください。
上記理解していなかった場合、私は、「はじめに」機械学習に沿って行くことができますここにいるので、彼は、すべてが問題ではない、ついていけませんでした。すべてのテクノロジー・スタック紙の虎、およびハンズオンより張り子の虎を破る方法です。
03. アイリス、機械学習のドアにあなたを取ります
「アイリス」読み方を単語ですか(?)?
アイリスに分けることができますsetosa、versicolorの、virginicaの 3品種、今一歩一歩を達成するために、思考の私の電車に従います。特定のデータを入力するためにどの種類の花を決定します。
最初のステップ:データを取得
sklearn.datasetsインポートload_irisから iris_data = load_iris()
ステップ2:スプリットデータセット
sklearn.model_selectionインポートtrain_test_splitから x_train、x_test、y_train、y_test = train_test_split(iris_data [ 'データ']、iris_data [ '標的']、random_state = 0)
第三段階:モデルを構築
sklearn.neighborsからKNeighborsClassifierをインポート KNN = KNeighborsClassifier(N_NEIGHBORS = 1) knn.fit(x_train、y_train)
ステップ4:モデル訓練評価、出力精度
y_pred = knn.predict(x_test) プリント( "正解率:{:.2f}" 形式(knn.score(x_test、y_test)))。
出力は次のようになります。
正解率:0.97
第五の工程:予測を表す4つのデータ:萼の長さ、幅、花弁の長さ、幅
newIRIS = [4,1.0,2,1.0] PRED = knn.predict(newIRIS) プリント( "花の品種:{}" 形式(iris_data [ 'target_names'] [predを])。)
予測結果:
花の品種:[ 'setosa']
これにより、あなたは機械学習のしきい値への片足を持っている、それはもはや白ではありません。
実際には、あなたが慎重に見つけることが、Pythonのコードは非常に簡潔実際に、実際には、コードは、複雑ではありません主なライブラリを使用しているため、すべての技術は、紙の虎、あなたのモリブデンMoの恐れ恐れています。
04. 最後に書かれました
テクノロジーは、どのような言語の使用の思考は考え、それの重要な考え方(3回を言うために何か重要なこと)ことが重要であることが重要であることはありません。
ここでもします。Doの深い技術一つ一つが、理解します。特に技術的な管理に従事したものは、確かに大きな助けと意思決定の技術ソリューションになります。
あなたが恐れていない、白のpythonている場合は、時折、システムの外に立って、新しいアイデア、悪くないアイデアを見て、毎日忙しいシステムを飛び出します。
あなたはまた、関連の仕事に従事している場合は最後に、床についてのアイデアを実装することを望むかもしれない、多分リーダーシップは、昇進や昇給だけで周りのコーナーを好きになるでしょう。
AIの時代、生涯学習は避けられない、ちょうど限り、地下水など、夢は最終的に育つ、学習のペースを抑えます。