機械学習の枠組みML.NET研究ノート[1]基本的な考え方

I.前文

       2019年5月、バージョン1.0でリリース2018月の出のバージョン0.1でのMicrosoftの機械学習フレームワーク、。バージョン1.0のリリースとかなり大きい(名前空間、方法、などを含む)バージョンの違い、中には、それが安定する必要があります。庭の前にも、私の研究の導入に関連する記事の多くは、多くの援助を提供してご覧ください。現在のデータに非常に豊富ではないので、学習プロセスはまた、かなりの数の迂回路で、記事のこのシリーズは、主に学習過程で私の経験のいくつかを記録し、その詳細のいくつかは、マシンのためにゼロの基礎を学ぶことを期待して、詳細に説明します学生はいくつかの助けを提供しています。(C#がゼロベースを行うことができません)

 

第二に、基本的な概念

1.機械学習とは何ですか?
定義:タスク(T)を完了するためのコンピュータプログラムは、より多くの(P)の性能にT(E)で取得したコンピュータの経験場合は、より良い、そして私たちは、このプログラムは、Tさんの体験を「学習」と言うことができます。

「機械学習」と呼ばれるものの簡単な説明:あなたが入力した場合、より多くのと呼ばれる優れたパフォーマンス、体験「の学習を。」たとえば、次のように伝統的なプログラム・ロジックは、アルゴリズムに基づいており、プログラムの場合と同じアルゴリズムが100年のために実行することでアップグレードする機能を持っていませんが、機械学習、データ(サンプル)に基づいており、かつ同じアルゴリズムの場合、データが蓄積され、より有効で、より強力なプログラムのパフォーマンス機能の下で。

 

2、機械を通して解決する伝統的なアルゴリズムと問題の違いの問題を解決することを学びます

解決すべき問題:会議室は、少年に来て、体を介してプログラムを評価する場合の少年がよく、カメラの前に立つように頼みました。

(1)従来のソリューション

  等身長、体重、測定値を、以下のように計算される(例えば、BMIなど)を測定アルゴリズムによって、プロセスはまず、我々がどれだけ人の体を決定するために分析し、主判断機能は、次のとおり

 

(2)機械学習アルゴリズム

   機械学習は、サンプルデータに依存しているので、アイデアは、このように、この問題を解決することです。

①まず、あなたは、次の表を形成するために、彼に裁判官を与えたインタビュー、そしてあなたの経験に基づいて測定データ、身長、体重を求め、データを収集するために街に連れて行く必要があります:

②モデルを訓練するために収集されたデータを形成し、その後、モデルによって決定されるべきオブジェクトを判定しています。次のようにプロセスは以下のとおりです。

 

小结:通过这个问题的解决,感觉通过机器学习来解决问题比传统方法麻烦多了,是的,对于身材判断这样的问题,人类可以很简单找到一个逻辑分析的方法,所以通过逻辑算法解决就比较方便,但有时候很多事情我们人类是很容易处理的,但我们却不知道其中的逻辑,比如:判断一张图片是否是18+图片,判断一片论文是否写得很好,判断一个人是否长得漂亮等等。这些问题人类很轻松就能处理,但无法总结出其中的规律并交给机器去执行,这时候机器学习算法就可以派上用场了。

 

 三、机器学习的流程

 机器学习的流程如下:

数据准备 -> 建模 -> 训练 -> 评估 -> 应用
在实际应用时,由于训练的过程可能时间比较长,所以我们会分两个阶段进行:
1、学习阶段:数据准备 -> 建模 -> 训练 -> 评估 -> 保存模型
2、消费阶段:读取模型 -> 应用

评估的过程就是对模型的检验,我们一般会把样本数据随机分成两份,其中一部分用来学习,另一部分用来检验模型效果,判断一下我们的模型能力。

 

以上是涉及到机器学习的有些最基础的理论知识,下面几篇文章会由浅入深介绍ML.NET的一些应用。

系列文章目录:

机器学习框架ML.NET学习笔记【1】基本概念

机器学习框架ML.NET学习笔记【2】入门之二元分类

机器学习框架ML.NET学习笔记【3】文本特征分析

机器学习框架ML.NET学习笔记【4】手写数字识别

机器学习框架ML.NET学习笔记【5】手写数字识别(续)

机器学习框架ML.NET学习笔记【6】TensorFlow图片分类

机器学习框架ML.NET学习笔记【7】人物图片颜值判断

机器学习框架ML.NET学习笔记【8】目标检测

机器学习框架ML.NET学习笔记【9】自动学习

 

资源下载:

项目源码:https://github.com/seabluescn/Study_ML.NET

资源文件:https://gitee.com/seabluescn/ML_Assets

(由于资源文件较大,所以放在码云平台提供下载)

 

おすすめ

転載: www.cnblogs.com/seabluescn/p/10904391.html