機械学習を学習する前に、あなたは、物事のいくつかを知っている必要があります

入門

過去数年間では、機械学習の人々が新たな関心を生成します。世界中の端末は、大量のデータのリリースであり、これらのデータは、非常に低コストで、過去最低のコストを計算 - この回復は、強力な基本的な要因によって駆動されているようです!

しかし、誰もがはい学習どのようなマシンを理解しています。ここではいくつかの例を示します。

  • 機械学習とは何ですか?それはどのようにビッグデータとビジネス・アナリティクス違うのですか?

  • 機械学習、データ解析、データマイニング、データ科学とAIとの違いは何ですか?

我々は最近、興味深い(しかし、非常に現実的)なテーマを掲載しました。

 

彼は、このトピックに考慮に混乱の度合いを取って、我々は機械学習についての紹介記事を書くしようとしていると述べました。アイデアは簡単にどのような5歳児(emmmmmmm ............まあ、私は申し訳ありませんが、あなたが高校を必要とするかもしれない)を理解することができるものを作成するために、人々を怖がらせるために、過去のすべての可能な条項を削除することです!

 

マシンが何であるかを学びますか?私の小さな実験の一つ......

私は観客を標的とする能力を過大評価(あるいは過小評価)しないことを確実にするために、私は完全な見知らぬ人の10組の分析を発見しました。彼らは(はい、そこに実際にそのような人々!!!!!)機械学習の前に聞いたことがありません。彼らは、これは言っていました:

  • 私にはわからない、マシンから学ぶことができますか?

  • マシンソフトウェアのプログラミング、何かを機械学習、

  • コンピュータで私が学ぶのを助けますか?

  • オンラインコース(!!!)

楽しかったです!パーフェクトは、彼らは機械学習を考えたかを説明します。ここで私は、マシンの概念を学習これらの人々に説明するものです。

  • 機械学習は、当洞察を得るように動作可能な(アルゴリズムを開発することによって)、最もインテリジェントな方法に大量のデータを参照します。

私は火星人として彼らに話を聞いたかのように、彼らが私を見て!彼らはのより良い理解を容易にすることができる、だから、私は説明する愚かな用語を停止し、その後、順番に、彼らに質問をします:

  • KJ :あなたがグーグルで何かを検索した場合、何が起こるのだろうと思いますか?

  • クルー:Googleは検索に関連するウェブページを表示します。

  • KJは:それは良いことです!しかし、Googleはあなたについてどのようにこれらの関連ページを表示することができますか?

彼らはより多くを望むようにこの時間は、それが見えます。そして、グループ内の一部の人々が話すようになりました

  • クルー:Googleは、ユーザーが過去にクリックした表示これらの検索により関連しているし、検索結果に結果を提供するページを学びます。

これは良い試みです。しかし、私はまた、彼の衝動をコントロールする必要があり、Googleは彼らがこのシンプルなコンセプトよりも、このより複雑な操作を行うためにそれらを伝えます。しかし、私は機械学習を説明するためのより良い方法があると思います。だから、私が言うようになりました。

  • KJは:まあ、それはいいですね。しかし、Googleはどのように多くの検索だけでなく、通常の検索プロセスのすべてのタイプになりますか?

  • メンバー:これは非常に大きな数でなければなりません-おそらく兆回の年間検索

  • KJ :まあ、どのようにGoogleに思いますし、正確に非常に多くの要求を満たすために?一部の人々はあなたがオフィスに座って、検索に問題がそれに関連しているものは、Googleの検索結果に対処するために続けていないと思いますか?

  • パネルメンバー:人間が扱うことができるように聞こえるように見えるので、私は、について考えていないが、これに対処するために誰もいませんでした。

  • KJ :あなたは正しいです。これは、機械学習のどこ役割です。機械学習は実用的な結果を得るために(アルゴリズムまたは論理的ルールのセットを開発することで)大量のデータを処理するための最もインテリジェントな方法で、一連の技術(我々が議論しているものの中には、検索をユーザーに提供することである)です。

私はそれを行っているように期待されるに従い、グループのメンバーは彼の頭をうなずいた。この時間は、ええ......見えます!しかし、ここで私はいつも感じています...

そのような機械学習やXなどの違いは何ですか - いくつかの一般的な問題がありますか?

あなたはその瞬間を機械学習についての学習を開始、あなたは高速爆撃あなたのロケットのような知識のすべての種類が表示されます。これらは、多くの業界で使用される用語です。人工知能、深い学習、データマイニングや統計:以下は、それらのいくつかです。

あなたがより明確に理解与えるために、私は簡単な方法でこれらの用語を説明します。また、機械学習におけるこれらの用語の重要性を学びます。

人工知能(AI)はどのようなものです:

これは、プログラムがプログラムを正当化する独自のを作るコンピュータ(マシン)を指します。ああ!その理由は何ですか?その理由は、意思決定を行うための基礎となっています。

私たち人間は非常に合理的かつ実用的な意思決定ではなく、明示的に知恵を作る傾向があるので、私は、(予想通り)、「合理的」というよりも知性を述べました。すべてではないスマートな意思決定が合理的かつ実行可能な(私の仮定)を必要とするためです。そのため、人工知能の使用の背後にあるコア動機は、コンピュータ(マシン)の挙動を達成するためのファッショナブルな方法ではなく、人間の愚かさによって導かれました!

AIは、実行中のプログラムの特定のパラメータかどうかを確認するためのプログラムを含むことができます。パラメータは、「X」は、特定のしきい値を超えたと言った場合、マシンは警告を発行することができる、およびしきい値は、順番に関連するプロセスの結果に影響を与えることがあります。

機械学習における人工知能の応用

機械学習機械を訓練した人工知能のサブセットであり、我々は過去の経験から学ぶことができます。過去の経験は、データ収集を通じて開発されます。そして、それが最終的な結果を提供するために、ナイーブベイズやサポートベクターマシンアルゴリズムを組み合わせています。

統計はどのようなものです:

この高レベルの段階では、私はあなたがすでに統計を知っていると仮定します。ない場合は、ここでは簡単な概要を示します統計情報を定義することができます、統計は全人口のデータを使用して数学の支店、またはデータであるか、分析し、与えること、母集団からサンプルを抽出するために、当然の結果。ように回帰、分散、標準偏差、条件付き確率とを用い統計的手法があります。

機械学習における統計の使用

私たちはこのことを理解してみましょう、私たちは、最初に、私は電子メールの受信トレイには2つのカテゴリに分類される必要があることを想定する必要があります「重要なメッセージ」「スパム」と スパムを識別するために、私が使用することができますと呼ばれるナイーブベイズ機械学習アルゴリズムはそれほど新しいメッセージがスパムとして識別、過去のスパムの周波数をチェックします。ベイズの定理を用いて、ナイーブベイズ統計的手法(一般的に条件付き確率と呼ばれます)。したがって、我々は機械学習アルゴリズムは、機械学習を行うために、統計的な概念を使用すると言うことができます。

PS:その発祥の地から機械学習と統計モデルとの主な違い。機械学習は、統計的モデリングからコンピュータ科学、数学の学科で始まりました。また、任意の統計モデリングは多くのディストリビューション、および機械学習アルゴリズムは、多くの場合、すべてのプロパティの分布を知らないことを前提としています。

学習の深さとは何か:

このアルゴリズムは、任意の関数をモデル化の推進に関連したヒトの脳と機械学習アルゴリズムの深さの研究(人工ニューラルネットワーク、ANN)の概念を使用しています。ニューラルネットワークは、大量のデータを必要とし、このアルゴリズムは、柔軟性のモデルの複数の出力を同時に高度を有します。ニューラルネットワークは、より複雑なテーマである、我々は完全に別の記事で説明することができます。

データマイニングとは何ですか。

機械学習とデータマイニング:私はちょうどデータアナリストの日を始め、私は常に2つの用語を混同するために使用します。しかし、私は、データマイニングは、特定の情報を検索する処理であることを学びました。マシンは、特定のタスクの完了に注力することを学びます。私は私が違いを思い出すのに役立つために例を挙げてみましょう;機械学習でどのように踊るために他人を教えます。街で最高のダンス・センターを探して誰かがデータマイニングで使用してください。それは、超簡単ではありません!

しかし、どのように我々は、実際にマシンを教えるのですか?

ティーチングマシンは構造化されたプロセスを含む、このプロセスは、各ステージは、より良いマシンのバージョンを構築することができます。簡単にするために、教育・マシンのプロセスは、3つの部分に分けることができます。

 

私は、その後の記事で詳細にこれらの三つのステップのそれぞれを説明します。今では、あなたは全体的な学習機械を確保するための3つの手順が重要な場所として与えられたタスクを実行できることを理解すべきです。機械の成功は2つの要因に依存します。

  1. どのように一般化効果の抽象データ。

  2. このマシンは、実用的なアプリケーションで未来を予測するためにそれを使用する方法を学びます。

機械学習は、どのような手順ですか?

機械学習のタスクを実行するための5つの基本的なステップがあります。

  1. データ収集:エクセル、アクセス、テキストファイルなどから、このステップは(過去のデータを収集するために)将来の学習のための基礎を形成するかどうか、元のデータ、。データの種類、より密度や数、優れた機械学習の見通し。

  2. データの作成:使用任意の分析手順は、どのようにデータの品質に依存します。これは、データの品質を決定するために時間がかかり、そのような行方不明などのデータや処理外れ値の問題を解決するための措置をとります。データの探索的分析は、そのようにデータの品質が急速に、方法のニュアンスの詳細な研究であってもよいです。

  3. 学習モデル:このステップでは、モデルの表現の形で適切なアルゴリズムおよびデータの選択を含みます。二つの部分に分かれて洗浄した後、データ-訓練および試験(比が前提に応じて決定される)、第一の部分(訓練データ)開発モデルのため。基準として使用される第二の部分(テストデータ)。

  4. モデル評価:第2の部分を使用して、データの正確性をテストするために(/テストデータを保持)。このステップは、選択されたアルゴリズムに従って、結果の精度を決定します。モデルの精度を確認するためのより良いテストは、その基本的な未使用時のモデル構築データのパフォーマンスを見ることです。

  5. 提高性能:此步骤可能涉及选择完全不同的模型或引入更多变量来提高效率。这就是为什么需要花费大量时间进行数据收集和准备的原因。

无论是任何模型,这5个步骤都可用于构建技术,当我们讨论算法时,您将找到这五个步骤如何出现在每个模型中!

机器学习算法有哪些类型?

 

监督学习/预测模型:

顾名思义,预测模型用于根据历史数据预测未来结果。预测模型通常从一开始就给出明确的指示,如需要学习的内容以及如何学习。这类学习算法被称为监督学习。

例如:当营销公司试图找出哪些客户可能会流失时,就会使用监督学习。我们还可以用它来预测地震,龙卷风等危险发生的可能性,目的是确定总保险价值。使用的算法的一些示例是:最近邻算法,朴素贝叶斯算法,决策树算法,回归算法等。

无监督学习/描述性模型:

它用于训练描述模型,其中没有设置目标,并且没有一个特征比另一个重要。无监督学习的情况可以是:当零售商希望找出产品组合时,顾客往往会更频繁地购买。此外,在制药工业中,可以使用无监督学习来预测哪些疾病可能与糖尿病一起发生。这里使用的算法示例是:K-均值聚类算法

强化学习(RL):

这是机器学习的一个例子,其中机器被训练根据业务需求做出特定的决定,唯一的座右铭是最大化效率(性能)。强化学习所涉及的理念是:机器/软件代理根据其所处的环境不断地自我训练,并应用它丰富的知识来解决业务问题。这种持续的学习过程可以减少人类专业知识的参与,从而节省大量时间!

RL中使用的算法的示例是马尔可夫决策过程。

PS:监督学习和强化学习(RL)之间存在细微差别。RL主要涉及通过与环境交互来学习。RL代理从其过去的经验中学习,而不是从其持续的试验和错误学习过程中学习,而是外部主管提供示例的监督学习中学习。

了解差异的一个很好的例子是无人驾驶汽车。自驾车使用强化学习来不断做出决策 - 走哪条路?速度是是多少?这些问题都是与环境互动后决定的。监督学习的一个简单表现是预测出租车从一个地方到另一个地方的车费。

机器学习有哪些应用?

了解机器学习的应用是非常有趣的。Google和Facebook广泛使用ML将其各自的广告推送给相关用户。以下是你应该了解的一些ML应用:

  • 银行和金融服务:ML可用于预测可能违约支付贷款或信用卡账单的客户。这是至关重要的,因为机器学习将帮助银行识别那些是可以获得贷款和信用卡的客户。

  • 医疗保健:它用于根据患者的症状诊断致命疾病(例如癌症),并根据类似患者的过去数据对其进行统计。

  • 零售:它用于识别销售频繁(快速移动)的产品和缓慢移动的产品,帮助零售商决定从货架上引入或移除哪种产品。此外,机器学习算法可用于查找哪两个/三个或更多产品一起销售。这样做是为了设计客户忠诚度计划,从而帮助零售商开发和维护忠诚的客户。

这些例子只是冰山一角。机器学习在每个领域都有广泛的应用。可以查看一些Kaggle问题以获得更多知识,上面包含的例子很容易理解,至少可以体验机器学习的无所不能。

随着人工智能的热潮,人们开始逐渐的对机器学习产生了兴趣,而这种兴趣也是全球化,虽然人们对机器学习有很大的兴趣,但是人们对机器学习似乎并没有真正的了解,而文章的作者借由向一些非数据科学行业内的小白科普机器学习的过程中,用非常白话的语言向我们介绍了什么是机器学习,一些机器学习中的专业术语,机器学习的步骤和机器学习的类型与应用。并且通过一些小案例向我们解释了各种算法的作用,在我认为,机器学习是进入人工智能领域一块很好的垫脚石,至少不会再未来的浪潮中使我们迷失了方向。

文章翻译自:Machine Learning basics for a newbie

原文链接:https://www.analyticsvidhya.com/blog/2015/06/machine-learning-basics/

 

おすすめ

転載: www.cnblogs.com/juanjiang/p/11112668.html