「人工知能」啓発学習

R&D人材のアイデンティティは2のPCインターネットとモバイルインターネットの開発プロセスを経験したときに身元が個人経営者の技術的な仕事に従事なっていないが、今、AIの波の新しい波に直面しています。しかし、インターネットの転覆が可能に/さまざまな業界/企業を経験しているとして、AI改造業界/企業はまた、多くの非技術的な背景や鈍感なテクノロジー企業経営者のためのトレンドである必要があり、AI /機械学習、単に手段名詞我々は、包装・ツー・ビジネスを追いかけている傾向....... しかし、まだ技術を愛する人のために、価値の深い理解は、企業がもはやAIとのパッケージ/製品の組み合わせでどのようにありますが、分析、ビジネスシーン、抽象的なビジネスシーン選択、データ収集、アルゴリズムから.... ..企業ビジネスとAIの着地部は、競合先発の優位性を形成するために合わせました。

私は以前にスプーン送りする教育を、善と悪、AI関連の書籍や多くの情報を見ていました。心の中で概念の完全な履歴のすべての種類、霧の感じのようなもの。関連を整理するためにこれらの散乱知識のその明確な階層構造を利用するために、優れた書籍や論文の数に直面したときしかし、これは、また、スプーン送り教育のために良いです。例えば、限定した学習人工知能、機械のコア技術を知って、人工知能、象徴、コネクショニズム、行動主義の歴史的発展を知っているが、学習の深さとは、機械学習のサブセットであり、ニューラルネットワークは、学習の深さを実現しますベースモデル、画像認識、音声認識、機械学習の自然言語処理アプリケーションの深さの調査.....今はほとんどAI(コア)の代名詞となっているので、それを見つけるのは非常に幸運、分野を学ぶすべての人の焦点となりました「Scikitは、学習と実践的なガイド(コピー版)学習TensorFlowマシン」この本は、本の最初の章では、彼の機械学習をしましょう、明確かつ体系的に理解がありました。他の章とケース深さとコードも実用的で強制力のある、非常に良好です。

人工知能についての他の本を読みます

  • 「スマート時代」 2016年には準備が始まったばかりで人工知能が、この波の波を追いかけるために本を、出版しました。だから、この本の一節を覚えて:.「これは時代の最高で、ホメオパシー、または逆張りダウン倍の最悪、私たち自身の選択ということ。」

  • 「人工知能革命」  の人気の科学の本を-評価は非常に浅い言ったが、それぞれの本は、自身の位置がそれをすべきであるが、人工知能、技術、科学の本の文字のかなり良い歴史を感じ。この本の偉大な英国のドラマから学ん同時に「ブラックミラー」、数四半期を追いかけて、棚ぼたにそれを検討しました。^ _ ^

  • 「科学の究極:話し人工知能」は人気の科学の本ですが、私はこの本はZhekesiweiに反映されていると感じ、より多くの困難を理解します。

  • 「コレクティブインテリジェンスプログラム」  公表の15年、クレソンは8.9高得点が、読者のほんの一握りを獲得。私は、AIとビッグデータの熱い時代、無名のタイトルはあなたが良い本を欠場ようになると思います「機械学習」には理解して練習したい「統計計算を、」友人が読んでお勧めします、そのシナリオは(そのような製品の好みの勧告として予想価格、試合、金融シーンをさかのぼり......)生活に非常に近い、コードが追加され行うことができます......が、実際に読んで推定必要以上の知識ポイントを伴うこの本を理解します回、および展開する学習の多く(¯(●●)を¯)

  • 「人工知能の概要」  、より正式な学術教科書の本、に似ているエントリ学習人工知能のガイドに適した広い範囲を包含する。

  • :「核分裂秒人工知能は、基本的なコースを理解するために」、このようなものを人工知能の数学的基礎を習得することを学ぶように良い組織と文脈の書籍、機械学習、人工ニューラルネットワークの最も燃える、深い学習が似ている、ニューラルネットワークの例。人工知能のシナリオを、どのような深さの学習、人工知能を超えた人工知能は、機械学習は、すべてではありません。コンテキストのこの漸進的な層は、人工知能の枠組みをより明確に理解を持って自分自身を説明します。本の著者と「人工知能の革命」の著者に加えて、書き込みは、技術とヒューマニズムの両方非常に良いです。

レジャーブックス:

  • 「未来の歴史」「歴史今日」のYuval•ヒーラリーの作品は、将来の紛争や危機の多くは、人間を探求するため、機械の知能が直面する可能性があります。

  • 「人工知能」「AI・未来」  カイフーリー先生の本、理解しやすいです。物事のいくつかの技術的な側面は、個人、社会と人工知能との関係について主に考えます。

第一章の演習「Scikit-学び、TensorFlow機械学習実践ガイド(コピー版)」付属

機械学習を定義するには?

  • 機械学習は、データから学習するコンピュータサイエンス(芸術)を作るようにプログラムされています。

  • 機械学習は、明示的なプログラミングなしで、学習能力を備えたコンピュータです。

  • コンピュータプログラムは、学習タスクタスクのパフォーマンスPのTのために、EとPの成長の経験でも増加する場合T E、Pの性能は、それが機械学習と呼ばれているの経験を使用しています。

機械学習は、すべての問題を解決することができ、4をリストしてください?

  • 問題は、手動調整の多くを必要とするか、または解決するために、ルールの長い文字列を持っている必要があります:機械学習は、コードを簡素化し、パフォーマンスを向上させることができます。

  • 問題を複雑に、解決する従来の方法は難しい:使用良い機械学習技術が解決策を見つけることができます。

  • 環境の変動:機械学習アルゴリズムは、新しいデータに適応することができます。

  • 複雑な問題と問題に対処するためのより良い方法で、大量のデータ(データマイニング)からの予期しない関係/トレンドを発見。

ラベルにトレーニングセットとは何ですか?

  • 教師付き学習では、アルゴリズムを訓練するために使用されるトレーニングデータは、タグと呼ばれる答えを、含まれています。

2つの一般的な教師付き学習タスクをリストしてください?

  • そのようなスパムフィルタとしての分類は、だけでなく、分類するための新しいメールフィルタのために、分類されたサンプルとのメールの多くを訓練することです。

  • 戻り値(予測目標値)は、例えば、車の価格を予測するために、いくつかの特性(走行距離、車両年齢、ブランド、など)を得ました。

4つの一般的な非監督タスクと指摘しましたか?

  • ユーザデータを大量に使用してクラスタリングは、パケット同様の来場者を検出し、ブログの訪問者を想定しています。

  • 可視化および寸法減少、タグ付けされた複雑なアルゴリズムの多数のためのデータ、アルゴリズム2Dまたは3D画像データが出力されます。

  • このような不正行為を防止するために、振込等の異常を検出する異常検出、トレーニングデータの前にトレーニングセットから自動的に削除製造上の欠陥、又は異常値を検出します。

  • 属性間の興味深い関係を見つけるために、大量のデータをマイニングアソシエーションルール学習、。

ロボットが未知の地形の様々な上を歩くことができれば、何を機械学習アルゴリズムのでしょうか?

  • 強化学習:学習システムは、(負の報酬罰あり)報い、薬剤、環境上で観察することができ、選択および動作の実装と呼びます。そして、それが最大の長期的な報酬を得るために、最善の方法(戦略)が何であるかを学ぶために所有する必要があります。ポリシーは、与えられた状況でのアクションエージェントが取られるべきで決定します。

要对你的顾客进行分组,你会采用哪类算法?

  • 在不知如何定义顾客组的情况下采用非监督学习的聚类算法;如果你知道你想要什么类别的用户组,采用监督学习的分类算法。

垃圾邮件检测是监督学习问题,还是非监督学习问题?

  • 监督学习问题

什么是在线学习系统?

  • 在线学习是用数据持续的进行训练,可以一次一个或者一次几个实例(小批量)。每个学习步骤都很快且廉价,所以系统可以动态地学习到达的数据。

什么是核外学习?

  • 在线学习算法也可以当机器的内存存不下大量数据时,用来训练系统(成为核外学习)。算法加载部分的数据,用这些数据进行训练,重复这个过程,直到用所有数据都进行了训练。

什么学习算法是用相似度做预测?

  • 基于实例学习的机器学习算法使用记忆来学习案例数据。然后使用相似度测量推广到新的例子。

基于模型学习算法的参数和学习算法的超参数的区别是什么?

  • 基于模型学习算法有一个或多个模型参数,这些参数决定了它将如何预测给定的新实例(例如,线性模型的斜率)。此学习算法试图找到这些参数的最优值,这样模型就可以很好地推广到新的实例。学习算法的超参数是是其本身的参数,而不是模型的。

基于模型学习的算法搜寻的是什么?最成功的策略是什么?基于模型学习如何预测?

  • 基于模型的学习算法为模型参数寻找最优值,使模型能够很好地推广到新的例子中。我们可以定义一个实用函数(或拟合函数)用来测量模型是否够好,或者定义一个代价函数来测量模型有多差。对于线性回归问题,人们一般是用代价函数测量线性模型的预测值和训练样本的距离差,目标是使距离差最小。

机器学习的四个主要挑战是什么?

  • 训练数据不足。机器学习需要大量的数据,才能让多数机器学习算法正常工作。即便对于非常简单的问题,一般也需要数千的样本,对于复杂的问题,比如图像或语音识别,你可能需要数百万的样本。(也可重复使用部分存在的模型)。

  • 没有代表性的训练数据。

  • 低质量的数据。如果训练集中的错误、异常值和噪声太多,系统检测出潜在规律的难度就会变大,性能就会降低。

  • 不相关的特征。避免进来的是垃圾,出去的也是垃圾。

如果模型在训练集上表现好,但推广到新实例表现差,问题是什么?给出三个可能的解决方案?

  • 出现了训练集的过拟合。过拟合发生在相对少量的训练数据,噪声较多,模型过于复杂的情况。解决方案:

    • 简化模型,可以选择一个参数更少的模型(比如使用线性模型,而不是高阶多项式模型)、减少训练数据的属性数、或者限制一下模型);

    • 收集更多的训练数据;

    • 减少训练数据的噪声(比如修改数据错误和去除异常值)。

什么是测试集,为什么要用它?

  • 在将算法模型应用在产品中前,使用测试集来进行评估模型推广误差率。

验证集的目的是什么?

  • 用训练集和多个超参数训练多个模型,选择在验证集上有最佳性能的模型和超参数。

如果用测试集调节超参数,会发生什么?

  • 如果在测试集上多次测量了推广误差率,调整了模型和超参数,以使模型最适合这个集合。这意味着模型对新数据的性能不会高。

什么是交叉验证,为什么它比验证集好?

  • 为了避免“浪费”过多训练数据在验证集上,通常的办法是使用交叉验证:训练集分成互补的子集,每个模型使用不同的子集训练,再用剩下的子集验证。一旦确定模型类型和超参数,最终的模型使用这些超参数和全部的训练集进行训练,用测试集得到推广误差率。


おすすめ

転載: blog.51cto.com/yaocoder/2403981