データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

https://www.toutiao.com/a6703348023008690701/

 

みなさん、こんにちは、今日はコラム入るようになった「AI中年レルム」更新のを、これは最初の記事では、どのようにデータ駆動型の深い学習を説明しています。

中年の領域に、それはこの状態で、独自の独立した思考を必要とし、移動が始まったマスターすることです。研究は模倣からのものであれば、この段階では、模倣、ステージ間のジャンプに従わなければならないので、創造的なプロセスに、従うことを、彼は創造の段階に入りました。このレルムの当初から、答えを持っていない可能性があり、問題の物語、より多くの私たちが一緒に仕事は思考を刺激することです。

著者&編集者|全能の三つの言葉を持っています

ディープ学習成功はトロイカから茎モデル、データ、およびハードウェアのコアデータのほとんどの背後にある、我々はデータ抽象的知識から学んできたからこそ学習の深さは、さまざまなタスクを完了することができます。

人工知能の開発、データの利用の進展に伴い、本日、について話をします。

データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

 

1データと学習

私はいつもあなたが手元にタスクを完了するために、データの種類がわからない、仕事上のデータの重要性を認識するために失敗した場合、それは真のエントリの深さの研究ではなく、生徒に言います。

それまでは、様々なフレームワーク、技術、プロジェクトにふけるに行くことができます。

ほとんどの人がプロセスのどのような種類で育つことを思い出してください。

(1)新たに生まれた子供は、全世界のために成長しているさまざまな情報を受け、金利に差を示しませんでした。

(2)若い年齢で、リーダーシップの下で、私たちの親や教師が宿題から暗唱することを学ぶようになった、間違った行動のほとんどは、エラー訂正になり、正しい動作が報われる。

(3)成長すると、完全に既存の知識を探求し、適用する熟練の楽しさとデータモデルの仕事を自分の地域で何人かの人々は、他の事は何人かの人々が答えを持っていないので、我々は新しい探求する必要があります法律は、そのような自分の会社、新たな知識の創造の確立など。

データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

 

これらのステージは、コアがデータの背後にあります。

(1)時間の知識なしに、すべての既存のデータが知識です。

(2)彼らは数学の試験を行うことを学んで、既存のデータベースを選択し、単語ライブラリをバックアップするために必要な言語を学びたいことを学ぶ必要があり、フィールドのために必要なときに学ぶ、実際には、楽譜、今回学ぶことが必要であるとし、既存のデータ学習

(3)時間の知識を利用して、彼らは自分の知識を調整することを学ぶ必要があり、新たなデータ入力のために、このプロセスでは、知識も更新されます。

(4)知識の作成は、合計アップ顔がされているから、科学と社会の法律、観察する必要がある場合にそのデータを修正しません

私が言ったように、データからのデータ、知識を照合し、分析し、寿命が得られる統計的に最も重要費やしたと言っても過言ではない「自然の模倣を。」

教師なし学習の機能への2教師付きフィーチャー・プロジェクト

教師なしと教師方法といえば、やはり引用する法令や不作為のルールのコントラストを。

法の支配にあるが、コアの法律のさまざまな設定、我々は従うように、コアとルールなしでは、ある非介入国が自然の法則の下で動作するように、。明らかに後者は大きな不確実性が、また達成することがより困難があり、より高度です。

この例で言うには、ある教師と教師なしの方法の後、我々はインテリジェントシステムの成長を見て、教師から教師なしに進行され、社会学の代表。

データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

 

(1)最も基本的な知能システムは、実際には、特定の分野の専門家の多くの経験に頼って、専門家の知識を使用するようにマシンを使用することです。1960年代から1980年代の人工知能の第二波の先頭に、エキスパートシステムは、あなたが知って興味がある可能性があり、非常に人気があります。

データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

 

(2) 随着技术的发展,研究者发现专家系统实在是过于简单和脆弱,于是研究出了一系列的模型,包括人工神经网络/SVM等等。通过专家的经验对数据进行预处理,完成知识的初步抽象(提取特征),之后丢给模型进行进一步的学习。与专家系统相比模型的复杂度大大提升,因此也可以开始解决更加复杂的问题,比如人脸的检测,语音的识别。在20世纪末和21世纪初,有监督的机器学习方法得到了非常广泛的应用和研究。

データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

 

(3) 随着大数据的爆发以及科学家的不断探索,研究人员开始认识到通过专家的经验对数据进行预处理是不合适的,数据的维度太高,专家不可能知道每一个任务到底需要怎样的预处理,所以无监督特征学习方法诞生。对于一个无监督的特征学习系统,它的输入应该尽可能是原始的数据,最大程度上保证信息的完整。至于学习的规则,仍然由专家来制定。

于是专家设计出各种各样的模型架构和优化目标来指导系统从数据中进行学习,与有监督的特征工程的最大区别在于使用数据的方式,这一类方法也被称为特征学习,于是我们有了传统的机器学习算法和深度学习算法之分。

データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

 

(4) 再往后发展,就需要机器自己创造模型,人类专家在其中所起的作用很小,甚至没有,这也是人工智能的未来,或许社会发展到一定的阶段,真的会有创造生命的那一天吧。

データは、より多くの成功があるとどのように冷酷な人工知能を押し、「AIは領土を当惑しました」

 

3 深度学习第一阶段-学习特征

在深度学习发展的第一阶段中,重点就是专家设计模型和优化策略,从数据中学习特征表达。

深度学习的成功很大程度上归功于卷积神经网络CNN模型架构,在图像,语音等领域都取得了大大突破。CNN是一种无监督的特征学习模型,输入原始数据,然后完成学习。关于CNN的基础,大家可以去阅读公众号的相关文章。

在这个过程中,模型的架构固然会影响最终的结果,但是更重要的却是数据集,没有一个好的数据集,怎么都不可能训练出好的模型。关于数据集的重要性,可以阅读往期文章。

「数据集」深度学习从“数据集”开始

4 深度学习第二阶段-学习模型

在深度学习发展的第二阶段中,重点就是学习网络模型本身和各种相关的策略。

在第一阶段,典型的工作流程是准备数据,选择模型框架,定义各类优化参数,然后开始训练。

模型的架构需要研究人员手动设计,模型的各类训练参数包括归一化方法,初始化方法,激活函数等等也需要研究人员根据经验进行调试。数据的使用,包括预处理,增强策略也需要研究人员进行尝试。

但是技术发展到今天,研究人员开始从数据中学习模型本身。

4.1、AutoML自动模型结构设计技术

在深度学习发展的这些年里,研究人员用尽了各种手段去探索和设计各种各样的网络,研究网络的深度,宽度,卷积的方式,浅层深层的信息流动和融合等,可以参见文章。

https://dwz.cn/t8oWtKTg

然而到了今天,新的网络设计方法开始流行,以Google Brain提出的AutoML为代表的技术,让机器根据不同的任务(数据),自动搜索最佳的模型架构,数据驱动了模型的学习。

4.2、AutoAugment自动数据增强策略

曾几何时,我们采用各种各样的几何变换,颜色变换策略来进行数据增强。随机裁剪,颜色扰动,都对提升模型的泛化能力起着至关重要的作用。

而如今,是时候寻找更好的方法了。以Google Brain提出的AutoAugment为代表的方法,使用增强学习对不同的任务学习到了各自最合适的增强方法,可以参考往期文章:

「技术综述」深度学习中的数据增强方法都有哪些?

4.3、自动优化参数选择

曾几何时,我们设计,比较,分析sigmoid,tanh,relu等激活函数对网络性能的影响。

而Google Brain提出的以Swish为代表的方法,在一系列一元函数和二元函数组成的搜索空间中,进行了组合搜索实验,利用数据学习到了比ReLU更好的激活函数,可以参考往期文章:

「AI初识境」激活函数:从人工设计到自动搜索

曾几何时,我们还在争论是最大池化好还是平均池化好,如今基于数据的池化策略已经被广泛研究。

曾几何时,我们还在不知道选择什么样的归一化方法好,如今,基于数据的归一化策略也在被研究。

昔、私たちはまだ良いの最適化方法の選択、そして、今、データの最適化法に基づくも検討されているのか分かりません。

内容は、公共の数を参照することができ、「AIの知人の領土、」我々は、より詳細な解釈を行うために戻ってきます。

これは、政策設計モデルを使用することから、モデルパラメータの最適化、データを選択し、言うことができる、深い学習が自動化に向けた、フルです。

概要

昔、我々は唯一の良いデータ抽象を使用しています。その後、私たちは自分自身のデータ抽象化機能から学びました。その後、我々はそれが抽象的機能を行くようにシステムを発明しました。その後、我々はデータがシステムを学びたいと思っています。

おすすめ

転載: blog.csdn.net/weixin_42137700/article/details/94437139