https://mp.weixin.qq.com/s/dQxbmSHouyAx13LxDKl8kQ
by 超神经
读论文这件事,对深入了解细分领域的技术和难题来说,重要性毋庸置疑。
2018 年也出现了很多优质的论文,比如各大顶级学术会议上的获奖论文,我们今天盘点的是 Reddit 网友心中那些 2018 帮助过他们的论文。
Reddit netizen:私はこの論文に投票します
@ beezlebub33推奨論文:
「好奇心主導型学習の
大規模研究」大規模な好奇心主導型学習の研究
https://pathak22.github.io/large-scale-curiosity/
推奨の理由:
この記事の重要性は、多くのゲームで優れたパフォーマンスが得られることを反映しています。重要なことは、予測を通じてゲームをプレイすることを学習し、期待に反する行動を特定し、未知の領域を探索できることです。これはAIの将来の方向性かもしれません:自己監視、ラベル付けされていないデータ、予測可能性、好奇心、内部の動機など。
監視されたトレーニングセットを作成し、これらのデータセットの行列を定義する十分な時間がありませんでした。しかし、AIに生データを提供し、システムの時空間進化の内部表現を学習できる場合は、目標を定義して、最終的にAIでそれを達成できます。
@YBuzzinGA推奨論文:
「教師なし学習ルールの
学習」教師なし学習ルール
https://arxiv.org/abs/1804.00222。
推奨される理由:
この記事は、教師なし学習を使用していくつかのタスクを完了することを対象としています。その特徴は、モデルがそれ自体で学習する方法を学習していることです。
メタ学習は重要な領域です。これらの学習ルールを学習することで、AIは自分自身を理解し、改善することができます。コンピュータに自分自身を理解する方法を教えることができれば、私たちは飛躍するかもしれません。
@breadwithlice推奨の論文:フレーズおよび教師なし神経機械翻訳に
基づく「フレーズベースおよび神経教師なし
機械翻訳」https://arxiv.org/abs/1810.04805v1
推奨の理由:
この記事では、単一のコーパスのみを使用して、マッピング、辞書、または並列データなしで翻訳を完了できます。
論文では、逆変換手法が使用されています。AからBに変換し、次にBをAに変換すると、トランスレーターが大幅に改善され、AとBを切り替えることができます。
@kartayyar推奨論文:
「
言語理解のためのディープ双方向トランスフォーマーの事前トレーニング」言語理解における
ディープ双方向メソッドの事前トレーニング
https://arxiv.org/abs/1809.10756
推奨される理由:
私が気に入っている点:
優れた革新的なコンセプト、彼らが使用するマスキング方法は非常に創造的です。
彼らは非常にシンプルな文章で彼らの中心的な哲学を明らかにしました。
Githubにコードの再現可能な結果があります。
さまざまなタスクを処理できます。
@ ndha1995推奨論文:
「確率的プログラミング入門」
確率的計画導入
https://arxiv.org/abs/1809.10756
推奨理由:
これは2018年の論文で私のお気に入りです。
著者は、確率論的計画を包括的かつ厳密に紹介し、最後の章では、ディープニューラルネットワークと確率論的計画の組み合わせに関する最近の研究を紹介しました。
論文を読むためのハードコアな提案
素晴らしい論文を知っていても、「すごい」と叫ぶ以外は本当にすばらしいのですが、どうすれば理解できるでしょうか。
まず、モチベーションについて考えます。積極的に探索し、受動的にタスクを完了したいと考えます。効果と経験はまったく異なります。私たちはいくつかのハードコアな提案を見つけました、ええと、私たちはここであなたを助けます。
批判的に読む
これは非常に重要な態度です。著者の視点を盲目的にフォローしないでください。代わりに、疑いに行き、確認します。
重要な読書とは何ですか?質問してみてください。著者が問題を解決しようとした場合、彼らはそれを正しく解決しましたか?簡単な解決策を考えなかった作家はいますか?ソリューションの制限は何ですか(作成者が気づかなかった、または明示的に認めたものを含む)?
著者の仮定は妥当ですか?仮説を立てると、論文の論理は明確かつ合理的ですか、それとも推論に欠陥がありますか?
著者がデータを提供する場合、それらのデータを使用して彼らの主張を確認できますか?また、データを収集するための彼らの道は妥当ですか?彼らはどのようにデータを解釈しますか?他のデータに切り替える方が良いでしょうか?
創造的に読む
論文を批判的に読むことは、構築するより破壊する方が簡単なので、最も難しいことではありません。また、創造的な読書には、より困難で前向きな考え方が伴います。
例:この記事の良いアイデアは何ですか?これらのアイデアの他のアプリケーションまたは拡張機能はありますか?それらをさらに促進することはできますか?大きな違いをもたらすような改善点はありますか?自分で関連研究を行う場合、次に何をしますか?
紙を読みながらメモを取る
多くの人が論文を読みながらメモを取る。この方法はとても良いので、質問やコメントは好きな方法で記録してください。著者の要点を見つけてください。
高く評価されているコーネル法
最も重要なまたは一見問題のあるデータをマークします。このようなマークは、論文を理解するのに役立ちますが、後でレビューするのにも役立ちます。
最初に読んだ後、
論文を1〜2文で要約してください。
ほとんどすべての優れた論文が特定の質問に対する答えを求めています。論文を簡潔に説明できれば、著者が解決したい問題や最終的な回答など、著者の業績を理解している可能性があります。主要なアイデアに焦点を当てたら、戻って論文の概要を説明し、具体的な詳細をより深く理解します。
実際、論文を1文または2文で要約するのが簡単な場合は、別の方法を試し、3つまたは4つの概要をリストして主要なアイデアを要約することができます。
できれば、
他の作品と比較してください
論文を要約することは、論文の科学的貢献を決定しようとする方法です。しかし、科学的価値を正確に把握するには、その論文をその分野の他の研究と比較する必要があります。これらのアイデアが新しいか、以前に登場したことがあるかを理解するには?
科学的研究を発表するには多くの方法があることは言及する価値があります。たとえば、新しいアイデアを提案するだけの論文もあれば、検証を実装してそれらがどのように機能するかを示す論文もあれば、以前のアイデアを組み合わせて新しいフレームワークに統合するものもあります。現場での他の作業を理解することは、紙の価値をよりよく理解するのに役立ちます。
超神経百科事典
教師なし学習
機械学習は、教師あり学習、教師なし学習、半教師あり学習に分類できます。
教師なし学習は、トレーニングセットに対応するカテゴリ識別を提供しない学習方法です。データセットはあるがラベルはない状況に適しています。
教師なし学習で使用されるデータにはラベルが付けられておらず、入力データに対応する出力結果はトレーニング中に不明です。監視付きの拡張機能はありません(正しい学習方法を教えてください)。
教師なし学習では、データを静かに読み取って、クラスタリング(類似のデータをグループにグループ化)や異常検出(異常を検索)などのデータモデルと法則を探します。
教師なし学習の目的は、データの内部構造を理解するために元のデータを分類することです。その特徴は、この種のネットワークの入力例のみを提供し、これらの例から潜在的なカテゴリルールを自動的に見つけることです。学習してテストした後、それを新しいケースに適用することもできます。