labml-nn: アノテーション付きの pyTorch ペーパー実装

著者:CSDN@ _Yakult_

labml-nn ライブラリには、さまざまなニューラル ネットワークと関連アルゴリズムのシンプルな PyTorch 実装が統合されており、ディープ ラーニング モデルを迅速に開発するのに役立ちます。コードを 1 行ずつ説明するドキュメントも付属しています。

1. ウェブサイト

ディープ ラーニング モデルのコードを 1 行ずつ説明する Web サイト ( https://nn.labml.ai/ )を共有します。この Web サイトには、すべての主流モデルが含まれています。

ここに画像の説明を挿入します

本ウェブサイトの中国語翻訳サイト:https ://nn.labml.ai/zh/

この Web サイトでは、ディープ モデルのコードを 1 行ずつ説明しています。

ここに画像の説明を挿入します

2.主な収録機種

収録されている主なモデルは、

タイプ プロジェクト
トランスフォーマー マルチヘッド アテンション、トランスフォーマー ビルディング ブロック、トランスフォーマー XL、相対マルチヘッド アテンション、回転位置埋め込み (RoPE)、リニア バイアス付きアテンション (ALiBi)、RETRO、圧縮トランスフォーマー、GPT アーキテクチャ、GLU バリアント、kNN-LM: Passed Memory実装の一般化、フィードバック トランスフォーマー、スイッチ トランスフォーマー、高速ウェイト トランスフォーマー、FNet、アテンション フリー トランスフォーマー、マスク言語モデル、MLP ミキサー: ビジョン用の完全な MLP アーキテクチャ、アテンション MLP (gMLP)、ビジュアル トランスフォーマー (ViT)、Primer EZ、Hourglass
エレウザー GPT-NeoX 48GB GPU で生成され、2 つの 48GB GPU で微調整された LLM.int8()
普及モデル ノイズ除去拡散確率モデル (DDPM)、ノイズ除去拡散暗黙モデル (DDIM)、潜在拡散モデル、安定拡散
敵対的生成ネットワーク オリジナル GAN、ディープ畳み込みネットワークを備えた GAN、Cycle GAN、Wasserstein GAN、勾配ペナルティを備えた Wasserstein GAN、StyleGAN 2
循環型高速道路ネットワーク 環状道路網
LSTM
ハイパーネットワーク - HyperLSTM ハイパーネットワーク - HyperLSTM
レスネット 残留ネットワーク
変換ミキサー
カプセルネットワーク
ユーネット
スケッチRNN
グラフニューラルネットワーク グラフ アテンション ネットワーク (GAT)、グラフ アテンション ネットワーク v2 (GATv2)
強化学習 近接ポリシーの最適化と一般化された利点の推定、デュアル ネットワークを備えたディープ Q ネットワーク、優先リプレイおよびデュアル Q ネットワーク
反事実的後悔の最小化 (CFR) CFR を使用して、ポーカーなどの不完全な情報を含むゲームを解決します。クーンポーカー
オプティマイザー Adam、AMSGrad、予熱付きの Adam オプティマイザー、Noam オプティマイザー、修正された Adam オプティマイザー、AdaBelief オプティマイザー、Sophia-G オプティマイザー
正規化層 バッチ正規化、レイヤー正規化、インスタンス正規化、グループ正規化、重み正規化、バッチチャネル正規化、DeepNorm
蒸留
適応型計算 熟考ネット
不確実性 分類の不確実性を定量化するための証拠に基づいた深層学習
アクティベーション ファジー タイルのアクティブ化
言語モデルのサンプリング手法 貪欲サンプリング、温度サンプリング、トップ k サンプリング、核サンプリング (Nucleus Sampling)
スケーラブルなトレーニング/推論 Zero3 メモリの最適化

3.githubコード

https://github.com/labmlai/annotated_deep_learning_paper_implementations/tree/master/labml_nn

4.pipのインストール

pip install labml-nn

おすすめ

転載: blog.csdn.net/qq_35591253/article/details/132850300