2023 年 5 月の第 4 週 大型モデルのコレクション

2023 年 5 月の第 4 週 大型モデルのコレクション

  • 2023.5.31
  • 著作権に関する声明: この記事はブロガー chszs のオリジナル記事であり、ブロガーの許可なく複製することはできません。

1. AI画像編集技術DragGANが登場

最近、Google の研究者は、マックス プランク情報学研究所および MIT CSAIL と協力して、DragGAN と呼ばれる画像編集ツールをリリースしました。これは非常に直感的な画像編集ツールで、ユーザーは画像内のピクセルと方向を制御するだけで画像を変形できます。このツールの可能性は、テキストから画像を生成する AI が常に希望するものを出力するとは限らないため、新しい画像を再生成するのではなく、生成後に画像を編集できることです。

コメント: 現時点では、このテクノロジーはまだデモ段階ですが、良いビジョンを示しています。

2.国産中国語大型言語モデル「Tianhe Tianyuan」をリリース

国家スーパーコンピューティング天津センターは、第7回世界インテリジェンス会議において、Tianhe Exascale Intelligent Computing Open Innovation Platformと中国国産大型モデル「Tianhe Tianyuan」を発表した。中国語の大規模言語モデルのデータ セットは比較的不足しています。国立スーパーコンピューティング天津センターは、ウェブページデータ、さまざまなオープンソーストレーニングデータ、中国小説データ、古代中国データ、百科事典データ、ニュースデータ、および伝統的な中国医学、医学などの専門分野のさまざまなデータセットとトレーニングデータを収集および整理しています。 、相談、法律など。トークンの総数は 350B に達し、トレーニングでは独自の大規模な中国語モデルが作成されました。将来的には、国家スーパーコンピューティング天津センターも、「天河天源大型モデル」に基づいて、医療、産業、法律などの分野のプロフェッショナルモデルの徹底的なトレーニングを開始する予定だ。将来的には、この大規模モデルは、深層学習プラットフォームのサポートの下で産業インテリジェンスの基盤となるでしょう。

コメント: 現時点では、私が持っていることを示すための単なる自慢セッションです。とにかく、一般人が使用できるわけではありませんし、公開されていません。自慢するのは自由です。

3. Microsoft、Windows Copilotをリリース

5 月 23 日、Microsoft はその夜の Build 2023 カンファレンスで、Windows Copilot が Windows 11 オペレーティング システムに完全に搭載されると発表しました。つまり、Windows Copilot は GPT-4 に基づいて構築された Bing AI チャットの Windows デスクトップ バージョンであり、ユーザーがコピー アンド ペースト、スクリーンショットの撮影、複数のウィンドウの管理などのさまざまなタスクを自動化するのに役立ちます。計画によれば、Windows Copilot は 6 月にプレビューを開始し、Windows Insider メンバーが最初にそれを体験できるようになります。
Microsoft はまた、AI 関連のアプリケーションと高度なエクスペリエンスをワンストップで紹介する AI Hub を Microsoft Store で開始します。

Baidu は中国最大のデスクトップ検索エンジンの王座を失い、Microsoft Bing が首位に立った。中国本土のデスクトップ検索市場では、2023 年 4 月までに Microsoft の Bing のシェアが再び過去最高を記録し、37.4% に達し、Baidu に代わって中国最大のデスクトップ検索エンジンとなる;Baidu のシェアは 27.01% に低下する;3 位からの検索エンジンは、Baidu に代わって中国最大のデスクトップ検索エンジンとなる6 位から 6 位は Sogou、Yandex (ロシア)、Haosou (360 Search)、Google で、市場シェアはそれぞれ 16.36%、7.45%、6.25%、5.2% です。

4. Intel、ChatGPTの6倍近い数兆パラメータのAIモデル「Aurora genAI」をリリース

Intel は、ChatGPT より 570% 大きい 1 兆パラメータの AI モデルを発表しました。Intel は最近関与した企業であり、最近、主に科学で使用される生成 AI モデルである Aurora genAI と呼ばれる製品を発表しました。IntelのAurora genAIモデルはMegatronとDeepSpeedに基づいており、その規模は1兆パラメータ(1 Trillion Parameters)に達していますが、ChatGPTの規模がわずか1750億パラメータであるのに比べ、Aurora genAIはパラメータ規模が約570%増加しています。Aurora genAI モデルは、一般的なテキスト、科学テキスト、科学データ、およびドメインに関連するコードでトレーニングされます。これは純粋に科学に焦点を当てた生成 AI モデルであり、次の用途に応用できる可能性があります。

  • クリーンエネルギー融合研究の推進
  • 触媒研究
  • がん研究
  • 航空宇宙研究
  • 神経科学の研究
  • 宇宙論の研究

Intelによれば、Intelがアルゴンヌ国立研究所およびHPEと協力して開発したエクサスケールのスーパーコンピュータ「Aurora(オーロラ)」と呼ばれるスーパーコンピュータを使用しているという。Aurora スーパーコンピューターは、21,248 個の Sapphire Rapids Xeon CPU と、63,744 個の Xe アーキテクチャの Ponte Vecchio GPU を使用しています (Intel によると、Ponte Vecchio GPU のパフォーマンスは Nvidia の H100 よりも優れています)。Aurora スーパーコンピューターは、1024 個の DAOS ノードと 10.9 PB の DDR5 Optane 永続メモリも使用しており、これらはすべて、エクサスケールのパフォーマンスを実現するために oneAPI を介して相互接続されています。

コメント: コンピューティング リソースが多すぎるため、一般企業はプレイできません。

5. ワシントン大学が「Guanaco」大規模モデルをオープンソース化し、自動テストのスコアがChatGPTの99.3%に達した

オープンソースの大規模モデルが再び重要な成果を上げ、ワシントン大学の「Guanabe」の自動テストスコアはChatGPTの99.3%に達し、人間が両者の答えを区別するのは困難となった。NVIDIA の科学者である Jim Fan 博士は、次のようにコメントしました。これは、大型モデルの小型化における新たなマイルストーンです。最初にスケールアップしてから縮小することが、オープンソース AI コミュニティのリズムになります。さらに重要なことは、QLoRA がグアナコと組み合わせて提案した新しいメソッドにより、大規模モデルの微調整に必要なメモリ要件が 780GB 以上から 48GB 未満に削減されることです。オープンソース コミュニティが直接カーニバルを開始し、24 時間以内に関連論文が最も懸念される AI 論文になりました。GPT-4 が審判を務め、グアナコは ChatGPT の 99.3% のスコアを獲得しました。

6. 医師会は中国初の医療大規模言語モデル MedGPT をリリース

Medical Association は、自社開発した Transformer アーキテクチャベースの国内初の医療大規模言語モデル MedGPT を正式にリリースしました。MedGPT は、汎用の大規模言語モデル製品とは異なり、実際の医療シーンで診断と治療の実際の価値を発揮し、病気の予防、診断、治療、リハビリテーションに至るまでのインテリジェントな診断と治療機能の全プロセスを実現することに主に取り組んでいます。

Googleは5月11日にPaLM2言語大型モデルを発表、その中でも医療AI分野向けのMed-PaLM2はUSMLE問題テストで正解率85.4%と医療専門家レベルに達し、ヒポクラテスAIがシミュレーションできる生成AIプラットフォーム患者は医師と会話し、114 件の証明書および試験テストのうち 105 件で GPT-4 を超えました。国内企業では、Weining Health も大規模な言語モデル WiNGPT を立ち上げており、これには 7 つのカテゴリの基本タスクと 20 以上のサブタスク (履歴、診断、推奨事項) が含まれています。

7. TikTokはAIチャットボットであるTakoをテスト中

TikTokは、短いビデオについてユーザーとコミュニケーションし、コンテンツの発見を支援できる「Tako」と呼ばれるAIチャットボットをテストしている。

8. 武漢大学が大型モデルCheeseChatを立ち上げ

武漢大学は、毎日の相談と学術支援を提供する大規模モデル CheeseChat を立ち上げました。現在、内部は学校内の教師と生徒のみに公開されています。

おすすめ

転載: blog.csdn.net/chszs/article/details/130963567