2023年6月第3週 大型モデルコレクション

2023年6月第3週 大型モデルコレクション

  • 2023.6.20
  • 著作権に関する声明: この記事はブロガー chszs のオリジナル記事であり、ブロガーの許可なく複製することはできません。

1. メタオープンソース AI 言語モデル MusicGen

6 月 12 日、Meta は最近、AI 言語モデル MusicGen を Github でオープンソースしました。このモデルは Transformer モデルに基づいています。モデル名が示すように、MusicGen は主に音楽生成に使用されます。テキストと既存のメロディーを完全な音楽に変換できます。さらに、MusicGen はテキストとメロディーの組み合わせ入力もサポートしています。たとえば、「軽い曲」を生成することを提案し、同時に「それをベートーベンの「歓喜の歌」と組み合わせてほしい」と依頼することもできます。

MusicGen の実際のパフォーマンスのテスト結果によると、Google の MusicLM や Riffusion、Mousai、Noise2Music などの他の音楽モデルと比較して、MusicGen は音楽とテキスト プロンプトの一致度や作曲の信頼性などの指標のテストで優れたパフォーマンスを示しています。 . 全体的にGoogle MusicLMより若干高いレベル。

プロジェクトアドレス: https://github.com/facebookresearch/audiocraft
デモアドレス: https://huggingface.co/spaces/facebook/MusicGen

2. 安定性により、画像を拡張するための新しいアプリ Uncrop Clipdrop が起動します

Stability AI と Clipdrop は最近、画像スケール エディターである Uncrop Clipdrop ツールをリリースしました。縦画像を横画像に、横画像を縦画像に変更したり、画像のスケールを任意に調整したりできます。

機能の点では、Uncrop は Photoshop Generative Fill に非常に似ており、その本質的な機能は AI を使用して指定された位置に画像コンテンツを作成することです。両者を比較すると、PS GF は画像を拡大するだけでなく、要件に応じて指定した位置に画像を作成することもできます。画像の細部をより細かく修正したい場合には、やはりPS GFの方が機能面で大きなメリットがあります。ただし、画像コンテンツの一部を拡大するだけの場合、Uncrop はすでに要件を十分に満たしています。Uncrop は操作が簡単で完全に無料です。

3. Adob​​eの生成AIツールFireflyがエンタープライズ版を発売

EMEA 2023 サミットで、アドビは AI 画像生成ツールである Firefly Enterprise Edition を発表しました。新しいバージョンは主に大企業を対象としています。企業は独自のデータ資産を使用して独自の Firefly 大規模モデルをトレーニングし、商用利用しても安全な画像コンテンツを迅速に生成できます。

公式サイトによると、Fireflyのエンタープライズ版は今年下半期に正式リリースされる予定だが、企業ユーザーはすでにエンタープライズ版Adobe ExpressでFireflyの機能を利用できる。

Firefly は、Adobe が 2023 年 3 月にリリースした AI 画像生成キットです。多くの AI ペイント ツールと同様に、ユーザーは Prompt (プロンプト ワード) を使用して画像を生成したり、画像スタイルを置き換えたり変更したりできます。5 月末、Firefly はパブリック ベータ版を正式にオープンし、1 億 5,000 万枚を超える画像の生成に使用されてきた Photoshop のクリエイティブな塗りつぶし機能に統合されました。安全な商用利用を保証することは、この新製品の主要なセールスポイントであり、Firefly の発売以来、Adobe にとって重要な考慮事項でした。Firefly モデルのトレーニングに使用されるデータ コンテンツは、Adobe Stock 画像、公的にライセンスされたコンテンツ、および著作権の期限が切れたその他のパブリック ドメイン コンテンツから取得されます。Adobe は、著作権紛争を起こすことなく、これらの画像に対するすべての権利を所有します。同時に、Stability AI や Midjourney などの人工知能画像生成の開発者は、作成者の知識や同意なしに画像を取得し、トレーニングに使用したとして訴訟の増加に直面しています。今年1月、ゲッティイメージズはStability AIが数百万枚の写真を違法に盗み、著作権を侵害したとして訴訟を起こした。

4. H3C、大規模プライベートドメインモデル「Baiye Lingxi」LinSeerをリリース

6 月 11 日、H3C は大規模なプライベート ドメイン モデル「LinSeer」をリリースしました。これは、垂直産業および排他的地域の顧客に、安全でカスタマイズされ、独占的で成長を続けるインテリジェント サービスを提供します。この大規模なモデルは、垂直アプリケーション データを接続して、正確かつ正確で無駄のないプライベート ドメインの垂直インテリジェンスを形成し、特定の機能を育成しますが、普遍的であることはできません。

要約すると、H3C は大規模モデル トレーニング用の AI サーバーを立ち上げました。これにより、さまざまなオープンソースの大規模モデルを選択し、企業のプライベート データと組み合わせて、最終的に大規模モデル サービスをプライベートで形成できます。企業が所有するもの。

5. Byteは今年、Nvidiaに10億ドル以上のGPUを発注する予定

「LatePost」によると、今年の春節以降、クラウドコンピューティングサービスを提供する中国の大手インターネット企業はすべてエヌビディアに大量発注を行ったという。Byte は今年 Nvidia に 10 億米ドル以上の GPU を発注しました (A100 と H800 は到着したものと未到着のものが含まれます)。また、別の大手インターネット メーカーによる Nvidia への 10,000 枚のカード注文は少なくとも 10 億ドル以上と推定されています元は定価に基づきます。RMB。Byteだけでも今年、NVIDIAが昨年中国で販売した商用GPUの総数に近い注文を出した可能性がある。

AIとクラウドコンピューティングに最も多く投資している中国のテクノロジー企業4社であるByte、Tencent、Alibaba、Baiduは、過去に数万のA100を蓄積していることがわかっています。このうち、絶対バイト数が最も多いのは A100 です。今年の新規注文を除くと、Byte A100とその前身であるV100の合計数は10万近くに達する。

蘇州証券、天豊証券、浙上証券、国聯証券、華西証券、東方証券、エッセンス証券などの証券調査機関は今年、大型モデルのコンピューティング能力に対する需要が国内サーバーメーカーの利益を促進するという調査報告書を発表した。間接的な平手打ちの恩恵を受けているのは、依然として外資系大手企業の Nvidia だ。

6. 360は「Smart Brain 4.0」をリリースし、360 Family Bucketに完全接続

6月13日、360カンパニーはコグニティブ汎用大規模モデル「Smart Brain 4.0」を披露する記者会見を開催し、マルチモダリティなどの主要機能の反復を完了し、「スマートブレイン4.0」に完全に接続されると主張した。 360 Family Bucket」を中国で発売予定。Vincent Videoのマルチモーダル機能。周宏毅氏は、中国は百車種戦争に入ったと考えており、最も重要なのは応用シナリオの競争であり、さらに国内コーナーで追い抜く鍵はマルチモダリティの発展にあると考えている。文生文と文生図、文生表、画像生成画像、画像生成テキスト、ビデオ理解およびその他の機能を実現できるクロスモダリティを生成する機能。

同時に360AIデジタルヒューマンもリリースされました。360 AI デジタル ヒューマンの将来の開発方向は、音声、ビデオを生成し、長期記憶を持ち、目標を分解して計画する能力も備え、実行力を備えた「手と足」を持ち、より良いサービスを提供することであると想像しました。人間。360 AI デジタル ヒューマンには現在 200 以上の役割があり、デジタル セレブとデジタル従業員の 2 つのカテゴリに分類されます。デジタル有名人には歴史上の人物、アイドルスター、文学者などが含まれ、デジタル従業員は企業従業員のナレッジアシスタントやオフィスアシスタントになることができます。360AIデジタルヒューマンはカスタマイズに対応しており、デジタルアバターやデジタルアシスタント、デジタルアイドルなどの私的知識ベースをアップロードすることで、誰もが自分だけのデジタルヒューマンを低コストで生成することができます。

7.「人工知能法」の草案が間もなく提出される

6月10日、「人工知能法」草案は国務院の2023年立法作業計画に盛り込まれ、年内に全国人民代表大会常務委員会に提出されて審議される予定だ。人工知能分野の法律は、人工知能テクノロジーの安全かつ信頼できる使用を保証します。法律は、責任帰属の方法や原則を明確にし、人権を保護し、人工知能の悪用を防止し、インテリジェントな意思決定プロセスをよりオープンで透明性を確保し、不公平で差別的な現象を防止し、公共の利益を保護し、将来のリスクを防止することができます。 。リスクの種類としては、主にデータセキュリティ、オンライン世論の脅威、アルゴリズム差別、個人情報漏洩、知的財産侵害、サイバー犯罪の誘発、技術独占、教育制度の侵食などが挙げられます。しかし、これらのリスクの多くはまだ推測・想定のレベルにとどまっており、実際には発生しておらず、また、その発生確率も不確定である。

8. Baichuan Intelligence は、70 億パラメータを備えた中国語と英語の事前トレーニング済み大規模モデルをオープンソース化しました

2023 年 6 月 15 日、Sogou の創設者である Wang Xiao によって設立された Baichuan Intelligent は、70 億のパラメーターを備えた中国語と英語の事前トレーニング済み大型モデル baichuan-7B を発売しました。報告によると、北京大学と清華大学はbaichuan-7Bモデルの使用を主導して関連研究活動を推進しており、将来的にbaichuan Intelligenceと協力してbaichuan-7Bモデルの応用と開発を共同で推進する予定であるとのこと。

baichuan-7B は、C-Eval、AGIEval、Gaokao の中国語の権威ある評価リストで ChatGLM-6B などの他の大型モデルを大幅に上回るだけでなく、MMLU 英語の権威ある評価リストでも LLaMA-7B を大きくリードしています。現在、baichuan-7B 大型モデルは Hugging Face、Github、Model Scope プラットフォームでリリースされています。今回のリリースもオープンソースの精神に従っており、baichuan-7BコードにはApache-2.0プロトコルが採用されており、モデルウェイトには簡単な登録で無料で商用利用できる自由商業契約が採用されている。

9. 6月に発表されたスタンフォード大学の最新LLMランキングリスト

最近、スタンフォード大学の研究者は、大規模な言語モデルに基づく新しい自動評価システムである AlpacaEval を提案しました。高速かつ低コストであるだけでなく、20,000 人の人間による注釈によって検証されています。

モデル名 勝率
GPT-4 95.28%
クロード 88.39%
チャットGPT 86.09%
ウィザードLM 13B 75.31%
グアナコ 65B 71.80%
ビクーニャ 13B 70.43%
フレーム 33B OASST RLHF 66.52%
グアナコ 33B 65.96%
ウスエルメス13B 65.47%
ビクーニャ 7B 64.41%
LLaMA 33B OASST SFT 54.97%
グアナコ 13B 52.61%
ダヴィンチ003 50.00%
グアナコ 7B 46.58%
ファルコン 40B 命令 45.71%
アルパカ ファーム PPO シム (GPT-4) 7B 44.10%
ピシア 12B SFT 41.86%
アルパカファーム PPO ヒューマン 7B 41.24%
アルパカ 7B 26.46%
ピシア 12B OASST SFT 25.96%
ファルコン 7B の指示 23.60%
密着 17.52%
ダヴィンチ001 15.17%

おすすめ

転載: blog.csdn.net/chszs/article/details/131300493