中国大規模モデル コーパス データ アライアンスが 9 名の新メンバーを迎え、コーパス データの第 2 バッチを開始

コーパスデータの供給レベルを向上させ、大規模モデル業界の高品質な発展を促進し、アプリケーションの革新と業界の実装を加速するために、9月8日、中国大規模モデルコーパスデータアライアンスがData Talk・Openを主催しました(当日最初のイベントは上海人工知能研究所で開催されました。

中国特許技術開発総公司、上海仲裁委員会、上海図書館(上海科学技術情報院)、上海データ交換所、上海社会信用促進センター、上海美都信息技術有限公司、上海チタニウムロボット有限公司、華東師範大学出版有限公司、上海都市建設都市運営(グループ)有限公司の9つの新しいメンバーユニットが「中国大規模モデルコーパスデータアライアンス」に参加しました。アライアンスメンバーは共同で、より多様性を提供します。大規模モデル技術の綿密な開発と高度な適用 データ要素の保護。

上海市経済情報化委員会の人工知能開発部門と情報化推進部門(ビッグデータ開発部門)の関係者が公開日活動に参加し、指導した。
 

メインスポンサー部門を代表して、上海人工知能研究所の副所長である王延峰氏は、コーパスデータアライアンスの開発状況と将来展望を共有し、また、OpenDataLab Pushu Artificial Intelligenceオープンデータプラットフォームとマルチの最初のバッチについても紹介した。 -アライアンスがリリースしたモーダル事前トレーニングコーパス- —Scholar ·Wanjuan 1.0

王延峰氏、上海人工知能研究所副所長

「中国大規模モデルコーパスデータ同盟」に新規会員ユニットが参加

8 月 14 日のScholar・Wanjuanのリリースに続いて、コーパス データ アライアンスは、オープン ソース コーパス データ セットの 2 番目のバッチであるHoney Nest · Pollen 1.0を開始しました。他のいくつかのアライアンスメンバーユニットもコーパスデータのオープンソースソリューションを形成しており、徐々にリリースキューに入る予定であると報告されています。

Midu Information の最高技術責任者である Liu Yidong 氏によると、Honey Nest Pollen 1.0 は主にインターネット メディア データに基づいており、これまでにその総数は 1 億件を超えています。このデータセットは、Midu シリーズの大規模モデルトレーニングで使用されており、ナレッジ Q&A やコンテンツ生成、分析レポートの自動生成、政府関係やメディアなどの垂直分野の原稿コンテンツのレビューと洗練など、さまざまなインテリジェントな生成サービスを提供します。

イベント中、上海データ取引所市場開発部副部長のZhang Jian氏とThe Paper社CTOのSun Hui氏がそれぞれ基調講演を行い、大規模なモデルコーパスデータの高品質な供給を強化する革新的な実践方法を共有した。 。

コーパス データ アライアンスは今後も「友人の輪」としての役割を果たし、各関係者からリソースを出し合い、会員単位の利点を活かし、力を合わせて大規模企業へのコーパス データの高レベルな供給を共同で推進していきます。モデルを作成し、大規模なモデルの開発のためのデータ サポートを提供します。

中国大規模モデルコーパスデータアライアンス

この研究は、上海人工知能研究所と、中国中央ラジオテレビ、人民日報オンライン、国家気象センター、中国科学技術情報院、上海メディアグループ、上海メディアグループを含む10の部門によって共同で開始された。大規模モデルの開発における高品質、大規模、安全で信頼できるコーパス データ リソースの需要に応え、大規模モデル科学研究と関連する産業生態学の発展を確実にするために、大規模モデル コーパス データ アライアンスは、は、2023年7月6日の世界人工知能会議の開会式で開催される予定。フォーラムの設立について発表され、モデルトレーニングを連携させることで、多知識、マルチモーダル、標準化された高品質なコーパスデータを共同で作成することを目指している、データ供給、学術研究、サードパーティサービスおよびその他の機関と連携し、貢献ベースで持続可能な運営の形成を模索し、国際的でオープンな大規模モデルコーパスデータエコシステムを構築するためのインセンティブメカニズム。

コーパス データをダウンロードし、Large Model Corpus Data Alliance に関する詳細情報を取得するには、https: //opendatalab.com/にログインしてください。

おすすめ

転載: blog.csdn.net/OpenDataLab/article/details/132810418