500G を超えるトップの学術データセットと大規模工場データセットがダウンロード可能で、科学研究や学術コンテスト向けの開発ガイドが公開されています。

大事なことは3回言う

参加登録締め切りまであと半月となりました!

参加登録締め切りまであと半月となりました!

参加登録締め切りまであと半月となりました!

006C3FgEgy1h65x48jn4nj312a0ggqh2

大会公式サイト登録リンク: https: //sourl.cn/G5RJKD

【最強の特典、大会用乾物シェア生放送】

9月14日から16日までの3日間連続で、毎日2人の専門家がオンライン生配信し、競技内容や見逃せない辛口な知識を詳しく解説する。

ライブリンク: https://live.bilibili.com/25865198

006C3FgEgy1h65x4h53cdj31240h8qi5
006C3FgEgy1h65x4qinh9j31220haduq
006C3FgEgy1h65x4x561bj31260h4qhv

1 アリーナでのコンテストの質問の解釈 (500G 以上の学術データセットがダウンロード可能)

~アリーナ系トラック・超高学歴ゴールドコンテンツ~

コンテストの主催者は、その分野のトップの専門家や教授を問題定義者として招待し、学術分野の研究と認識に基づいて、科学的かつ先進的な競争問題を設計し、国の主要な問題を解決するための基本的なアルゴリズムを目指しています。ニーズ。

質問1. 古書籍や古文書の画像解析と認識

コンテストのテーマの説明: 私の国で大量の古書籍をデジタル化する問題を解決するために、コンテストのテーマは、高精度の古書のテキスト検出、テキスト行の技術的問題を解決するための高度な人工知能アルゴリズムを収集することを目的としています。本コンペティションは、古書認識およびエンドツーエンドの古書認識を通じ、古書OCR技術の進歩を促進し、古書のデジタル化に貢献することを目的として、保護・整理・活用のための人工知能支援手法を提供することを目的として開催されます。

古書画像OCRデータセット

トレーニングセット、検証セット、テストセットにはそれぞれ古書文書の画像1,000枚(合計3,000枚)が含まれており、データは四庫全書、過去の王朝の稀覯古書、乾隆記などのさまざまな古書データから選択されています。大蔵経。
006C3FgEgy1h65x5remiuj312209caja

質問 2. 事前トレーニングされた言語モデル アプリケーションのチューニング アルゴリズム:

コンテストの説明: 近年、事前トレーニングされた言語モデルは、自然言語処理分野の発展を大きく促進してきました。事前トレーニングされた言語モデルに基づいて、少数のラベル付きサンプルのみを使用して、多くの下流タスクで優れたパフォーマンスを達成できます。しかし、多くの大規模言語モデルのパラメータは、運用コストや商業的採算性を考慮して公開されておらず、オープンなモデル推論 API の形でユーザーに提供されています。言語モデル推論 API を呼び出すだけで一般的な自然言語処理タスクを完了する方法が重要な研究方向になっています。このコンテストのテーマは、事前トレーニングされた大規模な言語モデルの調整に焦点を当てており、参加チームは、事前トレーニングされた言語モデルの推論能力を呼び出すという前提でのみ、自然言語理解に関連する 6 つの小さなサンプル学習タスクに合わせてモデルを調整する必要があります。言語モデル。

言語分類データセット

SST-2 は、センチメント アノテーションを備えた映画レビュー データセットです。Yelp センチメント分析データセットは、Yelp Web サイトのコメントに基づいて構築されています。AG のニュース トピック分類データセットには、2,000 を超えるニュース ソースから収集された多数のニュース コーパスが含まれています。 TREC は質問分類データセット、MRPC は文ペア分類データセット、SNLI は自然言語推論データセットです。
006C3FgEgy1h65x5yankbj312i0ncq8k

質問 3. データ選択とマーカー補正アルゴリズムの設計:

競合他社の説明: ディープ ニューラル ネットワークは、トレーニング データ セット内のノイズの多いラベルに簡単にオーバーフィットする可能性があり、その結果、テスト データ セットのパフォーマンスが低下します。この問題により、より現実的な問題におけるディープ ニューラル ネットワークのパフォーマンスが制限されます。ディープ ラーニング テクノロジをより実際のアプリケーション シナリオに適用できるようにするために、ラベル付きノイズを含むトレーニング データ セットでトレーニングされたディープ ニューラル ネットワークがテスト データ セットで良好なパフォーマンスを発揮できるように、新しい分類アルゴリズムを研究および開発します。ポスト深度 研究時代の研究における非常に重要かつ基本的な科学的問題。

この課題では、ノイズ ラベリングの特性を組み合わせて、ノイズ ラベリング問題に対する効率的で簡潔な形式の汎用分類アルゴリズムを開発します。

CIFAR-10、CIFAR-100 極小画像分類データセット

このタスクで使用されるベンチマーク データ セットは、CIFAR-10、CIFAR-100、Tiny ImageNet、Twitter、SST であり、より多くのシミュレーションとリアル ノイズ ラベル データセットの実験タスクが含まれます。具体的なタスクの形式とデータは、最終版で公開されます。

質問 4. 近似低ランク行列の特異値分解と逆行列:

競技概要: 行列計算は情報処理の最も基本的な計算タスクであり、ビッグデータ計算の「七大問題」の一つでもあります。特異値分解(SVD)や近似低位行列の逆変換アルゴリズムの研究は、情報処理やビッグデータの基礎理論の発展に重要な貢献を果たし、関連する基盤技術の革新を促進することができます。

このコンテストは、特に重要な低ランク行列の近似特異値分解および逆変換問題のクラスに焦点を当てています。特定の行列と、行列内のゼロ以外の特異値の最大数の割合の条件付き制約について、この課題では、チームが高速かつ効率的な行列の特異値分解および反転アルゴリズムを開発する必要があります。

近似的な低ランク行列特異値データセット

マトリックスコンピューティングは情報処理における最も基本的なコンピューティングタスクであり、ビッグデータコンピューティングで認識される「7つの巨大問題」の1つでもあります。マトリックスベースのコンピューティング理論のあらゆる進歩は、ビッグデータ分析、情報通信、その他の関連産業に広範な影響を与え、一連の技術変革を引き起こし、生産性の発展を大きく促進します。

コンテストの質問 5. 深層学習モデルに対する堅牢な防御アルゴリズム:

コンペティションの概要:現在広く使われている深層学習モデルは、一部のデータの自然変化という条件下ではモデルの脆弱性が不十分であり、人間の目には見えない敵対例に騙されてモデルの判定が不正確になってしまう。深層学習モデルの堅牢性を向上させるために、安全で信頼性の高い新世代の深層学習を開発します。この課題は画像分類タスクを対象としており、より効率的な敵対防御テクノロジを発見し、敵対攻撃に対するコンピュータ ビジョン モデルの堅牢性を向上させることを目的としています。

ImageNet コンピューター ビジョン データセット:

コンテストで使用される ImageNet データセットは、コンピューター ビジョン システムの認識タスクで使用される古典的なデータセットで、スタンフォード大学の Li Feifei 教授の指導の下で作成されました。このコンテストに推奨されるデータ セットは、毎年開催される ILSVRC 画像認識コンテストで使用される標準のトレーニング データとテスト データである ImageNet 分類タスクのサブセットです。ImageNet データセットと ILSVRC コンペティションは、コンピューター ビジョン テクノロジとディープ ラーニング モデルの開発にとって非常に重要であり、このコンペティションでは、古典的な画像分類タスクにおける大規模なデータセットに対するディープ ラーニング モデルの堅牢性をさらに調査することが期待されています。
006C3FgEgy1h65x65keamj312c066473

2 賞金総額1,000万ドル、才能ある人材が集まる

このコンテストは、世界的な人工知能の才能とチームを惹きつけるために重賞を設定し、国際的に競争力のある人工知能の革新的な産業クラスターのグループを形成します。このコンテストの賞金総額は 1,000 万ドルで、各質問には最大 100 万ドルの賞金が与えられ、史上最高額の賞金を獲得するアルゴリズム コンテストになる可能性があります。
006C3FgEgy1h65x6i86h0j31260dgk0h

3 参加手順

1. コンテスト登録期間:8月6日~10月7日

競技期間:8月6日~11月15日

2. 社会全体に開かれたコンテストであり、個人、高等教育機関、研究機関、企業、メーカーチーム等が応募でき、参加者は1チームのみ、各チームは最大2名まで参加可能です。 5人。

ノート:

(1) グループアリーナ競技以外にも、トピック作成やデータ連絡に関わる者の競技団体への参加を禁止します。

(2) 主催者及び競技トラックは大会にのみ参加することができ、ランキングには参加しません。

  1. コンテストの公式 QR コードをスキャンするか、鷲州研究所 (黄埔) の公式イベント ページにログインしてください: https://sourl.cn/G5RJKD

コンテストテーマの選択で、コンテストテーマに対応する「今すぐ登録」ボタンをクリックし、登録情報を入力すると、コンテストに登録できます。

注意事項:登録情報およびチーム情報は正確かつ有効なものであることを確認し、トランペットや偽名が発覚した場合は、出場資格、成績、賞与を取り消します。

4 コンテストの組織構造

指導部門: 彭城研究所、広州市科学技術局、広州市工業情報化局

支援機関: 広州市黄浦区人民政府、広州開発区管理委員会、広州ハイテク区管理委員会

主催: 磐州研究所(黄埔)

共催者: 中国応用数学学会 (ビッグデータおよび人工知能専門委員会)、中国コンピュータ連盟、中国指揮統制協会、中国人工知能協会、工業情報化部第五電子研究所、西甸大学広州研究所

おすすめ

転載: blog.csdn.net/Extremevision/article/details/126847447