500G+ 상위 학술 및 대규모 공장 데이터 세트 다운로드, 과학 연구 및 학술 대회 개발 가이드 공개

중요한 말을 세 번

등록마감까지 이제 보름밖에 남지 않았습니다!

등록마감까지 이제 보름밖에 남지 않았습니다!

등록마감까지 이제 보름밖에 남지 않았습니다!

006C3FgEgy1h65x48jn4nj312a0ggqh2

대회 공식 웹사이트 등록 링크: https://sourl.cn/G5RJKD

[최강 혜택, 대회용 건어물 공유 생방송]

9월 14일부터 16일까지 연속 3일 동안 매일 2명의 전문가가 온라인 생중계를 하며 대회 내용을 자세하게 설명하고 놓칠 수 없는 건조 지식을 전한다.

라이브 링크: https://live.bilibili.com/25865198

006C3FgEgy1h65x4h53cdj31240h8qi5
006C3FgEgy1h65x4qinh9j31220haduq
006C3FgEgy1h65x4x561bj31260h4qhv

1 경기장 내 경쟁 질문 해석(500G+ 학술 데이터 세트 다운로드 가능)

- 투기장 기반 트랙 · 초고학문 골드 콘텐츠 -

대회 주최측은 해당 분야의 최고 전문가 및 교수를 문제 정의자로 초빙하고 학계의 연구와 인식에 따라 과학적이고 미래 지향적인 경쟁 문제를 설계하여 국가의 전공을 해결하는 기본 알고리즘을 목표로 합니다. 필요합니다.

질문 1. 고대 서적 및 문서의 이미지 분석 및 인식

경쟁 주제 설명: 우리나라의 많은 고서 디지털화 문제를 해결하기 위해 경쟁 주제는 고급 인공 지능 알고리즘을 수집하여 고정밀 고서 텍스트 감지, 텍스트 라인의 기술적 문제를 해결하는 것을 목표로 합니다. 고서 OCR의 기술적 진보를 촉진하고 고서의 디지털화에 기여하기 위해 본 대회는 보호, 정리 및 활용을 위한 인공 지능 지원 방법을 제공하기 위해 개최됩니다.

고대 도서 이미지 OCR 데이터 세트

트레이닝 세트, 검증 세트, 테스트 세트에는 각각 고서 문서 이미지 1,000개(총 3,000개 이미지)가 포함되어 있으며, 데이터는 사구권서, 과거 왕조의 희귀 고서, 건륭 등 다양한 고서 데이터에서 선택됩니다. 삼장.
006C3FgEgy1h65x5remiuj312209caja

질문 2. 선행 학습된 언어 모델 애플리케이션 튜닝 알고리즘:

경쟁에 대한 설명: 최근 몇 년 동안 사전 훈련된 언어 모델은 자연어 처리 분야의 발전을 크게 촉진했습니다. 사전 훈련된 언어 모델을 기반으로 적은 수의 레이블이 지정된 샘플만으로 많은 다운스트림 작업에서 우수한 성능을 달성할 수 있습니다. 그러나 운영비용과 상업적 수익성을 고려하여 많은 대규모 언어모델의 파라미터를 공개하지 않고 개방형 모델 추론 API 형태로 사용자에게 제공하고 있다. 언어 모델 추론 API를 호출해야만 일반적인 자연어 처리 작업을 완료하는 방법이 중요한 연구 방향이 되었습니다. 경쟁 주제는 사전 훈련된 대규모 언어 모델의 튜닝에 초점을 맞추고 있으며, 참가 팀은 사전 훈련된 언어의 추론 능력을 불러일으킨다는 전제하에 자연어 이해와 관련된 6개의 소규모 샘플 학습 작업에 대한 모델을 튜닝해야 합니다. 언어 모델.

언어 분류 데이터 세트

SST-2는 감정 주석이 포함된 영화 리뷰 데이터 세트입니다. Yelp 감정 분석 데이터 세트는 Yelp 웹 사이트의 댓글을 기반으로 구축되었습니다. AG의 뉴스 주제 분류 데이터 세트에는 2,000개 이상의 뉴스 소스에서 수집된 다수의 뉴스 코퍼스가 포함됩니다. TREC는 질문 분류 데이터셋, MRPC는 문장 쌍 분류 데이터셋, SNLI는 자연어 추론 데이터셋입니다.
006C3FgEgy1h65x5yankbj312i0ncq8k

질문 3. 데이터 선택 및 마커 보정 알고리즘 설계:

경쟁에 대한 설명: 심층 신경망은 훈련 데이터 세트의 잡음 레이블에 쉽게 과적합되어 테스트 데이터 세트의 성능이 저하될 수 있습니다. 이 문제는 보다 실제적인 문제에서 심층 신경망의 성능을 제한합니다. 딥 러닝 기술이 보다 실제적인 응용 시나리오에 도달할 수 있도록 새로운 분류 알고리즘을 연구 및 개발하여 레이블이 지정된 노이즈가 있는 훈련 데이터 세트에서 훈련된 심층 신경망이 테스트 데이터 세트에서 좋은 성능을 가질 수 있도록 합니다. 심도 이후 학습 연령의 연구에서 매우 중요하고 근본적인 과학적 질문입니다.

이 과제는 노이즈 라벨링의 특성을 결합하여 노이즈 라벨링 문제에 대한 효율적이고 간결한 형식과 범용 분류 알고리즘을 개발합니다.

CIFAR-10, CIFAR-100 초소형 이미지 분류 데이터 세트

이번 작업에 사용된 벤치마크 데이터셋은 CIFAR-10, CIFAR-100, Tiny ImageNet, Twitter, SST 등이며, 더 많은 시뮬레이션과 실제 노이즈 레이블 데이터셋 실험 작업을 포함하고 있으며, 구체적인 작업 형태와 데이터는 최종적으로 공개될 예정이다.

질문 4. 근사 하위 행렬의 특이값 분해 및 반전:

경쟁 설명: 행렬 계산은 정보 처리의 가장 기본적인 계산 작업이며 빅 데이터 계산의 "7대 문제" 중 하나이기도 합니다. SVD(Singular Value Decomposition) 및 근사 하위 행렬에 대한 반전 알고리즘에 대한 연구를 수행하는 것은 정보 처리 및 빅 데이터의 기본 이론 개발에 중요한 기여를 했으며 관련 핵심 기술의 혁신을 촉진할 수 있습니다.

이 대회는 근사 하위 행렬 특이값 분해 및 특별한 의미의 반전 문제 클래스에 중점을 둡니다. 주어진 행렬과 행렬에서 0이 아닌 특이값이 가장 많은 비율의 조건부 제약 조건에 대해 이 문제를 해결하려면 팀이 빠르고 효율적인 행렬 특이값 분해 및 반전 알고리즘을 개발해야 합니다.

대략적인 낮은 순위 행렬 특이값 데이터 세트

매트릭스 컴퓨팅은 정보 처리에서 가장 기본적인 컴퓨팅 작업이며 빅 데이터 컴퓨팅이 인식하는 "7대 문제" 중 하나이기도 합니다. 매트릭스 기반 컴퓨팅 이론의 모든 발전은 빅 데이터 분석, 정보 통신 및 기타 관련 산업에 광범위한 영향을 미치고 일련의 기술 변화를 촉발하고 생산성 개발을 크게 촉진합니다.

경쟁 질문 5. 딥 러닝 모델에 대한 강력한 방어 알고리즘:

경쟁에 대한 설명: 현재 널리 사용되는 딥러닝 모델은 일부 데이터의 자연적 변화 조건에서 모델 취약성이 부족하고 인간의 눈에 보이지 않는 적대적 사례에 속아 모델 판단이 정확하지 않습니다. 딥 러닝 모델의 견고성을 향상시키기 위해 차세대 안전하고 신뢰할 수 있는 딥 러닝을 개발하십시오. 이 챌린지는 이미지 분류 작업을 목표로 하며, 보다 효율적인 적대적 방어 기술을 발견하고 적대적 공격에서 컴퓨터 비전 모델의 견고성을 개선하는 것을 목표로 합니다.

ImageNet 컴퓨터 비전 데이터 세트:

대회에 사용된 ImageNet 데이터 세트는 컴퓨터 비전 시스템 인식 작업에 사용되는 클래식 데이터 세트로 스탠포드 대학의 Li Feifei 교수의 지도하에 만들어졌습니다. 이 대회에 권장되는 데이터 세트는 연례 ILSVRC 이미지 인식 대회에서 사용되는 표준 교육 및 테스트 데이터인 ImageNet 분류 작업의 하위 집합입니다. ImageNet 데이터셋과 ILSVRC 경진대회는 컴퓨터 비전 기술과 딥러닝 모델 개발에 큰 의미가 있습니다.
006C3FgEgy1h65x65keamj312c066473

2 천만 상금 풀, 인재 유치

이 대회는 글로벌 인공 지능 인재와 팀을 유치하기 위해 무거운 상금을 설정하여 국제적으로 경쟁력 있는 인공 지능 혁신 산업 클러스터 그룹을 형성합니다. 이번 대회는 총 상금 1000만 달러를 책정할 예정이며 각 질문에는 최대 100만 달러의 상금이 수여되며 역사상 가장 높은 상금을 거머쥔 알고리즘 대회가 될 수도 있다.
006C3FgEgy1h65x6i86h0j31260dgk0h

3 참여방법

1. 대회 등록 기간: 8월 6일 - 10월 7일

대회 시간: 8월 6일 - 11월 15일

2. 공모전은 학회 전체로 개인, 고등교육기관, 연구기관, 기업체, 메이커팀 등이 참가할 수 있으며, 1인당 1팀만 참가 가능하며, 각 팀은 최대 5명.

메모:

(1) 그룹 아레나 대회 외에 주제 작성 및 데이터 접촉에 관련된 사람들은 대회 조직에 참가할 수 없습니다.

(2) 주최측과 대회 트랙은 대회에만 참가할 수 있으며 순위에는 참가하지 않는다.

  1. 대회의 공식 QR 코드를 스캔하거나 파저우 연구소(황푸)의 공식 이벤트 페이지에 로그인하세요: https://sourl.cn/G5RJKD

대회 주제 선택에서 대회 주제에 해당하는 "지금 등록" 버튼을 클릭하고 등록 정보를 작성하면 대회에 등록할 수 있습니다.

참고: 등록 정보 및 팀 정보가 정확하고 유효한지 확인하십시오.트럼펫 또는 가짜 이름이 발견되면 자격, 결과 및 보너스가 취소됩니다.

4 대회의 조직 구조

지도단위: 펑청연구소, 광저우시 과학기술국, 광저우시 공업정보화국

지원 단위: 광저우 황포구 인민정부, 광저우 개발구 관리위원회, 광저우 첨단기술구 관리위원회

후원: Pazhou 연구소(Huangpu)

공동 주최: 중국 산업 및 응용 수학 학회(빅 데이터 및 인공 지능 전문 위원회), 중국 컴퓨터 연맹, 중국 명령 및 제어 학회, 중국 인공 지능 학회, 공업 정보화부 제5 전자 연구소, 시뎬 대학교 광저우 연구소

Supongo que te gusta

Origin blog.csdn.net/Extremevision/article/details/126847447
Recomendado
Clasificación