ラマ2チームの中国人

The Heart of the Machine 編集者: Du Wei、Dan Jiang

LLaMA と比較して、Llama 2 の開発には多くの中国人学者が参加しています。

最近、Llama 2 のオープンソースにより、Yann LeCun をはじめとする多くの業界関係者が「大型モデルのパターンは大きく変わった」と直接語ります。

オープンソースに加えて、Meta は Llama 2 が商用利用無料であることも発表しました。Llama 2 は 70 億、130 億、700 億のパラメータ バージョンを提供し、トレーニング データは Llama 1 より 40% 増加し、2 兆トークンに達します。微調整されたチャット モデルは、人間がラベル付けした 100 万件のデータでトレーニングされています。

結果から、Llama 2 は、推論、コーディング、熟練度、知識テストを含む多くの外部ベンチマークにおいて他のオープンソース言語モデルよりも優れており、一部のデータセットでは GPT-3.5 に近づくこともでき、Google の PaLM と同等かそれを超えることもできます。 (540B)。

Meta のオープンソースへの取り組みへの取り組みを嘆く一方、注目は Llama 2 開発チームに向けられています。Gautier Izacard、Armand Joulin、Edouard Grave、Guillaume Lample、Timothee Lacroix など、LLaMA の中心的な著者の一部が Llama 2 の開発中に姿を消していることがわかります。

041feede53407ced06a6421ad181d004.jpeg

Llama 2 テクニカル レポート: https://ai.meta.com/research/publications/llama-2-open-foundation-and-fine-tuned-chat-models/

中心となる著者の変更に加えて、Llama 2 の約 70 人の著者の中には 10 人以上の中国人学者が含まれています。

『The Heart of the Machine』では、ラマ2の研究開発に参加した以下の中国人学者を整理している。間違いや漏れがある場合は、コメント欄で修正してください。

モヤ・チェン

c10f60a49787ec073e47b845681b1c9c.png

Moya Chen はメタ大規模言語モデル (LLM) の研究エンジニアであり、7 月に一時的に退職しました。2015 年に入社して以来、彼女の仕事には、プラットフォーム/ビジネス レピュテーション、コンピューティング カメラ (CV、AR)、WorldXR (CV、AR、および XR)、FAIR Labs (チャットボット)、および FAIR/GenAI (LLM) が含まれます。

彼女はカリフォルニア工科大学でコンピューター サイエンスの学士号を取得しています。

ジェレミー・フー

Jeremy Fu は現在、FAIR の研究エンジニアであり、主な方向性は大規模言語モデルです。彼は以前、Instagram Machine Learning でコンテンツ理解とユーザー モデリングに取り組んでいました。2021年1月よりメタ社にフルタイムで勤務予定。

彼は、シドニーのニューサウスウェールズ大学でコンピューターサイエンスとビジネスの学士号を取得しています。

ウェンイン・フー

8b475d8a49e75dedfba96c260986e028.png

Wenyin Fu は現在、メタ データ センター ML パフォーマンス エンジニアとして、主に ML プラットフォーム ソリューション導入の大規模設計と最適化、および最適な容量 ROI を実現するデータ センター ハードウェア ソリューションの評価に従事しています。彼は 2019 年 5 月に Meta に入社し、以前は Nvidia、AMD、Intel で働いていました。

彼は上海交通大学を卒業し、電気電子工学の学士号を取得し、ウィスコンシン大学マディソン校で電気工学およびコンピュータ工学の博士号を取得しました。

シンシア・ガオ

e67e4a602e68d7a64e71f9eff00e71b4.png

Cynthia Gao は現在、メタ プロダクト データ運用部門のプロジェクト マネージャーで、主に機械翻訳および生成 AI ラージ モデルの手動データ アノテーションと収集プロジェクトに従事しています。以前はFAIRを含むさまざまな部門で働いていました。

彼女は北京師範大学、カリフォルニア大学デービス校(学士号、心理学および中国の言語と文化)とモントレー国際研究所(修士号、翻訳およびローカリゼーション管理)で学んだことがあります。

ルイ・ホウ

f915d8fe959771b9102e30537106054f.png

Rui Hou は現在、Meta GenAI の研究員として、生成 AI テクノロジーと関連する生産アプリケーションに重点を置いています。彼は、以前にトヨタ研究所などの組織でインターンを務めた後、2020 年 4 月にメタに入社しました。

同済大学で学士号を取得し、ミシガン大学で修士号(インテリジェント システムとコンピュータ サイエンスの二重学位)と博士号(インテリジェント システム)を取得しました。

Google Scholar: https://scholar.google.com/quotes?user=PKHKqX0AAAAJ&hl=ja

ルー・インハイ

58905aff72d6f5063c65de9596a332e6.jpeg

Yinghai Lu 氏は現在、Meta のチーフ ソフトウェア エンジニアであり、Meta インフラ グループの AI 推論技術の責任者であり、現在生成 AI 推論の展開に従事しています。彼は 2016 年に Meta に入社し、広告とリールのレコメンデーション モデルの GPU 推論の導入を主導してきました。

同済大学で電気工学を専攻し卒業し、復旦大学で電気工学の博士号を取得しました。

Google Scholar: https://scholar.google.com/quotes?user=prBXsm8AAAAJ&hl=zh-CN

マオ・ユニン

114a0e1c399a11f18681742989c6dcfd.png

Yuning Mao は現在、Meta GenAI 研究科学者であり、Jiawei 教授の指導の下、イリノイ大学アーバナ シャンペーン校でコンピュータ サイエンスの学士号と博士号を取得し、上海交通大学の IEEE 優等生クラスを卒業しました。ハンさん。

彼の研究の目標は、人々がより効果的かつ効率的に情報や知識にアクセスできるようにすることです。この目標を達成するために、テキストの要約と生成、質問応答、パラメータの効率的な微調整、分類法の構築など、幅広い研究テーマに取り組んできました。最近では、特に大型モデルの安全性に関して、Meta LLaMA モデル シリーズの開発に携わっています。

個人ホームページ:https://Morningmoni.github.io/

聶宜新

618690836ee64534b7c70dbc68693fb2.png

Yixin Nie は現在、Meta AI の研究員です。彼は中国地質大学を卒業し、学士号を取得し、シカゴ大学で修士号を取得し、ノースカロライナ大学チャペルヒル校でコンピューターサイエンスの博士号を取得しました。

彼の研究は機械学習と自然言語処理に焦点を当てており、彼の研究関心は機械による自然言語習得のアイデアに由来しています。

個人ホームページ:https://easonnie.github.io/

シャオチン・エレン・タン

ae5d48a44ad9c481bd3a562e03ca298f.png

Xiaoqing Ellen Tan は現在、Meta AI のデータ サイエンス研究者です。彼女は 2018 年に中山大学で薬学とコンピュータ サイエンスの学士号を取得し、2019 年から 2021 年にカーネギー メロン大学でコンピュータ サイエンスの客員学生となり、2022 年にピッツバーグ大学で生物統計学の博士号を取得しました。

彼女の研究関心は、因果推論、データ統合、意思決定の公平性の分野における新しい統計および機械学習手法の開発にあります。

個人ホームページ:https://ellenxtan.github.io/

シュー・プーシン

8ce675bb96e07e9639b95f0a561bfccf.jpeg

Puxin Xu は現在、Meta AI のシニア データ エンジニアで、主にマルチモーダル データセット (テキスト、画像、ビデオ) と大規模モデルの事前トレーニング データに取り組んでいます。彼は中山大学で学士号 (人的資源と都市農村計画管理、統計学の二重専攻) を取得し、リーハイ大学で修士号 (工業工学およびシステム工学) を取得しました。

鄭燕

7759f5d018345d0fc1f5d11a905357ca.png

Zheng Yan は現在、Meta のソフトウェア エンジニアとして、AI を使用してアカウント アクセス チームが遭遇した問題を解決しています。以前は、スタンフォード大学のショーン N. パーカー アレルギーおよび喘息研究センターでデータ アナリストとして働いていました。彼はスタンフォード大学でコンピューター サイエンスの学士号を取得しています。

ユチェン・チャン

57f4f70289166451ff911ab5d9a1bd0f.png

Yuchen Zhang は現在、Meta AI のソフトウェア エンジニア (機械学習)/研究エンジニアとして、大規模モデル (言語/マルチモーダル) のトレーニングとスケーリング、および大規模モデルにおける責任ある AI の研究に取り組んでいます。彼女はエモリー大学で学士号を取得し、ペンシルベニア大学でエンジニアリングとデータ サイエンスの修士号を取得しています。

個人ホームページ:https://zycalice.github.io/

アンジェラ・ファン

e9a8c83254e7683b35fee09a6f498ee5.jpeg

Angela Fan は、Meta AI Research Paris の研究員で、機械翻訳に重点を置いています。以前は、ナンシーの INRIA とパリの FAIR で博士号取得のためにテキスト生成を学びました。それ以前は研究エンジニアであり、ハーバード大学で統計学の学士号を取得しました。

個人ホームページ:https://ai.meta.com/people/angela-fan/

参考リンク:

https://www.36kr.com/p/2176578148315396

公式アカウント「機械学習とAI生成の創造」に注目してください。もっと面白いことがあなたを待っています

寝転がって6万語!30方向130記事!CVPR 2023 の最も完全な AIGC 論文! 一気に読んで

安定拡散の簡単解説:AI塗装技術の潜在的な拡散モデルの解釈

制御可能なAIGC絵画生成アルゴリズムControlNetを徹底解説! 

クラシック GAN は次のように読む必要があります: StyleGAN

65c3da19e89573f6a7568046fe79114b.png GANのシリーズアルバムを見るには私をクリックしてください~!

一杯のミルクティーでAIGC+CVビジョンのフロンティアになろう!

最新かつ充実の100まとめ!拡散モデルの生成 拡散モデル

ECCV2022 | 対立ネットワーク GAN 生成に関する論文まとめ

CVPR 2022 | 25 以上の方向性、最新の 50 の GAN 論文

 ICCV 2021 | 35 のトピックに関する GAN 論文の概要

記事数は110以上!CVPR 2021 で最も完全な GAN ペーパーコーミング

記事数は100以上!CVPR 2020 で最も完全な GAN ペーパーコーミング

新しい GAN の解体: デカップリング表現 MixNMatch

StarGAN バージョン 2: マルチドメイン ダイバーシティ イメージの生成

添付のダウンロード | 「Explainable Machine Learning」の中国語版

添付のダウンロード | 「TensorFlow 2.0 ディープ ラーニング アルゴリズムの実践」

添付のダウンロード | 「コンピューター ビジョンにおける数学的手法」シェア

「深層学習に基づく表面欠陥検出手法の検討」

ゼロショット画像分類の調査: 10 年間の進歩

「ディープニューラルネットワークに基づく少数ショット学習の調査」

『礼書・薛記』には、「友なしで一人で学ぶのは孤独で無知だ」という言葉がある。

ミルク ティー カップをクリックして、AIGC+CV ビジョンのフロンティア ウェイバーになりましょう! 、  AI によって生成された創造物とコンピューター ビジョンの 知識の惑星に参加してください。

おすすめ

転載: blog.csdn.net/lgzlgz3102/article/details/131950467