3ème semaine de juin 2023 Collection de grands modèles

3ème semaine de juin 2023 Collection de grands modèles

  • 2023.6.20
  • Déclaration de droit d'auteur : cet article est l'article original du blogueur chszs et ne doit pas être reproduit sans l'autorisation du blogueur.

1. Modèle de langage IA méta open source MusicGen

Le 12 juin, Meta a récemment mis en open source son modèle de langage d'IA MusicGen sur Github. Ce modèle est basé sur le modèle Transformer. Comme le nom du modèle l'indique, MusicGen est principalement utilisé pour la génération de musique. De plus, MusicGen prend également en charge la saisie combinée de texte et de mélodie, par exemple, vous pouvez proposer de générer "une chanson légère" et en même temps demander de "la combiner avec "Ode à la joie" de Beethoven.

Selon les résultats des tests des performances réelles de MusicGen, par rapport à MusicLM de Google et à d'autres modèles musicaux tels que Riffusion, Mousai et Noise2Music, MusicGen fonctionne mieux sur des indicateurs tels que le degré de correspondance entre la musique et les invites textuelles et la crédibilité de la composition. Globalement légèrement supérieur au niveau de Google MusicLM.

Adresse du projet : https://github.com/facebookresearch/audiocraft
Adresse de la démo : https://huggingface.co/spaces/facebook/MusicGen

2. Stability lance une nouvelle application Uncrop Clipdrop pour agrandir les images

Stability AI et Clipdrop ont récemment lancé l'outil Uncrop Clipdrop, un éditeur d'échelle d'image. Vous pouvez transformer l'image verticale en image horizontale et l'image horizontale en image verticale, et ajuster l'échelle de l'image de manière arbitraire.

En termes de fonction, Uncrop est très similaire à Photoshop Generative Fill, et sa fonction essentielle est d'utiliser l'IA pour créer du contenu d'image à un emplacement spécifié. En comparant les deux, PS GF peut non seulement agrandir l'image, mais également créer une image à la position spécifiée en fonction des besoins. Si l'utilisateur souhaite modifier plus précisément les détails de l'image, le PS GF a tout de même un grand avantage en termes de fonctionnalité. Mais si vous avez juste besoin d'agrandir une partie du contenu de l'image, Uncrop peut déjà très bien répondre aux exigences, et Uncrop est facile à utiliser et entièrement gratuit !

3. Firefly, l'outil d'IA générative d'Adobe, lance une version entreprise

Lors de son sommet EMEA 2023, Adobe a lancé Firefly Enterprise Edition, un outil de génération d'images IA. La nouvelle version est principalement destinée aux grandes entreprises. Les entreprises peuvent utiliser leurs propres actifs de données pour former leurs propres grands modèles Firefly et générer rapidement un contenu d'image sans danger pour un usage commercial.

Selon le site officiel, la version entreprise de Firefly sera officiellement publiée au second semestre de cette année, mais les utilisateurs d'entreprise peuvent déjà utiliser les fonctions de Firefly dans la version entreprise d'Adobe Express.

Firefly est un kit de génération d'images AI publié par Adobe en mars 2023. Semblable à de nombreux outils de peinture AI, les utilisateurs peuvent utiliser Prompt (mot d'invite) pour générer des images, ou remplacer et modifier les styles d'image. Fin mai, Firefly a officiellement ouvert sa version bêta publique et a été intégré à la fonction de remplissage créatif de Photoshop, qui a été utilisée pour générer plus de 150 millions d'images. Garantir une utilisation commerciale sûre est un argument de vente majeur de ce nouveau produit, et c'est une considération importante pour Adobe depuis le lancement de Firefly. Le contenu de données utilisé pour former les modèles de Firefly provient d'images Adobe Stock, de contenu sous licence publique et d'autres contenus du domaine public dont le droit d'auteur a expiré - Adobe détient tous les droits sur ces images sans contestation du droit d'auteur. Dans le même temps, les développeurs de génération d'images d'intelligence artificielle tels que Stability AI et Midjourney font face à de plus en plus de poursuites judiciaires pour avoir saisi des images et les avoir utilisées pour la formation à l'insu ou sans le consentement des créateurs. En janvier de cette année, Getty Images a poursuivi Stability AI, affirmant qu'elle avait illégalement volé des millions d'images et violé le droit d'auteur.

4. H3C lance LinSeer, un modèle de domaine privé à grande échelle "Baiye Lingxi"

Le 11 juin, H3C a publié un grand modèle de domaine privé - "LinSeer", qui fournit aux clients des industries verticales et des régions exclusives des services intelligents sûrs, personnalisés, exclusifs et en croissance. Ce grand modèle relie les données d'application verticales pour former une intelligence verticale du domaine privé exacte, précise et allégée, et cultive des capacités spécifiques, mais il ne peut pas être universel.

En résumé, H3C a lancé un serveur d'intelligence artificielle pour la formation de modèles à grande échelle, qui peut choisir une variété de modèles à grande échelle open source, combinés avec les données privées de l'entreprise, et enfin former un service de modèles à grande échelle en privé. propriété de l'entreprise.

5. Byte commandera plus d'un milliard de dollars de GPU à Nvidia cette année

Selon "LatePost", après la Fête du Printemps de cette année, toutes les grandes sociétés Internet chinoises proposant des services de cloud computing ont passé d'importantes commandes auprès de Nvidia. Byte a commandé plus d'un milliard de dollars américains de GPU à Nvidia cette année (y compris les A100 et H800 qui sont arrivés et ne sont pas arrivés), et la commande de 10 000 cartes d'un autre grand fabricant Internet à Nvidia est estimée à au moins plus d'un milliard. yuan basé sur le prix catalogue RMB. Byte à lui seul a peut-être passé des commandes cette année proches du nombre total de GPU commerciaux Nvidia vendus en Chine l'année dernière.

Il est entendu que Byte, Tencent, Alibaba et Baidu, les quatre entreprises technologiques chinoises qui ont le plus investi dans l'IA et le cloud computing, ont accumulé des dizaines de milliers d'A100 dans le passé. Parmi eux, A100 a le nombre d'octets le plus absolu. Hors nouvelles commandes cette année, le nombre total de Byte A100 et de son prédécesseur V100 est proche de 100 000.

Soochow Securities, Tianfeng Securities, Zheshang Securities, Guolian Securities, Huaxi Securities, Orient Securities, Essence Securities et d'autres instituts de recherche sur les valeurs mobilières ont publié cette année des rapports de recherche selon lesquels la demande de puissance de calcul des grands modèles profitera aux fabricants de serveurs nationaux. de la gifle indirecte, le bénéficiaire est toujours la première société étrangère Nvidia.

6. 360 a publié "Smart Brain 4.0" et est entièrement connecté à 360 Family Bucket

Le 13 juin, 360 Company a tenu une conférence de presse pour présenter le modèle cognitif à grande échelle "Intelligent Brain 4.0", affirmant qu'il a terminé des itérations dans des capacités clés telles que la multimodalité, et qu'il sera entièrement connecté au " 360 Family Bucket" et sortira en Chine. La fonction multimodale de Vincent Video". Zhou Hongyi estime que la Chine est entrée dans une guerre de 100 modèles et que le plus important est la concurrence des scénarios d'application ; de plus, la clé du dépassement dans les coins nationaux réside dans le développement de la multimodalité. À l'heure actuelle, 360 a le capacité à générer des modalités croisées, qui peuvent réaliser Wenshengwen et Wenshengtu. , Table Wensheng, image générée par image, texte généré par image, compréhension vidéo et autres fonctions.

Au même moment, l'humain numérique 360 ​​​​AI est sorti. J'imaginais que l'orientation future du développement de l'humain numérique 360 ​​AI est de générer du son, de la vidéo, d'avoir une mémoire à long terme, même d'avoir la capacité de décomposer et de planifier des objectifs, et d'avoir des "mains et des pieds", avec un pouvoir exécutif, pour mieux servir êtres humains. 360 AI digital human compte actuellement plus de 200 rôles, qui sont divisés en deux catégories : célébrité numérique et employé numérique. Les célébrités numériques incluent des personnages historiques, des stars d'idoles, des personnalités littéraires, etc., et les employés numériques peuvent devenir des assistants de connaissances et des assistants de bureau pour les employés de l'entreprise. L'humain numérique 360 ​​AI prend en charge la personnalisation. Chacun peut générer son propre humain numérique exclusif à faible coût en téléchargeant sa base de connaissances privée, telle que des avatars numériques, des assistants numériques, des idoles numériques, etc.

7. Le projet de "loi sur l'intelligence artificielle" arrive bientôt

Le 10 juin, le projet de « loi sur l'intelligence artificielle » est entré dans le plan de travail législatif 2023 du Conseil des affaires d'État et prévoit de le soumettre au Comité permanent de l'Assemblée populaire nationale pour examen au cours de cette année. La législation dans le domaine de l'IA peut garantir l'utilisation sûre et fiable des technologies d'IA. La législation peut clarifier la méthode ou le principe d'attribution des responsabilités, protéger les droits de l'homme, prévenir l'abus de l'intelligence artificielle, garantir que le processus décisionnel intelligent est plus ouvert et transparent, prévenir les phénomènes injustes et discriminatoires, protéger les intérêts publics et prévenir les risques futurs . Les types de risques comprennent principalement la sécurité des données, la menace de l'opinion publique en ligne, la discrimination des algorithmes, la fuite d'informations personnelles, la violation de la propriété intellectuelle, l'induction de la cybercriminalité, le monopole technologique et l'érosion du système éducatif. Cependant, la plupart de ces risques sont encore au niveau des conjectures et des hypothèses, et ne se sont pas réellement concrétisés, et la probabilité de survenance de ces risques est également incertaine.

8. Baichuan Intelligence a ouvert un grand modèle chinois et anglais pré-formé avec 7 milliards de paramètres

Le 15 juin 2023, Baichuan Intelligent, fondée par Wang Xiao, le fondateur de Sogou, a lancé un grand modèle baichuan-7B pré-formé en chinois et en anglais avec 7 milliards de paramètres. Il est rapporté que l'Université de Pékin et l'Université Tsinghua ont pris l'initiative d'utiliser le modèle baichuan-7B pour promouvoir les travaux de recherche connexes et prévoient de coopérer avec baichuan intelligent à l'avenir pour promouvoir conjointement l'application et le développement du modèle baichuan-7B.

baichuan-7B surpasse non seulement d'autres grands modèles tels que ChatGLM-6B par un avantage significatif dans les listes d'évaluation faisant autorité chinoises C-Eval, AGIEval et Gaokao, mais mène également de manière significative LLaMA-7B dans la liste d'évaluation faisant autorité en anglais MMLU. À l'heure actuelle, le grand modèle baichuan-7B est sorti sur les plates-formes Hugging Face, Github et Model Scope. Cette version suit également l'esprit de l'open source.Le code baichuan-7B adopte le protocole Apache-2.0, et le poids du modèle adopte un accord commercial libre, qui peut être utilisé pour un usage commercial gratuit avec une simple inscription.

9. La dernière liste de classement LLM de Stanford publiée en juin

Récemment, des chercheurs de Stanford ont proposé un nouveau système d'évaluation automatique basé sur un grand modèle de langage - AlpacaEval. Non seulement il est rapide et peu coûteux, mais il a également été vérifié par 20 000 annotations humaines.

Nom du modèle Taux de réussite
GPT-4 95,28 %
Claude 88,39%
ChatGPT 86,09 %
AssistantLM 13B 75,31%
Guanaco 65B 71,80%
Vigogne 13B 70,43%
FLAMME 33B OASST RLHF 66,52 %
Guanaco 33B 65,96 %
Nous Hermes 13B 65,47 %
Vigogne 7B 64,41 %
LLaMA 33B OASST SFT 54,97 %
Guanaco 13B 52,61 %
Davinci003 50.00%
Guanaco 7B 46,58%
Instruire le Falcon 40B 45,71 %
Alpaca Farm PPO Sim (GPT-4) 7B 44,10%
Pythie 12B SFT 41,86 %
Alpaca Farm PPO Humain 7B 41,24%
Alpaga 7B 26,46 %
Pythie 12B OASST SFT 25,96 %
Instruction Falcon 7B 23,60%
Adhérer 17,52 %
Davinci001 15,17 %

Guess you like

Origin blog.csdn.net/chszs/article/details/131300493