Wang Haifeng, CTO von Baidu: Große Sprachmodelle läuten den Beginn der allgemeinen künstlichen Intelligenz ein

Am 16. August fand in Peking die WAVE SUMMIT Deep Learning Developer Conference 2023 statt, die vom National Engineering Research Center for Deep Learning Technology and Applications ausgerichtet wurde. Wang Haifeng, Chief Technology Officer von Baidu und Direktor des National Engineering Research Center for Deep Learning Technology and Applications, hielt eine Grundsatzrede. Wang Haifeng erklärte zum ersten Mal, dass das große Sprachmodell über die grundlegenden Grundfunktionen künstlicher Intelligenz wie Verständnis, Generierung, Logik und Gedächtnis verfügt und damit den Beginn der allgemeinen künstlichen Intelligenz einleitete.

Die Zahl der Entwickler von Flugpaddeln hat 8 Millionen erreicht, und die Zahl der Modelle hat 800.000 überschritten.

Die Deep-Learning-Entwicklerkonferenz WAVE SUMMIT begann im April 2019. Wang Haifeng schlug auf der ersten Konferenz vor, dass Deep Learning eine große Vielseitigkeit aufweist und die Merkmale der Standardisierung, Automatisierung und Modularisierung der industriellen Massenproduktion aufweist, wodurch künstliche Intelligenz gefördert wird, um in die Phase der industriellen Massenproduktion einzutreten. In den letzten vier Jahren hat die Entwicklung von Deep-Learning-Technologien und -Anwendungen diesen Standpunkt vollständig bestätigt. Die Deep-Learning-Technologie wird immer vielseitiger und die Standardisierung, Automatisierung und modularen Funktionen von Deep-Learning-Plattformen gewinnen immer mehr an Bedeutung. Der Aufstieg großer vorab trainierter Modelle hat die Tiefe und Breite der Anwendungen künstlicher Intelligenz weiter erweitert. Künstliche Intelligenz hat das Stadium der industriellen Massenproduktion erreicht.

Im Hinblick auf die Standardisierung werden Framework und Modell gemeinsam optimiert, mehrere Hardwaregeräte werden einheitlich angepasst und das Anwendungsmodell ist einfach und effizient, was die Schwelle für die Anwendung künstlicher Intelligenz erheblich verringert. Im Hinblick auf die Automatisierung reicht es vom Training über die Anpassung bis hin zur Inferenz Durch den Einsatz wird die Effizienz des gesamten Forschungs- und Entwicklungsprozesses im Bereich der künstlichen Intelligenz verbessert; Modularisierung Andererseits unterstützt eine umfangreiche Modellbibliothek auf industrieller Ebene die praktische Anwendung künstlicher Intelligenz in einer Vielzahl von Szenarien.

7be9df9a81ab7bf4b1d7ecdd3e89907f.jpeg

Es versteht sich, dass die Ökologie von Fei Paddle dank der gegenseitigen Förderung der industrietauglichen Deep-Learning-Open-Source-Open-Source-Plattform von Fei Paddle und des großen Modells von Wenxin immer erfolgreicher geworden ist. Es hat 8 Millionen Entwickler versammelt und 220.000 Unternehmen und Institutionen bedient. Basierend auf Fei Paddel, 80.000 Modelle. Wang Haifeng erklärte die bedeutungsvolle Bedeutung des chinesischen Namens der Flugpaddel-Entwicklergemeinschaft AI Studio „Galaxy Community“: „Mit einem aufrichtigen Herzen und einem Flugpaddel können wir zu den Sternen segeln.“ Gemeinsam mit allen Entwicklern und mit Unterstützung von Fei Piao und Wen Xin werden wir die Galaxy-Community aufbauen und uns in das Sternenmeer der allgemeinen künstlichen Intelligenz begeben.

f996af73867c6682a0a23d83455c624f.jpeg

Große Sprachmodelle läuten den Beginn der allgemeinen künstlichen Intelligenz ein

Wang Haifeng sagte, dass künstliche Intelligenz über eine Vielzahl typischer Fähigkeiten verfügt, von denen Verständnis, Generierung, Logik und Gedächtnis die wichtigsten Grundfähigkeiten sind. Je stärker diese vier Fähigkeiten sind, desto näher sind sie der allgemeinen künstlichen Intelligenz. Das große Sprachmodell hat Diese vier Fähigkeiten und die allgemeine künstliche Intelligenz bringen den Anbruch.

Insbesondere basieren die typischen Fähigkeiten der künstlichen Intelligenz wie Kreation, Programmierung, Problemlösung, Planung usw. alle auf grundlegenden Grundfähigkeiten wie Verständnis, Generierung, Logik und Gedächtnis, mit unterschiedlichem Grad an Abhängigkeit. Am Beispiel der Problemlösung ist vom Lesen der Frage über das Lösen der Frage bis hin zum schließlichen Schreiben der Antwort der umfassende Einsatz von Verständnis, Gedächtnis, Logik und generativen Fähigkeiten erforderlich.

Wie erlangt man diese Fähigkeiten? Am Beispiel von Wen Xinyiyan erhalten wir zunächst ein vorab trainiertes großes Modell durch Fusionslernen aus Billionen von Daten und Hunderten von Milliarden Wissen. Auf dieser Grundlage verwenden wir überwachte Feinabstimmung, Lernen zur Verstärkung menschlicher Rückmeldungen sowie Eingabeaufforderungen und andere Technologien und haben technische Vorteile wie Wissenserweiterung, Abrufverbesserung und Dialogverbesserung.

Darüber hinaus durch mehrere Strategien zur Optimierung von Datenquellen und Datenverteilung, Langtextmodellierung des Basismodells, überwachte Feinabstimmung mit mehreren Typen und mehreren Stufen, adaptive überwachte Feinabstimmung mit mehreren Aufgaben, Belohnungsmodelle mit mehreren Ebenen und mehreren Granularitäten und andere technologische Innovationen, umfassende Verbesserung grundlegender allgemeiner Fähigkeiten. Auf der Grundlage der Abrufverbesserung und Wissenserweiterung kann die Beherrschung und Anwendung von Weltwissen durch Wissenspunktverbesserung verbessert werden; logische Fähigkeiten können durch groß angelegte logische Datenkonstruktion, logische Wissensmodellierung, multigranulare semantische Wissenskombination und Symbolik verbessert werden neuronales Netzwerk; Gewährleisten Sie die Sicherheit großer Modelle durch den Aufbau eines umfassenden Sicherheitssystems für Daten-, Inhalts-, Modell- und Systemsicherheit.

In Bezug auf die Effizienz hat die Trainingsgeschwindigkeit des großen Modells von Wenxin durch die durchgängige adaptive Hybrid-Parallel-Trainingstechnologie von Fei Paddle und die gemeinsame Optimierung von Komprimierung, Inferenz und Dienstbereitstellung das Dreifache und die Inferenzgeschwindigkeit mehr als das Dreifache erreicht 30 mal.

In Bezug auf die Anwendung werden datengesteuerte, zeitnahe Konstruktion und Plug-in-Erweiterung zur Szenenanpassung und kollaborativen Optimierung verwendet. Wen und Antworten, Dateneinblicke und Diagrammerstellung, basierend auf der Fähigkeit, Bilder, Fragen und Antworten sowie Videos zu erstellen. Der Plug-in-Mechanismus erweitert die Möglichkeiten großer Modelle und lässt sich besser an die Anforderungen der Szene anpassen. Wang Haifeng sagte, dass Baidu in Zukunft mit Entwicklern ein Plug-in-Ökosystem aufbauen und technologische Innovationsergebnisse teilen werde.

Künstliche Intelligenz, repräsentiert durch große Sprachmodelle, dringt in Tausende von Branchen ein und beschleunigt die industrielle Modernisierung und das Wirtschaftswachstum. In diesem Prozess bilden technologische Innovation und Anwendungsimplementierung einen positiven Kreislauf, Fähigkeiten wie Verständnis, Generierung, Logik und Gedächtnis verbessern sich weiter, die Breite und Tiefe industrieller Anwendungen nimmt weiter zu und große Sprachmodelle läuten den Beginn allgemeiner künstlicher Intelligenz ein Intelligenz.

Supongo que te gusta

Origin blog.csdn.net/ZabeNbRdit36243qNJX1/article/details/132331507
Recomendado
Clasificación