5 große Herausforderungen und Lösungen für die Implementierung großer Modelle auf Unternehmensebene

Klicken Sie hier, um den vollständigen Veranstaltungsbericht anzuzeigen: https://my.oschina.net/u/4489239/blog/11105657

Klicken Sie hier, um zur Vorschau der Shenzhen Yuanchuang-Konferenz am 18. Mai zu springen: https://www.oschina.net/event/2332004

Am 20. April fand in Wuhan erfolgreich die 102. Yuanchuang-Konferenz statt. Diese Ausgabe lädt Experten für künstliche Intelligenz vom Wuhan Artificial Intelligence Research Institute, Huawei, MindSpore, JD Cloud und Gitee AI ein, Vorträge zum Thema [Wettbewerb großer Modelle und Leistungsoptimierung] zu halten. Yuan Lijiang, Produktdirektor von JD Cloud, hielt eine Grundsatzrede zum Thema „Inspiring the Future with Intelligence – Yanxi Large Model Platform“. Yuan Lijiang führte aus, dass es bei der Implementierung großer Modelle auf Unternehmensebene fünf große Herausforderungen gibt: Echtzeit, Erklärbarkeit, Sicherheit und Kontrollierbarkeit, komplexe Entscheidungsfindung und Professionalität. Der Schlüssel zur Implementierung liegt darin, wie man in Echtzeit korrekte Entscheidungen trifft und in einem unsicheren und sich dynamisch verändernden Umfeld umzusetzen.
 
Yuan Lijiang stellte vor, dass es zwei Hauptmethoden gibt, um große Modelle zu implementieren. Die Interaktionsbeziehung wird von Menschen durchgeführt. In einigen Szenarien übernimmt die KI die Arbeit Verarbeitung. , Vincent Tu usw. Tatsächlich müssen Unternehmen so viele Arbeitskräfte wie möglich freisetzen. Der andere ist der Agentenmodus, der sich besser für komplexe Szenarien in Unternehmen eignet. In diesem Modus agieren Menschen aus einer höherdimensionalen Perspektive als „Mentor“ oder „Coach“ der künstlichen Intelligenz, indem sie Ziele festlegen und die Ergebnisse überwachen Das große Modell kann seine Denkfähigkeit einsetzen, geeignete Werkzeuge und Ausreden verwenden und schließlich entsprechendes Ergebnis-Feedback geben.
 
Die wichtigsten Technologien, auf die sich Unternehmen bei der Implementierung großer Modelle verlassen, haben sich ebenfalls geändert. Der anfängliche Pre-Train-Modus ist mit den höchsten Kosten verbunden, später sind die Kosten für den SFT-Modus gesunken, aber der Implementierungseffekt war nicht gut Der RAG-Modus der Vektordatenbank wurde verbessert, der Effekt kann jedoch nur auf Wissensfrage- und Antwortszenarien beschränkt werden. Kompetente technische Teams widmen dem Agentenmodus mehr Aufmerksamkeit und können Unterstützung für mehrere Szenarien erzielen.
 
Im Finanzgeschäft von JD.com ist es schwierig, die Fähigkeit großer Modelle zur Lösung praktischer Probleme zu verbessern, indem man sich einfach auf SFT oder LoRA für große Modelle verlässt. Stattdessen basiert es auf der Agententechnologie, die es Maschinen ermöglicht, Tools zur Lösung von Geschäftsproblemen zu verwenden. Insbesondere wird der Agent verwendet, um die Benutzerziele zu verstehen, jede Unteraufgabe zu zerlegen und geeignete Tools für jede Unteraufgabe auszuwählen. Diese Tools sind einige Schnittstellen des ursprünglichen Geschäfts von JD.com und werden schließlich mit großen Modellfunktionen kombiniert, um Feedback zu geben . Auf diese Weise werden die Antworten auf die komplexen Fragen einiger Benutzer genauer.
 
Derzeit hat die vollständige Modellplattform von JD Yanxi eine mehrschichtige Produktmatrix aufgebaut. Die unterste Ebene ist die Ressourcenunterstützung, einschließlich Rechenressourcen, Speicherressourcen, Hochgeschwindigkeitsnetzwerk und Ressourcenplanung. Auf der Modellressourcenschicht werden Funktionen wie Modellverwaltung und -schulung, Datensatzverarbeitung sowie Modellbewertung und -bereitstellung bereitgestellt. Über der Modellressourcenschicht liegt der Aufbau intelligenter Agenten, wobei der Schwerpunkt auf der Integration verschiedener Tools liegt. Die oberste Schicht ist die Anwendungsdienstschicht, die sich an mehrere Unternehmensszenarien anpasst.
 
Die Plattform für große Modelle von JD Yanxi verfügt über sechs Hauptfunktionen: Zusammenarbeit bei der Ressourcenplanung, die eine effiziente Verwaltung und Planung von Rechenressourcen ermöglicht und die Leistungsoptimierung und Kostenkontrolle bei der Entwicklung großer Modelle sowie die Datenverwaltung für Anwendungen gewährleistet, die Verwaltung und Unterstützung für die Schulung großer Modelle bietet Vorschulung, Feinabstimmung, Verstärkungslernen, Bewertung usw. werden effizient durchgeführt; Modellschulung, Schulung und Feinabstimmung durch große Modelle ermöglichen es Unternehmen, maßgeschneiderte Modelle zu haben, um die Genauigkeit und Relevanz von Unternehmen zu verbessern Durch den Einsatz intelligenter Agenten in Kombination mit den vorhandenen IT-Systemen des Unternehmens wird sichergestellt, dass alle Großmodellanwendungen den Sicherheitsstandards sowie gesetzlichen und behördlichen Anforderungen entsprechen. Der Markt für intelligente Anwendungen bietet eine Reihe vorgefertigter Großmodellanwendungen dass Unternehmen direkt bereitstellen oder Plug-Ins bereitstellen können. Schneller Zugriff auf das System.
 
Scannen Sie den QR-Code, um die Wiederholung der Rede „Inspiring the Future – Yanxi Large Model Platform“ anzusehen⬇️
High-School-Schüler erstellen ihre eigene Open-Source-Programmiersprache als Coming-of-Age-Zeremonie – scharfe Kommentare von Internetnutzern: Unter Berufung auf die Verteidigung hat Apple den M4-Chip RustDesk veröffentlicht. Inländische Dienste wurden wegen grassierenden Betrugs eingestellt . In Zukunft plant er, ein unabhängiges Spiel auf der Windows-Plattform Taobao (taobao.com) zu produzieren. Webversionsoptimierungsarbeiten neu starten, Ziel für Programmierer, Visual Studio Code 1.89 veröffentlicht Java 17, die am häufigsten verwendete Java LTS-Version, Windows 10 hat eine Marktanteil von 70 %, Windows 11 geht weiter zurück ; Google unterstützt Hongmeng bei der Übernahme von Open-Source-Rabbit-R1;
{{o.name}}
{{m.name}}

Ich denke du magst

Origin my.oschina.net/u/4489239/blog/11105666
Empfohlen
Rangfolge