ChatGPT + X = mehr Möglichkeiten

ChatGPT verfügt über eine Vielzahl erweiterter Funktionen. Nach seiner Veröffentlichung hat es große Aufmerksamkeit erregt. Als groß angelegtes, von OpenAI trainiertes Verarbeitungsmodell natürlicher Sprache kann es eine Reihe von Funktionen wie die Erzeugung natürlicher Sprache, die Sprachübersetzung und das Verständnis natürlicher Sprache realisieren. und sprachliche Zusammenfassung . Zwei Monate nach der Veröffentlichung überstieg die Zahl der aktiven Nutzer pro Monat die 100- Millionen-Marke und ist damit die am schnellsten wachsende Verbraucher-App in der Geschichte.

Tatsächlich markiert die Einführung von ChatGPT offiziell das erste Jahr der kommerziellen Nutzung generativer KI . Generative KI besteht darin, mithilfe maschineller Lernmethoden Inhalte oder Objekte aus Daten zu lernen und dann basierend auf dem erlernten Modell neue und völlig originelle neue Inhalte zu generieren. Sie wird in verschiedenen Bereichen häufig eingesetzt, beispielsweise in der Verarbeitung natürlicher Sprache, der Bilderzeugung und der Audiogenerierung usw.

Gartner prognostiziert, dass generative KI bis 2025 10 % aller generierten Daten ausmachen wird , und der aktuelle Anteil beträgt weniger als 1 % . Die kommerziellen Aussichten generativer KI sind breit gefächert und ihre kommerziellen Anwendungsrichtungen umfassen hauptsächlich:

  •  Für eine intelligentere Informationsbeschaffung und -verarbeitung. Kürzlich gab Microsoft bekannt, dass es eine neue Version der Bing- Suchmaschine auf den Markt bringen wird , die ChatGPT integriert. ChatGPT kann die Suchmaschinenfunktion teilweise ersetzen, bestehende Wissensdatenbanken basierend auf Benutzerfragen abrufen und intuitivere Antworten liefern. Es wird erwartet, dass ChatGPT in Zukunft mit einer ganzen Reihe von Office- Tools verbunden wird , um Benutzer beim Zusammenfassen, Extrahieren und Übersetzen von Informationen zu unterstützen.

  •  Vertikale Dienstleistungen für Berufsfelder. Generative KI kann in professionellen Dienstleistungsbereichen wie E-Commerce, Werbemarketing und Codierung weit verbreitet eingesetzt werden. Sie kann einige primäre berufliche Arbeiten ersetzen und zu einem menschlichen Assistenten werden, was Unternehmen dabei hilft, viel Arbeitskosten zu sparen und die Produktionseffizienz zu verbessern.

Aber wie lässt sich ChatGPT in bestehende Technologien integrieren? Beginnen wir als Beispiele mit der ChatGPT+ -Wissenskarte und der ChatGPT+ -Büroautomatisierung:

1. ChatGPT + Knowledge Graph

Sachfehler stellen derzeit ein relativ großes Problem bei ChatGPT dar. Bei der Beantwortung mancher Fragen entsteht zwangsläufig das Gefühl von schwerwiegendem Unsinn . Die Lösung liegt darin, wie man eingreift und externes Wissen verarbeitet.

Eine Möglichkeit, externes Wissen einzubringen, besteht darin, während des Antwortvorgangs Links bereitzustellen. Obwohl die Antworten sachliche Fehler enthalten, kann über die Links eine manuelle Überprüfung durchgeführt werden, um das Problem sachlicher Fehler zu lösen.

d1252b28a196eacac9c86e4d2aacc7ca.png

Eine weitere Möglichkeit, externes Wissen einzubringen, ist der Knowledge Graph. Die Wissenskarte ist eine auf binären Beziehungen basierende Wissensbasis, die zur Beschreibung von Entitäten oder Konzepten in der realen Welt und ihren Beziehungen verwendet wird. Die Grundeinheit ist das Triplett [Entität-Beziehung-Entität ] zwischen Entitäten , die durch Beziehungen miteinander verbunden sind, um eine zu bilden Netzwerkstruktur.

Grundsätzlich ist die Wissenskarte im Wesentlichen eine Wissensdarstellungsmethode, die die Domänenontologie definiert, um die Wissensstruktur )Konzept, Entitätsattribut, Entitätsbeziehung, Ereignisattribut und Beziehung zwischen Ereignissen( Anschließend werden mittels Entitätserkennung, Beziehungsextraktion, Ereignisextraktion etc. strukturierte Daten aus verschiedenen Datenquellen extrahiert, mit Wissen gefüllt und schließlich im Attributgraphen- oder RDF- Format gespeichert .

Tatsächlich wurde bei der Ausrichtung auf PTM ( nicht LLM) in den ersten Jahren gesagt, dass PTM (vortrainiertes Sprachmodell) die Wissensbasis sei , die eine große Anzahl von Aufgaben wie Wissensprüfung zur Analyse und zum Verständnis umfasst , und LLM (chatgpt ) ist parametrisiertes Wissen. Der Vorteil von KG besteht darin, dass es bequem zum Debuggen ist , für den Menschen verständlich ist und über eine starke Fähigkeit verfügt, Diagrammstrukturen auszudrücken.

Aber diese beiden Punkte können kombiniert werden, insbesondere im Hinblick auf Argumentation ( gesunder Menschenverstand und Domänenbegründung ), Geschäftssysteminteraktion, Hyperautomatisierung, Zugriff und Aktualisierung zeitkritischer Inhalte usw. Es gibt viele Beispiele für Kombinationen.

Zum Beispiel führt KG bei der Textgenerierung verschiedener Diagrammaufgaben geeignetere Symbole aus, einschließlich numerischer Berechnungen, einschließlich Regelbegründungen usw., da dieser Teil für LLM tatsächlich relativ schwach ist oder die Lerneffizienz zu gering ist. Die Integration von Wissensgraphen in ChatGPT kann auf viele Arten erreicht werden. Geben Sie ihm ausreichend korrektes Wissen, führen Sie dann Wissensmanagement- und Informationsinjektionstechnologien wie Wissensdiagramme ein und begrenzen Sie außerdem den Datenbereich und die Anwendungsszenarien, um die von ihm generierten Inhalte zuverlässiger zu machen.

Beispielsweise können wir die Entitäten und Beziehungen im Wissensgraphen als Einbettungsvektoren darstellen, die als zusätzliche Merkmale in das Modell integriert werden, um die Leistung des Modells zu verbessern. Diese Methode kann sowohl die Strukturinformationen als auch die semantischen Informationen des Wissensgraphen in das Modell integrieren, sodass das Modell Text in natürlicher Sprache besser verstehen und generieren kann.

In einem Gespräch kann ein Wissensgraph dem Modell helfen, den Kontext des Gesprächs zu verstehen und genauere Informationen zur Beantwortung von Fragen bereitzustellen. Im LaMDA- Papier werden Wissensgraphen verwendet, um Kontextinformationen für Gespräche bereitzustellen. Durch die Kombination von Informationen aus Wissensgraphen können automatisch Fragen generiert werden, die Benutzern helfen, die Semantik und den Kontext zwischen Entitäten und Beziehungen besser zu verstehen.

Baidu hat vor einigen Tagen offiziell das generative große Sprachmodell „Wen Xin Yi Yan“ veröffentlicht, und das zugrunde liegende „Wen Xin große Modell“ ( Ernie 3.0 ) kombiniert Wissensgraphen. Vor Wenxin verwendeten die meisten großen LLM- Modelle Klartextdaten. Beispielsweise verfügt der GPT-3- Korpus mit 175 Milliarden Parametern über 570 GB gefilterten Text aus allgemeinen Crawls. Diesen Originaltexten fehlt der explizite Ausdruck von Wissen wie Sprachwissen und Weltwissen. Darüber hinaus werden die meisten großen Modelle autoregressiv trainiert, und solche Modelle zeigen bei herkömmlicher Feinabstimmung eine schlechte Leistung, wenn sie an nachgelagerte Sprachverständnisaufgaben angepasst werden.

Theoretisch wird die Einführung des Wissensgraphen die Leistung von Wenxin beim Verstehen von Problemen und beim Lösen praktischer Probleme in nachgelagerten Anwendungen erheblich verbessern. Daher verwendet Wenxin 3.0 einen 4-TB- Korpus bestehend aus Klartext und einer umfangreichen Wissenskarte als Trainingsdaten und verwendet verschiedene Arten von Vortrainingsaufgaben, damit das Modell effektiver aus wertvollen lexikalischen, syntaktischen und semantischen Informationen lernen kann Wissensstand. Unter diesen propagiert die Vortrainingsaufgabe drei Aufgabenparadigmen, nämlich das Verständnis natürlicher Sprache, die Erzeugung natürlicher Sprache und die Wissensextraktion. Wenxin 3.0 zeigte bei den Wenig-Schuss- und Null-Schuss- Aufgaben Vorteile gegenüber den vorherigen großen Modellen , wodurch seine verschiedenen Indikatoren das damalige SOTA- Modell übertrafen, und gewann den ersten Platz im Super GLUE- Benchmark-Test.

70aaad0abf610c99545f79aceb4127eb.png

Andererseits kann die hervorragende Leistung von ChatGPT bei Zero-Shot/Few-Shot tatsächlich auf den gesamten Prozess der Erstellung von Wissensgraphen zurückgeführt werden, z. B. auf die Verwendung von ChatGPT zur Entitätserkennung, Beziehungsextraktion und Ereignisextraktion Bis zu einem gewissen Grad erreicht Um das hohe Kostenproblem bei der Implementierung der Wissenskarte zu lindern.

Die bei ChatGPT aufgetretenen sachlichen Fehler und Aktualitätsprobleme bestehen jedoch auch in Wissensgraphen. Die Wissenskarte muss auch das Problem der Wissensaktualisierung lösen. Wenn die Wissenskarte außerdem nicht die Richtigkeit unstrukturierter Datenquellen garantieren kann, kommt es später zwangsläufig zu sachlichen Fehlern, die zweifellos Aufmerksamkeit erfordern.

2. ChatGPT + Büroautomatisierung

Im Büroautomatisierungsszenario gibt es bereits eine Vielzahl von Anwendungen auf Phänomenebene in Kombination mit ChatGPT , wie zum Beispiel:

  • ChatPDF kann zunächst das hochgeladene PDF analysieren und einen semantischen Index für jeden Absatz in der Datei erstellen. Wenn der Benutzer eine Frage stellt, sendet das Tool das zugehörige Segment an ChatGPT und lässt es dann in Verbindung mit der Frage interpretieren.

  • ResearchGPT : Sie können das PDF oder den Link des Artikels, den Sie lesen möchten, direkt hochladen , dann den Originaltext des Artikels anzeigen und rechts direkt Fragen stellen.

  • DocsGPT , ein Tool, das das Auffinden von Informationen in der Projektdokumentation vereinfacht. Durch die Integration leistungsstarker GPT- Modelle können Entwickler problemlos Fragen zu Projekten stellen und genaue Antworten erhalten.

  • ChatExcel , diese neue Anwendung, kann die Dateninformationen in der Tabelle direkt mithilfe natürlicher Sprache abfragen, ändern und andere Operationen durchführen, genau wie ein Assistent, der sich mit Excel auskennt .

Wir können jedoch deutlich erkennen, dass sich hinter diesen „ChatGPT+ -Büroautomatisierungstools tatsächlich ein unterstützendes Dokumentstandardisierungs- und Normalisierungsverarbeitungsmodul befindet, das Dokumente in aktuellen komplexen Formaten wie Word/PDF/Doc/Excel usw. effektiv verarbeiten kann . für die Normalisierungsverarbeitung, das Scannen der PDF- Version usw. und verwenden Sie diese als Eingabe. Durch die Kombination mit ChatGPT können die Produktleistung und das Benutzererlebnis erheblich verbessert werden.

Nun, das ist alles für heute. Wir gehen davon aus, dass die Branche die Technologie von ChatGPT genau verfolgen und weitere Möglichkeiten durch die Kombination verschiedener verwandter Technologien und endgültiger Anwendungsszenarien erkunden wird.

Acho que você gosta

Origin blog.csdn.net/qihoo_tech/article/details/129742427
Recomendado
Clasificación