Apropos ChatGPT und Q&A BI

Kürzlich ging im Guanyuan Data G-park „Let's Date! BI!“ die zweite Live-Übertragung der Serie „2023, wie die Finanzindustrie mit „wandernden Daten“ umgehen soll“ erfolgreich zu Ende. Byte, der Mitbegründer und Chefdatenwissenschaftler von Guanyuan Data, brachte die Erkundung und Überlegung zum Thema „Talking about ChatGPT and Q&A BI“ ein .

Einerseits führte Byte eine Reihe von Tools ein, die auf großen Sprachmodellen wie ChatGPT basieren , um die tägliche Arbeits- und Lebenseffizienz zu verbessern, andererseits im Bereich BI und Datenanalyse, Konversation oder Frage-und-Antwort BI wird der Fantasie der Zukunft endlose Möglichkeiten eröffnen .

Sprechen Sie über ChatGPT

Die aus der Arbeits- und Lebensperspektive herbeigeführten Verbesserungen werden hier aus der Perspektive des Lesens, Schreibens von Code und verschiedener Kreationen entfaltet. 

suchen

Als ChatGPT zum ersten Mal geboren wurde, sagten viele Leute, dass es Google untergraben würde. Denn es stellt sich heraus, dass man, um Wissen zu finden, nach Schlüsselwörtern bei Google oder Baidu suchen muss. Aber nach der Suche wird das Ergebnis Zehntausende Webseiten sein, und wir müssen einen nach dem anderen auf die Links klicken, um die Informationen anzuzeigen. Davon sind möglicherweise 10 von 10 Links nur für die Frage relevant. Wenn wir keine relevanten Informationen finden, müssen wir Schlüsselwörter erneut eingeben und erneut suchen.

In ChatGPT können Fragen direkt beantwortet werden. Allerdings weist ChatGPT zwei Mängel auf: Zum einen sind die Informationen nur bis 2021 verfügbar, zum anderen gibt es keine neuen Informationen, die nicht online sind und nicht aktuell sind.

New Bing integriert das ChatGPT-Modell. Wenn wir eine Frage eingeben, wird nicht nur die Suche ausgelöst, sondern auch automatisch die Webdokumente durchsucht, relevante Informationen zusammengefasst und die Ergebnisse direkt zurückgegeben. Nehmen Sie als Beispiel das Codeproblem: Die normale Suche springt zu relevanten Arten von Entwicklungswebsites wie CSDN, während New Bing den ausführbaren Code direkt auflistet. Das ist sehr praktisch und effizient.

Gleiches gilt für die Suche innerhalb eines Unternehmens. Im internen Informationsmanagementsystem eines Unternehmens ähneln die meisten Suchanfragen Google. Geben Sie Schlüsselwörter ein und es wird ein Dokumentlink angezeigt, der eine Übereinstimmung zwischen dem Titel und dem Inhalt des Textes enthält. Dies muss auch einzeln gefunden werden. Zu diesem Zeitpunkt wird das direkte Feedback durch den Abschluss der GPT-Fähigkeit viel Zeit sparen.

Neben New Bing gibt es mit  perplexity.ai  und  you.com zwei weitere Projekte  , auf die direkt zugegriffen werden kann und die ebenfalls Fragen und Antworten ähnlich wie ChatGPT bereitstellen. Suchen Sie nach einer Frage, und die Antwort wird direkt beantwortet und relevante Referenzlinks werden darin eingefügt. Dies ist ein großartiges Produkt zur Leistungssteigerung.

lesen

Lesen Sie hier mehr über zwei hervorragende Produkte  : Bearly.ai  und  TLDR . Bearly.ai ist ein Browser-Plugin. Wenn ein Benutzer einen langen Artikel öffnet, wird der Inhalt des Artikels automatisch zusammengefasst, die Schlüsselstruktur extrahiert und die Leseeffizienz effektiv verbessert. Darüber hinaus verfügt das Plug-in über eine wichtige Funktion: Es kann die Benutzerbewertungen von Produkten auf Amazon und anderen Shopping-Websites durchsuchen und die positiven und negativen Bewertungen zusammenfassen.

Innerhalb des Unternehmens bestehen häufig ähnliche Anforderungen, einschließlich E-Mail, WeChat-Kommunikation und sogar externer Kommentare. Durch die Möglichkeit, Informationen zu sammeln und auf dem GPT-Modell zu basieren, können Sie die Vor- und Nachteile von Produktdienstleistungen schnell erkennen.

suchen + lesen

Zusätzlich zur Suche verfügt Google über  ein Talk to Books-  Produkt. Wenn die Frage gestellt wird, wird der Originaltext zur Frage aus den veröffentlichten Büchern in der Geschichte extrahiert und das Quellbuch angezeigt.

Hierbei handelt es sich um Frage-und-Antwort-Suchen, nicht um strenge Stichwortübereinstimmungen. Wenn es sich nur um eine Keyword-Übereinstimmung handelt, ist die Effizienz nicht hoch. Wenn wir beispielsweise nach dem Schlüsselwort „Fehlerrate“ suchen, erhalten wir viele irrelevante Informationen, da wir nicht wissen, „welche Art von Fehlerrate“ wir wollen. Wenn aber Fragen im Detail durch natürliche Sprache gestellt werden, kann das Modell die Semantik automatisch verstehen und relevante Dokumente für eine umfassende Darstellung finden. Dies ist ein großer grundlegender Fortschritt und verbessert das Produkterlebnis.

schreibe den Code

Es gibt auch viele ausgereifte Anwendungen im Code, die automatisch Code durch Anmerkungen generieren oder die Codeausrichtung für semantische Anmerkungen auswählen und sogar die Leistung testen und überprüfen usw. Es gibt bekannte ChatGPT, Copilot,  Tabnine , CodeGeeX usw. und es gibt auch einige spezielle Tools zur Feldgenerierung, wie z. B. die integrierte KI-Funktion in Warp, die Terminalbefehle generieren kann, und die Chat2Query  , die zuvor von PingCAP erstellt  wurde Helfen Sie bei der automatischen Generierung von SQL und  geschäftsorientierteren Datenanalysetools wie Seek.ai , Manson usw.

Neben der Codegenerierung gibt es auch  Codium zur automatisierten Testgenerierung, Mintlify zur automatischen Dokumentengenerierung  und Bito mit verschiedenen integrierten Funktionen  .

Schaffung

Nehmen Sie im Bereich der Erstellung das Beispiel „Schreiben eines Plans zur Verbesserung der Softwarequalität“. Wir generieren 10–20 gute Planungsvorschläge über  notion.ai  und können die sekundäre Liste durch interaktive Anweisungen und Zeitplan für die Ausführung weiter erweitern.

Diese Tools können vernünftige Pläne entwerfen, wenn Sie bei der Arbeit verschiedene Pläne erstellen müssen. Auf dieser Basis und in Verbindung mit der tatsächlichen Situation des Unternehmens müssen wir nur noch individuelle Anpassungen vornehmen.

schnelles Engineering

Seit der Einführung von ChatGPT wird die Arbeit vieler Menschen in ChatGPT erledigt. Hier stellt sich die Frage: Wie sollten wir besser Fragen an ChatGPT stellen? Da ChatGPT über eine starke Antwortfähigkeit verfügt, müssen wir das Problem jedoch klar genug beschreiben, damit qualitativ hochwertige Antworten gegeben werden können. 

Hier stellen wir eine Reihe von Tools vor, die uns daran erinnern sollen, wie wir Fragen stellen können, wenn wir eine Szenenfrage haben. Diese Tool-Websites bieten schnelle Wortvorlagen, die uns helfen, bessere Fragen zu stellen. Darüber hinaus erfolgt der Austausch hochwertiger Frageerfahrungen anderer Nutzer. 

häufiges Problem

Das ChatGPT-Produkt selbst weist einige häufige Probleme auf:

  •  ChatGPT-Antworten können erfunden sein;

  • Kennen Sie nur die Informationen, die vor 21 Jahren im Internet veröffentlicht wurden;

  • Fragen der Datenschutzsicherheit.

Als Reaktion auf das Phänomen der zufälligen Herstellung gibt es derzeit einige Methoden, die optimiert werden können. Wenn Sie beispielsweise fragen „Wie ist die Leistung eines bestimmten Unternehmens?“ Wenn das Unternehmen die Daten überhaupt nicht offengelegt hat, kann es sein, dass es falsche Daten liefert, die eigentlich falsch sind.

Zu diesem Zeitpunkt benötigen wir einige schnelle Worte und konstruieren den Kontext der Antwort, wodurch die Situation einer zufälligen Erfindung weitgehend vermieden werden kann. Darüber hinaus können Sie für die Aktualität der Informationen New Bing verwenden. New Bing kombiniert die Zusammenfassungsfähigkeit von ChatGPT und kann basierend auf seiner eigenen Suchfunktion die neuesten Informationen abrufen, wodurch die Wahrscheinlichkeit einer zufälligen Fälschung stärker verringert wird.

Einschränkungen für öffentlich verfügbare Informationen. Innerhalb des Unternehmens kann eine Informationseingabe zur Weiterbildung erfolgen, um die Informationsbreite des Modells zu verbessern. Beispielsweise gibt es in den externen Informationen vor 2021 keine Informationen wie „Das Maskottchen von Guanyuan Data ist Guanxiaoyuan“. Wenn die Informationen an das Modell übermittelt werden, kann es weiter trainiert werden.

Hier verteilt wird es viele praktische Anwendungen geben. Viele Unternehmen verfügen über Hilfedokumente. Nehmen Sie als Beispiel die Hilfedokumente für Guanyuan Data BI-Produkte. Obwohl jeder die Hilfedokumentation einsehen kann, besteht eine hohe Wahrscheinlichkeit, dass ChatGPT sie nicht in den Schulungsprozess einbezieht. Mithilfe der Methode der erneuten Informationseingabe können dann die von Guanyuan Data veröffentlichten BI-Produktinformationen an das Modell übermittelt und anschließend Fragen gestellt werden. Auf diese Weise wird es zu einem intelligenten Q&A-Roboter, der auf das Unternehmen zugeschnitten ist.

Für Fragen der Datensicherheit. Am Beispiel geschäftlicher Probleme, um beispielsweise den Umsatz des letzten Quartals zu erhalten, übermitteln wir die Schemainformationen anstelle der vollständigen Datentabelleninformationen an ChatGPT und lassen ChatGPT SQL zurückgeben. Wir können diese SQL-Suche dann verwenden, um Daten intern abzurufen, wodurch Datenlecks effektiv vermieden werden können. Wenn es sich außerdem um sehr sensible Daten handelt, glaube ich, dass diese in Zukunft privat und vollständig außerhalb des öffentlichen Netzwerks bereitgestellt werden können und auch die Datensicherheit bis zu einem gewissen Grad gewährleistet werden kann. 

KI-Denken

Wenn wir über die Verwendung so vieler KI-Produkte sprechen, können wir feststellen, dass im KI-Zeitalter viele repetitive Arbeiten, sogar geistige Arbeit und Wissensarbeit, die früher viel Zeit in Anspruch nahmen, jetzt durch ChatGPT ersetzt werden können. Welchen Wert sollten wir Menschen also in der neuen Ära spielen? Was für Dinge wirst du tun?

Erstens müssen wir die grundlegende Funktionsweise der KI verstehen und ihr Funktionsprinzip grob verstehen; zweitens müssen wir den Unterschied zwischen KI und menschlicher Intelligenz verstehen, was KI gut kann und was sie nicht kann; schließlich , wie wir die tägliche Arbeit der KI übergeben können, welche Dinge wir selbst tun.

Wenn wir KI sinnvoll nutzen können, glaube ich, dass unsere Arbeitseffizienz um ein Vielfaches verbessert werden kann. Hier konzentriere ich mich darauf, mein persönliches Verständnis des Unterschieds zwischen Mensch und KI zu teilen.

  • Das erste ist kritisches Denken und Kreativität. Daran mangelt es der KI sehr, denn die KI kann Dinge nur tun, nachdem sie unsere Anweisungen erhalten hat.

  • Das zweite ist Empathie. Für die KI ist es schwierig, die Situation des Benutzers zu verstehen, aber es ist einfacher, sie zwischen Menschen zu verstehen.

  • Schließlich können Menschen mit Empathie Produktideen konzipieren, spezifische Prototypen erstellen und nachfolgende Produktveröffentlichungen testen und iterieren. Das sind Dinge, in denen Models nicht besonders gut sind.

Aber im oben genannten Prozess kann chatGPT eine sehr gute Hilfsrolle spielen. Beispielsweise kann es uns bei der Produktkonzeption dabei helfen, ein Brainstorming durchzuführen und Schlüsselideen aufzulisten.

Gedanken zur Frage-und-Antwort-BI

In  der gesamten Verknüpfung „Problemdefinition-Datenzugriff-Datenverarbeitung-Visualisierungsanzeige-interaktive Analyse-Entscheidungsfindungsaktion“ der BI-Datenanalyse bietet ChatGPT die Möglichkeit, diese zu kombinieren.

  • Problemdefinition: Für einige Szenarioprobleme können auf der Grundlage von ChatGPT vorläufige Datenanalysen und Entscheidungspläne abgerufen sowie manuelles Korrekturlesen und Ändern durchgeführt werden.

  • Datenzugriff: Früher mussten unstrukturierte Daten normalerweise bereinigt werden, aber jetzt müssen einige Daten möglicherweise nicht mehr bereinigt werden und eine End-to-End-Analyse kann direkt durchgeführt werden;

  • Datenverarbeitung: Unterstützung von Dateningenieuren bei der ETL-Entwicklung. Während des ETL-Entwicklungsprozesses generiert ChatGPT durch Fragen in natürlicher Sprache SQL, das Benutzer verwenden können, und kann mehrere Runden interaktiver Konstruktionen durchführen. Auch wenn im ersten Schritt eine Abweichung vorliegt, kann diese im zweiten Schritt erneut korrigiert werden;

  • Visuelle Präsentation: Beantworten Sie Geschäftsfragen und erhalten Sie schnell Datenergebnisse und Schlussfolgerungen. Nach dem Absenden der Frage wird automatisch SQL generiert und dann an ChatGPT übermittelt, um Textschlussfolgerungen und Folgeaktionsvorschläge zu generieren und Frage-und-Antwort-BI zu realisieren.

  • Interaktive Analyse: Automatische Erstellung detaillierter Analyseberichte. Stellen Sie basierend auf den Funktionen des BI-Systems eine Verbindung zu verschiedenen Datenquellen innerhalb des Unternehmens her und stellen Sie glaubwürdige Geschäftsanalyseberichte auf der Grundlage zuverlässiger Datenindikatorquellen bereit. Die automatische Identifizierung abnormaler Ursachen hat geschäftliche Bedeutung und wird in natürlicher Sprache angezeigt, wodurch kognitive Verzerrungen vermieden werden, die durch Unterschiede in den Datenanalysemethoden verursacht werden.

  • Maßnahmen zur Entscheidungsfindung: Stellen Sie Hilfsprognosen bereit und geben Sie zukünftige Empfehlungen auf der Grundlage historischer Maßnahmen.

Der Schwerpunkt liegt auf der Weitergabe einiger Versuche und Untersuchungen von Guanyuan-Daten in den Bereichen „Datenverarbeitung“, „Visualisierungsanzeige“ und „interaktive Analyse“ .

Chat2SQL

Chat2SQL ist ein Browser-Plugin, das wir zur Unterstützung der Datenverarbeitung entwickelt haben. Wenn Sie SQL schreiben müssen, können Sie das Plug-in mit einem Klick aktivieren. Durch Interaktion in natürlicher Sprache kann das Plug-in automatisch SQL generieren.

Interaktives Befragen kann viele Vorteile bringen. Erstens kann es Fehler kontinuierlich korrigieren. Am Anfang kann es zu Abweichungen kommen, aber mit zunehmender Interaktion kann es korrekte Ergebnisse liefern; zweitens kann es bei der Arbeit mit sehr komplexem SQL interaktiv SQL Schicht für Schicht generieren und aufbauen a Das Endergebnis ist ebenfalls sehr genau. Dies wird ein neues Paradigma für das Bauen sein.

Chat2Viz

Im Hinblick auf die visuelle Anzeige, also die Anzeige visueller Inhalte direkt nach dem Stellen von Fragen, war es für uns tatsächlich etwas mühsam, interaktive Analysen im BI-Dashboard durchzuführen, aber wenn wir die Ergebnisse über eine Suche wie Google anzeigen, ist das großartig Verbesserung.

Am Beispiel des ausländischen ThoughtSpot-Produkts werden in der Suchleiste visuelle Inhalte anhand von Schlüsselwörtern wie Conversion-Rate, Kanal und letzter Monat angezeigt. Es handelt sich nicht um einen Satz natürlicher Sprache. Die eigentliche natürliche Sprache sollte lauten: Wie hoch war die tägliche Conversion-Rate im letzten Monat?

Wir haben einen Produktprototyp Chat2Viz erstellt. Führen Sie zunächst eine Abfrage in natürlicher Sprache im Eingabefeld durch. Das Produkt generiert automatisch Abfrage-SQL und sendet es an ChatGPT, um Textschlussfolgerungen, visuelle Inhalte, Empfehlungen für andere Karten und Vorschläge für Folgemaßnahmen zu generieren. Dies ist für den geschäftlichen Einsatz sehr praktisch.

Chat2DataStory

Kann Chat2Viz eine „DataStory“ bilden, wenn daraus ein Follow-up wird? DataStory hat eine notwendige Voraussetzung, es erfordert eine Best Practice.

Denn wenn DataStory nur Daten bereitstellt, aber nicht über eine Verknüpfungslogik für die Geschäftsanalyse verfügt, ist dies für das Unternehmen selbst nicht von großem Nutzen. Ein E-Commerce-Kunde stellte beispielsweise fest, dass der Tmall-Kanal durch Daten den größten geschäftlichen Einfluss hat, aber das ist eine offensichtliche Tatsache, die dem Unternehmen nicht hilft. Daher sollte DataStory Informationen bereitstellen, die für das Unternehmen wirklich hilfreich sind.

In diesem Zusammenhang hat Guanyuan Data „automatische Dateneinsicht“ geschaffen. Der Kern davon ist der komplexe Analyse-„Entscheidungsbaum“, der die Analyseszenarien verschiedener Branchen prägt. Wir können die Analyse von Entscheidungsbaumverknüpfungen regelmäßig, vielleicht täglich oder wöchentlich, durchführen.

Basierend auf dem Analyselink des Entscheidungsbaums können Benutzer jeden Tag automatisch den Analysebericht des Entscheidungsbaums sehen. Wenn kein Problem vorliegt, beweist dies, dass die heutigen Daten normal sind. Wenn eine ungewöhnliche Situation vorliegt, wird ein auffälliges Zeichen angezeigt und dem Benutzer wird mitgeteilt, wo das Problem liegt und wo der Kern des Problems liegt. Dies ist ein Prototyp von DataStory. Und Follow-up-Benutzer werden in den wöchentlichen und monatlichen Besprechungen weiterhin zusätzliche Fragen von allen sammeln und sogar ungewöhnliche Fragen stellen, die weiter in den Entscheidungsbaum eingespeist werden und schließlich zu einer echten DataStory werden.

In Zukunft kann DataStory mehrere Interaktionsrunden unterstützen, einschließlich künftiger täglicher Fragen und der Präsentation eines Datenberichts. Dieser Bericht kann auch verwendet werden, wenn eine Besprechung zur Diskussion erforderlich ist. Und auf der Grundlage dieses Berichts ist es für die Zukunft eine sehr attraktive und spannende Entwicklungsrichtung, Untersuchungen durchzuführen und tiefergehende Analysen durchzuführen.

Guess you like

Origin blog.csdn.net/GUANDATA_/article/details/130011309