Was machen neben den ChatGPT-Modellen die großen, mittleren und kleinen Hersteller?

Nach der Einführung von ChatGPT haben große Unternehmen hart an „großen Modellen“ gearbeitet, und die Modellfähigkeiten sind zu einem Thema mit größter Besorgnis geworden. Obwohl ChatGPT den Produkttyp eines generativen Dialogroboters basierend auf großen Modellen direkt definiert, hat die Leistungsfähigkeit seines Modells auch dazu geführt, dass alle seine Probleme bei der Produktnutzung ignorieren.

Unabhängig davon, ob es sich um einen großen Hersteller handelt, der zugrunde liegende Modelle entwickelt, um einen kleinen Hersteller, der sich auf die Anwendungsschicht konzentriert, oder um einen unabhängigen Open-Source-Entwickler, konkurrieren sie alle insgeheim um die Produkterfahrung, die über die Modellfähigkeiten hinausgeht, und nehmen daran teil Dieses definierende Spiel mit unterschiedlichen Einstellungen. Die Dialogrevolution neuer Methoden der Mensch-Computer-Interaktion steht vor der Tür.

Was „rollen“ sie also außer Models noch?

Große Hersteller: Konzentrieren Sie sich auf Modelle, die Erfahrung ist etwas „einfach“, auf weniger zu konzentrieren ist mehr

ChatGPT: Dreiteiliges Framework definiert Minimalismus

Als Branchenmaßstab definiert ChatGPT direkt den Industriestandard für generative Gesprächsroboter. In den Anfängen verfügte die kostenlose Version von ChatGPT nur über Dialog-, Dialogverwaltungs- und einfache Themeneinstellungsfunktionen und eroberte mit ihren Modellfunktionen die Welt im Sturm. Da die Anzahl der Benutzer und Beschwerden zunahm, konnte der Produktmanager von ChatGPT nicht still sitzen und begann, nach und nach einige Funktionen hinzuzufügen.

Das Beeindruckendste ist zweifellos „Upgrade auf Plus“, das die Einstellungsseite in der unteren linken Ecke fest dominiert. Auf den ersten Blick gibt es nur zwei Wörter: „Geld hinzufügen“. Darüber hinaus hat ChatGPT nach und nach Funktionen wie Themeneinstellungen und Datenschutzverwaltung hinzugefügt, weist jedoch immer noch eine Zurückhaltung auf, was Bruder Xiao Long durchaus entspricht.

Der Hauptunterschied zur kostenpflichtigen Version von ChatGPT besteht in der Hinzufügung einer Schaltfläche zum Wechseln des Modells und der Hinzufügung von Beta-Funktionen in den Einstellungen. Sie können die Internet-Suchfunktion zum Durchsuchen verwenden oder andere Plug-Ins verwenden.

Bard & Bing: Undifferenzierter Wettbewerb

Die verbleibenden zwei der Großen Drei, Google Bard und Bing Chat, haben ebenfalls ihre eigenen Stile, behalten aber insgesamt immer noch einen minimalistischen Stil bei.

Die funktionale Designlogik von Bard ist fast die gleiche wie die von ChatGPT: Die Konversationsfunktion steht im Mittelpunkt und die erforderlichen Konversationsverwaltungs-, Kontoverwaltungs- und Schnittstelleneinstellungsfunktionen sind integriert. Als Meister der Suche hat Bard außerdem eine auf Dialogen basierende Suchfunktion eingeführt, die auf natürliche Weise Suchen auf der Grundlage von Fragen einleiten und zusammengeführte Ergebnisse präsentieren kann, wodurch das Erlebnis aktueller wird. Die Abfrage von Wetter- und Echtzeitinformationen funktioniert gut.

Große Modelle verfügen beim Generieren von Antworten über mehrere Antworten und entsprechende Gewichtungen. Die Funktion „Andere Antworten anzeigen“ von Bard bietet Benutzern mehr Auswahlmöglichkeiten. Als ich nach dem Wetter in Peking fragte, gab es sogar eine Textversion. Die tabellarische Version und die minimalistische Version sind toll.

Es ist erwähnenswert, dass Bards Antwortgenerierung in Bezug auf die Interaktion eine einmalige Generierung und kein Schreibmaschinenmodus ist (Texte erscheinen einzeln mit einem Schreibmaschineneffekt, siehe ChatGPT). Es fehlt ein Generierungsprozess und die Erfahrung tut dies fühlt sich nicht glatt genug an.

Anders als bei ChatGPT und Google Bard basiert die Positionierung von Bing Chat auf der Suche. Dabei werden Suchbegriffe aus der Eingabe zusammengefasst und anschließend die Suchergebnisse zusammengefasst. In jeder Antwort wird die entsprechende Quelle zitiert, was auch weniger kreativ ist, aber die Quelle ist überprüfbar und die Genauigkeit ist garantiert.

Bing hat auch einen minimalistischen Stil. Das Gesamtdesign der Produktschnittstelle unterscheidet sich nicht wesentlich von den anderen beiden, aber die Farben sind offensichtlich lebendiger. Funktionell gibt es zu Beginn nicht einmal eine Gesprächsverwaltungsfunktion, die Sie nach dem Gespräch löschen können, ohne Spuren zu hinterlassen. Später wurde die Funktion „Letzte Aktivität“ hinzugefügt, mit der Benutzer ihre letzten Konversationen sehen können.

Das einzige Merkmal von Bing ist, dass es drei Dialogstile festgelegt hat: kreativer, ausgewogener und genauer. Anhand dieses Parameters, der dem erweiterten Parameter Temperatur im entspricht, kann ermittelt werden, ob das Modell genauer oder kreativer ist GPT-Modell. . Da es jedoch nicht möglich ist, mehrere Modi gleichzeitig zu vergleichen, ist es für Benutzer schwierig, den Unterschied in der Benutzererfahrung zu spüren. Auch bei kreativeren Optionen mangelt es den Suchergebnissen aufgrund der stärker suchorientierten Positionierung von Bing immer noch an Kreativität.

Im Vergleich dazu ist die Hauptkonkurrenz zwischen den drei Giganten die Modellfähigkeit. Derzeit ist ChatGPT immer noch führend; Bard integriert die Such- und Generierungsmodi besser und die Erfahrung ist besser. Bing fehlt die Highlights im Einsatz, aber mit einem Satz Die GPT- 4-Modell reicht aus, um die meisten Benutzer anzulocken.

Kleine und mittlere Fabriken: Tiefe Anbauerfahrung, Erfahrung und Erfahrung, die über die Möglichkeiten hinausgeht

Anders als die Modellfähigkeiten großer Hersteller konzentrieren sich kleine und mittlere Fabriken sowie einzelne Entwickler mehr auf die Anwendungsschicht über der Modellschicht. Sie verlassen sich auf die zugrunde liegenden Modellfähigkeiten großer Hersteller und haben sich in Bezug auf Funktionalität und Erfahrung durchgesetzt.

Perplexity: So erstellen Sie ein suchbasiertes KI-Konversationsprodukt

Das erste, worüber ich sprechen möchte, ist
Perplexity, eine Konversationssuchmaschine, von der man sagen kann, dass sie Google Bard und Bing Chat in puncto Erfahrung übertrifft. Perplexität bedeutet übersetzt „Perplexität“ und ist ein im Bereich der künstlichen Intelligenz häufig verwendeter Indikator zur Beschreibung der Wirkung von Sprachmodellen. Je kleiner die Perplexität des Modells, desto leistungsfähiger ist das Modell. Perplexity ist ein kleines interdisziplinäres Team mit nur 14 Mitarbeitern, kann aber in Bezug auf die Produktstärke als ein großes Unternehmen und als Vorbild für mehr ist mehr bezeichnet werden.

Basierend auf der dreiteiligen grundlegenden Konversationsarchitektur im ChatGPT-Stil integriert Perplexity vertikale Feldsuche (akademisch, YouTube, Reddit, Wolfram usw.), Suchverlauf, Such-Hotlist und Copilot-Funktionen (ähnlich wie AutoGPT). Das UI-Design übernimmt ein traditionelles Suchlayout mit dem Dialogfeld oben auf dem Bildschirm und dem Eingabefeld ohne Dialograhmen unten. Die Leute können auf einen Blick erkennen, dass es sich bei diesem Produkt eher um ein „Such“-Produkt handelt.

Unter diesem Gesichtspunkt hat Perplexity seine Suchpositionierung deutlicher hervorgehoben als Google und Bing, mit einem klaren Banner und einer klaren Positionierung. Die Logik des Produkts ähnelt der von Bing, einer Zusammenfassung der Suchergebnisse. Nach mehrmaliger Verwendung fühlt es sich an, als seien die Verweise auf die Literatur umfassender und kreativer als Bing. In mehreren Gesprächsrunden fügt Perplexity außerdem verwandte Themen hinzu und prognostiziert anhand der Antworten weitere Fragen, die Sie möglicherweise haben. Wenn alles gut geht, müssen Sie nur einmal fragen, und die verbleibenden Fragen können mit nur einem Klick gelöst werden, wodurch das Erlebnis entsteht sehr weich.

Poe: Das Stichmonster aus „American Zhihu“

Poe ist die offizielle KI-Chat-Anwendung von Quora, dem „amerikanischen Zhihu“. Sie ist mit verschiedenen KI-Diensten wie GPT-3.5, GPT-4, Claude, Midjourney usw. verbunden. Sie ist derzeit das offiziellste „KI-Stichmonster“. ".

Sein größter Marketingargument: Sie können GPT-4 und Claude Instant kostenlos nutzen. Wenn Sie jedoch darauf klicken, werden Sie feststellen, dass GPT-4 nur einmal am Tag und 30 Mal im Monat verwendet werden kann. Das kann man nur sagen besser sein als nichts. Darüber hinaus ist die Produkterfahrung der einzelnen Dienste, abgesehen vom Stitching, sehr grob, es gibt fast nur Konversationsfunktionen und die Langzeitnutzungserfahrung ist schlecht.

Sein offizieller KI-Konversationsassistent Sage bietet in Bezug auf die Benutzererfahrung nichts Einzigartiges und sollte auch ein Modell wie GPT-3.5 verwenden.

Forefront: Die beste Alternative zu ChatGPT

Kostenloses GPT-4 ist fast die effektivste Werbemethode für alle Shell-Anwendungen. Solange Sie über diese Funktion verfügen, können Sie, auch wenn Sie sie nur einmal am Tag verwenden können, eine große Menge an Datenverkehr (PoE) täuschen.

Und
Forefront ist für GPT-4 fast völlig kostenlos. Es stammt aus einem GitHub-Projekt. Es bietet kostenlose GPT-4-Verbindungen für normale Internetnutzer durch Reverse Engineering von Poe, Bing und anderen großen Herstellern, die GPT-4 verwenden. Es hat 37.000 Sterne auf GitHub erzielt und ist fast das am schnellsten wachsende Projekt der letzten Zeit.

Forefront verfügt über integrierte, umfangreiche Persönlichkeitsvoreinstellungen, um den unterschiedlichen Bedürfnissen der Benutzer gerecht zu werden. Personalisierungsvorgaben basieren auf einem klassischen Eingabeaufforderungstrick: Lassen Sie ChatGPT eine bestimmte Rolle spielen, damit seine Antworten genauer sein können. Mit Forefront können Sie mit einem Klick mehrere Persönlichkeiten auswählen, darunter Leonardo da Vinci, Steve Jobs, Softwareentwicklungsingenieure usw., und bietet eine Fülle von Szenariovorlagen, die Szenarien wie Programmierunterstützung, kreatives Schreiben und akademische Forschung erfüllen können.

Shell-Anwendung: Explosion an Details, gute Nachrichten für versierte Spieler

Nachdem wir über die offiziellen Hauptakteure gesprochen haben, stellen wir nun die verschiedenen Shell-Produkte vor, die auf der offiziellen API basieren. Sie optimieren hauptsächlich die Front-End-Interaktion im Hinblick auf die Modellfunktionen und fügen einige Zusatzfunktionen hinzu. Benutzer können ihre eigenen APIs ausfüllen und verwenden.

Diese Art von Produkt eignet sich eher für erfahrene Anwender und als Produktivitätstool, und es gibt viele Details, die individuell angepasst werden können.

ChatBox: Der König der Multiplattform-Clients

ChatBox ist derzeit der ausgereifteste plattformübergreifende KI-Chat-Client. Benutzer können unabhängig auf ChatGPT, den Azure ChatGPT-Dienst, die Claude-API usw. zugreifen. Es hat 117.000 Sterne auf GitHub erhalten und erobert damit die Client-Welt. Für Benutzer, die von Clients besessen sind, ist es auch unter Windows die beste Wahl.

Die Architektur von ChatBox basiert ebenfalls auf der dreistufigen Architektur von ChatGPT, aber jeder Teil fügt weitere Funktionen hinzu, um dem vielfältigen und effizienten Nutzungserlebnis gerecht zu werden. Es legt außerdem eine Vielzahl voreingestellter Programme in der Konversationsverwaltungsfunktion fest, darunter Softwareentwicklung, persönlicher Assistent, Sprachassistent und andere Modi.

In den Einstellungen unterstützt ChatBox auch erweiterte Parameter und eine detailliertere Informationsanzeige: Erstens können Sie die Temperaturparameter anpassen, um die Zufälligkeit und Kreativität der Modellantworten anzupassen; gleichzeitig können Sie die API-Token-Nutzung anzeigen und die Anzahl schätzen von Eingabe- und Ausgabetokens und passen Sie Textgröße, Standardsprache und andere Funktionen an. Nach seiner Verwendung sollte er als der beste Client für Windows angesehen werden.

MacGPT: Wenn es nur einen GPT-Client gäbe, wäre es MacGPT

Der Grund, warum ChatBox nur der beste Desktop-Client für Windows sein kann, liegt daran, dass es auf der Mac-Plattform ein besseres Produkt gibt:
MacGPT.

Dank der Eigenschaften des Mac-Systems unterstützt MacGPT fünf Modi: Web, API, Taskleistenmodus, globales Callout und Intext. Jedes Szenario kann die Anforderungen erfüllen.

Der Webmodus entspricht einem vereinfachten Browserfenster und die gesamte Benutzererfahrung stimmt mit ChatGPT überein; die API-Modus-Erfahrung ähnelt ChatBox und entspricht einem lokalen Mac-Client; der Taskleistenmodus kann das Aufwachen aus der Taskleiste und das Starten von Gesprächen unterstützen Wenn Sie sich jederzeit darauf verlassen, stellt die Taskleiste sicher, dass ChatGPT in jedem Szenario schnell gestartet werden kann, was sehr effizient ist. Der globale Callout-Modus unterstützt das Aufrufen der oberen Konversationsleiste über Hotkeys und das sofortige Starten einer Konversation. Jeder, der Alfred verwendet hat, sollte
verstehen wie reibungslos diese Erfahrung ist.

Der Intext-Modus ist noch erstaunlicher, er ist einfach eine Killerwaffe für Textarbeiter. Wenn Sie in einer beliebigen Texteingabeumgebung (Memo, Word usw.) etwas eingeben /gpt, wird der nachfolgende Inhalt als Eingabe für ChatGPT verwendet und Antworten werden direkt in der aktuellen Textumgebung generiert. Sie können ChatGPT für Fragen und Antworten verwenden, ohne die Anwendung wechseln zu müssen. und direkt in das Dokument eingefügt, handelt es sich lediglich um eine globale Version von Notion AI, die in die Luft gesprengt werden muss.

ChatGPT-Next: Cloud-Service-KI-Assistent für alle

Wenn ich mich für einen webseitigen ChatGPT-Shell-Client entscheiden muss, würde ich
ChatGPT-Next gerne als den König der persönlichen Assistenten bezeichnen.

Sein Autor hat nicht nur diese Webanwendung entwickelt, sondern auch die Funktion der One-Click-Bereitstellung auf Vercel (Front-End-Hosting-Server). Das heißt, mit nur einem API-Schlüssel und ein paar Klicks kann jeder seinen eigenen exklusiven ChatGPT-Client haben, für den persönlichen Gebrauch, den Teamgebrauch oder als Service für andere, es ist kinderleicht.

Der Autor schickte den von mir bereitgestellten Client erfolgreich an meine Eltern und meine Oma, was ihnen einen kleinen KI-Schock versetzte. Oma machte mir sogar gerne eine große Schüssel geschmortes Schweinefleisch.

Auch in Bezug auf die Produktfunktionen ist ChatGPT-Next mit 20 voreingestellten Persönlichkeiten und Anwendungsszenarien ein Meister und unterstützt die Anpassung; in Bezug auf erweiterte Parameter, Modellauswahlmodell, Zufallstemperatur, maximale Anzahl an Einzelantworten und Präsenzstrafe für Themenfrische, Alles kann genau an das Bedarfsszenario angepasst werden. Gleichzeitig stellt die Komprimierung der historischen Nachrichtenlänge im Dialogmanagement auch eine Funktion auf Königsebene dar. Sie kann den Kontext zusammenfassen, wenn die Anzahl der Kontexte ein bestimmtes Token erreicht, und den vorherigen Speicher löschen, wodurch die Tokenbelegung effektiv reduziert und der Dialog länger wird dauerhaft. Schließlich ist die Benutzeroberfläche auch die am besten anpassbare aller Apps. Schriftarten, Sprache, Sendevorschau und kompakte Rahmen können angepasst werden.

In Bezug auf den Funktionsumfang und den Grad der Anpassung von Shell-Produkten ist ChatGPT-Next in allen Richtungen am stärksten. Es bietet die beste Erfahrung nach längerer Nutzung. Die Geschwindigkeit der API-Nutzung wird auch schneller sein als die offizielle Geschwindigkeit verschiedener Dienstleistungen. Es ist die erste Wahl für Produktivitätsspieler.

Inländische Großhersteller: Schneller Zugang zum Ökosystem, Startups sind einen Schritt schneller

DingTalk, Feishu und WeChat, die drei größten Büro-IM-Giganten in China, hatten bisher alle inoffiziellen Open-Source-Zugang zu KI-Robotern. Ein inländisches Startup-Unternehmen hat im Rahmen eines Marathonprojekts in der Open-Source-Community eine KI-Dialogrobotermatrix basierend auf DingTalk und Feishu entwickelt und dabei Multimodalität (ChatGPT, DALL·E + Whisper, Midjourney), Bilderstellung, Tabellenanalyse, Dokumentenexport integriert. Es können themenübergreifende Diskussionen, Formelberechnungen und andere Funktionen realisiert werden. Sogar die API wird kostenlos zur Verfügung gestellt, was die Stärkung des Unternehmens wirklich ermöglicht und es Hausangestellten ermöglicht, die ersten Akteure zu werden, die KI nahtlos nutzen können.

In Bezug auf ToB-Funktionen sollten inländische Startups weltweit an der Spitze stehen. Sie haben die Produktentwicklung abgeschlossen und können schnell entsprechend den Unternehmensbedingungen eingesetzt werden, wobei sie sich auf IM verlassen, um KI-Effizienzverbesserungen in Büros zu erzielen. Schnelle Bereitstellung mit einem Klick, KI-Berechtigungsverwaltung auf Unternehmensebene, Benutzerimport- und -exportnutzungsdatensätze, Abfangen von Risikowörtern usw. ermöglichen Unternehmensbenutzern eine reibungslose Nutzung.

WeChat verfügt auch über entsprechende Open-Source-Roboter, aber aufgrund der Einschränkungen der WeChat-Plattform selbst sind die Funktionen von WeChat-Robotern stark eingeschränkt. Grundsätzlich werden die offiziellen Funktionen in das WeChat-Dialogfeld verpflanzt.

Berichten zufolge integriert Meituan auch intern Gesprächsroboter, um den Mitarbeitern zu helfen, ihre Arbeitseffizienz zu verbessern. Der Xiaomei-Assistent verfügt über mehrere integrierte benutzerdefinierte Szenarien und Eingabeaufforderungen, um den Mitarbeitern den schnellen Einstieg zu erleichtern. Das Gesamterlebnis unterscheidet sich nicht von ChatGPT.

Die offiziellen Kunden anderer großer inländischer Modellhersteller versuchen alle immer noch, das Niveau von GPT-3 einzuholen, und sie befinden sich immer noch in einem geheimen Zustand. Es ist schwieriger, Erfahrungsqualifikationen zu erlangen als ausgereifte Produkte. Es gibt also viele Ich werde vorerst keinen Kommentar abgeben, aber es sollte bestätigt werden, dass es keine überraschenden Features mehr geben wird.

ChatGPT: Der App Store erreicht die Spitze, das Zeitalter der mobilen KI bricht an

Lassen Sie uns abschließend über ChatGPT sprechen.

Am 18. Mai wurde ChatGPT im App Store gestartet und stand schnell an der Spitze der iOS-Downloadliste. Auch ChatGPT auf der mobilen Seite hebt die Einfachheit hervor, es ist jedoch zu erkennen, dass einige Anstrengungen in die gesamte Interaktion gesteckt wurden: Die reguläre Konversationsschnittstelle hat Vibrations-Feedback für Antworten hinzugefügt, sodass es sich anfühlt, als wäre es die KI auf der anderen Seite Tippen und das Erlebnis ist überwältigend; gleichzeitig kann die Interaktion mit dem linken Wischen die Konversationsverwaltungsfunktion aufrufen, die Interaktion mit dem rechten Wischen kann eine neue Konversation eröffnen, die Logik ist klar; die allgemeine Benutzerfreundlichkeit ist auch sehr gut, viel besser als die Erfahrung im Web.

Die aktuellen Anwendungsszenarien des mobilen Endgeräts sind jedoch sehr begrenzt, und die meisten Menschen in ihrer Umgebung verwenden es als Wiki-Fragen und Antworten. Ohne die Unterstützung von Plug-Ins und Netzwerken verfügt das mobile Endgerät derzeit nicht über viele Anwendungsszenarien und Produktivität In mehreren Szenarien ist das Web-Terminal effizienter und kollaborativer. Reibungsloser – schließlich kann ich mein Telefon nicht eingeschaltet lassen, wenn ich bei der Arbeit bin.

Der iOS-Client löst jedoch die Schwierigkeit, ChatGPT plus aufzuladen. Er kann direkt über den App Store abonniert werden, sodass viele Benutzer GPT-4 endlich bequem nutzen können.

Das Potenzial des mobilen Endgeräts ist natürlich riesig. Jetzt ist ChatGPT gerade zu Ende gegangen, aber sein strategisches „Ich will alles“ ist zu erkennen. In der Vergangenheit gab es Poe- und Snapchat-Mobilterminals. ChatGPT hat zweifellos die Wettbewerbslandschaft der Mobilterminals verändert. Wir werden abwarten, wie sich daraus in Zukunft entwickeln wird.

Zusammenfassung

Die durch ChatGPT hervorgerufenen KI-Änderungen werden die Entwicklungsrichtung der Gesellschaft tiefgreifend verändern. Jetzt ist es eine chaotische Kampfsituation, und jeder versucht mit aller Kraft, etwas zu tun. Allerdings sind Modelle nichts, was normale Menschen tun können, so dass immer mehr Produkte mit Schwerpunkt auf Szenarioanwendungen entstanden sind, die auch Unternehmern und Entwicklern viele Ideen für KI-Anwendungen liefern.

Darüber hinaus ist die Lokalisierung ein weiteres wichtiges Thema. Die großen inländischen Hersteller hinken dem Fortschritt offensichtlich hinterher, aber die Anwendungsschicht hat bereits die Führung übernommen und verfügt über viele nützliche Produkte. Hier wird es den intensivsten Wettbewerb und die meisten Möglichkeiten geben in der Zukunft. Wenn Sie auf der großen Welle der KI reiten, könnten Sie genauso gut ein fliegendes Schwein sein.