Intelligente Lautsprecher erhalten mit ChatGPT „neues Leben“?

Intelligente Lautsprecher, einst bei Sprachassistenten beliebt, haben sich in den letzten Jahren auf dem Markt nicht gut behauptet. Laut dem neuesten Bericht „Monthly Tracking of China’s Smart Speaker Retail Market“, der von Luotu Technology veröffentlicht wurde, wird der Gesamtabsatz von Smart Speakern in China im Jahr 2022 26,31 Millionen Einheiten betragen, was einem Rückgang von 28 % gegenüber dem Vorjahr entspricht 7,53 Milliarden Yuan betragen, was einem Rückgang von 25 % gegenüber dem Vorjahr entspricht. Die von IDC veröffentlichten zehn wichtigsten Einblicke in den chinesischen Smart-Home-Markt im Jahr 2023 zeigten auch, dass die Marktnachfrage nach Smart-Lautsprechern allmählich nachlässt und der gesamte Markt einen Abwärtstrend aufweist.

Mit der rasanten Entwicklung von ChatGPT, einer generativen KI-Technologie, wird jedoch erwartet, dass mit ChatGPT ausgestattete intelligente Lautsprecher neuen Raum für Wachstum gewinnen. Laut der Analyse von Zhongtai Securities gibt es derzeit mehr als 700 Millionen intelligente Lautsprecher auf der Welt. Wenn man davon ausgeht, dass der Austauschzyklus des Produkts selbst etwa 3 bis 5 Jahre beträgt, kann der Ersatzbedarf, der durch diese ChatGPT-Runde entsteht, höher sein 140-200 Millionen Einheiten pro Jahr, was sich voraussichtlich zu einem weiteren Markt-Hotspot entwickeln wird. Auf dieser Grundlage soll auch das interaktive Niveau intelligenter Lautsprecher ein neues Niveau erreichen.

ChatGPT könnte eine neue Variable werden

Lange Zeit hatten intelligente Lautsprecherprodukte auf dem Markt mehr oder weniger Probleme wie ein schlechtes interaktives Erlebnis, einzelne Anwendungsszenarien, mangelnde Produktinnovation und eine schlechte Verbindung. Allerdings wird die aktuelle generative KI-Technologie, die durch ChatGPT repräsentiert wird, im Kontext verstanden. Durch mehrere Dialogrunden, die Generierung von Inhalten usw., die ein sehr hohes Maß an Interaktion zeigen, kann ChatGPT intelligente Lautsprecher mit neuen Variablen versorgen.

Erstens werden die Anwendungsszenarien intelligenter Lautsprecher weiter erweitert, indem man sich auf die Vorteile von ChatGPT bei der Generierung und dem Verständnis von Inhalten verlässt. ChatGPT bietet Anwendungsvorteile in verschiedenen Szenarien wie Dialogsystem, Textgenerierung, Spracherkennung und Textklassifizierung. Insbesondere im Dialogsystem kann ChatGPT natürliche und reibungslose Dialoginhalte generieren und mehrere Dialogrunden unterstützen; bei der Textgenerierung kann ChatGPT qualitativ hochwertige Textinhalte generieren und eine Vielzahl von Textgenerierungsaufgaben unterstützen; bei der Spracherkennung unterstützt ChatGPT mehrsprachige Spracherkennung und bietet ein umfassendes Sprachinteraktionserlebnis; bei der Textklassifizierung kann ChatGPT auf eine Vielzahl von Textklassifizierungsaufgaben angewendet werden, automatisch Funktionen erlernen und Klassifizierungseffekte und -effizienz verbessern. Die Vorteile der Mehrfeldanwendung von ChatGPT machen es zu einem der wichtigsten Werkzeuge im Bereich der Verarbeitung natürlicher Sprache.

Mit anderen Worten: Intelligente Lautsprecher, die mit ChatGPT ausgestattet sind, können die Absichten des Benutzers besser verstehen, sodass die Qualität des Antwortinhalts näher an der Leistung echter Menschen liegen kann. In Zukunft wird die Funktion intelligenter Lautsprecher möglicherweise nicht nur auf das Zuhause beschränkt sein, sondern auch im Büro Einzug halten und zum Assistenten für Menschen bei der Arbeit werden.

Zweitens treibt ChatGPT auch die Smart-Speaker-Branche dazu, in den Fokus des Kapitals zu rücken. Mit der weltweiten Beliebtheit von ChatGPT sind intelligente Lautsprecher als Träger der Interaktion mit künstlicher Intelligenz erneut zu einem Hotspot auf dem Markt geworden. Konzeptbestände intelligenter Lautsprecher, darunter Fenda Technology, Edifier, Hivi Technology, Guoguang Electronics usw., haben dies getan In letzter Zeit gab es einen starken Anstieg des Marktes, die Anzeichen eines Kapitalzuflusses sind sehr offensichtlich. Man kann sagen, dass in dem Moment, in dem die Smart-Speaker-Branche in eine Engpassphase geraten ist, das Aufkommen von ChatGPT Smart Speaker wieder in den Fokus der Öffentlichkeit gerückt und ihnen neue Möglichkeiten eröffnet hat.

Wie viele neue Variablen ChatGPT der Smart-Speaker-Branche bringen kann, wird sich natürlich erst zeigen, wenn Smart-Speaker, die mit ChatGPT ausgestattet sind, tatsächlich in Tausende von Familien Einzug halten.

Xiaodu ist schlauer

Bisher hat sich die Kombination aus intelligenten Lautsprechern und generativer KI-Technologie bei großen Playern durchgesetzt. Es wird berichtet, dass Xiaodu am 9. Februar dieses Jahres angekündigt hat, Wenxin Yiyan zu integrieren, um ein KI-Modell „Xiaodu Lingji“ für Smart-Device-Szenarien zu erstellen und es auf alle Xiaodu-Produkte anzuwenden. Mit Hilfe des Xiaodu Lingji-Modells kann der Sprachassistent im Xiaodu Smart Speaker zum „Superassistenten“ werden.

Erstens sind Xiaodu-Smart-Lautsprecher mit Hilfe des großen Modells von Xiaodu Lingji in der Lage, komplexe Informationen zu extrahieren und zu integrieren. Im offiziell veröffentlichten Testvideo teilt der Tester dem Superassistenten mit, dass er am Wochenende verschiedene Dinge tun wird, und bei der Beschreibung dieser Dinge wird der Tester bewusst nach „Änderungszeit“ fragen, z. B. Das A-Ereignis soll am Sonntag erledigt werden wird durch das B-Ereignis ersetzt. Selbst angesichts einer Reihe komplexer Anforderungen von Testern kann dieser Superassistent wirklich effektive Informationen daraus extrahieren und entsprechend einen korrekten Zeitplan für Tester erstellen.

Die vorherigen intelligenten Lautsprecher von Xiaodu waren jedoch nicht in der Lage, solch komplexe Informationen zu verstehen, zu extrahieren und zu integrieren. Es ist ersichtlich, dass die Rolle des Xiaodu Lingji-Modells offensichtlicher ist.

Zweitens kann das große Xiaodu Lingji-Modell in der Gerätesteuerungsverbindung in der Smart-Home-Szene die tatsächlichen Bedürfnisse der Benutzer genauer identifizieren. In der Smart-Home-Szene lässt sich das große Modell von Xiaodu Lingji in einen „Smart Butler“ verwandeln. Im offiziellen Test sagte der Tester dem Smart Butler beispielsweise, dass er jeden Morgen um 7:30 Uhr aufstehen müsse, und das auch Am Wochenende kann es später sein, etwa um 9 Uhr. Einfach um halb neun darf die Innentemperatur im Winter nicht unter 23 Grad liegen und kann im Sommer auf 26 Grad eingestellt werden. Zu diesem Zeitpunkt kann der Superassistent anhand dieser Beschreibungen bestimmen, wann die Klimaanlage im Haus eingeschaltet werden soll und auf welche Temperatur er eingestellt werden soll.

Im Vergleich zu herkömmlichen intelligenten Assistenten, die nur einfache und einmalige Anweisungen wie „Klimaanlage einschalten“ verstehen können, kann das Lingji-Modell erkennen, dass die Temperatur im Haus, also die Luft, von den Erwartungen des Benutzers abweicht, wenn der Benutzer nach Hause kommt Die Klimaanlage muss eingeschaltet und entsprechend der aktuellen Jahreszeit auf die richtige Temperatur eingestellt werden. Offensichtlich kann die Hinzufügung großer Modelle die kognitiven Fähigkeiten intelligenter Lautsprecher verbessern.

Tmall Elf ist wärmer

Tmall Genie, ein weiterer Gigant auf dem Gebiet der intelligenten Lautsprecher, zeigte ebenfalls seine Erfolge im Bereich der generativen KI-Technologie. Am 11. April gab Tmall Genie bekannt, dass es offiziell auf Alibaba Tongyi Qianwen zugreifen wird. Den auf der offiziellen Website angezeigten Informationen zufolge handelt es sich bei Tongyi Qianwen um ein Großmodell, das gezielt auf menschliche Anweisungen reagiert. Derzeit wurde der Unternehmenseinladungstest eröffnet und die offizielle Testwebsite veröffentlicht.

Laut Zhang Yong, Vorsitzender und CEO der Alibaba Group und CEO der Alibaba Cloud Intelligence Group, wird Tmall Genie in Zukunft nicht nur in der Lage sein, die Fragen der Benutzer zu beantworten, sondern auch zu einem humanisierten intelligenten Assistenten zu werden. Die Strategie von Tmall Genie ist das um ein großes Modell mit einer ausgeprägteren Persönlichkeit für intelligente Lautsprecher zu trainieren.

Einerseits kann der mit Tongyi Qianwen verbundene Tmall Genie einige spezifische personalisierte Eigenschaften generieren, um den individuellen Bedürfnissen der Benutzer gerecht zu werden. Im Gegensatz zu allgemeinen Modellen mit einem breiteren Spektrum an Wissen kann Tmall Genie mit Hilfe von Tongyi Qianwen, einem vertikaleren und personalisierteren Modell, anthropomorpher und intelligenter werden. Sein Wissen, seine Emotionen und seine Persönlichkeit, sein Gedächtnis usw. werden erheblich verbessert verbessert. Beispielsweise hat das Modell „Niao Niao Di Niao“ den gleichen Ton und die gleiche Intonation wie der Talkshow-Schauspieler Niao Niao, was auch die Spielbarkeit von Tmall Genie erhöht und ihn zu einem herzlichen und intelligenten Assistenten macht.

Andererseits wird die neue Generation von Tmall Genie über flexiblere Dialogmöglichkeiten verfügen. Tmall Genie, das mit Tongyi Qianwen verbunden ist, unterstützt den freien Dialog. Benutzer können jederzeit Themen unterbrechen oder wechseln. Tmall Genie kann jederzeit Inhalte entsprechend den Bedürfnissen und Szenarien des Benutzers generieren. Während des Laufvorgangs können Benutzer beispielsweise Tmall Genie bitten, eine zum Laufen geeignete Wiedergabeliste gemäß der 180-Schritte-Frequenz zu erstellen, und gleichzeitig können sie sich intensiv mit Tmall Genie über Kultur, Leben und anderes austauschen Felder.

Dank der starken technischen Unterstützung von Tongyi Qianwen wird die Benutzererfahrung von Tmall Genie intelligenter und personalisierter. Nach dem offiziellen Zugang zu Tongyi Qianwen könnte Tmall Genie in Zukunft eine relativ große Verbesserung des Benutzererlebnisses erleben, was Alibaba auch dabei helfen könnte, seine führende Position auf dem Markt für intelligente Lautsprecher weiter zu festigen.

Hindernisse für die Realität

Tatsächlich verfügen nicht nur Xiaodu und Tmall Genie über Layouts im Bereich ChatGPT, Huawei, Xiaomi usw. auch über Layouts im Bereich generative KI-Technologie und intelligente Lautsprecher. Wenn jedoch intelligente Lautsprecher, die mit generativer KI-Technologie ausgestattet sind, in jedem Zuhause eines jeden Benutzers populär werden sollen, stehen ihnen noch einige natürliche Hindernisse im Weg.

Erstens sind die Kosten für die Rechenleistung hoch. Aus Sicht der Rechenleistung ist „gewalttätiges Stapeln“ (unter Verwendung einer großen Anzahl leistungsstarker GPUs) angesichts einer starken Vergrößerung der Parameterskala zum Hauptmittel für Unternehmen geworden, um den Trainingseffekt großer Modelle zu verbessern Die hohen Kosten dahinter könnten dazu führen, dass die ChatGPT-Version der Intelligenz die Schwelle zur Popularisierung von Sprechern überschreitet.

Mit dem Aufkommen großer Open-Source-Modelle müssen einige Unternehmen jedoch große Modelle nicht mehr selbst von 0 auf 1 trainieren. Die trainierten großen Modelle können direkt aufgerufen und dann auf dieser Basis optimiert werden, was mit einem Training von Grund auf vergleichbar ist . Je größer das Modell, desto geringer sind die Kosten. Darüber hinaus wird mit der künftigen Weiterentwicklung des Algorithmus die Abhängigkeit von der Rechenleistung im Trainingsprozess großer Modelle erheblich verringert.

Zweitens sind die Nutzungsszenarien intelligenter Lautsprecher, die mit ChatGPT ausgestattet sind, begrenzt. Ein großer Teil des Grundes für die Explosion von ChatGPT liegt darin, dass es die Produktionseffizienz subversiv verbessern kann. Diese Ausgabemethode basiert hauptsächlich auf Text, Bildern und Videos, intelligente Lautsprecher legen jedoch mehr Wert auf die Sprachinteraktion. Darüber hinaus machen die Inhalte, die Audio-Feedback erfordern, im täglichen Leben und bei der Arbeit der Menschen möglicherweise nur einen kleinen Teil aus. Daher muss die Popularisierung der ChatGPT-Version intelligenter Lautsprecher mehr Szenarien finden, die für die Sprachinteraktion geeignet sind, und deren Verwendung begrenzt sein Szenarien bedeuten, dass die Verwendung der ChatGPT-Version des intelligenten Lautsprechers bald nachlassen könnte.

Drittens können mit ChatGPT ausgestattete intelligente Lautsprecher vor Herausforderungen bei der Datensicherheit stehen. Wenn Sie möchten, dass intelligente Lautsprecher mit generativer KI-Technologie ausgestattet sind, um die Bedürfnisse der Benutzer besser zu verstehen und personalisierte Lösungen bereitzustellen, dann erfordert generative KI unweigerlich die Erfassung persönlicher Daten der Benutzer und die Erfassung der Privatsphäre der Benutzer. Ich war schon immer sensibler. Darüber hinaus sind die einschlägigen Gesetze und Vorschriften nicht solide, was eine Herausforderung bei der Popularisierung von ChatGPT-Smart-Lautsprechern darstellen wird.

Darüber hinaus müssen die Auswirkungen von ChatGPT auf die gesamte Smart-Speaker-Branche ein langfristiger Prozess sein, und die generative KI-Technologie befindet sich noch in einem frühen Entwicklungsstadium, und ihre tatsächlichen Auswirkungen auf die Smart-Speaker-Branche sind möglicherweise noch nicht klar erkennbar Es ist absehbar. Ja, der von ChatGPT ausgelöste Hype beschleunigt diesen Prozess.

Supongo que te gusta

Origin blog.csdn.net/liukuang110/article/details/130699602
Recomendado
Clasificación