In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber

https://mp.weixin.qq.com/s/NXGSLylqaItkcCmfUBbIuA

By 超神经

在 1 月 28 日的 2019 网络春晚上,AI 虚拟主持人登台主持节目,撒贝宁作为与 AI 替身同台的主持人之一,当场宣布准备准备「隐退」, AI 取代主持人的时刻真的来临了吗?

Am diesjährigen Internet-Frühlingsabend erschienen zum ersten Mal vier virtuelle Image-Hosts, basierend auf dem Auftritt von Sa Beining, Zhu Xun, Gao Bo und Long Yang. Die vier Gastgeber waren alle auf derselben Bühne wie ihr virtueller Gastgeber, was der Party wirklich viel Spaß machte.

Die schnellmundige Xiaosa ist vor AI Xiaosa fast aus dem Ruder gelaufen

Aus dem Video ist ersichtlich, dass es eine große Ähnlichkeit zwischen dem virtuellen KI-Host und der Entität gibt. Zusätzlich zum Verlust von Menschen beim Beantworten und Schütteln des Telefons gibt es auch eine entsprechende Körpersprache, und jeder virtuelle Host hat eine andere Die Ausdruckseigenschaften.

Was ist ein virtueller Host?

Berichten zufolge ist diesmal der virtuelle Gastgeber der Internet Spring Festival Gala ObEN durch 3D-Bildrekonstruktion und elektronische Tonsimulationstechnologie, um ein virtuelles Bild zu erstellen und eine personalisierte virtuelle Bild-PAI (Personal AI) für künstliche Intelligenz zu erstellen. ).

Neben dem virtuellen Gastgeber dieser Online-Frühlingsfest-Gala arbeitete ObEN auch mit Prominenten und Star-Unternehmen zusammen. Die SM Corporation, Koreas größtes Unterhaltungsunternehmen, ist einer der frühesten Angel-Investoren von ObEN.

Im Juni 2017 gründete ObEN in Zusammenarbeit mit der südkoreanischen SM Entertainment Company das weltweit erste Urheberrechtsunternehmen für künstliche Intelligenz, AI Star, in Hongkong, das auf Chinesisch Magic Star heißt, um ein virtuelles Idol zu erstellen. Die inländische weibliche Idolgruppe SNH48 kündigte auch eine Zusammenarbeit mit ObEN an, um ein exklusives Bild der künstlichen Intelligenz zu schaffen.

In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber

Die Kerntechnologie dieses Produkts besteht hauptsächlich aus drei Aspekten:

Erstens ist es die Schaffung eines visuellen Bildes. Mithilfe von Fotos des Körpers des Hosts, 3D-Scannern, 3DS MAX, MAYA und anderen 3D-Modellierungswerkzeugen kann AI ein Algorithmusmodell erstellen und schließlich eine Gesichts- und Körperform erstellen, indem die Beziehung zwischen der Farbverteilung des Fotos und der Tiefe der Struktur verstanden wird.

Die zweite ist die Klangsynthese. Die von ihnen verwendete KI-Sprachtechnologie erfordert keine große Sammlung von Sprachbibliotheken, nur ein Dutzend Sätze Sprachaufzeichnung, und die Erstellung eines Sprachmodells kann durch Methoden wie das Extrahieren von Merkmalsparametern und das Lernen von Übertragungen erreicht werden.

Machen Sie den virtuellen Host schließlich so realistisch wie möglich. Dies erfordert nicht nur eine visuelle Darstellung, die zu ihren Klängen passt, sondern auch eine Personalisierung. Durch Sensoren und Bewegungsverfolgungsgeräte in Kombination mit KI- und Bewegungserfassungstraining kann der virtuelle Host gesprochene Sprache, Mimik, Gesten, Körperbewegungen und Szeneninteraktionen entsprechend dem entsprechenden Körper simulieren.

Obwohl dies das erste Mal ist, dass AI eine Frequenzweiche veranstaltet, gibt es in der virtuellen Ankerwelt der KI wirklich viele Auftritte.

Der erste chinesische KI-Nachrichtensprecher

Auf der fünften Internetkonferenz im November 2018 zeigte die Nachrichtenagentur Xinhua einen ihrer neuen Reporter. Dies ist der erste Nachrichtensprecher der virtuellen KI-Synthese. Qiu Hao, der Prototyp der KI, sagte: "Image Es ist mein Bild und der Ton passt zu meiner Stimme, aber ich habe nie die Worte gesagt, die gesendet wurden ... "

In diesem Video können wir den Anker im Video sehen, der sich in seinem Akzent vorstellt, wobei die Stimme, sein Gesicht und seine Lippen entsprechende Bewegungen haben. Ich muss sagen, dass es Überraschungen gibt, aber es gibt immer noch einige Enttäuschungen. Im Vergleich zu lebenden Ankern kann man auf einen Blick erkennen, dass es sich um ein Produkt der Mechanisierung handelt. Die Art und Weise, wie es funktioniert, erfordert, dass Menschen Pressemitteilungen schreiben.

Diese co-technische Unterstützung stammt von Sogous "Klon-Technologie". Der Schlüssel hinter dieser Technologie ist die Sprachsynthese und Bilderzeugung.

In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber

Die Sprachsynthesetechnologie kann eine kleine Menge von Audiodaten verwenden, damit das Maschinenmodell die Spracheigenschaften des Eingabeobjekts lernen, die Klangfarbe, den Rhythmus, die Emotionen und andere Aspekte erfassen und schließlich die Audioinformationen des Eingabetextes realisieren kann.

Die Bilderzeugung nutzt das Lernen und die Konstruktion von Gesichtserkennung, dreidimensionaler Gesichtsrekonstruktion, Ausdrucksmodellierung usw. und erreicht schließlich die Entsprechung zwischen Audioausgabe und visuellen Ausgabeinformationen.

Unabhängig von diesen Slots besteht der größte Werbepunkt dieser Technologie darin, dass sie die Klonfunktion auf dem Bildschirm realisieren kann. Dies bedeutet wahrscheinlich, dass Sie mit dem Fernseher, Tablet und Mobiltelefon eine Person sehen können, die drei verschiedene Inhalte gleichzeitig sendet.

Neon Country baut nicht nur Hatsune, sondern auch Anker

Japan hatte früher berichtet, und ihre KI-Anker wurden auch gemacht.

Im April letzten Jahres war der Anker in einer Sendung mit dem Titel "NEWS CHECK 11" im NHK-Fernsehen ein niedlicher Cartoon-KI-Anker - "Nachrichtensprecher Yomiko".
In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber

Dieser Anker wird mithilfe der CG-Technologie hergestellt. Er lernt, aus einer großen Anzahl von Aufzeichnungen in Phoneme aufzuteilen, lernt dann die Texterkennung und das Lesen und liest schließlich Nachrichten.

Darüber hinaus wurden auch Roboter als Nachrichtensprecher realisiert.

Der von der Osaka University und der Kyoto University entwickelte Schönheitsroboter "Elika" diente im April 2018 auch als Nachrichtensprecher des japanischen NNN-Fernsehsenders.

"Elika" spielt als 23-jähriges schönes Mädchen. Es erhält ein normales weibliches Gesicht. Die Stimme von "Elika" wird basierend auf der Aufnahme der Sprecher synthetisiert, was als sehr natürlich bezeichnet werden kann.

In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber

Darüber hinaus verfügt es über ein fortschrittliches Dialogsystem. Wenn es mit Personen spricht, sammelt es Informationen über Mikrofone und Sensoren, nimmt die Stimme und Handlungen der anderen Partei wahr, wendet sich dann an die andere Partei und führt ein reibungsloses Gespräch.

Seine Augen, sein Mund, sein Hals und andere 19 Stellen können durch Luftdruck bewegt werden, was eine Vielzahl von Ausdrucksformen zeigt, und sie können auch einige einfache Bewegungen lebhaft ausführen.

Wann wird der Host ersetzt?

In Bezug auf die Internet Spring Festival Gala hat das Auftreten der vier ungezogenen virtuellen Gastgeber viel Aufmerksamkeit erhalten, und aus der Haltung des Publikums geht hervor, dass sie sie sehr mögen.

Werden sie also eine Gelegenheit für den Gastgeber sein, entlassen zu werden? Vielleicht würden weder Xiaosa noch Xiao Xiaosa zustimmen.

In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber
"Xiao Sa Abschiedsbühne"

Was den Akzent der KI-Nachrichtensendung und die inkonsistenten Gesichtsausdrücke betrifft, gibt es noch Raum für Verbesserungen. Japans lebhafte Nachrichtenroboter haben die lokale Nachrichtenindustrie nicht in großem Umfang ersetzt. Sie befinden sich höchstens noch auf dem Niveau von Hilfs- und Neuheiten.

Wenn wir es so betrachten, hat uns der technologische Fortschritt zwar eine neuartige und schöne Erfahrung gebracht, aber vielleicht gehen Gimmicks in einer solchen Ära schneller als sie tatsächlich sind.

Vielleicht kommt der Tag, der ersetzt wird, irgendwann, aber es ist sicherlich nicht heute. Wir sollten glauben, dass die Menschen an diesem Tag möglicherweise den Weg gelöst haben, mit der KI auszukommen. Während des Frühlingsfestivals zu dieser Zeit werden wir nicht nur KI sehen, die die Frühlingsfest-Gala veranstaltet, sondern auch KI-Aufführungen.

Wir warten nur darauf, dass die KI uns mit offenem Mund füttert.
In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber

Super nervöse Enzyklopädie

Lernen übertragen

Transferlernen ist eine Methode, um vorhandenes Wissen zu nutzen, um neues Wissen zu erlernen.

Beim Transferlernen wird das vorhandene Wissen als Quelldomäne und das neu zu lernende Wissen als Zieldomäne bezeichnet.

Der Zweck des Migrationslernens besteht darin, Wissen und Erfahrung aus einer oder mehreren Quellaufgaben zu extrahieren und es dann auf eine Zieldomäne anzuwenden.

Grundlegende Methoden des Transferlernens

1) Die Beispielmigration
findet Daten ähnlich der Zieldomäne in der Quelldomäne und passt das Gewicht dieser Daten an, damit die neuen Daten mit den Daten der Zieldomäne übereinstimmen.

2) Bei der Modellmigration wird
davon ausgegangen , dass die Quelldomäne und die Zieldomäne Modellparameter gemeinsam nutzen. Dies bedeutet, dass ein Modell, das in der Quelldomäne durch eine große Datenmenge trainiert wurde, zur Vorhersage auf die Zieldomäne angewendet wird.

3) Beziehungsmigration
Unter der Annahme, dass zwei Domänen ähnlich sind, teilen sie eine bestimmte Ähnlichkeitsbeziehung, und die logische Netzwerkbeziehung in der Quelldomäne wird für die Migration auf die Zieldomäne angewendet.

In der zukünftigen Frühlingsfest-Gala benötigen Sie möglicherweise keinen Live-Gastgeber

Ich denke du magst

Origin blog.51cto.com/14929242/2535613
Empfohlen
Rangfolge