Neues Upgrade der Live-Broadcast-Architektur: Volle Unterstützung für Taobao Double 11 Live-Broadcasts

Taobao Live hat in den letzten drei aufeinander folgenden Jahren zu einer deutlichen Umsatzsteigerung geführt. Seit 2020 sind mehr als 100 Berufe zu Taobao Live gewechselt, unabhängig vom Status des Meisters oder des Händlers. Eine große Anzahl von Zulassungen wird von der neuen Verkaufsstelle bestimmt. Der Umgang mit der hohen Nachfrage nach Live-Übertragungen von Double Eleven-Nutzern stellt zweifellos höhere technische Anforderungen und Herausforderungen für die Live-Übertragung in Taobao. Gleichzeitig haben E-Commerce-Live-Übertragungen eine starke interaktive Anziehungskraft. Je zeitnaher die Reaktion des Ankers auf das Sperrfeuer ist, desto effektiver wird der Kauf.

Durch einen AB-Test wird bestätigt, dass sich eine Verzögerung positiv auf das E-Commerce-Live-GMV auswirkt. Es ist jedoch schwierig, die Verzögerung herkömmlicher Live-Übertragungsformate wie HLS, FLV und RTMP zu verringern. Herkömmliche Live-CDNs eignen sich nicht mehr für Live-Übertragungen mit geringerer Latenz, und das gesamte technische System muss aktualisiert werden. Um die Verzögerung der Live-Übertragung zu verringern, gibt es in der Branche verschiedene Ansätze:

Schemavergleich

Private Vereinbarung

Optimierung des TCP-Protokollstapels

QUIC

SRT

WEBRTC

bewirken

das beste

Allgemeines

besser

besser

es ist gut

Vielseitigkeit

Unterschied

optimal

gut

Niedriger

Gut

Schwierigkeit der Realisierung

schwierig

Kann tief oder flach sein

Allgemeines

Allgemeines

schwierig

Die Verzögerungen bei LHLS-, CMAF- und sogar LLHLS-Lösungen betragen im Grunde mehr als 2 Sekunden, daher werden wir sie vorerst nicht vergleichen. Umfassende Überlegungen: Das WEBRTC-Programm entspricht relativ unseren Anforderungen. Die technische Abteilung von Amoy und Alibaba Cloud haben gemeinsam ein Multimedia-Übertragungsnetz mit geringer Latenz aufgebaut, das auf WEBRTC basiert.


Übertragungsnetz mit geringer Latenz, das Kommunikation und Live-Übertragung kombiniert


Die Verzögerung der Live-Übertragung ist immer ein großes Problem, und viele Teams überlegen, wie die Verzögerung verringert werden kann. Die Übertragung mit geringer Latenz ist ein umfassendes Problem. Es muss nicht nur von den Entwurfsüberlegungen ausgegangen werden, sondern auch von der engen Zusammenarbeit zwischen Client, Server und Datensystem. Das grundlegendste Übertragungsprotokoll wird nicht aktualisiert, und es gibt immer eine Obergrenze für Verzögerungen.

RTCP-Protokoll-Header

Für das traditionelle rtmp, hls, http-flv-Protokoll, das auf tcp basiert, ist tcp eine zuverlässige Übertragung und muss warten, bis einige Daten in einem schwachen Netzwerk eintreffen, um fortzufahren. Bei Audio- und Videodaten können jedoch einige Daten verloren gehen, z. B. Frames, auf die nicht verwiesen wird. Darüber hinaus befindet sich die Überlastungskontrolle von tcp auf der Kernel-Ebene. Wenn eine Überlastung auftritt, wird das Schiebefenster direkt halbiert, was zu einem geringen Datendurchsatz führt. Gleichzeitig fehlt die Steuerung der Anwendungsebene, es ist für Audio- und Videoszenen unflexibel und die Genauigkeit ist gering. Darüber hinaus hat tcp die Funktion der Aggregation von Neuübertragungen, was zu einer langsamen Datenbestätigung und einer erhöhten Verzögerung führt.

Aus diesen Gründen von TCP haben traditionelle Spieler einen Puffer von mehr als 5 Sekunden, um Netzwerkjitter zu bekämpfen. Daher verwendet die herkömmliche Audio- und Videokommunikation grundsätzlich nicht das TCP-Protokoll, sondern UDP.

Nachdem die Live-Übertragung die Verzögerung verringert hat, gibt es viele Ähnlichkeiten mit der Kommunikation in der Übertragung, und der Plan kann zusammen betrachtet werden. Das auf udp basierende webrtc ist eine halbzuverlässige Übertragung und ausgereifte Technologie, die sich besser für Audio- und Videoszenarien eignet. Aus dem Signalisierungsdesign wird das private Protokoll der RTC-App übernommen, der RTC-Standard ist miteinander kompatibel und die Audio- und Videoübertragung verwendet eine Socket-Verbindung. Das Jianlian-Abkommen ist rationalisiert und stellt sicher, dass die Mediendaten zum schnellsten 1RTT ausgegeben werden und die Übertragung schnell gestartet werden kann.

GRTN-Übertragungsnetz

Das Designkonzept von GRTN besteht darin, Kommunikationstechnologie zur Übertragung von Live-Multimediadaten zu verwenden. Technologie ist eine Technologie, daher ist es selbstverständlich zu erkennen, dass ein Netzwerk sowohl Audio- und Videokommunikation als auch Live-Übertragung unterstützen kann.

Nach der einheitlichen Architektur gibt es nur einen Satz Code und einen Satz Betriebs- und Wartungssystem, wodurch die Wartungskosten gesenkt werden. Es werden mehrere Dienste zusammengestellt, und die Spitzenbandbreite jedes Dienstes ist unterschiedlich. Der Gesamtspitzenwert ist niedriger als die Summe der Spitzen jedes Dienstes. Der Betreiber berechnet unsere Bandbreite normalerweise gemäß der Spitze oder 95 Spitzen. Nachdem mehrere Dienstspitzen versetzt sind Die Kosten werden entsprechend reduziert. Zukünftig werden in diesem Netzwerk auch On-Demand-Planungen und die Verteilung von Dateien durchgeführt, was sich stärker auf Spitzenverschiebungen und Kostensenkungen auswirkt.

Auf dem Randknoten des CDN stromabwärts wird die Protokollkonvertierung realisiert und in das RTC-Protokoll konvertiert, und es kann auch eine Live-Übertragung mit geringer Latenz realisiert werden. Auf diese Weise realisieren die fortschrittlichsten Systeme auf dem Markt Live-Übertragungen mit geringer Latenz.

GRTN wechselt jedoch nicht nur für die Downlink-Wiedergabe zum RTC-Protokoll, sondern auch zu einem Full-Link-RTC-Protokoll. Full-Link-RTC kann auch das Qualitätsproblem der letzten Meile auf der Hostseite lösen, Paketverlusten zwischen Servern widerstehen und die Qualität verbessern. Der durch die Zwischenprotokollkonvertierung verursachte Verlust wird verringert, wodurch eine geringere Übertragungsverzögerung erreicht wird. Nach der Realisierung der Vollverbindungs-RTC kann die Überlastungskontrolle durchgängig erfolgen, z. B. durchgängiger FEC-Paketverlust, Umschaltung großer und kleiner Streams, SVC / GOP-Verlust und andere Strategien zur Zusammenarbeit, um die Benutzererfahrung zu verbessern. Nach einer durchgängigen RTC-Übertragung mit geringer Latenz wird es für das Publikum sehr einfach, eine Verbindung zum Mikrofon herzustellen. Sie müssen nur einen Stream von der Publikums-Seite hochladen, und der Anker wird heruntergezogen, um zu spielen, und Sie können die Verbindung erkennen.

Darüber hinaus fragen sich einige Schüler möglicherweise, was der Unterschied zwischen einem End-to-End-RTC-System und einem herkömmlichen Konferenzsystem ist. Der Unterschied besteht darin, dass herkömmliche Konferenzsysteme normalerweise in einem zentralen Computerraum mit wenigen Zugriffsknoten bereitgestellt werden. GRTN wird direkt auf dem CDN bereitgestellt, um die Qualität durch globale Abdeckung zu verbessern.

Das dritte Merkmal von GRTN ist die dezentrale Architektur und die dynamische Pfadplanung. Schüler, die Live-CDN machen, werden einen tiefen Eindruck haben. Wenn es viele kleine Anker gibt, ist die Bandbreite der Rückgabequelle sehr teuer. Kleine Anker haben eine niedrige Trefferquote und ein hohes Return-to-Source-Verhältnis. In einigen Fällen sind mehr als 50% der Bandbreite erforderlich, um zur L2 (Zwischenquelle) zurückzukehren, was hohe Kosten verursacht.

Da L2 (Zwischenquelle) und zentraler Computerraum eine bessere Garantie als L1 (Randknoten) bieten, ist der Bandbreitenpreis normalerweise höher als L1, wodurch die Bandbreite der Rückquelle teurer wird. Alle Live-CDNs versuchen ihr Bestes, um die Back-to-Source-Bandbreite zu reduzieren, einschließlich der Verwendung der 302-Umleitung, der Einrichtung von Cold-Flow-Clustern usw., aber Back-to-Source-L2 ist unvermeidlich. Die dezentrale Architektur bedeutet, dass der Rückweg direkt von L1 verlaufen kann, ohne durch L2 oder den zentralen Computerraum zu verlaufen, wodurch der Übertragungsweg reduziert wird, was nicht nur die Rückgabekosten erheblich reduziert, sondern auch die Übertragungsqualität verbessert. Arbeiten Sie mit der dynamischen Pfadplanung zusammen, um die optimale Lösung zwischen Kosten und Qualität zu finden. Da die Audio- und Videostreams nicht durch das Zentrum geleitet werden müssen, wird die Auswirkung des Ausfalls des Zentrums erheblich verringert.

Die meisten GRTN-Module sind für jedes Unternehmen gleich, es gibt jedoch auch einige Inhalte, die für jedes Unternehmen angepasst werden müssen. Die Geschäftsanpassung besteht hauptsächlich aus drei Teilen: Client, Überlastungskontrolle und Übertragungsstrategie sowie Bearbeitung von Streaming-Medien. Diese drei Teile haben ein einheitliches Design der Zugriffsschnittstelle. Am relevantesten für die Übertragungsqualität ist vor allem die Überlastungskontrolle und die Übertragungsstrategie.

Überlastungskontrollalgorithmus für adaptive Dienste



▐Tiefe  Anpassung: Starke Netzwerk-Push-Stabilität 


Tiefe Netzwerkoptimierung. Geben Sie zunächst ein starkes Netzwerkurteil, verbessern Sie die Stabilität der Push-Stream-Bildqualität für starke Netzwerkbenutzer und steuern Sie die Bitrate, um versehentlichen Paketverlust und Verzögerung zu vermeiden. Darüber hinaus ist der AIMD-Algorithmus zur Steuerung der Bitrate optimiert, um zu beschleunigen und zu verlangsamen. Starke Netzwerkbandbreitennutzung: Um den Bereich schwacher Netzwerke zu begrenzen, ist der native Überlastungssteuerungsalgorithmus zu empfindlich, um Jitter zu verzögern, wodurch seine Strategie zur Anpassung der Bitrate geglättet wird.

▐Das  System sucht nach der optimalen Lösung: Optimierung der selbstlernenden Parameter 


Herkömmliche Optimierungen der Audio- und Videoübertragung erfordern normalerweise professionelle Talente, die auf Erfahrungswerten basieren, was hohe Talente erfordert. Wir können den Prozess der Talentoptimierung jedoch automatisch durch das System implementieren. Optimieren Sie systematisch den theoretischen Standardwert des Überlastungssteuerungsalgorithmus in WebRTC, kämmen Sie den Parameterbereich basierend auf Vorkenntnissen, aktivieren Sie die Parameterkonfiguration, die Stapelparametererkennung basierend auf Vorkenntnissen und das Design eines Mehrwinkel-Bewertungsalgorithmus. Durch kontinuierliche Iteration wird die optimale Lösung der Überlastungskontrollparameter gefunden. Zu den Vorteilen des Parameter-Selbstlernsystems gehört auch, dass das System bei Änderungen der Umgebung automatisch die optimale Lösung aktualisieren kann und die Erfahrung von Fachleuten es schwierig macht, sich so schnell an die neue Umgebung anzupassen. Nach Verwendung der selbstlernenden Parameteroptimierung am Push-Ende sank die Staurate des gesamten Push-Flusses um 40% und die Verzögerung um 12%.


▐Frontier Exploration: Überlastungskontrolle  basierend auf verstärktem Lernen 

Inspiriert von Pensieve [1], der neuesten Forschungsrichtung im akademischen Bereich, haben wir mit der Pekinger Universität für Post und Telekommunikation zusammengearbeitet, um die Taobao-Live-Übertragung basierend auf dem Algorithmus zur Kontrolle der Überlastungskontrolle, einer selbst entwickelten Strategie in Kombination mit einem traditionellen Algorithmus zur Überlastungskontrolle, in einem stabilen Netzwerk anzupassen und die Bandbreite aufrechtzuerhalten Wenn die Auslastungsrate nicht sinkt, kann die Verzögerung um 20% und der Stillstand um etwa 25% verringert werden.

Die Forschungsergebnisse von Taobao Live in diese Richtung wurden von der akademischen Gemeinschaft anerkannt und zwei Jahre in Folge in der Top-Online-Konferenz MobiCom (Concerto [2], OnRL [3]) veröffentlicht.

[1]. Hongzi Mao, Ravi Netravali und Mohammad Alizadeh. 2017. Neuronales adaptives Video-Streaming mit Denkarium. In den Proceedings der Konferenz der ACM Special Interest Group für Datenkommunikation, SIGCOMM 2017, LosAngeles, CA, USA, 21.-25. August 2017. 197–210.

[2]. Zhou, Anfu et al. "Lernen, den Video-Codec mit dem Transportprotokoll für die mobile Videotelefonie zu koordinieren." Die 25. Internationale Jahreskonferenz für Mobile Computing und Networking. 2019.

[3]. Zhang, Huanhuan et al. "OnRL: Verbesserung der mobilen Videotelefonie durch Online-Verstärkungslernen." Vorträge der 26. Internationalen Jahreskonferenz für Mobile Computing und Networking. 2020.


Netzwerkübertragungsstrategie für Live-Übertragung


Der Überlastungssteuerungsalgorithmus gibt hauptsächlich die Netzwerküberlastung zurück und kann die Netzwerküberlastung nicht direkt verringern. Um die Überlastung des Netzwerks zu verringern, muss mit Netzwerkübertragungsstrategien zusammengearbeitet werden, einschließlich Switching für große und kleine Streams, SVC, GOP-Verlust, reibungslose Übertragung, FEC, ARQ / NACK usw.

Der Überlastungssteuerungsalgorithmus ist vollständig modularisiert und von webrtc umgestaltet. Die Leistung ist mehr als doppelt so hoch wie die von webrtc. Er ist für Live-Übertragungsszenen stark optimiert, berücksichtigt die zweite Öffnung und Verzögerung, unterstützt GCC- und BBR-Algorithmen und verfolgt die maximale Durchsatzrate. Im Falle eines kleinen Netzwerkjitters ist dies nicht betroffen, und die maximale Unterstützung beträgt 20% Paketverlust und Jitter innerhalb von 500 ms. Im Gegensatz zur Kommunikationsszene mit extrem geringer Latenz und Fließfähigkeit verfolgt die Live-Übertragungsszene eine hohe Bildqualität, um das Seherlebnis des Benutzers zu gewährleisten. Der gesamte Algorithmus wird über Online-Broadcast-Daten AB zurückgemeldet, und das System optimiert iterativ weiter.

▐ Adaptives System mit Null-Transcodierungsrate


In den meisten Live-Broadcast-Systemen der Branche können Benutzer bei einem schlechten Benutzernetzwerk auf eine niedrigere Auflösung umschalten, um eine reibungslose Wiedergabe zu gewährleisten.

Low-Definition-Live-Streaming erfordert Cloud-Transcodierung. Die Cloud-Transcodierung muss decodiert und dann codiert werden. Das Codieren und Decodieren verbraucht viel Rechenressourcen und verursacht daher viele Transcodierungskosten.

In der Kommunikationstechnologie ist keine Transcodierung erforderlich. Wenn der Überlastungssteuerungsalgorithmus feststellt, dass die Bandbreite überlastet ist, passt er die Übertragungscoderate automatisch an, um die Überlastung zu verringern. Dieser Überlastungssteuerungsalgorithmus ist jedoch in einem Live-Übertragungssystem nicht anwendbar, da einige Benutzer schlechte Netzwerke haben, was die Qualität aller Zuschauer verringert. Daher kann die Codesteuerung des Live-Broadcast-Systems die Ankercoderate nicht direkt anpassen. Wir müssen es separat betrachten. Wenn das Upstream-Netzwerk des Hosts überlastet ist, muss die Codierungsrate des Hosts angepasst werden. Wenn das Downstream-Netzwerk einiger Viewer überlastet ist, kann die Codierungsrate des Hosts nicht angepasst werden. Stattdessen können einige unwichtige Informationen am Rand des CDN verworfen werden. Erzielen Sie eine Reduzierung der Verlustrate. Strategien zur Reduzierung der Bitrate umfassen: SVC, GOP-Verlust, große und kleine Streams usw.

SVC ist eine Technologie, die einen Teil des Videoinhalts verlieren kann, obwohl sie die Anzeigequalität ein wenig verringert, aber sicherstellen kann, dass der Inhalt sichtbar ist und für relativ statische Szenen geeignet ist. In diesem Szenario ist es aufgrund der kleinen Bewegungen fast unsichtbar, z. B. Live-Streaming mit Waren.

SVC ist in zwei Typen unterteilt: Luftraum-SVC und Zeitbereich-SVC. Spatial SVC bezieht sich auf eine Technologie, bei der ein Teil des Videoinhalts verloren geht und die Bildrate unverändert bleibt, die Videodefinition jedes Bilds jedoch reduziert wird. SVC im Zeitbereich bezieht sich auf eine Technologie, bei der ein Teil des Videoinhalts verloren geht und die Bildrate sinkt. Die Definition jedes Bilds entspricht jedoch fast der des ursprünglichen Bilds. Kurz gesagt, die SVC im Zeitbereich soll den Verlust an Klarheit und Fließfähigkeit sicherstellen, und die räumliche SVC soll die Fließfähigkeit und den Verlust an Klarheit sicherstellen. Gegenwärtig weisen die meisten Luftraum-SVC-Codierungsalgorithmen in der Industrie eine verringerte Komprimierungsrate auf, und selbst der Effekt ist nicht so gut wie das gleichzeitige Codieren großer und kleiner Ströme, sodass sie weniger verwendet werden.

Flache Struktur

Die in der Industrie üblicherweise verwendete Struktur ist die einschichtige Pyramidenstruktur von X265.

Pyramidenstruktur

Taobao Live verwendet den S265-Encoder und unterstützt eine mehrschichtige Pyramidenstruktur. Der Vorteil ist, dass der Referenzrahmen näher ist und die Korrelation stärker ist. Je höher der Rahmen der Pyramide ist, desto niedriger ist die Priorität und desto geringer ist die Auswirkung des Verwerfens, wenn das Netzwerk überlastet ist.

Berücksichtigen Sie bei der Auswahl von Referenzrahmen Zeit, Qualität und Stufe

Die Wahl des Referenzrahmens ist sehr wichtig. Wählen Sie einen Referenzrahmen mit besserer Qualität und je besser die Qualität der Lösung. Je näher der Referenzrahmen ausgewählt wird, desto höher ist die Ähnlichkeit des Rahmens und desto besser ist die Komprimierungsqualität. Da jede Schicht einen Qualitätsverlust aufweist, ist die Qualität umso schlechter, je höher der Referenzpegel ist. Je höher der Referenzpegel, desto mehr muss der Referenzabstand verkürzt und die Qualität des Rahmens verbessert werden.

Daher kann nach Verwendung der SVC-Technologie im Zeitbereich von S265 nicht nur die Möglichkeit erreicht werden, die Bildverlustrate am Rand des CDN während einer Überlastung zu verringern, die Störrate zu verringern, sondern auch eine höhere Komprimierungsrate ohne Datenverlust und die Gesamtkomprimierungsrate zu erzielen Eine Steigerung von 5 bis 6 Prozentpunkten.

Bei extremer Überlastung reicht dies jedoch nicht aus. Sie müssen die Lost-Gop-Strategie verwenden, um Staus schnell zu beheben. In einem Gop muss die Coderate entsprechend dem Gop-Breitengrad gezählt werden. Wenn die Bandbreite nicht ausreicht, müssen die folgenden Frames bis zum I-Frame verworfen werden. Dies bringt auch ein Problem mit sich. Die Daten in der zweiten Hälfte des Gops sind nur Audio, und die Daten sind unzureichend, und die Bandbreite für die Überlastungskontrolle wird stark sinken. Als Reaktion auf diese Situation wurde eine Reihe von Anpassungen auf Algorithmenebene vorgenommen.

▐Strategie  gegen Paketverlust 

Strategien gegen Paketverlust umfassen FEC, ARQ / NACK, reibungslose Übertragung usw. zusätzlich zu der oben erwähnten Code-Reduktionsrate.

FEC ist ein Vorwärtsfehlerkorrekturcode, dh beim Codieren wird mehr Redundanz codiert, so dass die Decodierungsseite einige Daten verliert und dennoch die Originaldaten wiederherstellt. FEC wurde in der Vergangenheit normalerweise in Radio- und Fernsehsystemen verwendet und spielte eine wichtige Rolle in Einwegübertragungssystemen. Später wurde auch die Audio- und Videokommunikationstechnologie FEC zum Standard. Das Live-Übertragungssystem unterscheidet sich jedoch vom Rundfunksystem und auch vom Audio- und Videokommunikationssystem. Aufgrund der großen Anzahl von Zuschauern erhält eine große Anzahl von Zuschauern Redundanz, selbst wenn das Netzwerk gut ist, wenn FEC kompiliert wird, um den Paketverlust jedes Zuschauers zu bekämpfen, was zu einem Bandbreitenverbrauch und Kostensteigerungen führt. Wenn die Redundanz für jeden Betrachter am Rand des CDN neu berechnet wird, ist der Berechnungsbetrag für die FEC-Matrix relativ groß und die Berechnungskosten des CDN sind sehr hoch. Daher wird die FEC des Live-Broadcast-Systems auf der Host-Seite mit fester Redundanz programmiert. Das CDN wählt den Prozentsatz der FEC aus, der für das Netzwerk jedes Betrachters am Randknoten transparent übertragen werden soll, um das Ziel zu erreichen, nicht nur dem Verlust von Netzwerkpaketen zu widerstehen, sondern auch Kosten zu sparen.

ARQ oder NACK sind beide Techniken zum Anfordern einer erneuten Übertragung, wenn ein Paketverlust festgestellt wird. Wenn das Netzwerk jedoch überlastet ist, verschlimmert das Anfordern einer erneuten Übertragung die Überlastung und muss mit Vorsicht verwendet werden.

Einer der Hauptverursacher von Stottern im Netzwerk ist Netzwerkjitter wie WLAN- und 4G-Signalstörungen, die eine kurzfristige Netzwerkunterbrechung verursachen können, und dann kommen alle Daten sofort an. Alle Daten werden in einem Augenblick gesendet, was zu einer Überlastung des Netzwerks führen kann, was zu Stottern führt. Wenn ein übergroßer Anker beim Senden von Daten einen Anstieg aufweist, kann er den CDN-Knoten direkt füllen und einen größeren Bereich von Stottern verursachen.

Die Strategie des reibungslosen Sendealgorithmus verhindert Netzwerk-Bursts und glättet den Netzwerkverkehr, insbesondere wenn eine große Anzahl von Benutzern gleichzeitig den Live-Übertragungsraum betritt. Gleichzeitig ist es stark auf die zweite Eröffnungsszene zugeschnitten. Durch die Neugestaltung des Sendemechanismus und des Algorithmus wird die Sendeleistung erheblich verbessert, was mehr als dem 1,4-fachen der Leistung von nativem Webrtc entspricht. Reibungsloses Senden verwendet den udp-Mehrpaket-Sendemechanismus sendmmsg, um eine neue Sendelogik zu erstellen und die Sendeeffizienz erheblich zu verbessern. Die Wiedergabeseite der Live-Broadcast-Szene muss Sekunden lang geöffnet sein. Während des Starts der Broadcast sendet der Server überschüssige Gop-Daten gemäß der Konfiguration, die sich etwas vom Schrittmacher der Kommunikationsszene unterscheidet.

Für die Live-Broadcast-Szene unterteilen wir die reibungslose Übertragung in drei Stufen

  • Erstes Bild in Sekunden

    • Es sind hauptsächlich die Daten des ersten I-Frames, die bei Live-Übertragungen normalerweise sehr groß sind. Die Daten des ersten I-Frames werden schnell mit der konfigurierten Höchstgeschwindigkeit an den Player gesendet.

  • Öffnen Sie den Gop-Cache in Sekunden    

    • Nachdem der erste I-Frame gesendet wurde, werden Gop-Pufferdaten mit einer relativ hohen Geschwindigkeit gesendet.

  • Normal senden    

    • Zu diesem Zeitpunkt wird es gemäß der konfigurierten Geschwindigkeit oder gemäß der durch die Überlastungssteuerung angegebenen Bandbreite gesendet.


Darüber hinaus hat die Live-Sendeszene auch den Einfluss eines festen Zeitrahmens. Im Kommunikationsszenario werden nur große I-Frames gesendet, wenn pli und fir I-Frames anfordern, und die Daten sind relativ stabil. Die Live-Übertragungsszene wird jedoch für 2 bis 4 Sekunden festgelegt, und es werden I-Frames angezeigt, ähnlich der Szene rechts in der folgenden Abbildung. Große I-Frames können für 200-400 ms gesendet werden, wenn die Netzwerkbandbreite nicht ausreicht. Da Audio und Video gleichzeitig in der Warteschlange für reibungsloses Senden vorhanden sind, wird das Senden von Audio blockiert. Daher werden in der zweiten Einschaltstufe Audio und Video in einer verschachtelten Reihenfolge gesendet. Nach der zweiten Einschaltstufe wird Audio zuerst gesendet.

um zusammenzufassen


Mit dem rasanten Aufkommen der E-Commerce-Live-Übertragung, wie Live-Inhalte effizient und zuverlässig bereitgestellt werden können, egal ob Algorithmus, Client oder Server, ist die Einzelpunktoptimierung zu einem Engpass geworden. Um einen Durchbruch zu erzielen, ist das gesamte Design und die Transformation des Live-Broadcast-Systems erforderlich. .

Derzeit hat Taobao Live Broadcast Pionierarbeit bei der Aktualisierung der neuen Live-Broadcast-Architektur geleistet. Der RTC-Verbindungszugriff wird für die erste und letzte Meile des Benutzers abgeschlossen. Durch Live-Broadcasts mit geringer Latenz wird die Live-Broadcast-Ära von 5 auf 7 Sekunden auf 1 Sekunde verzögert . Diese epochale technologische Innovation ist untrennbar mit der Optimierung und Innovation von Überlastungskontrollalgorithmen und -strategien für Taobao-Live-Sendungen sowie dem gemeinsamen Aufbau des GRTN-Systems für die Live-Übertragung von Taobao-Live-Übertragungen und Alibaba Cloud-Medienkommunikation verbunden.

Kundenspezifische Optimierung von Überlastungssteuerungsalgorithmen für Live-Broadcast-Szenen, starke Netzwerk-Streaming-Stabilität, verbesserte starke Netzwerkbandbreitennutzung, reibungslose Strategie zur Steuerung der Code-Rate, selbstlernendes Parameteroptimierungssystem, Stapelparametererkennung basierend auf Vorkenntnissen, Mehrwinkel-Bewertungsalgorithmus Das Design findet durch kontinuierliche Iteration die optimale Lösung für Überlastungssteuerungsparameter. Nachdem wir die Optimierung der selbstlernenden Parameter am Push-Ende verwendet hatten, sank die Push-Verzögerungsrate insgesamt um 40% und die Verzögerung um 12%. Basierend auf der Überlastungskontrolle des verstärkten Lernens haben wir mit der Pekinger Universität für Post und Telekommunikation zusammengearbeitet, um die Taobao-Live-Übertragung basierend auf der Überlastung des verstärkten Lernens anzupassen Der Steueralgorithmus, eine Strategie, die selbst entwickelte und traditionelle Überlastungssteuerungsalgorithmen kombiniert, kann Verzögerungen in einem stabilen Netzwerk um 20% und Verzögerungen um etwa 25% reduzieren, während die Bandbreitennutzung beibehalten wird. Die Forschungsergebnisse von Taobao Live in diese Richtung wurden von der akademischen Gemeinschaft anerkannt und haben zwei Jahre in Folge Artikel auf der Top-Online-Konferenz MobiCom veröffentlicht.

Für den Aufbau eines Live-Broadcast-Systems auf Kommunikationsebene besteht das Entwurfskonzept von GRTN darin, mithilfe der Kommunikationstechnologie Live-Multimediadaten zu übertragen, sodass ein Netzwerk sowohl Audio- und Videokommunikation als auch Live-Broadcast unterstützen kann. Die Bandbreitenabrechnung des Betreibers hängt normalerweise vom Spitzenwert oder vom Spitzenwert 95 ab. Nachdem mehrere Dienstspitzenwerte versetzt sind, kann der Effekt der Spitzenverschiebung und Kostenreduzierung erzielt werden. Auf den Randknoten des CDN-Downstreams wird eine Protokollkonvertierung implementiert, um in ein RTC-Protokoll zu konvertieren, um eine Live-Übertragung mit geringer Latenz zu erreichen. GRTN wechselt jedoch nicht nur zum RTC-Protokoll für die Downlink-Wiedergabe, sondern auch zu einem Vollverbindungs-RTC-Protokoll. Gleichzeitig ist GRTN eine dezentrale Architektur. Mit dynamischer Pfadplanung kann die optimale Lösung zwischen Kosten und Qualität gefunden werden. Auf diesem System werden Strategien zur Optimierung der Netzwerkübertragung implementiert, einschließlich Switching für große und kleine Streams, SVC, GOP-Verlust, reibungslose Übertragung, FEC, ARQ / NACK usw.

Derzeit läuft Taobao Live Double 11 vollständig auf dem GRTN-System. Im Vergleich zum Double 11 des Vorjahres hat sich die zweite Öffnungsrate um 32% erhöht, die Stallrate um 79% verringert und der Stall vv um 44% verringert. In Zukunft wird das Live-Broadcast-Team von Taobao das System weiter optimieren und innovativeres Gameplay untersuchen, ergänzt durch das rasante Wachstum der Nachfrage nach E-Commerce-Live-Broadcasts.

✿ Weiterführende   Literatur



Autor | Tao-Abteilung Audio- und Video-Technisches Team

Bearbeiten | Orange

Produziert | Alibabas neue Einzelhandelstechnologie

Ich denke du magst

Origin blog.csdn.net/Taobaojishu/article/details/111189128
Empfohlen
Rangfolge