Bericht zur KI-Investitionsstrategie 2024: Die drei Elemente der KI schwingen mit, AIGC Cloud-to-End-Beschleunigung

Heute geteiltKI-Serie ausführlicher Forschungsbericht: „ 2024 AI Investment Strategy Report: AI Drei Elemente schwingen mit: AIGC Cloud-to-End-Beschleunigung》.

(Bericht erstellt von: China Galaxy Securities Research Institute)

Gesamtbericht: 103 Seiten

Kernpunkt: Die Popularität der Branche wird anhalten und wir werden die sechs Hauptinvestitionslinien aktiv ergreifen.

(1) Branchenmarktüberblick und Leistungsübersicht 202303

1. Aufgrund des Booms in der Kreditbranche in der ersten Jahreshälfte fielen die Löhne nach dem Schock Ende Juni wieder zurück.

Wenn man auf das Jahr 2023 zurückblickt, das von der neuen Welle großer künstlicher Intelligenzmodelle beeinflusst wird, die durch ChatGT ausgelöst wird, ist die Gesamtleistung der Branche aktiv.

2. Die Umsatzwachstumsrate der Branche ging in den ersten drei Quartalen im Jahresvergleich zurück, während sich der den Muttergesellschaften zuzurechnende Nettogewinn im Jahresvergleich verbesserte.

Im Jahr 2023 blieb die Branchenleistung in den ersten drei Quartalen aufgrund von Faktoren wie lokalem Finanzdruck hinter den Erwartungen zurück. In den ersten drei Quartalen 2023 stieg der Branchenumsatz im Jahresvergleich um 5,00 %, die Wachstumsrate ging jedoch zurück ( Die Wachstumsrate im dritten Quartal des letzten Jahres betrug 10,36 %. Der der Muttergesellschaft zuzurechnende Nettogewinn stieg im Jahresvergleich um 12,99 % (die Wachstumsrate im dritten Quartal des letzten Jahres betrug -59,39 %). Quartale waren immer noch negativ. Der Gesamt-ROE der Branche (verwässert) betrug 1,79 %. Die durchschnittliche Bruttogewinnmarge der Unternehmen in der Branche betrug 39,95 % (Jahresvergleich +1,8 Prozent), Nettogewinnmarge -4,86 % (Jahresvergleich +11,32 Prozent).

3. Die Gesamtleistung des Branchenumsatzes und des Nettogewinns war in den letzten fünf Jahren schlecht, aber die Forschungs- und Entwicklungsinvestitionen der Unternehmen nehmen weiter zu.

Beeinflusst durch mehrere Faktoren wie den lokalen Steuerausgabendruck haben sich die Einnahmen und der Nettogewinn der Computerindustrie seit 2020 schlecht entwickelt. Der F&E-Kostensatz des Unternehmens ist stetig gestiegen, wobei der Kostensatz im dritten Quartal 2023 deutlich auf 19,22 % anstieg.

(2) Überprüfung des ausländischen Marktes für Technologieaktien

1. Seit Jahresbeginn haben sich US-Technologieaktien im Allgemeinen besser entwickelt als der US-Aktienmarkt, während Hongkonger Aktien und chinesische Konzeptaktien schleppend abschnitten.

Von Anfang 2023 bis zum 4. Dezember ET haben der Nasdaq und der Philadelphia Semiconductor Index den S&P 500 übertroffen. Von Anfang 2023 bis Anfang April übertraf der TAMAMA Technology Index den S&P 500 Index und den Nasdaq Index; ab Anfang April übertraf der TAMAMA Technology Index den S&P 500 Index, den Nasdaq Index und den Philadelphia Semiconductor Index.

2. Die Renditen von US-Anleihen werden im Jahr 2023 weiter steigen und die Bewertung von Technologieaktien wird periodisch unter Druck geraten.

Im Jahr 2023 wird die Federal Reserve die Zinsen am 1. Februar, 22. März, 4. Mai und 26. Juli jeweils um 25 Basispunkte anheben. Der Federal Funds Rate wird von 4,50 % zu Jahresbeginn auf 5,50 % steigen. Die Anleiherenditen begannen Anfang 2022 aufgrund einer Reihe von Zinserhöhungen durch die Federal Reserve zu steigen; Anfang Oktober 2023 erreichte die Benchmark-Rendite 10-jähriger US-Staatsanleihen ihren Höchststand von 4,81 %, den höchsten Stand seit 16 Jahren. Durch den Schritt der Federal Reserve gerieten Technologieaktien zeitweise unter Druck, und der Trend zu Zinserhöhungen verlief schleppend. Da die Federal Reserve die Zinserhöhungen einstellt und in der ersten Hälfte des nächsten Jahres voraussichtlich einen Zinssenkungskanal einleiten wird, dürfte der Bewertungsdruck auf Technologiewerte nachlassen.

(3) Anlagevorschläge: Es wird empfohlen, die sechs Hauptanlagelinien zu verstehen

Mit Blick auf das Jahr 2024 bleibt die Nachfrage nach Upstream-Rechenleistung mit der Implementierung von AIGC in mehreren Szenarien hoch. Die Freigabe des Werts von Datenelementen wird zu einer doppelten Verbesserung des Volumens und der Qualität der Datenindustrie führen. Eine große Zahl von ausländischen Parametern und großen Modellen sind Open Source, und die Durchdringungsrate der inländischen vertikalen Großmodellindustrie ist schnell. Ascension, wir glauben, dass die Computerindustrie im nächsten Jahr vor einem Davis Double Tap steht. Molekulare Seite (Leistungsseite): Anders als bei der Bewertungsoffensive im Jahr 2023 wird erwartet, dass die Computerindustrie im Jahr 2024 die Resonanz der „drei Elemente“ (Rechenleistung + Daten + Algorithmus) einläutet. Eine aktive Finanzpolitik wird voraussichtlich dazu führen erwartete Verbesserung der nachgelagerten Nachfrage und der Daten. Wenn Faktoren in die Tabelle einfließen, wird erwartet, dass die molekulare Leistung ihren Tiefpunkt erreicht und wieder ansteigt. Auf der Nennerseite (Bewertungsseite) wird erwartet, dass die Federal Reserve die Zinssätze im Jahr 2024 senken wird. Wenn die inländische Geldpolitik im nächsten Jahr voraussichtlich locker sein wird, wird dies dem Technologiewachstum zugute kommen und die Liquidität verbessern, was dazu beitragen wird, die Bewertungen weiter zu erhöhen.

Konkret wird empfohlen, im Jahr 2024 sechs Hauptinvestitionsschwerpunkte zu erfassen:

Hauptlinie eins, die Seite der Rechenleistung: Der Anteil von AIcapex an den Ausgabenprognosen großer ausländischer Hersteller nimmt weiter zu. Angetrieben durch inländische Richtlinien und große Modellparameter-Benchmarks sowie Übersee-Upgrades wird erwartet, dass die globale intelligente Rechenleistung weiterhin einen hohen Boom verzeichnet. Anders als der Markt befürchtet der Markt, dass der künftige Bedarf an Rechenleistung kurzfristig seinen Höhepunkt erreichen und im nächsten Jahr niedriger ausfallen wird als erwartet. Wir glauben, dass die neue Generation der künstlichen Intelligenz auf lange Sicht den Startschuss gegeben hat Die sechste Runde von Kangbo, und das AIGC-Großmodell wird zum Auslöser. Die Produktivitätsrevolution hat gerade erst begonnen. Der jüngste Finanzbericht von NVIDIA zeigt, dass der Umsatz im Rechenzentrum im Jahresvergleich um 297 % gestiegen ist und die Vorauszahlungsprognose für 2025 weiterhin hoch ist . In den nächsten fünf Jahren wird die durchschnittliche jährliche Wachstumsrate der intelligenten Rechenleistung Chinas voraussichtlich 52,3 % erreichen, und die durchschnittliche jährliche Wachstumsrate der allgemeinen Rechenleistung beträgt 18,5 %. Die Unterbereiche konzentrieren sich auf 1) Lokalisierung der Rechenleistung (mit Schwerpunkt auf der Huawei-Kette; 2) Speicher mit hoher Bandbreite (HBM-Industriekette); 3) KI-Serverführer: 4) Flüssigkeitskühlungs-Industriekette: 5) Leasing von Rechenleistung.

Hauptzeile zwei, Datenseite: Im ersten Jahr der drei Wertfreigaben von Datenelementen werden diese in die Tabelle aufgenommen, um die „Explizitität“ des Datenwerts zu fördern. Die „menschliche Datenform“ wird Anfang 2024 eingeführt und markiert den Abschluss des Datensprungs von natürlichen Ressourcen zu Wirtschaftsgütern und den offiziellen Beginn der Ära der Datenverwertung. Anders als bei den Marktvorschriften schätzt der Mainstream des Marktes, dass die Marktgröße für Datenelemente voraussichtlich 10 Billionen Marktflächen betragen wird. Wir schätzen, dass die Größe des Datenkapital-Aktienmarkts im Jahr 225 voraussichtlich 35,49 Billionen erreichen wird. Es ist davon auszugehen, dass Datenelemente eine wichtige Unterstützung für die Verbesserung der Bilanzen von Regierung und Unternehmen werden und dadurch die Modernisierung und Transformation der heimischen Wirtschaft sowie die umfassende Transformation und Modernisierung der Kommunalverwaltungen von „Landfinanzierung“ zu „digitaler Finanzierung“ fördern werden ." Es wird empfohlen, sich auf Folgendes zu konzentrieren: 1) Der Zeitpunkt der Umsetzung der Bestätigung von Datenverwertungsrechten, der Preisgestaltung und anderer Richtlinien; 2) Staatliche Cloud-Anbieter; 3) Unternehmen mit Datenbeständen oder Datenbetriebsrechten; 4) Datenverwaltung, Daten Anbieter von Sicherheits-, Datenreplikations- und Katastrophendiensten.

Hauptzeile drei, Algorithmusseite: Das große Modell schreitet weiter von der Cloud zum Ende voran, die Cloud wird weiter aktualisiert und das große Terminalmodell steht kurz vor der Veröffentlichung. OpenAI wird GPT-5 voraussichtlich in der ersten Hälfte des nächsten Jahres veröffentlichen, und Meta wird voraussichtlich Llama3 entwickeln, ein Open-Source-Großmodell, das leistungsfähiger als GPT4 ist. Google hat das große Modell PaLM2 veröffentlicht, um leichte mobile Endgeräte zu implementieren, und wird in Kürze das multimodale große Sprachmodell Gemini veröffentlichen; Qualcomm hat das neueste Xiaolong 8Gen3-Chipmodell StableDiffusion und sein Kern-Plug-in ControlNet veröffentlicht, die beide auf dem ausgeführt werden können Terminal. Der Markt für Cloud-Service-Produkte wächst weiter und katalysiert die Implementierung großer Modelle auf Edge-Geräten, darunter Smartphones, Laptops, XR, Roboter, Headsets, Smart Cars, intelligente Internet-of-Things-Terminals (AIT) usw. Es wird empfohlen, sich auf Softwaredienstleistungsunternehmen auf der Seite des Betriebssystems zu konzentrieren.

Hauptzeile vier, letzte Wandseite: 1) Das von GPT4 unterstützte bildschirmfreie tragbare Gerät „AIPin“ wurde geboren und formte die Form der Mensch-Computer-Interaktion neu. Der Verkauf beginnt im Jahr 2024 und wird voraussichtlich ein neues eröffnen. leichtes“ Terminal-Großmodell Eine neue Ära der Hardware: 2) Teslas humanoider Roboter 202401 wird voraussichtlich mit dem Hochfahren der Produktion beginnen, und die Ära der verkörperten Intelligenz steht vor der Tür: 3) Die Verbreitungsrate inländischer intelligenter Cockpits wird voraussichtlich das globale Niveau übertreffen , autonomes Fahren12 nimmt von Jahr zu Jahr stetig zu, und die Verkäufe intelligenter Autos wachsen rasant. Aufgrund der Nachfrage nach Software für intelligente Autos wird erwartet, dass Chinas Marktdurchdringungsrate für intelligente Cockpits im Jahr 2023 66 % und die weltweite Marktdurchdringung für autonomes Fahren L2/L3 erreichen wird Es wird erwartet, dass die Rate im Jahr 2024 37 %/1,5 % erreichen wird. Ab dem nächsten Jahr wird mit dem erwarteten Durchbruch von 13 Richtlinien erwartet, dass die L3-Seedurchdringungsrate einen schnellen Aufwärtstrend einleiten wird. 4) Der 5G-Smartphone-Markt wird wieder wachsen Im Jahr 2024 wird die Wachstumsdynamik im Mobiltelefonbereich von Huawei voraussichtlich am stärksten sein. Konzentrieren Sie sich auf Investitionsmöglichkeiten für Komponenten- und Softwareanbieter in verschiedenen Arten von Terminal-Industrieketten.

Hauptzeile fünf, ökologische Seite: Huawei bricht durch, um die Transformation des Ökosystems der Informationsinnovation voranzutreiben, die Ökologie der Hongmeng-Industriekette floriert weiterhin, Huawei führt die Transformation der Ökologie der Informationsinnovationsindustrie an, „Ni Peng + Jie Teng“ löst einen doppelten Alarm aus Computerstrategie „Hongmeng + Euler“ „Gemeinsam werden wir eine wichtige Grundlage für die Entwicklung der heimischen Betriebssystemindustrie schaffen. Hongmeng ist ein Betriebssystem für eine Welt, in der alles miteinander verbunden ist. Die Anzahl der ökologischen Geräte, die mit dem Hongmeng-System von Huawei ausgestattet sind, hat zugenommen.“ über 700 Millionen. Die Zahl der Harmony0s-Entwickler hat 2,2 Millionen überschritten, und API-Aufrufe haben 59 Milliarden Mal pro Tag erreicht Das Ökosystem wird weiterhin Generationen auswählen und erweitern. Es wird empfohlen, auf die vor- und nachgelagerten Partner von Huawei in der Industriekette zu achten.

Die Hauptlinie ist groß und die Szeneseite: Es wird erwartet, dass KI+-Bildung, Finanzen, Büro, Recht und medizinische Versorgung zuerst umgesetzt werden. 1) KI+-Bildung: Die Technologie der künstlichen Intelligenz hat breite Anwendungsszenarien im Bildungsbereich und ist es auch Eines der besten Szenarien für die Implementierung künstlicher Intelligenz: 2) AI+ Finance: Vertikale kleine Modelle sind in bestimmten Bereichen sehr umsetzbar, und inländische große Finanzmodelle erobern den Boden: 3) AI+ Office: Künstliche Intelligenz erhöht sowohl den ARPU-Wert als auch Zahlungsrate von Bürosoftware: 4) A+ Law, generatives A1 kann 44 % der juristischen Arbeit ersetzen und ermöglicht mehrere Anwendungsszenarien in der Rechtsbranche; 5) AI+ Medical unterstützt die Transformation und Verbesserung der intelligenten medizinischen Versorgung. Es wird empfohlen, auf führende Unternehmen in verschiedenen Teilsektoren zu achten.

Hauptlinie 1: Die Durchdringungsrate intelligenter Rechenleistung auf der Rechenleistungsseite nimmt rapide zu

(1) Seite der Rechenleistung: Technologische Innovation und Politik sind Zweiradantrieb, und die Rechenleistung der KI boomt

1. Auf der Angebotsseite wird die Rechenleistung weiter verbessert, und in Zukunft wird die „Cloud-Edge-End“-Architektur entstehen.

In Bezug auf die Rechenleistung kann sie in allgemeine Rechenleistung, intelligente Rechenleistung und Superrechenleistung unterteilt werden. Den Kern der Rechenleistung bilden verschiedene Rechenchips wie CPU, GPU, FPGA, ASIC usw., die von Computern, Servern, Hochleistungsrechnerclustern und verschiedenen intelligenten Terminals getragen werden. Massive Datenverarbeitung und verschiedene digitale Anwendungen sind untrennbar miteinander verbunden Rechnen. Die Verarbeitung und Berechnung von Kraft. Je größer der Rechenleistungswert, desto stärker die umfassende Rechenleistung. Die häufig verwendete Maßeinheit ist FLOPS (die Anzahl der pro Sekunde ausgeführten Gleitkommaoperationen).

Rechenleistung ist die Menge an Informationsdaten, die ein Gerät pro Sekunde basierend auf Änderungen seines internen Zustands verarbeiten kann. Die Entwicklung von Rechenleistungsträgern hat die Ära durchlaufen, die von Abakus und mechanischen Taschenrechnern repräsentiert wird, bis hin zu Servern, die auf der Basisplattform des Internets basieren. Da sich in den letzten 20 Jahren der Reichtum an Rechenleistungsträgern erheblich verbessert hat, ist ein Trend zu einer diversifizierten Entwicklung zu beobachten.

Die Rechenleistungsarchitektur kann in Chips, Geräte und Software zerlegt werden und stellt ein integriertes „Cloud-Edge-End“-Muster dar. In Zukunft wird ein allgegenwärtiges Rechenleistungsbereitstellungsmodell gebildet, bei dem die Cloud-Seite für umfangreiche komplexe Berechnungen, die Edge-Seite für die einfache Berechnungsausführung und die Terminalseite für Wahrnehmung und Interaktion verantwortlich ist.

2. Große Modelle führen zu einem exponentiellen Wachstum der Nachfrage nach intelligenter Rechenleistung

Große Modelle erfordern leistungsstarke Rechenleistung zur Unterstützung des Trainingsprozesses und des Inferenzprozesses. Laut OpenAI-Daten erfordert das Training des GPT-3175B-Modells eine Rechenleistung von bis zu 3640PF-Tagen (wenn eine Billiarde Gleitkommaoperationen pro Sekunde ausgeführt werden, sind 3640 Tage erforderlich). Seit 2018 hat die Parameterskala großer Modelle Hunderte Milliarden Parameter erreicht. Die physikalische Technik und die Anzahl der Kerne der CPU stoßen an ihre Grenzen. Im KI-Zeitalter kann die CPU allein die Nachfrage nicht mehr decken. Die Entwicklung intelligenter Rechenleistung durch heterogene Beschleunigungschips wie GPU, FPGA, ASIC usw. ist zu einem Trend geworden und wird schließlich zum Protagonisten der Rechenleistung werden die Ära der generativen künstlichen Intelligenz.

Nach dem Mooreschen Gesetz verdoppelt sich die Rechenleistung im KI-Zeitalter durchschnittlich alle 3,43 Monate. Seit 2012 ist die Rechenleistung der zugrunde liegenden maschinellen Lerntechnologie, die die KI antreibt, exponentiell gestiegen. Laut dem OpenAI-Papier betrug die Verdopplungszeit der Rechenleistung in der frühen Phase des Deep Learning 21,3 Monate, und in der Deep-Learning-Phase betrug die Verdoppelungszeit der Rechenleistung 21,3 Monate. Die Verdoppelungszeit der Rechenleistung betrug 5,7 Monate. Im großen Modellzeitraum wird sich die für KI-Trainingsaufgaben verwendete Rechenleistung alle 3,43 Monate verdoppeln, was den durch das Mooresche Gesetz verursachten Anstieg der Rechenleistung (Transistoren verdoppeln sich alle 18 Monate) bei weitem übersteigt.

Der Rechenleistungsbedarf großer Modelle spiegelt sich hauptsächlich in den folgenden drei Szenarien wider:

(1) Anforderungen an die Rechenleistung vor dem Training: Der Modell-Vortrainingsprozess ist das Hauptszenario, das Rechenleistung verbraucht. ChatGPT verwendet ein vorab trainiertes Sprachmodell. GPT-3 verfügt über etwa 175 Milliarden Parameter. GPT-4 ist mehr als zehnmal größer als GPT-3. Es verfügt über etwa 1,8 Billionen Parameter, verteilt auf 120 Schichten, 13 Billionen Token und OpenAI Training Die FLOPS von GPT-4 betragen etwa 2,15*10^25, und die Rechenleistung eines einzelnen NVIDIA A100 beträgt 19,5TFlops (19,5 Billionen Gleitkommaoperationen pro Sekunde). Wenn die Auslastung nicht berücksichtigt wird, dauert das Training mit 25.000 A100s 52 Tatsächlich wurde der Fall 90 bis 100 Tage lang auf etwa 25.000 A100 trainiert, mit einer MFU (mittlere funktionale Auslastung) zwischen 32 % und 36 %. Wenn die Kosten für OpenAI-Cloud-Computing fast 1 US-Dollar pro 100 Stunden betragen, ohne alle Experimente, fehlgeschlagene Schulungen und andere Kosten wie Datenerfassung, RLHF (Optimierung von Sprachmodellen basierend auf menschlichem Feedback in einer Reinforcement-Learning-Methode), Personalkosten usw ., die Kosten für diese Schulung belaufen sich auf etwa 63 Millionen US-Dollar.

(2) Anforderungen an die Rechenleistung für den täglichen Betrieb: Es wird erwartet, dass ChatGPT für den einmonatigen Betrieb eine Rechenleistung von etwa 4874,4 PFlops-Tagen benötigt, mit entsprechenden Kosten von etwa 18 Millionen US-Dollar. Nach Abschluss des Modell-Vortrainings ist der Bedarf von ChatGPT an der zugrunde liegenden Rechenleistung nicht gesunken. Im täglichen Betrieb bringt die Benutzerinteraktion einen Datenverarbeitungsbedarf mit sich. Laut September-Daten der offiziellen OpenAI-Website hat ChatGPT derzeit mehr als 100 Millionen Nutzer und generiert 1,8 Milliarden Besuche pro Monat. Laut der Zeitschrift Fortune belaufen sich die Kosten für die Rechenleistung des Cloud-Dienstes jedes Mal, wenn ein Benutzer mit ChatGPT interagiert, auf etwa 0,01 US-Dollar. Auf dieser Grundlage schätzen wir, dass die monatlichen Betriebskosten für die Rechenleistung von OpenAI für ChatGPT 18 Millionen US-Dollar betragen.

(3) Anforderungen an die Rechenleistung für die Modelloptimierung: Aus Sicht der Modelliteration ist das ChatGPT-Modell nicht statisch, sondern erfordert eine kontinuierliche Feinabstimmung des Modells, um sicherzustellen, dass sich das Modell im besten Anwendungszustand befindet. Während des Optimierungsprozesses müssen Entwickler einerseits die Modellparameter anpassen, um sicherzustellen, dass der Ausgabeinhalt nicht schädlich und verzerrt ist; andererseits muss das Modell basierend auf Benutzerfeedback und PPO (Proximal Policy Optimization) angepasst werden im großen oder kleinen Maßstab modifiziert werden. Iteratives Training im großen Maßstab. Daher führt die Modelloptimierung auch zu Kosten für die Rechenleistung von OpenAI. Die spezifischen Anforderungen an die Rechenleistung und die Höhe der Kosten hängen von der Iterationsgeschwindigkeit des Modells ab.

3. Übersee: Das Ausmaß der globalen Rechenleistung ist in eine Phase der Beschleunigung eingetreten, und Technologieriesen erhöhen weiterhin ihre KI-Investitionsausgaben.

Mit der globalen Welle der künstlichen Intelligenz ist das Ausmaß der globalen Rechenleistung explosionsartig gewachsen. Im Jahr 2022 wird die Gesamtskala der globalen Rechenleistung 906 EFlops erreichen, mit einer Wachstumsrate von 47 %, wovon die grundlegende Rechenleistungsskala (FP32) 440 EFlops beträgt, die intelligente Rechenleistungsskala (umgerechnet in FP32) 451 EFlops beträgt Die Leistungsskala des Supercomputings (umgerechnet in FP32) beträgt 451EFlops. 16EFlops. Laut der Prognose von China Mobile wird die globale Rechenleistung in den nächsten fünf Jahren um mehr als 50 % wachsen. Die Gesamtrechenleistung globaler Computergeräte wird bis 2025 3ZFlops und bis 2030 20ZFlops überschreiten.

Die von AIGC geleiteten Anwendungen zeigten eine starke Leistung und trieben das schnelle und nachhaltige Wachstum des intelligenten Computings voran. IDC prognostiziert, dass der weltweite Markt für künstliche Intelligenz von 19,5 Milliarden US-Dollar im Jahr 2022 auf 34,66 Milliarden US-Dollar im Jahr 2026 wachsen wird. Unter anderem wird die Größe des Marktes für generative künstliche Intelligenz von 820 Millionen US-Dollar im Jahr 2022 auf 10,99 Milliarden US-Dollar im Jahr 2026 steigen, und sein Anteil am Gesamtmarkt für künstliche Intelligenz wird von 4,2 % auf 31,7 % steigen. Generative künstliche Intelligenz wird die innovative Entwicklung von Branchen wie dem Internet, der Fertigung, dem Finanzwesen, der Bildung und der medizinischen Versorgung fördern.

Den Berichten ausländischer Cloud-Giganten für das dritte Quartal zufolge steigern Investitionen in künstliche Intelligenz den Umsatz und die Kapitalausgaben. Seit Jahresbeginn hat der rasante Aufstieg der generativen KI-Technologiewelle zu einem deutlichen Anstieg der Nachfrage nach KI-Rechenleistung geführt. Die ausländischen Cloud-Giganten Google, Microsoft und Meta (Amazon werde ich vorerst nicht berücksichtigen, Amazon hat die Investitionsausgaben für Lagerhaltung und Logistik im dritten Quartal reduziert, mit größerer Auswirkung. Die Investitionsausgaben beliefen sich im dritten Quartal auf 21,205 Milliarden US-Dollar, wobei die gesamten Investitionsausgaben im Vergleich zum Vorquartal um 9,43 % stiegen, was hauptsächlich auf erhöhte Investitionen in die KI-Infrastruktur zurückzuführen ist . Jedes Unternehmen erklärte bei der Leistungsbesprechung, dass es im Jahr 2024 weiterhin in den KI-Bereich investieren werde.

4. Inland: Die Nachfrage nach intelligenter Rechenleistung wächst weiter und das Chip-Verbot führt zu einem Missverhältnis zwischen Angebot und Nachfrage nach High-End-Rechenleistung.

Rechenleistung hat einen erheblichen Einfluss auf die Förderung des BIP-Wachstums und der digitalen Wirtschaft. Relevante Daten zeigen, dass mit jedem Anstieg des Rechenleistungsindex der fünfzehn Stichprobenländer um 1 Punkt die digitale Wirtschaft und das BIP des Landes um 3,6‰ bzw. 1,7‰ wachsen werden. Dieser Trend wird sich voraussichtlich von 2023 bis 2026 fortsetzen.

China belegt im Rechenleistungsindex den zweiten Platz und ist Spitzenreiter. Laut dem „2022-2023 Global Computing Power Index Assessment Report“ gehören zu den Ländern der ersten Reihe China und die Vereinigten Staaten; zu den Ländern der zweiten Reihe gehören Japan, Deutschland, das Vereinigte Königreich, Frankreich, Kanada, Südkorea und Australien; zur dritten Reihe Zu den Tier-Ländern gehören Indien, Italien, Brasilien, Russland, Südafrika und Malaysia. Im Jahr 2022 stieg der Rechenleistungsindex Chinas im Vergleich zum Vorjahr um 1,4 % und erreichte 71 Punkte. Im Jahr 2022 wurde er wiederholt von der Epidemie beeinträchtigt und das jährliche BIP-Wachstum war geringer als erwartet. In einem solchen allgemeinen Umfeld ist Chinas Computer Der Leistungsindex stieg weiter.

Die Größe der Kern-Computerindustrie Chinas hat schnell zugenommen und ist zu einem wichtigen Motor des inländischen BIP-Wachstums geworden. Nach Angaben des Ministeriums für Industrie und Informationstechnologie hat der Umfang der Kernrechenleistungsindustrie meines Landes Ende 2022 1,8 Billionen Yuan erreicht, und der Gesamtumfang der Rechenleistung hat 180 EFLOPS erreicht, mit einer jährlichen Wachstumsrate von fast 30 %; der Gesamtumfang der Speicherleistung hat 1.000 EB überschritten; unter den nationalen Hub-Knoten wird die Einweg-Netzwerkverzögerung auf weniger als 20 Millisekunden reduziert. Es wird geschätzt, dass das Ausmaß von Chinas Kernindustrie für Rechenleistung im Jahr 2023 zunehmen wird. Jeder in Rechenleistung investierte Yuan wird das BIP-Wirtschaftswachstum um 3 bis 4 Yuan steigern.

Das Jahr 2023 ist der Wendepunkt für die digitale Transformation der Unternehmen und es wird erwartet, dass die Investitionsausgaben im Jahr 2024 weiter steigen werden. Ab 2022 werden globale Unternehmen beginnen, den Digitalisierungsprozess im Zuge der digitalen Transformation zu beschleunigen. 2023 wird der Wendepunkt der digitalen Transformation von Unternehmen sein. Unternehmen werden aus der Ära der digitalen Transformation in das digitale Geschäftszeitalter eintreten und schrittweise in eine neue Phase eintreten Digitalisierung. Einer IDC-Studie zufolge werden die weltweiten Ausgaben für die digitale Transformation bis Ende 2023 52 % der gesamten IKT-Ausgaben von Unternehmen ausmachen, und 52 % der weltweiten Ausgaben für Softwareanwendungen werden ebenfalls im SaaS-Modell erfolgen. Die weltweiten Ausgaben für digitale Transformationstechnologien werden im Jahr 2023 voraussichtlich um 16,9 % steigen. Die digitale Transformation zeigt erste Ergebnisse bei Kostensenkungen, Effizienzsteigerungen, verbesserten Innovationsfähigkeiten sowie der Transformation und Modernisierung von Geschäftsmodellen und ist zur zentralen Entwicklungsstrategie von Unternehmen geworden.

Es wird erwartet, dass der Gesamtumfang der inländischen Rechenleistungsindustrie in den nächsten drei Jahren eine jährliche Wachstumsrate von etwa 30 % beibehalten wird, und die Durchdringungsrate und der Anteil intelligenter Rechenleistung nehmen rasch zu. In den letzten Jahren hat mein Land seine Investitionen in Infrastruktur wie Computer, Netzwerk und Speicher kontinuierlich erhöht und großen Wert auf die qualitativ hochwertige Entwicklung von Computerinfrastruktur wie Rechenzentren, intelligenten Rechenzentren, Supercomputing-Zentren und Edge-Rechenzentren gelegt. In den letzten fünf Jahren überstieg die durchschnittliche jährliche Wachstumsrate der Rechenleistungsindustrie meines Landes 30 %.

Die Durchdringungsrate intelligenter Rechenleistung nimmt allmählich zu. Die intelligente Rechenleistung wächst rasant, und die intelligente Rechenleistung ist zu einem neuen Wachstumsmotor für die neue Rechenleistung geworden. Bis Ende 2022 hat die Gesamtgröße der chinesischen Rechenleistung 180 EFLOPS erreicht, wovon die Größe der intelligenten Rechenleistung bereits 180 EFLOPS erreicht hat stieg im Vergleich zum Vorjahr um 41,4 % und übertraf damit die weltweite Gesamtleistung intelligenter Rechenleistung. Wachstumsrate (25,7 %), wobei die allgemeine Rechenleistungsskala 137 EFLOPS beträgt, was etwa 76,7 % ausmacht, und die intelligente Rechenleistungsskala 41 EFLOPS beträgt für etwa 22,8 %. Laut dem „China Artificial Intelligence Computing Power Development Assessment Report 2022-2023“ wird die durchschnittliche jährliche Wachstumsrate der intelligenten Rechenleistung Chinas in den nächsten fünf Jahren 52,3 % erreichen, und die durchschnittliche jährliche Wachstumsrate der allgemeinen Rechenleistungsskala wird 52,3 % erreichen 18,5 % betragen. Es wird erwartet, dass Chinas intelligente Rechenleistung bis 2026 145 EFLOPS erreichen wird, was 36,7 % entspricht. Mit der rasanten Entwicklung großer KI-Modelle wächst die Nachfrage nach intelligenter Rechenleistung explosionsartig und die Durchdringungsrate wird deutlich zunehmen.

(2) Hauptinvestitionslinien auf der Seite der Rechenleistung: Lokalisierung, Speicher mit hoher Bandbreite, KI-Server, Flüssigkeitskühlung, Leasing von Rechenleistung

1. Exportverbot zwingt zur Beschleunigung der Lokalisierung, Parametervergleich Huawei Ascend vs. Nvidia

Das Exportverbot beeinträchtigt die Versorgung im Ausland und zwingt zu einer Beschleunigung der inländischen Substitution. Am 17. Oktober 2023 erließ das Bureau of Industry and Security (BIS) des US-Handelsministeriums neue Exportverbotsbestimmungen für Chips, die den Kauf wichtiger High-End-Chips durch China strenger einschränken. Einerseits haben inländische Unternehmen und Forschungsinstitute seit der Einführung von ChatGPT in etwas mehr als einem halben Jahr mehr als 130 große Modelle auf den Markt gebracht. Unter ihnen haben führende Akteure damit begonnen, große Modelle auf bestimmte Szenarien anzuwenden, um beliebte Anwendungen zu erstellen. . Um andererseits eine Rechenleistungsbasis aufzubauen, haben lokale Regierungen mit dem Bau intelligenter Rechenzentren begonnen, um die Informationsautobahn im Big-Data-Zeitalter zu legen, industrielle Innovation und Modernisierung zu fördern und die Kosten für Unternehmen für die Nutzung wissenschaftlicher Daten zu senken und technologische Errungenschaften, dargestellt durch große Modelle.

2. Die „Memory Wall“ schränkt die Freisetzung von Rechenleistung ein und Volumen und Preis von HBM-Speichern mit hoher Bandbreite steigen.

Derzeit haben GPUs bei Training und Inferenz unter den KI-Chips einen absoluten Vorteil. KI-Chips, auch KI-Beschleuniger oder Rechenkarten genannt, sind Module, die speziell für die Bewältigung einer großen Anzahl von Rechenaufgaben in Anwendungen der künstlichen Intelligenz entwickelt wurden. KI-Chips sind die Kernkomponenten von KI-Servern und machen fast 70 % des Wertes von KI-Servern aus . Derzeit umfassen gängige KI-Computing-Chips hauptsächlich CPU, GPU, FPGA, ASIC usw. Unter diesen ist die GPU ein relativ ausgereifter Allzweck-Chip für künstliche Intelligenz, während FPGA und ASIC halb- und vollständig angepasste Chips sind, die auf den Merkmalen der Anforderungen an künstliche Intelligenz basieren. GPU, FPGA und ASIC dienen als Beschleunigungschips zur Unterstützung der CPU in groß angelegten Berechnungen.

Hauptzeile 2: Auf der Datenseite geben Datenelemente dreimal einen Wert frei und gelangen in die Tabelle, um die „Explizitenität“ des Werts zu fördern.

(1) Daten in menschlicher Form: Mit der Implementierung Anfang 2024 hat die Ära der Datenkapitalisierung offiziell begonnen

Daten als immaterielle Vermögenswerte sind nicht exklusiv, während Daten als Inventar exklusiv sind. In den meisten Szenarien und Unternehmen verwenden Unternehmen Datenressourcen wiederholt. Zu den Nutzungsszenarien gehören unter anderem die Selbstnutzung von Daten zur Generierung von Produktverkäufen zur Generierung von wirtschaftlichem Wert, die Weitergabe von Daten an Kunden zur Generierung von wirtschaftlichem Wert usw. Datenressourcen werden von verwendet mehreren Parteien. , hat kein ausschließliches Nutzungsrecht und sollte ein immaterieller Vermögenswert sein. In den Bestandsszenarien werden hauptsächlich Datenerfassungs- und -verarbeitungshersteller berücksichtigt. Der Zweck der Generierung von Datenressourcen besteht lediglich für den Verkauf und die Übertragung des Dateneigentums. Nach dem Verkauf gehören die Daten nicht mehr dem ursprünglichen Unternehmen und sind exklusiv.

(2) Es besteht noch Spielraum für eine Verfeinerung der Datenelementrichtlinien, und es wird erwartet, dass die katalytische Wirkung der Richtlinie hervorgehoben wird

Die Systemformulierung in den Zwanzig Datenartikeln erstreckt sich über den gesamten Lebenszyklus der Datenindustriekette und schlägt vier Kerndatenbasissysteme vor, darunter das Dateneigentumsrechtesystem, das Datenelementzirkulations- und Transaktionssystem, das Datenelementeinkommensverteilungssystem, und das Datenelement-Governance-System. Unter diesen vier Systemen ist das Dateneigentumsrechtssystem die Grundlage, das Zirkulations- und Transaktionssystem der Kern, das Einkommensverteilungssystem die treibende Kraft und das Governance-System die Garantie. Diese vier Grundsysteme sind die „vier Balken und acht Säulen“ der nachhaltigen Entwicklung der Datenwirtschaft meines Landes und der Eckpfeiler der Entwicklung von Datenelementen.

(3) Datenelemente führen zu drei Wertfreigaben, und der Datenkapitalraum wird voraussichtlich 30 Billionen erreichen

Die drei Wertveröffentlichungen erfolgen schrittweise, wobei die letztere auf der vorherigen basiert. Derzeit sind die ersten beiden Datenwertfreigabeumgebungen meines Landes allmählich ausgereift. Wir glauben, dass sich die dritte Wertfreigabe von der Vergangenheit unterscheidet und sich auf die Datenzirkulation von innerhalb des Unternehmens nach außen konzentriert, wodurch der Datenfluss von der Angebotsseite zur Nachfrageseite verbessert wird und die Produktionseffizienz und der Datenwert als Ganzes maximiert werden Produktionsfaktor. Darüber hinaus werden die drei Wertfreigaben neue datenbezogene Technologien hervorbringen und die Industriekette weiter bereichern und verbessern.

(4) Analyse segmentierter Investitionsmöglichkeiten: „Eindeutigkeit“ des Werts entlang der gesamten Industriekette

Data Governance ist untrennbar mit einer qualitativ hochwertigen Datenerfassung und -annotation verbunden. Aus der Perspektive der AI-Data-Governance-Industriekettenkarte ist der Upstream hauptsächlich der Anbieter von Daten und der Downstream hauptsächlich die endgültige Anwendungspartei der Daten. Die für das Training und die Inferenz von KI-Modellen verwendeten Daten werden hauptsächlich von Midstream-Basisdatendienstanbietern gesammelt und kommentiert, und die Data-Governance-Plattform optimiert und verwaltet die Daten.

Derzeit gibt es entsprechende Erkundungen und Umsetzungen auf industrieller Seite. People's Data, eine Tochtergesellschaft von People's Daily Online, stellt die „drei Zertifikate“ für Datenelemente gemäß der in den „Twenty Articles on Data“ genannten Trennung der drei Rechte aus – „Data Resource Ownership Certificate“ und „Data Processing Use Rights Certificate“. " und "Data Product Operation Rights Certificate" . Die „Drei Zertifikate“ basieren auf der People's Chain Baas-Dienstplattform (Version 2.0), die Rechtebestätigung, Verkettung, Zertifikatspeicherung und Transaktionsdienste durchführt. Die „drei Zertifikate“ zielen hauptsächlich darauf ab, relativ verstreute Daten zwischen Partei- und Regierungsbehörden auf allen Ebenen und Big-Data-Austauschen zu vereinheitlichen und zu verbinden, eine nationale Plattform für Datenhandelsdienste zu bilden und gleichzeitig das Problem unklarer Datenrechte zu lösen.

Gesamtbericht: 103 Seiten

Supongo que te gusta

Origin blog.csdn.net/GPT20236688/article/details/134895165
Recomendado
Clasificación