Zhiyuan AI Daily (2022-08-30): Huawei Xie Lingxi: Persönliche Ansichten zur Entwicklung des Bereichs der visuellen Erkennung

【Zhiyuan AI Daily】 Schnelllesen für 5 Minuten am Tag, AI wichtige Dinge, die man nicht verpassen sollte! Willkommen, wenn Sie hier klicken , um Zhiyuan AI Daily zu folgen und ihn zu abonnieren.

Standpunkt | Huawei Xie Lingxi: Persönliche Ansichten zur Entwicklung des Bereichs der visuellen Erkennung
Standpunkt: Ausgehend von der Differenz zwischen Computer Vision und Natural Language Processing (den beiden am meisten betroffenen Forschungsrichtungen in der künstlichen Intelligenz) führt dies zu drei grundlegenden Eigenschaften des Bildes Signale: Informationsarmut, domänenübergreifende Variabilität und unendliche Granularität, und ordnen Sie sie mehreren wichtigen Forschungsrichtungen zu.

Bestandsaufnahme | In den nächsten zehn Jahren wird sich die KI-Spracherkennung in diese fünf Richtungen entwickeln 
: mehrsprachiges ASR-Modell, reichhaltige standardisierte Ausgabeobjekte, groß angelegte ASR für alle, Mensch-Maschine-Kollaboration und verantwortungsvolle ASR

Interpretation | ICLR Spotlight: Facebook hat einen verlustfreien INT8-Optimierer vorgeschlagen, kann eine einzelne Maschine Hunderte von Milliarden von Parametermodellen ausführen? 
Highlights: Mit nur zwei Zeilen Codeänderungen können Sie Hunderte von Milliarden Modellen auf einer einzigen Maschine trainieren.

Erfahrungen | Tipps: Umgang mit unbalancierten Proben 
Aspekt „One-Meal-Operation“: Zusammenfassung einiger häufig verwendeter Lösungen für das Problem unbalancierter Proben, wie „Resampling“, „Tomek-Links“ usw.

Information | ECCV 2022 Papier, CMU schlug den ersten visuellen Rahmen für schnelle Wissensdestillation vor: ResNet50 80,1 % Genauigkeit, 30 % Trainingsbeschleunigung 
Aspekt: ​​Es ist eine der besten Strategien zur Wissensdestillation für Genauigkeit und Geschwindigkeit, und der Code und das Modell sind alle Open-Source.

Modell | Mit der Hinzufügung von Web UI verwandelt sich das Text-Bild-Modell Stable Diffusion in ein Zeichenwerkzeug, um Blockbuster-Kunsthighlights zu generieren 
: Dieses Projekt ermöglicht es Freunden, die nicht über systematisches Erlernen von UI-Kenntnissen verfügen, zu beginnen.

Interpretation | Tongji & Youtu & Southwest Jiaotong University schlugen vor, Frequenzbereichsinformationen zu verwenden, um Luftrauminformationen für eine genaue Erkennung von Tarnzielen zu unterstützen 
Aspekt: ​​Umfassende Experimente an drei weit verbreiteten COD-Datensätzen zeigen, dass diese Methode deutlich besser ist als andere hochmoderne künstlerische Methode.

Download| Mathematische Herleitung erklärt die DL-Theorie im Detail! Princetons neustes 127-seitiges pdf „Deep Learning Theory“ Concise Book bringt Sie dazu, Deep-Learning-Optimierung, Generalisierung und andere 
Sichtweisen zu verstehen: basierend auf dem Graduiertenseminar der Princeton University im Herbst 2019 und gleichzeitig mit dem Optimierung, Statistik und Maschinen des Institute of Advanced Studies Study in Verbindung mit Special Years.

Kurs | Highlights des neuesten Kurses „Robot Learning and Decision Making“ der Cornell University 
: Dieser Kurs konzentriert sich auf Algorithmen, zieht Lehren aus der realen Robotik und hat eine starke Programmierkomponente.

Modelle | ECCV 2022 Paper: Große Modelle? Miniaturen? Ich will alles: Splitten und Entkoppeln von Wissen!
Highlights: Die Zerlegung eines großen Modells in mehrere kleine Modelle kann die Skalierbarkeit des Modells erheblich erweitern und die Interpretierbarkeit zwischen Aufgaben sicherstellen.

Supongo que te gusta

Origin blog.csdn.net/lionkingcz/article/details/126603441
Recomendado
Clasificación