Deep-Learning-Praxis: Einführung und Praxis von Faltungs-Neuronalen Netzen

Autor: Zen und die Kunst der Computerprogrammierung

1. Einleitung

Mit der Entwicklung neuer Informationstechnologien wie dem Internet und dem mobilen Internet spielt Deep Learning in vielen Bereichen wie Bilderkennung, Textklassifizierung, maschineller Sprachverarbeitung, autonomes Fahren und Spracherkennung eine immer wichtigere Rolle. Unter Deep Learning versteht man das Trainieren eines Modells durch eine Reihe von Mitteln, sodass es automatisch effektive Merkmalsdarstellungen aus einer großen Datenmenge lernen und diese Merkmale zur Vorhersage oder Klassifizierung von Eingabedaten verwenden kann. Es wurde erstmals von Deep Belief Networks vorgeschlagen und ist ein tiefes, unbeaufsichtigtes neuronales Feedforward-Netzwerk, das ein hochpräzises Lernen komplexer Datensätze ermöglichen kann. Das Convolutional Neural Network (CNN) stellt eine sehr wichtige Netzwerkstruktur beim Deep Learning dar. Es wurde zunächst für Bilderkennungsaufgaben vorgeschlagen und wird nach und nach auch in anderen Bereichen wie Sprache und Text eingesetzt. In den letzten Jahren haben sich mit der kontinuierlichen Verbesserung der GPU-Hardwareleistung GPU-beschleunigte Deep-Learning-Frameworks (wie TensorFlow, Theano usw.) zu einem Forschungs-Hotspot entwickelt, und CNN ist auch zu einem der heißen Themen im Bereich Deep geworden Lernen. In diesem Artikel werden die grundlegenden Konzepte, Prinzipien und grundlegenden Betriebsmethoden von Faltungs-Neuronalen Netzen ausführlicher erläutert und anhand praktischer Beispiele gezeigt, wie Faltungs-Neuronale Netze in Python implementiert werden. Abschließend werden einige Referenzmaterialien bereitgestellt, in der Hoffnung, dass die Leser sie selbst üben und ein tiefgreifendes Verständnis der Prinzipien und Anwendungen von Faltungs-Neuronalen Netzen erlangen können.

2. Erläuterung grundlegender Konzepte und Begriffe

2.1 Bild

Traditionell basiert Computer Vision hauptsächlich auf der zweidimensionalen Bildsignalverarbeitung, d. Mit der Popularisierung dreidimensionaler Kameras und der Laserscan-Technologie sowie der Verbesserung der Tiefensensortechnologie entwickelt sich die moderne Computer Vision jedoch in Richtung multimodaler und hochdimensionaler Daten. Unter ihnen spielt Deep Learning eine entscheidende Rolle bei der Bilderkennung.

2.2 Modell

Faltungs-Neuronales Netzwerk (Convol

おすすめ

転載: blog.csdn.net/universsky2015/article/details/132798322