[Mathematik in der Künstlichen Intelligenz] Grundlagen der linearen Algebra

Artikelverzeichnis der Serie

[Studiennotizen zur künstlichen Intelligenz] Mathematik in der künstlichen Intelligenz – Überblick
[Mathematik in der künstlichen Intelligenz] Differentialrechnung einer variablen Funktion
[Mathematik in der künstlichen Intelligenz] Grundlegende lineare Algebra
[Mathematik in der künstlichen Intelligenz] Multivariates Funktionsdifferential



Vorwort

Im Vergleich zur Softwareentwicklung erfordert der Bereich der künstlichen Intelligenz viel mathematisches Wissen. Hauptsächlich werden Analysis, lineare Algebra, Wahrscheinlichkeitstheorie und Optimierung behandelt.
In diesem Artikel werden hauptsächlich die Grundlagen der linearen Algebra vorgestellt.
Dieser Artikel dient als meine Notizen zum Erlernen künstlicher Intelligenz, hauptsächlich für mich selbst, um die Vergangenheit Revue passieren zu lassen und das Neue in der Zukunft zu lernen, und es hier zu klären, wird als zweite Studie betrachtet. Es ist mir eine Ehre, Ihnen behilflich sein zu dürfen. Wenn ich falsch liege, freue ich mich über Korrekturen. Bei Verstößen wenden Sie sich bitte an den Autor, um die Löschung zu veranlassen.


1. Vektoren und ihre Operationen

Der Vektor ist das grundlegendste Konzept der linearen Algebra. Tatsächlich handelt es sich um ein eindimensionales Array bestehend aus N
Zahlen
oder Kraft. Vektoren,
Fügen Sie hier eine Bildbeschreibung ein
die Komponenten von Vektoren werden Dimensionen genannt, und die gesamte Menge n-dimensionaler Vektoren bildet einen n-dimensionalen euklidischen Raum:
Fügen Sie hier eine Bildbeschreibung ein

1.2 Zeilen- und Spaltenvektoren

Zeilenvektoren ordnen Vektoren zeilenweise an, und Spaltenvektoren ordnen Vektoren spaltenweise an.
Fügen Sie hier eine Bildbeschreibung ein
In der Mathematik schreiben wir mehr Daten als Spaltenvektoren und in Programmiersprachen speichern wir mehr Daten als Zeilenvektoren.

1.3 Vektoroperationen

Zu den Vektoroperationen gehören hauptsächlich: Addition, Multiplikation, Subtraktion, inneres Produkt und Transponierung. Lassen Sie uns sie einzeln auflisten:

1.3.1 Addition und Subtraktion von Vektoren

Die ihnen gleichen Komponenten werden separat addiert. Offensichtlich müssen die Längen der beiden Vektoren gleich sein. Wir werden die Subtraktion hier nicht auflisten, und es ist einfach, aus einer Instanz andere Fälle abzuleiten.
Fügen Sie hier eine Bildbeschreibung ein

1.3.2 Multiplikation von Vektoren

Es ist eine Zahl und jede Komponente dieses Vektors wird multipliziert
Fügen Sie hier eine Bildbeschreibung ein

1.3.3 Transponieren

Wandeln Sie einen Spaltenvektor in einen Zeilenvektor und einen Zeilenvektor in einen Spaltenvektor um
Fügen Sie hier eine Bildbeschreibung ein

1.3.4 Algorithmen

A+B+C=A+(B+C)
K*(X+Y)=KX+KY

1.3.5 Inneres Produkt von Vektoren

Zwei Spaltenvektoren:
Fügen Sie hier eine Bildbeschreibung ein
gleich der Multiplikation der entsprechenden Positionen und dann der Addition.
Das Wesen des inneren Produkts zweier Vektoren besteht darin, ein Skalar zu werden
Fügen Sie hier eine Bildbeschreibung ein

1.4 Norm von Vektoren

Die Formel der Norm besteht darin, den Absolutwert jeder Komponente des Vektors mit P zu potenzieren und dann die Potenzfunktion zu verwenden, um einen Teil von P zu berechnen. Dabei muss P eine ganze Zahl von 1, 2, 3 ... bis zur positiven Unendlichkeit
sein Die
Norm des Vektors besteht darin, den Vektor in einen Skalar umzuwandeln, den Ausdruck der Norm durch zwei vertikale Linien darzustellen und dann P in die untere rechte Ecke zu schreiben
Fügen Sie hier eine Bildbeschreibung ein
Fügen Sie hier eine Bildbeschreibung ein

  1. Die Norm ist die Summe absoluter Werte und die Norm 1. Ordnung wird als L1 geschrieben
    Fügen Sie hier eine Bildbeschreibung ein
  2. Die Norm ist die Summe des Quadrats und des Wurzelzeichens. Tatsächlich stellt sie die Länge des Vektors dar. Der in der High School gelernte Modul des Vektors. Es ist sehr nützlich, die 2-Norm später als L2-Norm zu schreiben . Es
    Fügen Sie hier eine Bildbeschreibung ein
    wird später verwendet, wenn über reguläre Begriffe gesprochen wird.

1.5 Spezielle Vektoren

1.5.1 Nullvektor

ist ein Vektor mit allen Nullkomponenten
(0 0 . . 0)

1.5.2 Einheitsvektoren

Es ist ein Vektor mit L2-Norm/Modul/Länge 1

2. Matrix und ihre Operationen

Fügen Sie hier eine Bildbeschreibung ein
Eine Matrix ist ein zweidimensionales Array. Es ist eine m-mal-n-Matrix. Sie hat m Zeilen und n Spalten. Jede Zeile und Spalte enthält ein Element. Jedes Element hat eine Zeilenbeschriftung i und eine Spaltenbeschriftung j, ein ij

2.1 Quadratische Matrix, symmetrische Matrix, Identitätsmatrix, Diagonale

2.1.1 Quadratische Matrix

Quadratische Matrix: Im Folgenden werden mehrere spezielle Matrizen vorgestellt. Wenn m gleich n ist, spricht man von einer quadratischen Matrix
Fügen Sie hier eine Bildbeschreibung ein

2.1.2 Symmetrische Matrizen

Symmetrische Matrix: Die Definition lautet, dass a ij gleich a ji ist , dann ist es eine symmetrische Matrix und es muss eine quadratische Matrix sein
Fügen Sie hier eine Bildbeschreibung ein

2.1.3 Identitätsmatrix

Einheitsmatrix: Die Hauptdiagonale ist alle 1 und die anderen Positionen sind 0. Dies wird als Einheitsmatrix bezeichnet. Die Einheitsmatrix wird als I geschrieben, was eine quadratische Matrix sein muss, was 1 in der Zahl entspricht.
Fügen Sie hier eine Bildbeschreibung ein

2.1.4 Diagonalmatrix

Diagonalmatrix: Die Hauptdiagonale ist ungleich Null und andere Positionen sind 0
Fügen Sie hier eine Bildbeschreibung ein

2.2 Funktionsweise der Matrix

2.2.1 Matrixaddition und -subtraktion

Die Addition der Matrix ist die Addition der entsprechenden Positionen der Matrix, und das Gleiche gilt für die Subtraktion, bei der es sich um die Subtraktion der entsprechenden Positionen handelt.
Fügen Sie hier eine Bildbeschreibung ein

2.2.2 Multiplikation

Fügen Sie hier eine Bildbeschreibung ein
Es gibt auch eine ganz besondere Operation für Matrizen

2.2.3 Transponieren

Die Operation der Transposition ist die gleiche wie die des Vektors, d. h. aij in aji umzuwandeln und Zeilen und Spalten auszutauschen
Fügen Sie hier eine Bildbeschreibung ein
Fügen Sie hier eine Bildbeschreibung ein

2.2.4 Multiplikation von Matrizen

Die Matrixmultiplikation ist nicht dasselbe wie die allgemeine Multiplikation.
Sie benötigt jede Zeile der ersten Matrix und jede Spalte der zweiten Matrix, um das innere Produkt zu bilden und das Ergebnis zu erhalten, das
Fügen Sie hier eine Bildbeschreibung ein
das Verteilungsgesetz, das Assoziativgesetz und das Kommutativgesetz
A+ erfüllt B+C=A+(B+C)
Addition muss erfüllt sein, Fokus auf Multiplikation
Zunächst einmal erfüllt die Multiplikation das Assoziativgesetz
(AB) C=A(BC)
erfüllt das Verteilungsgesetz, hier ist das linke Verteilungsgesetz und das rechte Verteilungsgesetz
( A+B)C=AC+BC
A(B+C)=AB+AC
betont insbesondere, dass die Matrix nicht das Kommutativgesetz erfüllt und nicht unbedingt gleich ist, auch wenn die Größe von AB von der von BA und
AB abweicht
BA Es gibt eine spezielle Transponierungsformel
Fügen Sie hier eine Bildbeschreibung ein

2.3 Inverse Matrix

Die Matrix hat AB, aber es gibt kein A/B. Mit anderen Worten, es gibt nur die inverse
Matrix. Wie ist die inverse Matrix definiert?
Angenommen, es gibt eine Matrix A. Beachten Sie, dass es sich um eine quadratische Matrix handeln muss. Multipliziert mit Matrix B ist I
AB=I
oder
BA=I. I
ist die Identitätsmatrix. Dann nennen wir B hier die rechte inverse Matrix von A und die Die linke inverse Matrix
hat ein A. Eine sehr wichtige Schlussfolgerung ist, dass, wenn ein solches B existiert, seine linke Inverse und seine rechte Inverse gleich sein müssen.
Welchen Nutzen hat die Invertierung der ? Es kann uns helfen, lineare Gleichungen zu lösen. Wenn beispielsweise AZ=B
gleichzeitig mit dem Kehrwert von A multipliziert wird, dann wird Z=A's -1 mit B multipliziert. Der Zweck seiner Erfindung besteht ebenfalls darin, solche Dinge zu tun.
Von hier aus können wir auch sehen, dass die Identitätsmatrix in unserer Multiplikation wie 1 ist.
Schauen wir uns die Formel an:
Fügen Sie hier eine Bildbeschreibung ein

2.4 Determinante

Tatsächlich wird die Determinante beim maschinellen Lernen nicht oft verwendet. Eine Matrix muss eine quadratische Matrix sein, um ihre Determinante zu berechnen. Die Determinante ist die Berechnungsmethode, mit der die Matrix in einen
Skalar umgewandelt wird
Fügen Sie hier eine Bildbeschreibung ein
Fügen Sie hier eine Bildbeschreibung ein
. Schauen wir uns die Determinante unten an. Die Natur der In der Formel ist dies natürlich die mit α multiplizierte Zahl in Form einer quadratischen Matrix
Fügen Sie hier eine Bildbeschreibung ein
, was der Multiplikation der n-ten Potenz von α mit der Determinante von A entspricht, denn als wir uns gerade die Berechnungsmethode angesehen haben, ist sie äquivalent zu Multiplizieren Sie jede Spalte mit α. Ist es n-ter Ordnung?

Fügen Sie hier eine Bildbeschreibung ein


Zusammenfassen

Das Obige ist das, worüber ich heute sprechen werde. In diesem Artikel werden nur kurz die Grundkenntnisse der linearen Algebra vorgestellt, die zu den relativ grundlegenden Wissenspunkten in der Hochschulmathematik gehören. Die fortgeschrittenen Kenntnisse der linearen Algebra werde ich später weiter erläutern.

Acho que você gosta

Origin blog.csdn.net/guigenyi/article/details/129780796
Recomendado
Clasificación