Artikelverzeichnis der Serie
[Studiennotizen zur künstlichen Intelligenz] Mathematik in der künstlichen Intelligenz – Überblick
[Mathematik in der künstlichen Intelligenz] Differentialrechnung einer variablen Funktion
[Mathematik in der künstlichen Intelligenz] Grundlegende lineare Algebra
[Mathematik in der künstlichen Intelligenz] Multivariates Funktionsdifferential
Artikelverzeichnis
Vorwort
Im Vergleich zur Softwareentwicklung erfordert der Bereich der künstlichen Intelligenz viel mathematisches Wissen. Hauptsächlich werden Analysis, lineare Algebra, Wahrscheinlichkeitstheorie und Optimierung behandelt.
In diesem Artikel werden hauptsächlich die Grundlagen der linearen Algebra vorgestellt.
Dieser Artikel dient als meine Notizen zum Erlernen künstlicher Intelligenz, hauptsächlich für mich selbst, um die Vergangenheit Revue passieren zu lassen und das Neue in der Zukunft zu lernen, und es hier zu klären, wird als zweite Studie betrachtet. Es ist mir eine Ehre, Ihnen behilflich sein zu dürfen. Wenn ich falsch liege, freue ich mich über Korrekturen. Bei Verstößen wenden Sie sich bitte an den Autor, um die Löschung zu veranlassen.
1. Vektoren und ihre Operationen
Der Vektor ist das grundlegendste Konzept der linearen Algebra. Tatsächlich handelt es sich um ein eindimensionales Array bestehend aus N
Zahlen
oder Kraft. Vektoren,
die Komponenten von Vektoren werden Dimensionen genannt, und die gesamte Menge n-dimensionaler Vektoren bildet einen n-dimensionalen euklidischen Raum:
1.2 Zeilen- und Spaltenvektoren
Zeilenvektoren ordnen Vektoren zeilenweise an, und Spaltenvektoren ordnen Vektoren spaltenweise an.
In der Mathematik schreiben wir mehr Daten als Spaltenvektoren und in Programmiersprachen speichern wir mehr Daten als Zeilenvektoren.
1.3 Vektoroperationen
Zu den Vektoroperationen gehören hauptsächlich: Addition, Multiplikation, Subtraktion, inneres Produkt und Transponierung. Lassen Sie uns sie einzeln auflisten:
1.3.1 Addition und Subtraktion von Vektoren
Die ihnen gleichen Komponenten werden separat addiert. Offensichtlich müssen die Längen der beiden Vektoren gleich sein. Wir werden die Subtraktion hier nicht auflisten, und es ist einfach, aus einer Instanz andere Fälle abzuleiten.
1.3.2 Multiplikation von Vektoren
Es ist eine Zahl und jede Komponente dieses Vektors wird multipliziert
1.3.3 Transponieren
Wandeln Sie einen Spaltenvektor in einen Zeilenvektor und einen Zeilenvektor in einen Spaltenvektor um
1.3.4 Algorithmen
A+B+C=A+(B+C)
K*(X+Y)=KX+KY
1.3.5 Inneres Produkt von Vektoren
Zwei Spaltenvektoren:
gleich der Multiplikation der entsprechenden Positionen und dann der Addition.
Das Wesen des inneren Produkts zweier Vektoren besteht darin, ein Skalar zu werden
1.4 Norm von Vektoren
Die Formel der Norm besteht darin, den Absolutwert jeder Komponente des Vektors mit P zu potenzieren und dann die Potenzfunktion zu verwenden, um einen Teil von P zu berechnen. Dabei muss P eine ganze Zahl von 1, 2, 3 ... bis zur positiven Unendlichkeit
sein Die
Norm des Vektors besteht darin, den Vektor in einen Skalar umzuwandeln, den Ausdruck der Norm durch zwei vertikale Linien darzustellen und dann P in die untere rechte Ecke zu schreiben
- Die Norm ist die Summe absoluter Werte und die Norm 1. Ordnung wird als L1 geschrieben
- Die Norm ist die Summe des Quadrats und des Wurzelzeichens. Tatsächlich stellt sie die Länge des Vektors dar. Der in der High School gelernte Modul des Vektors. Es ist sehr nützlich, die 2-Norm später als L2-Norm zu schreiben . Es
wird später verwendet, wenn über reguläre Begriffe gesprochen wird.
1.5 Spezielle Vektoren
1.5.1 Nullvektor
ist ein Vektor mit allen Nullkomponenten
(0 0 . . 0)
1.5.2 Einheitsvektoren
Es ist ein Vektor mit L2-Norm/Modul/Länge 1
2. Matrix und ihre Operationen
Eine Matrix ist ein zweidimensionales Array. Es ist eine m-mal-n-Matrix. Sie hat m Zeilen und n Spalten. Jede Zeile und Spalte enthält ein Element. Jedes Element hat eine Zeilenbeschriftung i und eine Spaltenbeschriftung j, ein ij
2.1 Quadratische Matrix, symmetrische Matrix, Identitätsmatrix, Diagonale
2.1.1 Quadratische Matrix
Quadratische Matrix: Im Folgenden werden mehrere spezielle Matrizen vorgestellt. Wenn m gleich n ist, spricht man von einer quadratischen Matrix
2.1.2 Symmetrische Matrizen
Symmetrische Matrix: Die Definition lautet, dass a ij gleich a ji ist , dann ist es eine symmetrische Matrix und es muss eine quadratische Matrix sein
2.1.3 Identitätsmatrix
Einheitsmatrix: Die Hauptdiagonale ist alle 1 und die anderen Positionen sind 0. Dies wird als Einheitsmatrix bezeichnet. Die Einheitsmatrix wird als I geschrieben, was eine quadratische Matrix sein muss, was 1 in der Zahl entspricht.
2.1.4 Diagonalmatrix
Diagonalmatrix: Die Hauptdiagonale ist ungleich Null und andere Positionen sind 0
2.2 Funktionsweise der Matrix
2.2.1 Matrixaddition und -subtraktion
Die Addition der Matrix ist die Addition der entsprechenden Positionen der Matrix, und das Gleiche gilt für die Subtraktion, bei der es sich um die Subtraktion der entsprechenden Positionen handelt.
2.2.2 Multiplikation
Es gibt auch eine ganz besondere Operation für Matrizen
2.2.3 Transponieren
Die Operation der Transposition ist die gleiche wie die des Vektors, d. h. aij in aji umzuwandeln und Zeilen und Spalten auszutauschen
2.2.4 Multiplikation von Matrizen
Die Matrixmultiplikation ist nicht dasselbe wie die allgemeine Multiplikation.
Sie benötigt jede Zeile der ersten Matrix und jede Spalte der zweiten Matrix, um das innere Produkt zu bilden und das Ergebnis zu erhalten, das
das Verteilungsgesetz, das Assoziativgesetz und das Kommutativgesetz
A+ erfüllt B+C=A+(B+C)
Addition muss erfüllt sein, Fokus auf Multiplikation
Zunächst einmal erfüllt die Multiplikation das Assoziativgesetz
(AB) C=A(BC)
erfüllt das Verteilungsgesetz, hier ist das linke Verteilungsgesetz und das rechte Verteilungsgesetz
( A+B)C=AC+BC
A(B+C)=AB+AC
betont insbesondere, dass die Matrix nicht das Kommutativgesetz erfüllt und nicht unbedingt gleich ist, auch wenn die Größe von AB von der von BA und
AB abweicht ≠
BA Es gibt eine spezielle Transponierungsformel
2.3 Inverse Matrix
Die Matrix hat AB, aber es gibt kein A/B. Mit anderen Worten, es gibt nur die inverse
Matrix. Wie ist die inverse Matrix definiert?
Angenommen, es gibt eine Matrix A. Beachten Sie, dass es sich um eine quadratische Matrix handeln muss. Multipliziert mit Matrix B ist I
AB=I
oder
BA=I. I
ist die Identitätsmatrix. Dann nennen wir B hier die rechte inverse Matrix von A und die Die linke inverse Matrix
hat ein A. Eine sehr wichtige Schlussfolgerung ist, dass, wenn ein solches B existiert, seine linke Inverse und seine rechte Inverse gleich sein müssen.
Welchen Nutzen hat die Invertierung der ? Es kann uns helfen, lineare Gleichungen zu lösen. Wenn beispielsweise AZ=B
gleichzeitig mit dem Kehrwert von A multipliziert wird, dann wird Z=A's -1 mit B multipliziert. Der Zweck seiner Erfindung besteht ebenfalls darin, solche Dinge zu tun.
Von hier aus können wir auch sehen, dass die Identitätsmatrix in unserer Multiplikation wie 1 ist.
Schauen wir uns die Formel an:
2.4 Determinante
Tatsächlich wird die Determinante beim maschinellen Lernen nicht oft verwendet. Eine Matrix muss eine quadratische Matrix sein, um ihre Determinante zu berechnen. Die Determinante ist die Berechnungsmethode, mit der die Matrix in einen
Skalar umgewandelt wird
. Schauen wir uns die Determinante unten an. Die Natur der In der Formel ist dies natürlich die mit α multiplizierte Zahl in Form einer quadratischen Matrix
, was der Multiplikation der n-ten Potenz von α mit der Determinante von A entspricht, denn als wir uns gerade die Berechnungsmethode angesehen haben, ist sie äquivalent zu Multiplizieren Sie jede Spalte mit α. Ist es n-ter Ordnung?
Zusammenfassen
Das Obige ist das, worüber ich heute sprechen werde. In diesem Artikel werden nur kurz die Grundkenntnisse der linearen Algebra vorgestellt, die zu den relativ grundlegenden Wissenspunkten in der Hochschulmathematik gehören. Die fortgeschrittenen Kenntnisse der linearen Algebra werde ich später weiter erläutern.