Neuronale Netze - Matrizen
LIN 8080
Eine Matrix besteht aus m Zeilen und n Spalten. Sie werden in fettgedruckten Grossbuchstaben notiert: A oder durch ein Zahlenfeld m x n mit den Zahlen aij, wobei (i = 1, 2, ..., m) und (j = 1, 2, ..., n) gilt. Auch A = (aij) sind häufig zu finden.
Besondere Matrizen sind: Die Nullmatrix 0, alle Elemente sind Null. Die Identitätsmatrix I, die diagonalen Elemente sind 1 (beginnend oben links, nach unten rechts), alle anderen Elemente sind Null. Zu beachten ist, dass die Spalten (Zeilen) von I als linear unabhängige Vektoren zu sehen sind.
Es können nur Matrizen der gleichen Grösse addiert / subtrahiert werden. Es werden die Elemente mit den selben Indexwerten addiert, bzw subtrahiert. A + B = (aij + bij)
Ein Vektor ist ein Spezialfall einer Matrix. Sie besteht aus m x 1 einer Spalte (Spaltenvektor) mit m Elementen, oder einer 1 x n Matrix mit einer einzelnen Zeile.
Die Multiplikation (Division) einer Matrix mit einer Zahl c geschieht, imdem man alle Elemente der Matrix mit c mutipliziert (dividiert).
Die Produktmatrix AB erhält man, wenn alle Elemente der Matrix miteinander multipliziert werden. Dazu müssen die Matrizen die gleiche Grösse haben (die gleiche Anzahl Spalten und Zeilen).
Die Transponierte Matrix zu A ist die Matrix A^T. Sie entsteht durch Vertauschen der Spalten und Zeilen. Ist A = A^T, nennt man sie symmetrisch und es gilt aij = aji.
Ist A eine m x n Matrix und x eine n x 1 Matrix (Spaltenvektor), dann ist das Produkt Ax = y eine m x 1 Matrix (ein Spaltenvektor).
Die Inverse Matrix A^-1 ist eine Matrix B mit AB = BA = I. Nur quadratische Matrizen (n x n) können eine Inverse Matrix sein. Es gilt: (A^-1)^T = (A^T)^-1. Nicht alle Matrizen haben eine Inverse Matrix, aber es läßt sich zu jeder Matrix eine Pseudoinverse Matrix ermitteln.
Pseudoinverse Matrizen stellen bei Neuronalen Netzen normalerweise die Differenz zwischen einer Zielausgabe t und der tatsächlichen Ausgabe y dar. Der Gesamtfehler E hat die Form:
mit p als Anzahl der Trainingsdurchgänge. In Matrizen Schreibweise: WXX^T = TX^T. Da XX^T nicht unbedingt eine Inverse Matrix haben muss, wählt man den Umweg über eine Konstante Lambda > 0 und erhält W(XX^T + Lambda 1) = TX^T. Somit erhält man immer mindestes eine Lösung, ansonsten gilt die, welche die kleinste Summe der Quadrate der Matrizenwerte hat.