Einführung in nn.Linear in PyTorch: Verständlich erklärt

Name: Matt Popovic

Published on 20.6.2023

Deep Learning hat das Feld der künstlichen Intelligenz revolutioniert und ermöglicht es Maschinen, die menschliche Intelligenz in noch nie dagewesener Weise zu imitieren. Im Herzen dieser Revolution steht PyTorch, eine beliebte Open-Source-Maschinenlernbibliothek, die zwei wichtige Funktionen bietet: Tensorrechnung mit starker GPU-Beschleunigung und tiefe neuronale Netzwerke, die auf einem bandbasierten autograd-System aufgebaut sind. Eine der grundlegenden Komponenten von PyTorch ist nn.Linear, ein Modul, das eine lineare Transformation auf die eintreffenden Daten anwendet. Dieser Artikel bietet einen umfassenden Leitfaden zum Verständnis von nn.Linear in PyTorch, seiner Rolle in neuronalen Netzwerken und wie es sich mit anderen linearen Transformationsmethoden vergleicht.

nn.Linear ist eine lineare Ebene, die in neuronalen Netzwerken verwendet wird und eine lineare Transformation auf Eingabedaten mit Hilfe von Gewichten und Bias anwendet. Es ist eine entscheidende Komponente in der Architektur vieler Deep Learning Modelle. Dieser Leitfaden geht auf die Details von nn.Linear ein, einschließlich seiner Definition, wie es funktioniert und seinen Anwendungen im Bereich des Deep Learnings. Wir werden auch häufig gestellte Fragen und verwandte Anfragen behandeln, um ein gründliches Verständnis dieses essentiellen PyTorch-Moduls zu ermöglichen.

Möchten Sie schnell Data Visualisierungen aus Python Pandas Dataframe ohne Code erstellen?

PyGWalker ist eine Python-Bibliothek für die explorative Datenanalyse mit Visualisierung. Mit PyGWalker (opens in a new tab) können Sie Ihren Jupyter Notebook Datenanalyse- und Data-Visualisierungs-Workflow vereinfachen, indem Sie Ihren Pandas Dataframe (und Polars Dataframe) in eine Tableau-ähnliche Benutzeroberfläche für visuelle Exploration verwandeln.

(opens in a new tab)

Verständnis von nn.Linear in PyTorch

Was ist nn.Linear?

Im Kontext neuronaler Netzwerke ist nn.Linear ein Modul, das von PyTorch bereitgestellt wird und eine lineare Transformation auf die eintreffenden Daten anwendet. Diese Transformation wird durch die Formel y = xA^T + b repräsentiert, wobei x die Eingabe, A das Gewicht, b der Bias und y die Ausgabe ist.

Das nn.Linear-Modul nimmt zwei Parameter an: in_features und out_features, die die Anzahl der Eingabe- bzw. Ausgabe-Merkmale repräsentieren. Wenn ein nn.Linear-Objekt erstellt wird, initialisiert es eine Gewichtsmatrix und einen Bias-Vektor zufällig. Die Größe der Gewichtsmatrix beträgt out_features x in_features und die Größe des Bias-Vektors beträgt out_features.

import torch
from torch import nn
 
## Erstellen eines Objekts für die lineare Klasse
linear_layer = nn.Linear(in_features=3, out_features=1)

Im obigen Code-Snippet erstellen wir eine Instanz von nn.Linear mit drei Eingabe-Merkmalen und einem Ausgabe-Merkmal. Das Ergebnis ist eine 3x1 Gewichtsmatrix und ein 1x1 Bias-Vektor.

Wie funktioniert nn.Linear?

nn.Linear funktioniert, indem es eine Matrixmultiplikation der Eingabedaten mit der Gewichtsmatrix durchführt und den Bias-Term hinzufügt. Diese Operation wird auf jede Schicht in einem Feedforward-Neuronalen Netzwerk angewendet.

## Eingabe an die lineare Ebene übergeben
output = linear_layer(torch.tensor([1,2,3], dtype=torch.float32))
print(output)

Im obigen Code-Snippet geben wir einen Tensor der Größe 3 (entsprechend der Anzahl der Eingabemerkmale) an die linear_layer weiter. Die Ausgabe ist ein Tensor der Größe 1 (entsprechend der Anzahl der Ausgabemerkmale), der das Ergebnis der linearen Transformation ist.

Initialisierung von Gewichten und Bias

Die Gewichte und Bias in nn.Linear sind Parameter, die das Modell während des Trainings lernt. Zu Beginn werden sie zufällig initialisiert. Sie können die Gewichte und Bias mit den Attributen weight und bias anzeigen.

## Gewichte und Bias anzeigen
print(linear_layer.weight)
print(linear_layer.bias)

Das obige Code-Snippet gibt die Gewichtsmatrix und den Bias-Vektor der nn.Linear-Ebene aus.

Während PyTorch diese Parameter zunächst zufällig initialisiert, können Sie sie auch manuell setzen oder unterschiedliche Initialisierungsmethoden verwenden. Beispielsweise können Sie das Modul torch.nn.init verwenden, um spezifische Initialisierungsmethoden auf die Gewichte und Bias anzuwenden. Hier ist ein Beispiel für die Verwendung der Xavier Uniform-Initialisierung:

import torch.nn.init as init
 
## Initialisieren der Gewichte mit Xavier Uniform-Initialisierung
init.xavier_uniform_(linear_layer.weight)
 
## Bias auf Null initialisieren
init.zeros_(linear_layer.bias)

Im obigen Code-Snippet verwenden wir die Funktion xavier_uniform_ aus torch.nn.init, um die Gewichte unserer linear_layer zu initialisieren. Der Bias wird mit der Funktion zeros_ auf Null initialisiert. Diese Initialisierungsmethoden können den Lernprozess des neuronalen Netzwerks verbessern.

Vergleich von nn.Linear und nn.Conv2d

nn.Linear und nn.Conv2d sind beide grundlegende Module in PyTorch, die für unterschiedliche Zwecke verwendet werden. Während nn.Linear eine lineare Transformation auf die eintreffenden Daten anwendet, wendet nn.Conv2d eine 2D-Faltung auf ein Eingangssignal an, das aus mehreren Ebenen besteht.

Der Hauptunterschied zwischen nn.Linear und nn.Conv2d liegt in ihrer Anwendung. nn.Linear wird typischerweise in vollständig verbundenen Schichten verwendet, bei denen jede Eingabeneuron mit jedem Ausgabeneuron verbunden ist. Auf der anderen Seite wird nn.Conv2d in Faltungsschichten verwendet, die hauptsächlich in Faltungsneuronalen Netzwerken (CNNs) für Aufgaben wie Bildverarbeitung eingesetzt werden.

In Bezug auf ihre Parameter erfordert nn.Linear die Anzahl der Eingabe-Merkmale und die Anzahl der Ausgabe-Merkmale. nn.Conv2d erfordert die Anzahl der Eingabekanäle (oder die Tiefe der Eingabe), die Anzahl der Ausgabekanäle und die Kernelgröße.

Anwendungen von nn.Linear im Deep Learning

nn.Linear ist ein vielseitiges Modul in PyTorch und findet zahlreiche Anwendungen im Bereich des Deep Learning. Hier sind ein paar Beispiele:

Multi-Layer Perceptron (MLP): MLPs sind eine Art von feed-forward neuronalen Netzwerken, die aus mindestens drei Schichten von Knoten bestehen: einer Eingabeschicht, einer versteckten Schicht und einer Ausgabeschicht. Jede Schicht ist vollständig mit der nächsten Schicht verbunden, und nn.Linear wird verwendet, um diese Verbindungen zu implementieren.
Lineare Regression: Bei linearen Regressionsaufgaben kann nn.Linear verwendet werden, um die lineare Gleichung zu implementieren, die das Modell lernt.
Daten-Transformation: nn.Linear kann verwendet werden, um Eingabedaten in eine höhere Dimension zu transformieren, um komplexere Aufgaben zu lösen.
Deep Learning Modelle: Viele Deep Learning Modelle, wie Autoencoder, verwenden nn.Linear in ihrer Architektur.

Im nächsten Abschnitt werden wir uns genauer mit der Verwendung von nn.Linear in einem PyTorch-Modell befassen, einschließlich der Initialisierung von Gewichten und Bias sowie der Verwendung in einem Modell. Wir werden auch Beispiele für seine Anwendungen im Deep Learning geben.

Verwendung von nn.Linear in einem PyTorch-Modell

Die Verwendung von nn.Linear in einem PyTorch-Modell umfasst die Definition der Schicht im Konstruktor des Modells und die Anwendung auf die Eingabedaten in der forward-Methode. Hier ist ein Beispiel für ein einfaches feed-forward neuronales Netzwerk, das nn.Linear verwendet:

class Net(nn.Module):
    def __init__(self):
        super(Net, self).__init__()
        self.fc1 = nn.Linear(10, 5)
        self.fc2 = nn.Linear(5, 2)
 
    def forward(self, x):
        x = F.relu(self.fc1(x))
        x = self.fc2(x)
        return x
 
# Erstelle eine Instanz des Netzwerks
net = Net()

In dem obigen Code-Snippet definieren wir ein Netzwerk Net mit zwei linearen Schichten (fc1 und fc2). Die forward-Methode definiert den Vorwärtsdurchgang der Eingabe durch das Netzwerk. Die Funktion F.relu wendet die ReLU-Aktivierungsfunktion auf die Ausgabe der ersten linearen Schicht an, bevor sie zur zweiten linearen Schicht weitergegeben wird.

Häufige Fehler und Lösungen für nn.Linear in PyTorch

Beim Verwenden von nn.Linear können einige häufige Fehler auftreten. Hier sind einige davon zusammen mit ihren Lösungen:

Ungleiches Eingabeformat: Die Größe der Eingabe muss mit dem in_features-Parameter von nn.Linear übereinstimmen. Wenn sie nicht übereinstimmt, tritt ein Laufzeitfehler auf. Um dies zu beheben, stellen Sie sicher, dass die Größe des Eingabeungstensors mit dem in_features-Parameter übereinstimmt.
Falsche Größen von Gewichten und Bias: Die Gewichtsmatrix und der Biasvektor müssen Größen haben, die mit den in_features- bzw. out_features-Parametern übereinstimmen. Wenn sie nicht übereinstimmen, tritt ein Laufzeitfehler auf. Um dies zu beheben, stellen Sie sicher, dass die Größen der Gewichtsmatrix und des Biasvektors korrekt sind.
Verwendung von nn.Linear mit 3D-Eingabe: nn.Linear erwartet eine 2D-Eingabe, aber manchmal können Sie versehentlich eine 3D-Eingabe übergeben (z. B. von einer Faltungsschicht in einem CNN). Dadurch wird ein Laufzeitfehler verursacht. Um dies zu beheben, können Sie torch.flatten oder view verwenden, um die Eingabe in eine 2D-Form zu bringen.

Fazit

Zusammenfassend ist nn.Linear eine grundlegende Komponente in PyTorch und im Deep Learning. Es spielt eine entscheidende Rolle bei der Implementierung von linearen Transformationen in neuronalen Netzwerken, und das Verständnis dafür kann wesentlich dazu beitragen, Deep Learning Modelle zu erstellen und Fehler zu beheben. Egal, ob Sie gerade erst mit PyTorch anfangen oder ein erfahrener Anwender sind, die Beherrschung von nn.Linear ist eine wertvolle Fähigkeit in Ihrem Deep Learning Werkzeugkasten.

FAQs

Welchen Zweck hat ein Biasvektor in nn.Linear?

Der Biasvektor in nn.Linear ermöglicht es dem Modell, die Ausgabe der linearen Transformation entlang der y-Achse zu verschieben. Dies kann entscheidend sein, um das Modell an die Daten anzupassen, insbesondere wenn die Daten nicht um den Ursprung zentriert sind. Ohne den Bias würde das Modell immer durch den Ursprung gehen, was seine Fähigkeit zur Anpassung an die Daten einschränken könnte.

Wie initialisiert man Gewichte und Bias für eine lineare Schicht in PyTorch?

Gewichte und Bias für eine lineare Schicht in PyTorch können beim Erstellen eines nn.Linear-Objekts initialisiert werden. Standardmäßig werden sie mit zufälligen Werten initialisiert. Sie können sie jedoch manuell setzen oder verschiedene Initialisierungsmethoden aus dem Modul torch.nn.init verwenden.

Was ist der Unterschied zwischen nn.Linear und nn.Conv2d in PyTorch?

nn.Linear und nn.Conv2d werden beide verwendet, um Schichten in neuronalen Netzwerken zu implementieren, haben jedoch unterschiedliche Zwecke. nn.Linear wendet eine lineare Transformation auf die eintreffenden Daten an und wird in der Regel in vollständig verbundenen Schichten verwendet. Auf der anderen Seite wendet nn.Conv2d eine 2D-Faltung auf ein Eingangssignal an und wird hauptsächlich in Faltungsschichten für Aufgaben wie Bildverarbeitung verwendet.

nn.Linear in PyTorch: Clearly Explained python __call__ Method: Everything You Need to Know