The-Transformer-model-architecture

Autor/Urheber:

Yuening Jia

Attribution:

Das Bild ist mit 'Attribution Required' markiert, aber es wurden keine Informationen über die Attribution bereitgestellt. Vermutlich wurde bei Verwendung des MediaWiki-Templates für die CC-BY Lizenzen der Parameter für die Attribution weggelassen. Autoren und Urheber finden für die korrekte Verwendung der Templates hier ein Beispiel.

Shortlink:

https://www.dewiki.de/b/3098d1

Quelle:

Wikimedia Commons

Größe:

850 x 765 Pixel (48342 Bytes)

Beschreibung:

The Transformer model architecture

Lizenz:

CC BY-SA 3.0

Credit:

DOI:10.1088/1742-6596/1314/1/012186

Bild teilen:

Weitere Informationen zur Lizenz des Bildes finden Sie hier. Letzte Aktualisierung: Fri, 19 Apr 2024 19:26:50 GMT

Relevante Artikel

Transformer (Maschinelles Lernen)

Ein Transformer ist eine Methode, mit der ein Computer eine Folge von Zeichen in eine andere Folge von Zeichen übersetzen kann. Dies kann z. B. benutzt werden, um Text von einer Sprache in eine andere zu übersetzen. Dazu wird ein Transformer mittels maschinellem Lernen auf einer (großen) Menge von Beispiel-Daten trainiert, bevor das trainierte Modell dann zur Übersetzung verwendet werden kann. Transformer gehören zu den Deep-Learning-Architekturen. Transformer wurden 2017 im Rahmen der Neural-Information-Processing-Systems-Konferenz veröffentlicht. Weitere Beispielanwendungen von Transformern sind die Textgenerierung oder die Zusammenfassung längerer Texte. Transformer weisen hierbei eine bessere Effizienz gegenüber Long-short-term-memory-Architekturen (LSTM) auf und sind die Grundarchitektur vieler vortrainierter Machine-Learning-Modelle wie .. weiterlesen

Navigation

Navigation

Themenportale

Werbung

The-Transformer-model-architecture

Relevante Artikel