FLAN-T5-XL

von Google

 

 
Das auf Huggingface verfügbare Modell Flan-T5-XL ist ein großes Sprachmodell, das für verschiedene Aufgaben der Spracherzeugung geeignet ist. Da wir bei unseren Experimenten mit dem Flan-XXLl-Modell einen guten Eindruck gewonnen haben, möchten wir auch andere verfügbare Versionen testen.

FLAN-T5-XL

von Google

 

 
Das auf Huggingface verfügbare Modell Flan-T5-XL ist ein großes Sprachmodell, das für verschiedene Aufgaben der Spracherzeugung geeignet ist. Da wir bei unseren Experimenten mit dem Flan-XXLl-Modell einen guten Eindruck gewonnen haben, möchten wir auch andere verfügbare Versionen testen.

Hauptanwendungsfälle: Modell zur Sprachgenerierung, welches für Übersetzungen, Textzusammenfassungen, Sentimentanalyse oder Anliegenerkennung verwendet werden kann. Die Qualität der Sprachgenerierung liegt hinter größeren, moderneren Modellen zurück, während beispielsweise die Anliegenerkennung ähnlich gut ist.  

 
Inputlänge: 512 Tokens (ca. 384 Wörter) ist Basis, bis zu 2048 Token (ca. 1536 Wörter) trainiert  

 
Sprachen: Englisch, Französisch, Rumänisch, Deutsch  

 
Modellgröße: ~3 Milliarden Parameter

Hauptanwendungsfälle: Modell zur Sprachgenerierung, welches für Übersetzungen, Textzusammenfassungen, Sentimentanalyse oder Anliegenerkennung verwendet werden kann. Die Qualität der Sprachgenerierung liegt hinter größeren, moderneren Modellen zurück, während beispielsweise die Anliegenerkennung ähnlich gut ist.  

 
Inputlänge: 512 Tokens (ca. 384 Wörter) ist Basis, bis zu 2048 Token (ca. 1536 Wörter) trainiert  

 
Sprachen: Englisch, Französisch, Rumänisch, Deutsch  

 
Modellgröße: ~3 Milliarden Parameter