Das SpeechToText-Plugin bietet im Arbeitsplatz eine Umgebung an, in der Audio- bzw. Video-Dateien hochgeladen werden, die dann über einen konfigurierbaren Backend-Server in Text umgewandelt wird.
Das Plugin bietet mit dem Interface SpeechToTextPlugin\Contracts\Services\PredictionServiceInterface die Möglichkeit, unterschiedlichste Transkriptions-Backends zu nutzen.
Der aktuelle Default ist, über Replicate das Model https://replicate.com/vaibhavs10/incredibly-fast-whisper zu verwenden. Dazu muss aber die Environment-Variable `REPLICATE_TOKEN` gesetzt werden, da sonst kein Zugriff auf Replicate erfolgen kann. Das Token erhält man unter https://replicate.com/account/api-tokens
Beispiel für den Eintrag in Stud.IPs `.env`-Datei:
REPLICATE_TOKEN="r8_..."
- Stud.IP ab Version 6.0
Dieses Projekt unterliegt der GNU Affero General Public License v3.0 oder höher (AGPL-3.0-oder-höher).
Weitere Informationen finden Sie in der Datei LICENSE oder unter https://www.gnu.org/licenses/agpl-3.0.html.
