Wer gerne #Transkriptionen für seinen #Podcast anbieten möchte, oder gerne andere Podcasts transkribiert hätte, für den ist dieses Tool von @ybaumy@digitalcourage.social interessant.
Basierend auf #Whisper (#OpenSource #Spracherkennung von #OpenAI) kann man damit beim #Cloud-Anbieter seiner Wahl (#OVH, #Hetzner, #GCP) massenweise Podcasts transkribieren.
@ybaumy@digitalcourage.social was ich persönlich mir wünschen würde, wäre ein Tool, mit dem ich aus einer Ausgangsdatei und seperater Metadaten (insbesondere #Kapitelmarken) mehrere fertig exportierte Audioformate bekomme, die diese Kapitelmarken enthalten. Auphonic bietet das als bezahlten Service. Als freie Variante für die Konsole gab es mal dieses Tool: https://sendegate.de/t/podcast-workflow-loesung-fuer-kapitelmarken/6591
Das hat auch funktioniert, wurde dann aber nicht mehr aktualisiert aufgrund fehlenden Interesses und ist ziemlich hoffnungslos veraltet.
@ybaumy@digitalcourage.social Kapitelmarken scheinen mir wichtiger als Transkriptionen, weil eine Transkription des gesprochenen Wortes eine Abstraktion von Sprache ist, während Schrift eigentlich eine eigene, davon unterscheidbare Kategorie wäre. Das Lesen von Transkription erfordert entsprechend Übung und Aufwand, den ich mir nicht zumuten muss, wenn ich genauso das ursprüngliche Artefakt anhören kann. Das Problem dabei:Wie komme ich genau auf die entscheidenden Aussagen? Dafür sind kleinteilige Kapitelmarken super
@ybaumy@digitalcourage.social Transkriptionen können das auch teilweise leisten, indem man sie beispielsweise über den Player einbindet. Das können aber nur wenige Player und am liebsten möchte man den Text direkt mit der Datei. Das geht nur über deren integrierte Metadaten. Die können soweit mir bekannt maximal Kapitelmarken, keine Transkriptionen.