Zeit sparen mit Transkriptions-Apps - next media makers e.V.

Wer Interviews nicht selbst abtippen möchte, bekommt heutzutage tatkräftige Unterstützung von Transkriptions-Apps zum Zeit sparen. Noch ist keine von ihnen fehlerfrei, alle Texte muss man danach noch einmal händisch überarbeiten, Fehler ausbessern, doppelte Wörter löschen… Trotzdem können sie eine große Zeitersparnis sein. Hier sind unsere Empfehlungen:

Transkriptions-App: Trint

Transkription: Das Programm kann keine Satzzeichen setzen, die Groß- und Kleinschreibung scheitert manchmal, ebenso das Zusammen- bzw. Getrenntschreiben. Auch alle Füllwörter und ähms, alles doppelt Gesprochene steht ebenfalls drin. Ab und zu schleichen sich kleine Fehler hinein. Der Text ist also nicht sofort druckreif. Die Bearbeitung geht dennoch deutlich schneller, als wenn ihr alles selbst tippen müsstet. Trint nutzt die Spracherkennungssoftware Speechmatics.

Aufnahmequalität: Eine Aufnahme mit dem Smartphone in einer halbwegs ruhigen Umgebung reicht schon, damit Trint die Datei nutzen kann. Aufnahmen über Skype hingegen funktionieren meist nicht. Ihr könnt acht verschiedene Audioformate nutzen. Die Software unterstützt verschiedene englische Akzente und zwölf europäische Sprachen, darunter Deutsch.

Handling: Praktischerweise sind Audio und Text in der Software miteinander gekoppelt. Die Wiedergabegeschwindigkeit kann angepasst werden. Für alle Podcaster und Radiojournalisten wichtig: Trint setzt eigenständig Timecodes, die man zudem selbst bearbeiten kann. Ausgewählte Textabschnitte können direkt abgespielt werden – Schluss mit dem nervigen hin- und herspringen im Tonmaterial. Alles ist browserbasiert, man muss also nicht extra ein Programm herunterladen.

Kosten: Hier kommt der große Nachteil: Die ersten 30 Minuten sind zwar umsonst, danach wird es aber recht teuer. Es gibt unterschiedliche Preisstufen im Abomodell.

Fazit: Definitiv eine Transkriptions-App zum Zeit sparen! Leider hat Trint vor kurzem auf ein Abonnement-Modell umgestellt, wodurch die Anwendung ziemlich teuer geworden ist. Trotzdem ist es in unseren Augen eine der besten, die es derzeit gibt. Der große Vorteil: Das Programm kann automatisch zwischen mehreren Sprechern unterscheiden und wurde extra für Journalisten konzipiert.

Transkriptions-App: Amberscript

Transkription: Natürlich unterlaufen auch Amberscript Verständnisfehler, dennoch ein sehr simples wie effizientes Tool für eine zeitsparende Verschriftlichung von Audio-Dateien. Das Tool weißt einige Fehler in der Erkennung von Stimmen (zumindest in Englisch) auf. Für eine saubere Trennung der verschiedenen Stimmen sollte man parallel nachhören um die Trennung manuell zu korrigieren.

Aufnahme: Mit der eigenen Speech-to-Text-Engine werden hier Audiodateien (.mp3, .mp4, .aac, .m4a, .wma und .wav) in kurzer Zeit in editierbare Transkripte konvertiert. Im Moment unterstützt Amberscript Deutsch und Englisch, aber auch viele europäische und internationale Sprachen wie Hindi, Chinesisch Mandarin, Russisch oder Türkisch – insgesamt 35 Sprachen.

Handling: Die Audio-Zeitleiste ist mit dem Text verbunden, dadurch können Textstellen im Online-Editor ganz einfach gesucht, markiert und editiert werden. Eine Stunde Audio wird in nur wenigen Minuten transkribiert, die Textausgabe erfolgt in einem übersichtlichen Layout. Zeitstempel werden automatisch an den Text gekoppelt, zudem gibt es die Möglichkeit die Tonspur zu verlangsamen um parallel hören und editieren zu können. Das Handling ist im ganzen sehr angenehm und spart deutlich Zeit. Auch der Export erfolgt reibungslos. EIne weitere Möglichkeit ist, das Audio “einzuschicken” und von Mitarbeiter reinzeichnen zu lassen, die manuelle Transkription dauert 24 bis 48 Stunden und kostet natürlich mehr.

Kosten: Es gibt eine Testversion mit der man vor Kaufabschluss 30 Minuten kostenfrei transkribieren kann. Anschließend kann man ein Abonnement abschließen: Für 75 € im Monat erhält man 5 Stunden Auudiomaterial, jede weitere kostet 20 €. Man kann außerdem einen Stunden-/Minutentarif buchen.

Fazit: Das Tool hängt sich gelegentlich auf, für den doch recht teuren Preis sicherlich kein Werkzeug für Berufseinsteiger. Das Monats-Abonnement enthält nur fünf Freistunden und ist daher für regelmäßigen Gebrauch kaum effizient. Wer allerdings nur gelegentlich transkribieren muss, ist mit dem Stunden-/Minutentarif gut bedient. Großer Pluspunkt: Im Gegensatz zu anderen Angeboten unterstützt Amberscript die deutsche Sprache.

Transkriptions-App: Descript

Transkription: Descript nutzt Google als ASR (Automatic Speech Recognition). Meist erkennt die Software verschiedene Sprecher automatisch. Man kann zudem die einzelnen Sprecher direkt im Transkript benennen.

Aufnahmequalität: Descript unterstützt Audop- und Videofiles. Der große Nachteil: Die Software unterstützt bisher nur die englische Sprache.

Zum Handlung: Bei Descript kann sowohl der Text, als auch das Audio editiert werden – das Program reflektiert die Änderungen jeweils beim anderen. Und: Wird der geschriebene Beitragstext eingesprochen, verknüpft Descript diese Tonspur wiederum mit dem Beitragstext, so dass ein ganzer Radiobeitrag in einem produziert werden kann. Descript kann auch Text zu Ton wandeln, geschriebenen Text also vorlesen und die Stimme „faken“. Viel passiert über Drag-and-Drop, was sehr anwenderfreundlich ist.

Kosten: Drei Stunden Material pro Monat sind kostenlos. Ansonsten setzt das Program auf ein Abomodell, dass jährlich oder monatlich bezahlt werden kann.

Fazit: Descript ist deutlich günstiger und vor allem eine gute Alternative, wenn man nicht nur transkribieren, sondern auch Beiträge gestalten möchte. Leider unterstützt es noch nicht die deutsche Sprache.

Transkriptions-App: Otter.ai

Transkription: Wie auch bei anderen Anwendungen, ist die Transkription von Otter.ai nicht perfekt. Manchmal werden Sätze mitten im Satz unterbrochen und eine neue Zeile beginnt. Es erkennt keine Satzzeilen oder Absätze. „Ambient Voice Intelligence“ heißt die KI, die aus der Nutzung und den eingespielten Gesprächen lernt: Sie erkennt einzelne Sprecher und hilft beim Durchsuchen des Materials mit der Generierung von Schlüsselwörtern.

Aufnahmequalität: Zu Beginn nimmt Otter einige Aufnahmen von eurer Stimme auf, um sie danach beim Transkribieren besser von der eures Interviewpartners unterscheiden zu können. Statt die App mit bereits aufgenommenen Tonaufnahmen zu „füttern“, nehmt ihr das Gespräch direkt mit der App auf – so wird das Gesprochene synchron transkribiert. Auch Otter unterstützt bisher nur die englische Sprache.

Zum Handling: Otter ist eine App (iOS und Android), muss also im Gegensatz zu den zuvor vorgestellten Softwareanwendungen extra heruntergeladen werden. Man kann die unterschiedlichen Interviewpartner selbst benennen. Das Programm erkennt die unterschiedlichen Stimmen danach recht gut und sortiert die richtigen Namen dazu. Otter unterstützt die Anwender beim „Clean out” des Transkriptes, in dem es z.B. die Geschwindigkeit heruntersetzt, um besser direkt beim Lesen und Mithören Fehler korrigieren zu können. Durch Antippen einer bestimmten Textstelle kommt man zur entsprechenden Position in der Aufnahme – super, um das Tonmaterial anschließend zu schneiden.

Kosten: 600 Minuten pro Monat sind kostenlos. Das Premium-Modell mit mehr Funktionen und 6.000 freien Minuten pro Monat kostet 10 Dollar pro Monat.

Fazit: Leider nur für englische Aufnahmen und weit davon entfernt, perfekt zu Transkribieren. Die generierten Texte sind vor allem nützlich, da man automatische Schlagwörter bekommt – perfekt für lange Recherchen mit vielen Interviews, die man durchsuchbar machen möchte. Großer Pluspunkt: Die Anwendung ist kostenlos nutzbar.

Transkriptions-App: Auphonic

Transkription: Auphonic nutzt die „Automatic speech recognition services“ von Wit.ai, Google, Amazon und Speechmatics.

Aufnahme: Die Online-Software aus Österreich hilft dabei, Audio- und Videofiles umzuwandeln und zu optimieren.

Handling: Auphonic ist viel mehr als nur ein Transkriptionsprogram. Es hilft es dabei, Podcast- und Radiobeiträge schnell und einfach zu verbessern. Zudem kann man direkt ein Intro- und Outro festlegen – wichtig für Podcaster. Der „Audio Algorithmus“ verbessert die Tonqualität, etwa in dem die Lautstärke innerhalb der Gesamtdatei angeglichen wird, Störgeräusche entfernt und Hintergeräusche gedämmt werden. Bis zu zwei Stunden Audio pro Monat sind kostenlos optimierbar.

Kosten: Zwei Stunden pro Monat sind gratis. Je nach Speech-Engine kostet der Service unterschiedlich viel. Wit.ai ist komplett kostenlos (aus Kalifornien), Google Cloud Speech unterstützt über 80 Sprachen und man kann eine Stunde pro Monat kostenlos nutzen. Speechmatics (aus Großbritannien) soll wohl der beste externe Service sein, kennt 74 Sprachen und kostet 0,06 £ pro Minute. Hier steht dazu eine konkrete Anleitung.

Fazit: Preislich völlig in Ordnung, in der Anwendung allerdings weniger gut als die anderen Programme.

Vergleicht selbst!

Wir haben euch hier unsere liebsten Transkriptions-Apps zum Zeit sparen vorgestellt. Zudem hat der Blog Timbunce verschiedene Software und Programme verglichen. Schaut dort gerne noch einmal rein. Auch der Blog Clickomania hat dem Thema einen empfehlenswerten Artikel gewidmet.

Zudem haben wir viel von der Software podigee gelesen, sie allerdings noch nicht ausprobiert. Habt ihr Erfahrungen damit? Oder kennt vielleicht selbst eine gute Anwendung? Dann schreibt uns! An info@nextmediamakers.de