Nie wieder stundenlang Podcasts durchsuchen – so wird eine interessante Sendung zum durchsuchbaren Text!
Kennst du das? Du hörst einen spannenden Podcast und denkst dir: „Wow, das will ich mir merken!“ Aber ein paar Tage später willst du genau diese eine Stelle nochmal nachschauen – und müsstest jetzt die ganze Sendung nochmal durchhören. Keine Lust, oder?
Es gibt eine einfache Lösung: Ich verwandle die Audiodatei einfach in Text! Das klingt kompliziert, aber glaub mir – es ist überraschend einfach.
So funktioniert’s: Aus Audio wird Text
Das Zauberwort heißt „Transkription“ – also gesprochene Worte werden zu geschriebenem Text. Und das Beste: Mit dem richtigen Programm geht das kostenlos und völlig automatisch!
Was du brauchst: Das Programm Whisper
„Whisper“ ist eine kostenlose Software mit künstlicher Intelligenz, die aus gesprochenen Worten automatisch Text macht.
Der große Vorteil: Alles läuft auf deinem eigenen Computer – deine Dateien müssen nicht ins Internet hochgeladen werden. Das finde ich besonders wichtig!
Los geht’s: So installierst du Whisper
Schritt 1: Das Programm runterladen
Öffne diese Internetseite in deinem Browser: https://github.com/Const-me/Whisper/releases
Dort findest du die Datei WhisperDesktop.zip. Klick drauf und lade sie runter. Die Datei ist richtig klein.
Schritt 2: Die Datei entpacken
Die runtergeladene Datei ist „gepackt“ – wie ein Päckchen, das du erst auspacken musst. Das machst du so:
- Geh in deinen Download-Ordner
- Klick mit der rechten Maustaste auf „WhisperDesktop.zip“
- Wähl „Alle extrahieren…“ aus
- Such dir einen Ort aus, wo du das Programm haben willst (zum Beispiel auf dem Desktop)
- Klick auf „Entpacken“
Fertig!
Schritt 3: Das Herzstück runterladen – das KI-Modell
Jetzt kommt noch ein wichtiger Schritt: Du brauchst noch das eigentliche „Gehirn“ vom Programm – das KI-Modell.
Ich empfehle dir ggml-medium.bin (1,42 GB groß)
Es ist wie die goldene Mitte: Die Qualität ist richtig gut, aber es dauert trotzdem nicht ewig.
Du kannst es hier runterladen: https://huggingface.co/ggerganov/whisper.cpp/tree/main
Danach schiebst du die Datei einfach in den Whisper-Ordner, den du vorher entpackt hast
Schritt 4: Jetzt wird’s spannend – deine erste Transkription!
- Öffne den Ordner von Whisper
- Mach einen Doppelklick auf WhisperDesktop.exe
- Beim ersten Start fragt dich das Programm: „Welches Modell willst du?“
- Du wählst jetzt ggml-medium.bin aus.
- Wähl deine MP3-Datei aus (zum Beispiel deinen Podcast)
- Stell die Sprache ein – für Deutsch wählst du „German“
- Beim Output-Format nimmst du „Text file“ und wählst „Place that file to the input folder“ (oder einen anderen Ordner, wo du die Datei haben willst)
- Klick auf „Transcribe“
Und dann? Dann heißt es etwas warten!
Ein Fortschrittsbalken zeigt dir, wie weit es schon ist.
Wie lange dauert das?
Das ist natürlich von deinem Computer abhängig. Bei einem normalen PC mit Grafikkarte dauert eine einstündige Audiodatei ungefähr 15 bis 25 Minuten. Das Tolle: Du kannst in der Zeit ganz normal weiterarbeiten – Whisper läuft einfach im Hintergrund.
Was bekommst du am Ende?
Nach der Transkription hast du eine Textdatei mit allem, was in deinem Podcast gesagt wurde. Und jetzt kannst du:
- Ganz einfach nach bestimmten Wörtern suchen
- Wichtige Stellen markieren
- Dir Notizen dazu machen
- Den Text in eine KI hochladen
(Zum Beispiel Lumo: https://lumo.proton.me – geht sogar als Gast ohne Konto)
und den Prompt (Auftrag) schreiben: „Fass mir die Hauptaussagen zusammen …“
Mein Fazit
Diese KI-Anwendung hat mir echt geholfen! Egal ob Podcasts, Online-Vorträge oder Interviews – ich kann jetzt alles in durchsuchbaren Text verwandeln. Und das komplett kostenlos, ohne mich irgendwo anmelden zu müssen, und alles bleibt auf meinem Computer.
Probier’s doch einfach mal aus – ich bin gespannt, ob es dir genauso hilft wie mir!


