From Know-how to Wow Deep Dive

Ein Voice-Avatar als Host eines Podcasts? Wie kam es dazu und wo lagen die Herausforderungen. Stephanie Lachnit, Director Audio Production hat die Antworten. Den Podcast „From Know-how to Wow“ realisiert Achtung Broadcast für Bosch schon seit Ende 2021 - einmal monatlich. Das etablierte Format wird mit dem KI-Podcast um eine Deep-Dive-Variante erweitert.
Was ist daran besonders, Stephanie?
Das Bemerkenswerte am From Know-how to Wow Deep Dive ist sicherlich, dass das Format vom Voice-Avatar eines menschlichen Podcast-Hosts präsentiert wird. Wir haben für das Format die Stimme von Geoff Gustitus synthetisiert. Geoff hostet seit Ende 2021 den mittlerweile mehrfach ausgezeichneten Bosch Tech-Podcasts From Know-how to Wow.
Warum war es wichtig, dass die KI die Stimme von Geoff bekommt?
Mit dem Format, dem Deep Dive hatten wir den Auftrag, den etablierten Bosch Podcast-Kanal „From Know-how to Wow“ um ein vertiefendes Kurzformat zu erweitern. Es lag nahe, dass dieses explizit nerdige Tech-Format, das die Exzellenz der Ingenieur*innen und Entwickler*innen von Bosch akzentuieren soll, auch in seiner Umsetzungsart Next Level liefert. Mit der Sprachsynthese und der KI reizt Bosch neue technische Möglichkeiten aus. Mit der sogenannten „custom neural voice“ präsentiert die synthetisierte Stimme des echten Hosts Geoff, der den Bosch Podcast-Fans schon bekannt ist, das Kurzformat.
Welche Prozesse sind notwendig, um aus Geoff den Voice Avatar zu generieren?
Kurz gesagt: Es braucht eine gewisse Menge an authentischem Audiomaterial von Geoff. Den Rest macht das Programm. Das „Training“ des Stimm-Models dauert im Moment noch einige Stunden an Rechenleistung.