1. Stimmsynthese: Künstliche Stimmen, die nicht nach Konserve klingen
Wer schonmal Text-to-Speech mit künstlicher Stimmsynthese gehört hat, kennt das Problem: Computergenerierte Stimmen sind oftmals schwer verständlich und unangenehm zu hören. Was für Navigationssoftware noch akzeptabel sein mag, ist für emotionale Inhalte unpassend. Spätestens für Longform-Content ist es nicht auszuhalten.
Doch RTL hat in diesem Jahr eine Lösung präsentiert, die rein theoretisch den Moderator Maik Meuser schon bald überflüssig machen könnte. Zusammen mit Microsoft hat RTL Deutschland ein KI-Projekt gestartet: Vier Stunden gesprochener Text reichten, damit „lebensechte, natürlich klingende Versionen der Stimmen entstanden, die vom menschlichen Original nicht mehr zu unterscheiden sind”, wie RTL verspricht. Und die mussten nicht einmal extra eingesprochen werden. Bestehendes Material genügt. Das Video zeigt: Wer aufmerksam zuhört, wird die Unterschiede feststellen. Gerade bei fremdsprachigen Wörtern oder Abkürzungen. Aber von konserviger Stimmsynthese hebt sich das Produkt deutlich ab.
Stimmsynthese dieser Art ersetzt gute Stimmen und professionelle Sprecher*innen nicht, sondern ergänzt sie. Überall da, wo es Massen an Inhalten oder personalisierten Content braucht, könnte die Technologie eingesetzt werden und Inhalte besser, zugänglicher und barrierefreier zu machen. Vor allem, wenn sie weiterentwickelt wird und dann auch komplexe Texte gut hörbar sind.
Zu diskutieren ist dabei allerdings die ethische Perspektive: Maik Meuser selbst sagt, dass es sich nicht besonders gut anfühlt, etwas mit seiner Stimme zu hören, ohne es selbst gesagt zu haben. Ein Mindestanspruch dürfte die Kennzeichnung sein, dass eine Stimme nicht real eingesprochen ist. Doch ob damit genug für die Glaubwürdigkeit von Inhalten getan ist? Ich habe da so meine Zweifel. Wichtig wird sein, ganz deutlich zu machen, wer da spricht: Echter Mensch oder künstliche Intelligenz.
2. Holo-Ads und AR: Endlich in die breite Masse?
2014 hat Pepsi Max technologisch recht einfach gezeigt, wie man die Realität mit einem einzigen Screen erweitern kann. Wer sich nicht erinnert: Der folgende Spot ist bereits acht Jahre alt und erweckt eine Bushaltestelle auf unheimliche Weise zum Leben.
In der Zwischenzeit hat sich die Technologie weiterentwickelt und das Metaverse ist in aller Munde. Doch sowohl Augmented Reality als auch holographische Werbung ist noch nicht wirklich breit etabliert. Dabei bieten sich mittlerweile auch für kleine Marken recht niedrigschwellig Ansatzpunkte, um AR und Holo-Ads in den Werbe- und Kommunikationsmix zu integrieren. Her mit den kreativen Ansätzen.
3. Low-Code und No-Code: Wird die Tech-Welt demokratisiert?
41 Prozent aller nicht IT-Angestellten schaffen oder customizen bis 2025 technische Lösungen. Das will die Consulting-Firma Gartner herausgefunden haben. Je mehr Menschen mit Technologie arbeiten müssen, umso größer wird der Bedarf an Low-Code- und No-Code-Anwendungen. Egal ob Fragebögen, Landing Pages oder Anwendungen zur Gamification. All das werden in Zukunft Menschen umsetzen, die im Zweifel keine Zeile Code gesehen haben. Die Kölner No-Code-Plattform VisualMakers spricht dabei sogar von einer Demokratisierung der Tech-Welt.
Letztlich macht No-Code die Welt aber nicht nur einfacher, sondern auch schneller: Mit No-Code lassen sich beispielsweise komplette Marketing-Funnels automatisiert aufsetzen. Nachteil an der Sache: Auch No-Code will erstmal gelernt sein. Doch das geht einfacher als ganze Programmiersprachen zu verstehen.
Mit diesem Ausblick auf die Trends des kommenden Jahres verabschiedet sich „Tech Tuesday“ in eine kurze Winterpause. Mein Kollege Karsten Zunke meldet sich am 10. Januar wieder mit seinem gewohnt fundierten Blick auf die MarTech-Welt. Erholsame Feiertage und einen guten Rutsch!