Alles, was Sie über OpenAI's Whisper wissen müssen

Alles, was Sie über OpenAI's Whisper wissen müssen

Seit seiner Veröffentlichung im Jahr 2022 hat ChatGPT die Welt im Sturm erobert. Der Chatbot von OpenAI wird von Unternehmen bis hin zu Studenten genutzt und ist heute ein fester Bestandteil bei der Beantwortung von Fragen, der Unterstützung bei Schreibaufgaben und der Lösung von Problemen.

Aber das ist nicht das einzige interessante Projekt von OpenAI.

Wir stellen vor: Whisper.

Whisper ist eine neue KI-gestützte Lösung, die bei der Umwandlung von Audio in Text hilft. Das System verarbeitet natürliche Sprache und wurde basierend auf 680.000 Stunden Daten aus dem Internet trainiert. Es schlägt vor allem in der Transkriptionswelt Wellen, indem es Apps wie Transcribe dabei hilft, Ihnen genauere Transkriptionen zu liefern - und das in mehr Sprachen als je zuvor.

Springen zu:

Was ist OpenAI's Whisper?

Whisper von OpenAI ist ein automatisches Spracherkennungssystem, das darauf trainiert wurde, mehrere Sprachen und eine Reihe komplexer Themen zu verstehen und zu transkribieren.

Im Gegensatz zu ChatGPT, GPT-3 und GPT-4 ist Whisper Open Source und öffentlich zugänglich, sodass der Code zum Aufbau, zur Entwicklung und zur Verbesserung von Apps verwendet werden kann - wie Transcribe!

Was kann OpenAI's Whisper?

Hier ein paar der Schlüsselfunktionen von Whisper KI:

  • Versteht Akzente

Einige automatisierte Transkriptionsdienste haben Schwierigkeiten, verschiedene Akzente und Stimmen zu verstehen. Whisper wurde auf einem vielfältigen Datensatz trainiert, sodass es verschiedene Akzente besser verstehen kann.

  • Trennt Hintergrundgeräusche

Wenn Sie versuchen, eine minderwertige Audioaufnahme mit vielen Hintergrundgeräuschen zu transkribieren, sind die Ergebnisse oft ungenau. Mit seinem umfangreichen Training ist Whisper besser in der Lage, Hintergrundgeräusche zu trennen und Stimmen in lauten Umgebungen zu unterscheiden, sodass selbst bei schlechter Audioqualität hochwertige Ergebnisse erzielt werden.

  • Versteht Fachchinesisch

Wenn Sie eine Aufnahme voller Fachjargon haben, besteht die Möglichkeit, dass die Transkriptionssoftware (wie der Otto-Normal-Verbraucher) nicht versteht, worüber gesprochen wird. Dank seines umfassenden Trainings ist Whisper besser in der Lage, Fachsprache in einer Reihe von Branchen und Disziplinen zu verstehen.

  • Mehrsprachige Transkription

Eine der besten Eigenschaften von Whisper ist seine Fähigkeit, mehrsprachige Transkriptionen durchzuführen. Aktuell werden 57 Sprachen unterstützt, wobei die Genauigkeit dieser verschiedenen Sprachen derzeit noch variiert.

  • Übersetzt ins Englisch

Und nicht zuletzt ermöglicht Whisper auch die Übersetzung aus diesen 57 Sprachen ins Englische.

p241_image1
p241_image2

Bildquelle: https://openai.com/research/whisper

Mit welchen Daten wurde Whisper trainiert?

Whisper wurde mit 680.000 Stunden Audiodaten in verschiedenen Sprachen trainiert (und den dazugehörigen Transkriptionen). Diese Daten decken ein breites Spektrum an Themen und Akzenten ab. Etwa ein Drittel des Whisper-Audiodatensatzes ist nicht englisch, und der Datensatz umfasst auch 125.000 Stunden Übersetzungen ins Englische.

Die Verwendung eines so großen und vielfältigen Datensatzes hat die Fähigkeit, der KI Sprache zu verstehen enorm verbessert und das auch mit unterschiedlichen Akzenten, Hintergrundgeräuschen und bei komplexen Themen.

Wie genau ist die Transkription mit Whisper KI?

Dank seines robusten Datensatzes ist Whisper sehr gut darin, genaue Transkriptionen zu liefern. Allerdings wird die KI-gestützte Spracherkennungstechnologie immer noch verbessert. Daher sind die Transkriptionen von Whisper zum jetzigen Zeitpunkt nicht perfekt und können bestimmte Wörter falsch transkribieren.

Whisper selbst unterscheidet auch nicht zwischen verschiedenen Sprechern. Aber: Whisper ist auch nicht für die alleinige Verwendung gedacht, sondern soll als Grundlage für die Entwicklung nützlicher Apps (und für weitere Forschung) dienen. Wenn es in andere Technologien - wie Transcribe - integriert wird, sind die Möglichkeiten grenzenlos!

Werfen Sie auch einen Blick auf unsere KI-Vorhersagen für die Zukunft

Wie sich Transcribe die Leistungsfähigkeit von Whisper zunutze macht

Bei Transcribe machen wir uns die Leistungsfähigkeit von Whisper zunutze und bauen auf dem Code auf, um Ihnen Transkriptionen zu liefern, die genauer sind als je zuvor.

Unser Fokus liegt auf der Benutzererfahrung. Wir haben ein intuitives Tool entwickelt, das die neueste Spitzenforschung nutzt, um Ihnen die besten und genauesten Transkriptionen zu liefern.

Testen Sie Transcribe jetzt

Wenn Sie selbst sehen möchten, wie Transcribe and Whisper Ihnen bei Ihren Audio- und Videotranskriptionen helfen können, dann laden Sie die Transcribe App herunter oder verwenden Sie den Online-Editor, um loszulegen.

News abonnieren

Danke, dass Sie unseren Newsletter abonniert haben!