AIElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99...

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama

Doporučujeme

Insta360 převléklo miniaturní kameru Go 3S do retro stylu

Insta360 zkouší zaujmout nostalgickou vlnou a představilo speciální edici své miniaturní akční kamery Go 3S Retro Bundle. Novinka sází na vzhled inspirovaný starými kompakty a místo klasického Action Podu přináší nový Retro Viewfinder. Ten připomíná jednoduchý optický hledáček známý z filmových fotoaparátů.

Google představil Googlebook a míří za Chromebook

Google ukázal novou řadu notebooků s názvem Googlebook. Firma je označuje za první laptopy navržené přímo kolem umělé inteligence Gemini. Novinky dorazí na trh letos na podzim a vznikají ve spolupráci s výrobci Acer, Asus, Dell, HP a Lenovo. Google tím zároveň otevírá novou kapitolu po více než patnácti letech Chromebooků.

Sony uvedlo novou verzi nositelné klimatizace Reon Pocket Pro

Sony pokračuje ve svém trochu bizarním, ale očividně úspěšném projektu osobní klimatizace. Novinka s názvem Reon Pocket Pro navazuje na předchozí generace zařízení, které si uživatel připne za krk pod oblečení. Výrobce letos vsadil hlavně na vyšší výkon, pohodlnější nošení a lepší regulaci teploty.

Apple testuje AirPods s kamerami

Apple podle nových informací dokončuje testování AirPods s integrovanými kamerami. Nejde ale o klasické focení nebo natáčení videa. Kamery mají hlavně pomáhat umělé inteligenci chápat okolí uživatele a nabídnout nové funkce podobné chytrým brýlím.

Samsung spouští One UI 8.5 pro první vlnu telefonů a tabletů

Samsung začal vydávat aktualizaci One UI 8.5 pro vybrané telefony a tablety Galaxy. Nový systém dorazil nejdřív do Jižní Koreje a od 11. května se postupně rozšiřuje i do dalších regionů včetně Evropy, Indie nebo Severní Ameriky. První hlášení z USA potvrzují, že aktualizaci už dostávají majitelé řady Galaxy S25.

Samsung končí s vlastními SMS a uživatelům mizí zprávy

Samsung v USA po více než patnácti letech ukončí aplikaci Samsung Messages. Americké uživatele začne od července 2026 směrovat na Google Messages. Změna ale nepřináší jen novou aplikaci. Část majitelů telefonů Galaxy hlásí, že jim po migraci mizí staré i nové konverzace.

CarPlay nově podporuje už tři AI chatboty

Apple rozšiřuje možnosti CarPlay a do aut pouští dalšího AI chatbota. K ChatGPT a Perplexity se nově přidal také Grok od firmy xAI Elona Muska, která se mezitím spojila se SpaceXAI. Řidiči tak mají na výběr už trojici známých konverzačních služeb přímo na palubní obrazovce auta.

OpenAI rozšířilo Codex a míří přímo proti Claude Code

OpenAI výrazně rozšířilo možnosti svého nástroje Codex. Z původně poměrně úzce zaměřeného asistenta pro úpravu kódu se stává univerzálnější pracovní nástroj. Nově zvládá ovládat počítač, pracovat s integrovaným prohlížečem nebo kontrolovat pull requesty přímo z GitHubu. Firma zároveň spustila i nové rozšíření pro Chrome.

reMarkable se vrací k černobílým tabletům s novým Paper Pure

reMarkable po několika barevných modelech znovu sází na jednoduchost. Nový tablet Paper Pure navazuje na šest let starý reMarkable 2 a vrací značku k monochromatickému E Ink displeji. Firma láká hlavně na rychlejší odezvu, nižší hmotnost a nové funkce pro práci s poznámkami.

Chrome pro Android nabídne webům jen přibližnou polohu

Google upravuje práci s polohou v Chromu pro Android. Nově si uživatelé budou moci vybrat, jestli webům pošlou přesnou, nebo jen přibližnou polohu. Funkce navazuje na změny v Androidu 17 a míří hlavně na větší soukromí.

OpenAI přidává do Codexu AI mazlíčky

OpenAI rozšiřuje svůj nástroj Codex o novinku, která má zpříjemnit práci programátorům. Do aplikace přichází AI mazlíčci. Nejde o další nástroj na psaní kódu. Jde o malé animované společníky, kteří sledují, co Codex právě dělá, a informují uživatele v reálném čase.

Apple vydal nový firmware pro AirPods Pro 3

Apple rozeslal nový firmware pro AirPods Pro 3. Jde o první výraznější aktualizaci od minulého měsíce. Tehdy dorazila verze 8B39, nyní ji střídá build 8B40. Aktualizace přichází krátce před vydáním iOS 26.5.

Gemini míří do aut s Android Automotive

Google rozšiřuje AI asistenta Gemini do aut s Android Automotive. Postupně nahradí dosavadního Google Assistanta a zamíří nejen do nových vozů, ale i do těch starších. Aktualizace dorazí formou softwaru, takže změnu pocítí miliony řidičů bez nutnosti koupě nového auta.

Apple ruší základní Mac mini s menším úložištěm

Apple potichu upravil nabídku Macu mini. Z prodeje zmizela varianta s menším úložištěm. Zákazníci tak přišli o nejdostupnější konfiguraci. Firma tím fakticky posunula vstupní model výš.

Motorola Razr Fold míří mezi špičku skládacích telefonů

Motorola konečně odhalila svůj první „book-style“ skládací telefon Razr Fold. Novinka cílí přímo na nejvyšší třídu a chce konkurovat zavedeným modelům od Samsungu a Googlu. Už první informace ale naznačují, že nepůjde o dostupnější variantu, na kterou část trhu čeká.
Reklama
Reklama
Reklama
Reklama