AIElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99...

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama

Doporučujeme

OpenAI rozšířilo Codex a míří přímo proti Claude Code

OpenAI výrazně rozšířilo možnosti svého nástroje Codex. Z původně poměrně úzce zaměřeného asistenta pro úpravu kódu se stává univerzálnější pracovní nástroj. Nově zvládá ovládat počítač, pracovat s integrovaným prohlížečem nebo kontrolovat pull requesty přímo z GitHubu. Firma zároveň spustila i nové rozšíření pro Chrome.

reMarkable se vrací k černobílým tabletům s novým Paper Pure

reMarkable po několika barevných modelech znovu sází na jednoduchost. Nový tablet Paper Pure navazuje na šest let starý reMarkable 2 a vrací značku k monochromatickému E Ink displeji. Firma láká hlavně na rychlejší odezvu, nižší hmotnost a nové funkce pro práci s poznámkami.

Chrome pro Android nabídne webům jen přibližnou polohu

Google upravuje práci s polohou v Chromu pro Android. Nově si uživatelé budou moci vybrat, jestli webům pošlou přesnou, nebo jen přibližnou polohu. Funkce navazuje na změny v Androidu 17 a míří hlavně na větší soukromí.

OpenAI přidává do Codexu AI mazlíčky

OpenAI rozšiřuje svůj nástroj Codex o novinku, která má zpříjemnit práci programátorům. Do aplikace přichází AI mazlíčci. Nejde o další nástroj na psaní kódu. Jde o malé animované společníky, kteří sledují, co Codex právě dělá, a informují uživatele v reálném čase.

Apple vydal nový firmware pro AirPods Pro 3

Apple rozeslal nový firmware pro AirPods Pro 3. Jde o první výraznější aktualizaci od minulého měsíce. Tehdy dorazila verze 8B39, nyní ji střídá build 8B40. Aktualizace přichází krátce před vydáním iOS 26.5.

Gemini míří do aut s Android Automotive

Google rozšiřuje AI asistenta Gemini do aut s Android Automotive. Postupně nahradí dosavadního Google Assistanta a zamíří nejen do nových vozů, ale i do těch starších. Aktualizace dorazí formou softwaru, takže změnu pocítí miliony řidičů bez nutnosti koupě nového auta.

Apple ruší základní Mac mini s menším úložištěm

Apple potichu upravil nabídku Macu mini. Z prodeje zmizela varianta s menším úložištěm. Zákazníci tak přišli o nejdostupnější konfiguraci. Firma tím fakticky posunula vstupní model výš.

Motorola Razr Fold míří mezi špičku skládacích telefonů

Motorola konečně odhalila svůj první „book-style“ skládací telefon Razr Fold. Novinka cílí přímo na nejvyšší třídu a chce konkurovat zavedeným modelům od Samsungu a Googlu. Už první informace ale naznačují, že nepůjde o dostupnější variantu, na kterou část trhu čeká.

Honor posouvá hranice střední třídy

Honor 600 míří vysoko a budí otázku, proč lidé stále sahají po drahých vlajkách. Telefon přináší prvky, které byly ještě nedávno vyhrazené top modelům. Výsledkem je zařízení, které působí mnohem prémiověji, než by kdo čekal.

Google Meet zvládne AI poznámky i z osobních schůzek

Google rozšiřuje své AI funkce ve Workspace. Nově dokáže nástroj pro poznámky v Google Meet zachytit i osobní schůzky. Funkce přepisuje a shrnuje rozhovory v reálném čase. Stačí k tomu mobil a spuštěný Gemini notetaker.

Sony Xperia 1 VIII míří k výraznému redesignu

Nové úniky naznačují, že Sony chystá u modelu Xperia 1 VIII zásadní změnu vzhledu. První render se objevil už začátkem dubna a mnozí ho považovali za aprílový vtip. Postupně se ale přidaly další obrázky. Ty původní tvrzení posilují.

Microsoft Teams upraví panel schůzky a omezí nechtěné zvedání ruky

Microsoft chystá změnu, která potěší každého, kdo někdy omylem „zvedl ruku“ během online schůzky. Problém, na který si uživatelé dlouhodobě stěžují, má konečně řešení. Firma upraví rozhraní tak, aby se podobné přešlapy stávaly méně často.

Gemini pro Google Home dostává funkci pokračující konverzace

Google rozšiřuje schopnosti svého hlasového asistenta Gemini pro chytrou domácnost. Nově přichází funkce pokračující konverzace, která umožní mluvit s asistentem přirozeněji a bez neustálého opakování aktivační fráze. Funkce startuje v režimu předběžného přístupu.
Reklama
Reklama
Reklama
Reklama