0.6 C
Czech
Pátek 6. února 2026
AIElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99...

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama

Doporučujeme

Google Home nově podporuje chytrá tlačítka v automatizacích

Google Home dohání velký dluh. Nová verze aplikace přidává podporu chytrých tlačítek v automatizacích. Uživatelé tak konečně mohou fyzickým stiskem ovládat další zařízení v domácnosti, nejen hlasem nebo přes mobil.

Sony WF-1000XM6 se ukazují na uniklých snímcích

Chystaná sluchátka Sony WF-1000XM6 se předčasně objevila v internetovém obchodě a únik odhalil jejich podobu i několik prvních detailů. Snímky rychle zmizely, ale internet je stihl zachytit. Nová generace tak na sebe upozorňuje ještě před oficiálním představením.

Google chystá aplikaci Desktop Camera pro Android počítače

Google potichu zveřejnil novou aplikaci s názvem Desktop Camera. Objevila se na Google Play bez větší pozornosti. Vypadá jako první náznak toho, jak bude focení fungovat na připravovaných Android počítačích. Aplikace působí jednoduše a teprve na začátku vývoje.

Samsung Galaxy Z TriFold se vyprodal během minut

Samsung spustil prodej svého nového trojitě skládacího telefonu a zásoby zmizely téměř okamžitě. Zájem překvapil i zkušené technologické novináře. Mnozí čekali, že extrémní cenovka zájem rychle ochladí. Opak se stal realitou už během prvních minut.

Android posiluje ochranu proti krádežím telefonů

Google rozšiřuje sadu funkcí, které mají zlodějům zkomplikovat život. Novinky navazují na nástroje představené už v minulých letech a míří hlavně na ochranu dat i samotného zařízení. Cílem je, aby se ztracený nebo ukradený mobil stal pro pachatele co nejméně užitečný.

Moltbot láká tisíce lidí na osobního AI asistenta ale zároveň otevírá dveře rizikům

Otevřený projekt Moltbot se během pár týdnů proměnil v jeden z nejrychleji rostoucích AI nástrojů. Nabízí asistenta, který píše na WhatsApp nebo Slack a sám plní úkoly. Zájem letí nahoru. Spolu s ním ale i obavy o bezpečnost.

Android 17 přidá do systému ještě víc rozostření

Android 17 naváže na loňský designový posun a znovu zvýrazní práci s rozostřením. Uniklá interní verze systému ukazuje víc průhledných a barevně tónovaných prvků napříč rozhraním. Nejde o revoluci. Google ladí směr Material 3 Expressive a posouvá ho dál v detailech.

Apple v únoru ukáže Siri poháněnou Gemini

Apple se chystá předvést novou generaci Siri, která poběží na modelech Gemini od Googlu. Podle zákulisních informací má prezentace proběhnout už v druhé polovině února. Půjde o první hmatatelný výsledek nedávno oznámené spolupráce obou firem v oblasti umělé inteligence. Apple tím chce naplnit sliby, které zazněly už loni v létě.

YouTube Music nově synchronizuje frontu přehrávání mezi zařízeními

YouTube Music přidává funkci, na kterou uživatelé čekali roky. Služba nově synchronizuje přehrávací frontu napříč zařízeními, kde je uživatel přihlášený. Hudba tak plynule naváže při přechodu z mobilu na tablet nebo web. Funkce připomíná Spotify Connect a míří na každodenní pohodlí při poslechu.

WhatsApp umožní sdílení historie chatu s novými členy skupin

WhatsApp rozšiřuje funkci, na kterou uživatelé čekali roky. Noví členové skupinových chatů mohou po přidání dostat přístup k části starší konverzace. Díky tomu se rychle zorientují v dění a nebudou odkázáni na dodatečné vysvětlování. Funkce se zatím objevuje u vybraných beta testerů na iOS, ale směřuje k širšímu nasazení.

Apple chystá AI pin a telefon, který zvládne tři systémy

Apple po letech opatrnosti konečně zrychluje v oblasti umělé inteligence. Po odkladu vylepšené Siri na rok 2026 se rýsuje výrazná změna směru. Podle zákulisních informací má Apple pracovat na nové podobě Siri, která se má proměnit v plnohodnotný chatbot. Už nepůjde jen o hlasového asistenta, ale o konverzační rozhraní podobné ChatGPT.

Adobe Acrobat přidává tvorbu prezentací a podcastů z dokumentů

Adobe dál rozšiřuje umělou inteligenci v Acrobatu a souvisejících službách. Po loňském uvedení Acrobat Studio teď firma posouvá práci s PDF o krok dál. Nové funkce staví na PDF Spaces, tedy sdílených prostorech pro dokumenty, poznámky a spolupráci. Cíl je jasný. Ušetřit čas a zjednodušit práci s obsahem, který už uživatelé mají.

iPhone 18 má dostat výrazně jasnější displej

Apple chystá u iPhonu 18 jeden z největších posunů v oblasti displejů za poslední roky. Podle informací z dodavatelského řetězce má být obrazovka výrazně jasnější než u všech předchozích generací. Změna má být natolik zásadní, že ji nezvládne splnit jeden ze současných dodavatelů panelů. Konkrétně čínská společnost BOE.
Reklama
Reklama
Reklama
Reklama