AIElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99...

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama

Doporučujeme

Amazon ukončí podporu starších Kindle zařízení

Amazon oznámil, že ukončí podporu starších čteček Kindle a tabletů Fire. Týká se modelů vydaných v roce 2012 a dříve. Změna začne platit 20. května 2026. Uživatelé si už na těchto zařízeních nestáhnou ani nekoupí nové e-knihy.

Firefox chystá velký redesign Nova

Firefox se po letech chystá na zásadní změnu. Projekt s interním názvem Nova má přinést největší úpravu rozhraní za zhruba šest let. Úniky designů ukazují úplně jiný prohlížeč, než na jaký jsou uživatelé zvyklí od éry Proton z roku 2021. Novinka má dorazit v horizontu několika měsíců spolu s dalšími funkcemi.

Picsart otevírá monetizaci pro všechny tvůrce

Picsart spouští nový program Earn with Picsart, který má změnit způsob, jakým si tvůrci vydělávají. Platforma ho otevřela všem svým více než 130 milionům uživatelů bez pozvánek a bez požadavku na počet sledujících. Tvůrci tak mohou začít vydělávat bez ohledu na velikost publika.

Galaxy Z Fold 8 zůstane známý, hlavní změna se odehraje v displeji

Samsung chystá Galaxy Z Fold 8 a první informace naznačují překvapivě konzervativní přístup. Novinka má na první pohled vypadat téměř stejně jako loňský Fold 7. Důvod ale neleží v nedostatku inovací. Klíčová změna se má skrývat uvnitř konstrukce, konkrétně v samotném displeji.

Gemini pro Google Home přináší ovládání světel podle nálady

Google posouvá svůj chytrý domov o krok dál. Gemini pro Home dostává novou várku funkcí, které mají ovládání zjednodušit a zpřesnit. Nejvíc pozornosti budí takzvané expresivní ovládání světel. Stačí popsat náladu a systém nastaví barvy sám.

Samsung nabízí aplikaci proti nevolnosti z pohybu pomocí zvuku

Samsung přichází s neobvyklým řešením kinetózy. Nová aplikace Hearapy slibuje úlevu pomocí jednoduchého zvuku. Stačí si na minutu pustit tón o frekvenci 100 Hz do sluchátek. Podle firmy to může zmírnit nevolnost až na dvě hodiny.

Bluesky představuje Attie, AI nástroj pro tvorbu vlastních feedů

Bluesky rozšiřuje své ambice mimo sociální síť. Nově ukázalo aplikaci Attie, která využívá umělou inteligenci k tvorbě vlastních obsahových feedů. Nejde o další funkci uvnitř aplikace, ale o samostatný produkt postavený na stejném základu.

Android 17 Beta 3 vrací rychlé zapnutí WiFi jedním klepnutím

Google v Androidu 17 Beta 3 vrací funkci, kterou uživatelé dlouho postrádali. WiFi lze znovu zapnout nebo vypnout jediným klepnutím v rychlém nastavení. Jde o návrat ke staršímu a jednoduššímu chování, které zmizelo s příchodem Androidu 12.

Apple tvrdí, že iPhone v režimu Lockdown Mode nikdo neprolomil

Apple po téměř čtyřech letech od spuštění bezpečnostního režimu Lockdown Mode hlásí výrazný výsledek. Podle firmy neexistuje jediný potvrzený případ, kdy by byl iPhone s tímto režimem úspěšně napaden špionážním softwarem. Jde o nejtvrdší ochranu, jakou Apple běžným uživatelům nabízí.

Google rozšiřuje živé překlady do sluchátek na iOS a do dalších zemí

Google posouvá překlady o krok dál. Funkce Live Translate nově dorazila na iOS a výrazně rozšiřuje dostupnost po světě. Uživatelé tak mohou poslouchat překlady v reálném čase přímo ve sluchátkách. Stačí aplikace Google Translate a připojená sluchátka.

Reddit posílí boj s boty pomocí ověřování uživatelů

Reddit zpřísňuje boj proti botům. Nově chce lépe rozlišit mezi skutečnými uživateli a automatizovanými účty. Některé profily proto mohou narazit na výzvu, aby potvrdily, že za nimi stojí člověk. Podle šéfa firmy Steve Huffmana ale půjde o výjimečné případy.
Reklama
Reklama
Reklama
Reklama