-0.2 C
Czech
Pátek 16. ledna 2026
AIElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99...

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama

Doporučujeme

Google Photos chystá ovládání rychlosti videa a čistší zobrazení fotek

Google Photos patří k nejpoužívanějším aplikacím pro správu fotek a videí na světě. Má přes deset miliard stažení a pro spoustu lidí je prakticky nepostradatelná. Přesto jí dlouhodobě chyběly některé základní funkce, které konkurence nabízí už roky. Teď to ale vypadá, že Google se konečně chystá jednu z nich doplnit.

YouTube TV spouští nový vzhled živého průvodce na Androidu a iOS

YouTube TV na začátku roku rozjíždí výraznou změnu v mobilních aplikacích. Na Androidu a iOS se začíná ve velkém objevovat přepracovaný Live Guide, tedy průvodce živým vysíláním. Úprava navazuje na rozhraní, které služba nasadila na televizích už v roce 2023. Teď se stejné pojetí dostává i na mobily.

Apple varuje před útoky na iPhony bez aktualizace

Apple znovu potvrzuje, že iPhony čelí aktivním útokům pomocí pokročilého špionážního softwaru. Tentokrát nejde o teoretické riziko, ale o zranitelnosti, které už útočníci skutečně zneužívají. Dvě kritické chyby byly sice opraveny, ale jen pro část uživatelů. Většina iPhonů zůstává bez ochrany, pokud jejich majitelé nepřejdou na nejnovější systém.

Gmail přidává AI Inbox a přehledy s Gemini, část funkcí je jen pro předplatitele

Gmail oficiálně vstupuje do éry umělé inteligence Gemini. Google rozšiřuje svou e mailovou službu o nové nástroje, které mají uživatelům pomoci lépe se orientovat v doručené poště, rychleji hledat informace a efektivněji psát odpovědi. Změny se týkají jak bezplatných uživatelů, tak předplatitelů placených tarifů Google AI Pro a Ultra.

Nintendo ukázalo první barevné Joy-Cony pro Switch 2

Nintendo oficiálně představilo první barevnou variantu ovladačů Joy-Con pro konzoli Switch 2. Nové provedení kombinuje světle fialovou a světle zelenou barvu a na trh dorazí 12. února společně s hrou Mario Tennis Fever. Jde o první pokus Nintenda odlišit Joy-Con 2 od základní verze barevně, nikoli funkčně.

Lego představilo Smart Bricks a rozvířilo debatu o budoucnosti hraní

Lego na veletrhu CES 2026 v Las Vegas představilo Smart Bricks, nové chytré kostky plné senzorů, světel a zvuků. Podle firmy jde o největší inovaci za posledních téměř 50 let. Nový systém má oživit klasické stavebnice a reagovat na pohyb, dotyk i vzájemnou interakci jednotlivých dílků.

Asus slibuje první Wi-Fi 8 router ještě letos, i když Wi-Fi 7 jsme sotva začali používat

Ještě ani zdaleka nejsme ve fázi, kdy by se Wi-Fi 7 stalo běžným standardem v domácnostech, a už se mluví o další generaci. Na veletrhu CES 2026 se Wi-Fi 8 stalo jedním z velkých témat. Asus, Broadcom i MediaTek zde ukázali zařízení a čipy připravené na budoucí standard 802.11bn, přestože jeho finální podoba má dorazit až za několik let.

Google Keep má za sebou silný rok a hledá další směr

Rok 2025 byl pro Google Keep nezvykle rušný. Aplikace, která dlouhé roky působila spíš jako nenápadná poznámková služba bez větších ambicí, se dočkala řady změn. Některé byly čistě praktické, jiné designové. Celek ale ukazuje, že Google Keep znovu řeší svou roli v ekosystému Workspace a ve světě, kde do všeho vstupuje umělá inteligence.

Sluchátka určená ke spánku si našla místo i během dne

Původně měla řešit chrápání a neklidné noci. Nakonec se z nich stala každodenní výbava. Drobné špunty Soundcore Sleep A30, navržené hlavně na spaní, si jejich autorka oblíbila i při chůzi, cvičení a práci. Ne proto, že by hrály nejlépe. Ale proto, že se přizpůsobily jejímu životu bez námahy.

Clicks přiváží na CES 2026 nový hardware s fyzickou klávesnicí

Clicks zahajuje letošní veletrh CES ve velkém stylu. Představuje hned dva nové produkty, které staví na fyzické QWERTY klávesnici a návratu k soustředěné komunikaci. Jde o univerzální externí klávesnici Clicks Power Keyboard a o vůbec první smartphone značky s názvem Clicks Communicator. Oba míří na uživatele, kteří chtějí psát rychle, přesně a bez rozptylování.

AirPods Pro 3 přinášejí největší změny za roky a další už jsou na cestě

AirPods Pro 3 dorazily na podzim 2025 a Apple jimi výrazně posunul svou prémiovou řadu bezdrátových sluchátek. Nová generace sází na lepší potlačení hluku, vyšší kvalitu zvuku a funkce, které míří dál než jen k poslechu hudby. Do popředí se dostává zdraví, pohyb a umělá inteligence. Výsledkem jsou sluchátka, která mají ambice stát se každodenním společníkem.

Únik z One UI 8.5 potvrzuje design a nové funkce Galaxy S26

Samsung si zřejmě nechtěně poodhalil vlastní plány. V kódu One UI 8.5 se objevily 2D rendery, které odpovídají chystané řadě Galaxy S26. Konkrétně modelům Galaxy S26, S26 Plus a S26 Ultra. Obrázky potvrzují dřívější úniky a dávají poměrně jasnou představu o tom, jak budou nové vlajkové lodě vypadat.

True Ventures věří, že iPhone čeká konec do deseti let

Smartphone je dnes skoro prodloužením lidské ruky. Podle Jon Callaghan ale tahle éra míří ke konci. Spoluzakladatel fondu True Ventures tvrdí, že iPhony přestaneme používat do deseti let. Možná už za pět. Nejde o provokaci, ale o investiční tezi, na kterou fond sází reálné peníze.

LG představilo Gallery TV jako konkurenci Samsungu The Frame

LG se před veletrhem CES 2026 hlásí o slovo v kategorii designových televizí. Nová Gallery TV míří přímo proti Samsungu The Frame a dalším obrazovým televizím, které mají v interiéru působit spíš jako umělecký objekt než klasická obrazovka. LG vsadilo na podobný koncept, ale s několika rozdíly, které stojí za pozornost.
Reklama
Reklama
Reklama
Reklama