-6.1 C
Czech
Čtvrtek 22. ledna 2026
AIElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99...

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama

Doporučujeme

Apple Intelligence Siri má zpoždění, které Applu nakonec může pomoct

Apple slíbil velkou proměnu Siri a nástup Apple Intelligence už v roce 2024. Realita ale za očekáváním zaostala. Nová generace hlasového asistenta dorazí výrazně později a firma to ani příliš neskrývá. Vývoj vlastních AI modelů se ukázal jako náročnější, než Apple čekal. Do hry navíc vstoupila dlouhodobá opatrnost při práci s daty.

Threads se dostaly před X v denní mobilní návštěvnosti

Sociální síť Threads od společnosti Meta poprvé předběhla X v počtu globálních denních uživatelů na mobilních zařízeních. Vyplývá to z odhadů analytické firmy Similarweb za první polovinu ledna. Threads podle nich denně používá zhruba 143 milionů lidí na mobilech, zatímco X přibližně 126 milionů. Jde o symbolický milník v dlouhodobém souboji dvou textově orientovaných platforem.

OLED MacBook Pro je blíž než kdy dřív a může dorazit už letos

Vývoj OLED MacBooku Pro se podle nejnovějších informací výrazně posunul. Výroba panelů už běží a Apple má mít za sebou klíčové testování. To naznačuje, že přechod na OLED displeje není vzdálená vize, ale konkrétní plán. A možná i otázka měsíců, ne let.

Microsoft potvrzuje první bezplatnou aktualizaci Windows pro rok 2026

Je rok 2026 a Windows znovu stojí na rozcestí. Microsoft po loňském odkladu definitivního konce Windows 10 potvrdil, že říjen 2026 bude skutečně poslední metou. Přesto firma znovu couvla jen částečně. Nabízí bezplatné rozšířené bezpečnostní aktualizace, ale jen těm, kteří splní dané podmínky.

Stovky milionů sluchátek a reproduktorů ohrožuje chyba v Bluetooth Fast Pair

Bezdrátová sluchátka a přenosné reproduktory se měly připojovat rychle a bez starostí. Přesně to byl cíl technologie Google Fast Pair. Jeden dotyk a hotovo. Teď se ale ukazuje, že stejná pohodlnost může hrát do karet útočníkům. Podle bezpečnostních výzkumníků z belgické univerzity KU Leuven obsahuje Fast Pair vážnou chybu, která otevírá cestu ke špehování, sledování i převzetí kontroly nad audio zařízeními.

Xbox, Nintendo a PlayStation aktualizují společné zásady bezpečnějšího hraní

Velcí hráči herního průmyslu znovu potvrzují, že bezpečnost online hraní berou vážně. Xbox oznámil aktualizaci takzvaných Safer Gaming Principles, na nichž dlouhodobě spolupracuje s Nintendo a PlayStation. Nejde o novou iniciativu, ale o pokračování partnerství, které vzniklo už na konci roku 2020.

Skládací iPhone má dostat tekutý kov a vylepšený titan

První skládací iPhone se znovu připomíná. Podle čerstvých úniků má Apple vsadit na materiály, které zatím ve velkém nepoužíval. Klíčovou roli má hrát tekutý kov v pantu a nová varianta titanu v těle zařízení. Cílem je vyšší odolnost, menší hmotnost a dlouhá životnost konstrukce. Premiéra se očekává už letos na podzim spolu s řadou iPhone 18.

Google Photos chystá ovládání rychlosti videa a čistší zobrazení fotek

Google Photos patří k nejpoužívanějším aplikacím pro správu fotek a videí na světě. Má přes deset miliard stažení a pro spoustu lidí je prakticky nepostradatelná. Přesto jí dlouhodobě chyběly některé základní funkce, které konkurence nabízí už roky. Teď to ale vypadá, že Google se konečně chystá jednu z nich doplnit.

YouTube TV spouští nový vzhled živého průvodce na Androidu a iOS

YouTube TV na začátku roku rozjíždí výraznou změnu v mobilních aplikacích. Na Androidu a iOS se začíná ve velkém objevovat přepracovaný Live Guide, tedy průvodce živým vysíláním. Úprava navazuje na rozhraní, které služba nasadila na televizích už v roce 2023. Teď se stejné pojetí dostává i na mobily.

Apple varuje před útoky na iPhony bez aktualizace

Apple znovu potvrzuje, že iPhony čelí aktivním útokům pomocí pokročilého špionážního softwaru. Tentokrát nejde o teoretické riziko, ale o zranitelnosti, které už útočníci skutečně zneužívají. Dvě kritické chyby byly sice opraveny, ale jen pro část uživatelů. Většina iPhonů zůstává bez ochrany, pokud jejich majitelé nepřejdou na nejnovější systém.

Gmail přidává AI Inbox a přehledy s Gemini, část funkcí je jen pro předplatitele

Gmail oficiálně vstupuje do éry umělé inteligence Gemini. Google rozšiřuje svou e mailovou službu o nové nástroje, které mají uživatelům pomoci lépe se orientovat v doručené poště, rychleji hledat informace a efektivněji psát odpovědi. Změny se týkají jak bezplatných uživatelů, tak předplatitelů placených tarifů Google AI Pro a Ultra.

Nintendo ukázalo první barevné Joy-Cony pro Switch 2

Nintendo oficiálně představilo první barevnou variantu ovladačů Joy-Con pro konzoli Switch 2. Nové provedení kombinuje světle fialovou a světle zelenou barvu a na trh dorazí 12. února společně s hrou Mario Tennis Fever. Jde o první pokus Nintenda odlišit Joy-Con 2 od základní verze barevně, nikoli funkčně.

Lego představilo Smart Bricks a rozvířilo debatu o budoucnosti hraní

Lego na veletrhu CES 2026 v Las Vegas představilo Smart Bricks, nové chytré kostky plné senzorů, světel a zvuků. Podle firmy jde o největší inovaci za posledních téměř 50 let. Nový systém má oživit klasické stavebnice a reagovat na pohyb, dotyk i vzájemnou interakci jednotlivých dílků.
Reklama
Reklama
Reklama
Reklama