AIElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99...

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama

Doporučujeme

Wear OS 7 přinese Gemini i nové widgety

Google na konferenci I/O 2026 ukázal první detaily o Wear OS 7. Nová verze systému pro chytré hodinky dorazí později letos a zaměří se hlavně na přehlednější prostředí, lepší výdrž baterie a hlubší propojení s Gemini. Nejvíc změn uvidí majitelé Pixel Watch, ale část novinek dostanou i další hodinky s Wear OS.

Microsoft ukázal nové Surface pro firmy s AI v hlavní roli

Microsoft představil novou generaci pracovních zařízení Surface for Business. Novinky míří hlavně na firmy a kanceláře, které chtějí využívat AI přímo v počítači bez nutnosti spoléhat na cloud. Firma ukázala nové modely Surface Laptop for Business i Surface Pro for Business. Všechny pohání procesory Intel Core Ultra Series 3 a Microsoft slibuje vyšší výkon i dlouhou výdrž baterie.

Sony představilo výroční sluchátka 1000X the Collexion

Sony slaví deset let řady 1000X novým modelem sluchátek s aktivním potlačením hluku. Novinka nese název 1000X the Collexion a navazuje na loňský model WH-1000XM6. Tentokrát ale nejde jen o další generační posun. Sony sází hlavně na výraznější design, pohodlí a luxusnější zpracování.

Apple chystá Siri s automatickým mazáním chatů

Apple podle zákulisních informací připravuje pro iOS 27 velkou proměnu Siri. Nově má fungovat jako samostatná aplikace s chatovacím rozhraním podobným ChatGPT. Firma přitom chce výrazně zdůraznit ochranu soukromí a nabídne i automatické mazání konverzací po určité době.

iPhone 18 přinese novou ochranu polohy před operátory

Apple chystá u celé řady iPhone 18 zásadní změnu. Firma podle zákulisních informací definitivně opustí modemy od Qualcommu a nasadí vlastní čipy C2. Většina debat se zatím točí kolem rychlosti nebo výdrže baterie. Ve skutečnosti ale nová generace přinese i méně nápadnou novinku v oblasti soukromí.

OpenAI přináší Codex do mobilní aplikace ChatGPT

OpenAI rozšiřuje svůj nástroj Codex do mobilní aplikace ChatGPT pro iPhone, iPad a Android. Uživatelé díky tomu mohou na dálku sledovat práci AI asistenta, schvalovat úkoly nebo zadávat nové příkazy, aniž by seděli u počítače. Firma tím dál posouvá své ambice v oblasti autonomního programování.

Instagram přidal Instants a uživatelé řeší, jak funkci vypnout

Instagram spustil novou funkci Instants, která přináší rychlé mizící fotografie přímo do soukromých zpráv. Meta ji představuje jako spontánnější způsob sdílení běžných momentů. Místo pečlivě upravených příspěvků mají uživatelé posílat autentické fotky, které po otevření zmizí. Ne každého ale novinka potěšila.

Insta360 převléklo miniaturní kameru Go 3S do retro stylu

Insta360 zkouší zaujmout nostalgickou vlnou a představilo speciální edici své miniaturní akční kamery Go 3S Retro Bundle. Novinka sází na vzhled inspirovaný starými kompakty a místo klasického Action Podu přináší nový Retro Viewfinder. Ten připomíná jednoduchý optický hledáček známý z filmových fotoaparátů.

Google představil Googlebook a míří za Chromebook

Google ukázal novou řadu notebooků s názvem Googlebook. Firma je označuje za první laptopy navržené přímo kolem umělé inteligence Gemini. Novinky dorazí na trh letos na podzim a vznikají ve spolupráci s výrobci Acer, Asus, Dell, HP a Lenovo. Google tím zároveň otevírá novou kapitolu po více než patnácti letech Chromebooků.

Sony uvedlo novou verzi nositelné klimatizace Reon Pocket Pro Plus

Sony pokračuje ve svém trochu bizarním, ale očividně úspěšném projektu osobní klimatizace. Novinka s názvem Reon Pocket Pro navazuje na předchozí generace zařízení, které si uživatel připne za krk pod oblečení. Výrobce letos vsadil hlavně na vyšší výkon, pohodlnější nošení a lepší regulaci teploty.

Apple testuje AirPods s kamerami

Apple podle nových informací dokončuje testování AirPods s integrovanými kamerami. Nejde ale o klasické focení nebo natáčení videa. Kamery mají hlavně pomáhat umělé inteligenci chápat okolí uživatele a nabídnout nové funkce podobné chytrým brýlím.

Samsung spouští One UI 8.5 pro první vlnu telefonů a tabletů

Samsung začal vydávat aktualizaci One UI 8.5 pro vybrané telefony a tablety Galaxy. Nový systém dorazil nejdřív do Jižní Koreje a od 11. května se postupně rozšiřuje i do dalších regionů včetně Evropy, Indie nebo Severní Ameriky. První hlášení z USA potvrzují, že aktualizaci už dostávají majitelé řady Galaxy S25.

Samsung končí s vlastními SMS a uživatelům mizí zprávy

Samsung v USA po více než patnácti letech ukončí aplikaci Samsung Messages. Americké uživatele začne od července 2026 směrovat na Google Messages. Změna ale nepřináší jen novou aplikaci. Část majitelů telefonů Galaxy hlásí, že jim po migraci mizí staré i nové konverzace.

CarPlay nově podporuje už tři AI chatboty

Apple rozšiřuje možnosti CarPlay a do aut pouští dalšího AI chatbota. K ChatGPT a Perplexity se nově přidal také Grok od firmy xAI Elona Muska, která se mezitím spojila se SpaceXAI. Řidiči tak mají na výběr už trojici známých konverzačních služeb přímo na palubní obrazovce auta.
Reklama
Reklama
Reklama
Reklama