0.7 C
Czech
Sobota 22. listopadu 2025

Gemini má nový design a ukládá obrázky i videa

Aplikace Gemini, klíčová AI funkce na telefonech a tabletech Galaxy, se dočkala další vizuální úpravy. Nový vzhled nabízí čistší domovskou obrazovku a přehlednější rozvržení. Kromě toho přibyla nová sekce s názvem My Stuff, kde uživatel najde všechna média vytvořená v rámci chatu s Gemini.

ElevenLabs spouští službu Scribe, pokročilý model převodu řeči na text. Zvládne 99 jazyků

Společnost ElevenLabs se dosud specializovala především na technologie pro převod textu na řeč, nyní však přichází s novinkou z opačné strany tohoto oboru. Představuje Scribe, svůj první model pro automatický převod řeči na text (tzv. STT). Ten si klade za cíl zlepšit přesnost a dostupnost přepisu v celkem 99 jazycích. Nabízí pokročilé funkce, jako jsou časové značky u jednotlivých slov či rozpoznávání různých mluvčích.

Reklama

Scribe se profiluje jako řešení pro rozmanité situace — od zachycení zápisků a shrnutí jednání, přes tvorbu titulků, až po náročné audio nahrávky s více hlasy. Za vývojem stojí klíčové osobnosti společnosti ElevenLabs, Flavio Schneider a Tim von Känel. Změřili se na to, aby nástroj nabízel nejen vysokou přesnost, ale i komplexní funkce pro pohodlné využití v praxi.

Bezkonkurenční výkon v 99 jazycích

Mezi hlavní přednosti Scribe patří podrobná identifikace mluvčích i zvukových událostí a důraz na minimalizaci chybovosti — a to napříč 99 jazyky. V interních testech porovnávala společnost ElevenLabs Scribe s konkurenčními modely (Whisper Large V3, Deepgram Nova-3 či Gemini 2.0 Flash) a podle zveřejněných dat Scribe dosahoval nejnižší míry chyb. Výsledkem je například až 98,7procentní přesnost v italštině a 96,7procentní v angličtině, což platí i pro řadu dalších jazyků. Včetně těch méně rozšířených, jako jsou srbština, kantonština nebo malajalamština.

Vedle přesného přepisu textu v různých jazycích nabízí Scribe také API určené pro vývojáře. Ti mohou díky němu vytvářet přepisy ve formátu JSON s vyznačenými neřečovými událostmi i jednotlivými mluvčími. To výrazně usnadňuje nasazení nástroje v různých aplikacích. Za hodinu zpracovaného audia si ElevenLabs účtuje 0,40 USD, přičemž po dobu šesti týdnů od spuštění je služba k dispozici se zaváděcí slevou.

Společnost zároveň chystá verzi Scribe s nízkou latencí pro potřeby živého přepisu, což by mělo dále rozšířit pole jeho využití. Služba je už teď dostupná skrze ovládací panel ElevenLabs, kde lze jednoduše nahrát audio či video a získat přepis ve formátu, který přesně odpovídá daným požadavkům.

S tímto krokem ElevenLabs jednoznačně vstupuje do boje s už zavedenými hráči na poli převodu řeči na text, jako jsou Google, Otter nebo Fireflies. Díky pokročilým funkcím, vysoké přesnosti a cenově přívětivé nabídce má Scribe potenciál stát se nepostradatelným nástrojem nejen pro firmy, ale pro každého, kdo potřebuje spolehlivé a efektivní řešení automatického přepisu.

Reklama
Reklama

Sledujte nás na sítích

Google konečně propojuje Kalendář a úkoly

Google přichází s novinkou, která může výrazně zefektivnit každodenní práci. V Kalendáři si nově můžete vyhradit čas přímo na konkrétní úkol z Google Tasks. Odpadá tak nutnost vytvářet falešné „focus time“ schůzky, jen aby se ochránil váš čas před ostatními.

Microsoft mění Windows 11 na systém s AI agenty

Windows 11 se brzy stane platformou pro nové generace AI agentů. Microsoft proměňuje celý operační systém na takzvaný „agentský OS“, kde umělá inteligence nejen radí, ale také aktivně ovládá prvky systému za uživatele. Klíčovým místem se stává hlavní panel, který se mění v rozcestník pro interakci s agenty a Copilotem.

Google spustil Nano Banana Pro s podporou Gemini 3

Google představil novou verzi svého nástroje pro generování a úpravu obrázků Nano Banana Pro. Ten staví na čerstvě uvedeném modelu Gemini 3 Pro, který Google oznámil teprve v úterý. Novinka přináší výrazné vylepšení oproti původnímu Nano Banana, který se stal virálním hitem díky přeměnám selfie do podoby 3D figurek.

Androidy a iPhony si teď pošlou soubory přes AirDrop

Apple a Google se konečně technologicky sblížili. Uživatelé iPhonů mohou nově posílat soubory přes AirDrop na vybraná zařízení Pixel s Androidem. Funguje to i obráceně. Google totiž potichu zajistil, že jeho Quick Share umí komunikovat s AirDropem. Apple s tím neměl nic společného.

Galaxy Buds 4 Pro nabídnou přepracovaný design i ovládání pohybem hlavy

Samsung chystá novou generaci bezdrátových sluchátek Galaxy Buds 4 Pro. Podle uniklých animací z nadstavby One UI 8.5 dojde nejen na změny vzhledu, ale i na novinky ve funkční výbavě. Mezi nimi vyniká hlavně nová funkce ovládání pomocí pohybů hlavy.

Gemini má nový design a ukládá obrázky i videa

Aplikace Gemini, klíčová AI funkce na telefonech a tabletech Galaxy, se dočkala další vizuální úpravy. Nový vzhled nabízí čistší domovskou obrazovku a přehlednější rozvržení. Kromě toho přibyla nová sekce s názvem My Stuff, kde uživatel najde všechna média vytvořená v rámci chatu s Gemini.

LinkedIn usnadňuje hledání lidí pomocí AI

LinkedIn představil novou funkci vyhledávání, která využívá umělou inteligenci. Uživatelé už nemusejí zadávat jména, názvy pozic nebo firmy. Stačí jednoduše popsat, koho hledají. Můžou napsat třeba „absolventi Northwesternu v zábavním marketingu“ nebo „kdo mi vysvětlí pracovní víza v USA“.

Valve představil bezdrátový headset Steam Frame

Valve oznámil nový VR headset Steam Frame, který má ambici nahradit stárnoucí Index. Headset zvládá nejen VR hry, ale i běžné tituly ze Steamu díky streamování přes Wi-Fi. Funguje zcela bez kabelu a část her dokáže spustit i nativně bez připojení k počítači.

Apple a Issey Miyake uvádějí iPhone Pocket

Apple a japonská módní značka Issey Miyake spojily síly a přinášejí nový doplněk. iPhone Pocket je pružný obal s popruhem, který se dá nosit na těle, na tašce nebo v ruce. Díky své žebrované struktuře se přizpůsobí každému iPhonu i dalším drobnostem.

Google vylepšuje Pixel AI bez ohrožení soukromí

Google představil technologii Private AI Compute, která umožňuje telefonům Pixel využívat výkonné AI modely v cloudu, aniž by uživatel přišel o soukromí. Novinka přichází s listopadovým Feature Dropem a míří nejdřív na Pixel 10 a vybrané starší modely.
Reklama

NEJNOVĚJŠÍ

Google konečně propojuje Kalendář a úkoly

Google přichází s novinkou, která může výrazně zefektivnit každodenní práci. V Kalendáři si nově můžete vyhradit čas přímo na konkrétní úkol z Google Tasks. Odpadá tak nutnost vytvářet falešné „focus time“ schůzky, jen aby se ochránil váš čas před ostatními.

Microsoft mění Windows 11 na systém s AI agenty

Windows 11 se brzy stane platformou pro nové generace AI agentů. Microsoft proměňuje celý operační systém na takzvaný „agentský OS“, kde umělá inteligence nejen radí, ale také aktivně ovládá prvky systému za uživatele. Klíčovým místem se stává hlavní panel, který se mění v rozcestník pro interakci s agenty a Copilotem.

Google spustil Nano Banana Pro s podporou Gemini 3

Google představil novou verzi svého nástroje pro generování a úpravu obrázků Nano Banana Pro. Ten staví na čerstvě uvedeném modelu Gemini 3 Pro, který Google oznámil teprve v úterý. Novinka přináší výrazné vylepšení oproti původnímu Nano Banana, který se stal virálním hitem díky přeměnám selfie do podoby 3D figurek.

Androidy a iPhony si teď pošlou soubory přes AirDrop

Apple a Google se konečně technologicky sblížili. Uživatelé iPhonů mohou nově posílat soubory přes AirDrop na vybraná zařízení Pixel s Androidem. Funguje to i obráceně. Google totiž potichu zajistil, že jeho Quick Share umí komunikovat s AirDropem. Apple s tím neměl nic společného.

Galaxy Buds 4 Pro nabídnou přepracovaný design i ovládání pohybem hlavy

Samsung chystá novou generaci bezdrátových sluchátek Galaxy Buds 4 Pro. Podle uniklých animací z nadstavby One UI 8.5 dojde nejen na změny vzhledu, ale i na novinky ve funkční výbavě. Mezi nimi vyniká hlavně nová funkce ovládání pomocí pohybů hlavy.

Gemini má nový design a ukládá obrázky i videa

Aplikace Gemini, klíčová AI funkce na telefonech a tabletech Galaxy, se dočkala další vizuální úpravy. Nový vzhled nabízí čistší domovskou obrazovku a přehlednější rozvržení. Kromě toho přibyla nová sekce s názvem My Stuff, kde uživatel najde všechna média vytvořená v rámci chatu s Gemini.

LinkedIn usnadňuje hledání lidí pomocí AI

LinkedIn představil novou funkci vyhledávání, která využívá umělou inteligenci. Uživatelé už nemusejí zadávat jména, názvy pozic nebo firmy. Stačí jednoduše popsat, koho hledají. Můžou napsat třeba „absolventi Northwesternu v zábavním marketingu“ nebo „kdo mi vysvětlí pracovní víza v USA“.

Valve představil bezdrátový headset Steam Frame

Valve oznámil nový VR headset Steam Frame, který má ambici nahradit stárnoucí Index. Headset zvládá nejen VR hry, ale i běžné tituly ze Steamu díky streamování přes Wi-Fi. Funguje zcela bez kabelu a část her dokáže spustit i nativně bez připojení k počítači.

Apple a Issey Miyake uvádějí iPhone Pocket

Apple a japonská módní značka Issey Miyake spojily síly a přinášejí nový doplněk. iPhone Pocket je pružný obal s popruhem, který se dá nosit na těle, na tašce nebo v ruce. Díky své žebrované struktuře se přizpůsobí každému iPhonu i dalším drobnostem.

Google vylepšuje Pixel AI bez ohrožení soukromí

Google představil technologii Private AI Compute, která umožňuje telefonům Pixel využívat výkonné AI modely v cloudu, aniž by uživatel přišel o soukromí. Novinka přichází s listopadovým Feature Dropem a míří nejdřív na Pixel 10 a vybrané starší modely.
Reklama
Reklama
Reklama