AIGoogle představuje revoluční nástroj AI pro automatické vytváření jedinečných zvukových stop

Google představuje revoluční nástroj AI pro automatické vytváření jedinečných zvukových stop

Společnost Google představila revoluční nástroj pro převod videa na zvuk pro svůj generátor umělé inteligence DeepMind. Zásadně mění způsob vytváření zvukových stop pro videa.

Nový nástroj je známý jako V2A (video to audio). Kombinuje pixely videa s textovými podněty v přirozeném jazyce a vytváří pohlcující zvukové scény, které dokonale ladí s děním na obrazovce. Tato inovace umožňuje synchronizaci audiovizuálních prvků, což zvyšuje celkový zážitek ze sledování.

Podle společnosti Google dokáže nástroj V2A generovat neomezené množství nápadů na zvukovou stopu, což vyhovuje široké škále tvůrčích možností. Spojením tohoto nástroje s modely pro generování videa, jako je Veo, mají nyní tvůrci možnost vytvářet dramatické zvukové stopy, které doplní jakoukoli scénu. Uživatelé mají navíc možnost zadávat podněty a editační ukazatele, které umělou inteligenci vedou při generování požadovaného zvukového výstupu.

Absolutní flexibilita pro tvůrce

Technologie V2A otevírá tvůrcům obsahu svět možností a nabízí úplnou tvůrčí kontrolu nad procesem tvorby zvukové stopy. Uživatelé mohou nechat umělou inteligenci generovat zvukovou stopu na základě vizuálních vstupů a jazykových pokynů. Nebo mohou zvukovou stopu navrhnout sami. Tato flexibilita dává tvůrcům možnost přizpůsobit zvukové prvky svých videí tak, aby účinně odpovídaly tónu a tempu vyprávění.

Společnost Google předvedla působivé příklady nástroje V2A v akci. Včetně zvukové stopy ve westernovém stylu doprovázející kovboje jedoucího na koni a divokého vlka vyjícího na měsíc. Schopnost nástroje vylepšovat různé typy záběrů, jako jsou archivní materiály a němé filmy, dokazuje jeho všestrannost a přizpůsobivost. Generováním zvukových stop, které plynule spolupracují s dialogy postav a tónovými prvky, pomáhá nástroj V2A vytvořit správnou zvukovou atmosféru pro každou scénu.

Společnost Google pokračuje ve zdokonalování své sady poskytovatelů obsahu generovaného umělou inteligencí. Nadále se snaží zvyšovat kvalitu a výkonnost svých technologií. Uvědomuje si, že je důležité řešit problémy, jako jsou artefakty na vstupu videa a zlepšení synchronizace rtů u videí zahrnujících řeč. Neustálým vývojem a aktualizací svých nástrojů umělé inteligence chce Google poskytovat špičková řešení, která splňují vyvíjející se potřeby tvůrců obsahu i diváků.

Reklama

Doporučujeme

Gmail přináší end-to-end šifrování na Android a iPhone

Google spustil end-to-end šifrování pro Gmail na mobilních zařízeních. Uživatelé Androidu a iPhonu mohou nově číst a psát šifrované e-maily přímo v aplikaci. Není potřeba instalovat další nástroje ani řešit složité nastavení. Funkce ale zatím nedorazí ke všem.

Amazon ukončí podporu starších Kindle zařízení

Amazon oznámil, že ukončí podporu starších čteček Kindle a tabletů Fire. Týká se modelů vydaných v roce 2012 a dříve. Změna začne platit 20. května 2026. Uživatelé si už na těchto zařízeních nestáhnou ani nekoupí nové e-knihy.

Firefox chystá velký redesign Nova

Firefox se po letech chystá na zásadní změnu. Projekt s interním názvem Nova má přinést největší úpravu rozhraní za zhruba šest let. Úniky designů ukazují úplně jiný prohlížeč, než na jaký jsou uživatelé zvyklí od éry Proton z roku 2021. Novinka má dorazit v horizontu několika měsíců spolu s dalšími funkcemi.

Picsart otevírá monetizaci pro všechny tvůrce

Picsart spouští nový program Earn with Picsart, který má změnit způsob, jakým si tvůrci vydělávají. Platforma ho otevřela všem svým více než 130 milionům uživatelů bez pozvánek a bez požadavku na počet sledujících. Tvůrci tak mohou začít vydělávat bez ohledu na velikost publika.

Galaxy Z Fold 8 zůstane známý, hlavní změna se odehraje v displeji

Samsung chystá Galaxy Z Fold 8 a první informace naznačují překvapivě konzervativní přístup. Novinka má na první pohled vypadat téměř stejně jako loňský Fold 7. Důvod ale neleží v nedostatku inovací. Klíčová změna se má skrývat uvnitř konstrukce, konkrétně v samotném displeji.

Gemini pro Google Home přináší ovládání světel podle nálady

Google posouvá svůj chytrý domov o krok dál. Gemini pro Home dostává novou várku funkcí, které mají ovládání zjednodušit a zpřesnit. Nejvíc pozornosti budí takzvané expresivní ovládání světel. Stačí popsat náladu a systém nastaví barvy sám.

Samsung nabízí aplikaci proti nevolnosti z pohybu pomocí zvuku

Samsung přichází s neobvyklým řešením kinetózy. Nová aplikace Hearapy slibuje úlevu pomocí jednoduchého zvuku. Stačí si na minutu pustit tón o frekvenci 100 Hz do sluchátek. Podle firmy to může zmírnit nevolnost až na dvě hodiny.

Bluesky představuje Attie, AI nástroj pro tvorbu vlastních feedů

Bluesky rozšiřuje své ambice mimo sociální síť. Nově ukázalo aplikaci Attie, která využívá umělou inteligenci k tvorbě vlastních obsahových feedů. Nejde o další funkci uvnitř aplikace, ale o samostatný produkt postavený na stejném základu.

Android 17 Beta 3 vrací rychlé zapnutí WiFi jedním klepnutím

Google v Androidu 17 Beta 3 vrací funkci, kterou uživatelé dlouho postrádali. WiFi lze znovu zapnout nebo vypnout jediným klepnutím v rychlém nastavení. Jde o návrat ke staršímu a jednoduššímu chování, které zmizelo s příchodem Androidu 12.

Apple tvrdí, že iPhone v režimu Lockdown Mode nikdo neprolomil

Apple po téměř čtyřech letech od spuštění bezpečnostního režimu Lockdown Mode hlásí výrazný výsledek. Podle firmy neexistuje jediný potvrzený případ, kdy by byl iPhone s tímto režimem úspěšně napaden špionážním softwarem. Jde o nejtvrdší ochranu, jakou Apple běžným uživatelům nabízí.

Google rozšiřuje živé překlady do sluchátek na iOS a do dalších zemí

Google posouvá překlady o krok dál. Funkce Live Translate nově dorazila na iOS a výrazně rozšiřuje dostupnost po světě. Uživatelé tak mohou poslouchat překlady v reálném čase přímo ve sluchátkách. Stačí aplikace Google Translate a připojená sluchátka.
Reklama
Reklama
Reklama
Reklama