-8.1 C
Czech
Pátek 9. ledna 2026
AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Lego představilo Smart Bricks a rozvířilo debatu o budoucnosti hraní

Lego na veletrhu CES 2026 v Las Vegas představilo Smart Bricks, nové chytré kostky plné senzorů, světel a zvuků. Podle firmy jde o největší inovaci za posledních téměř 50 let. Nový systém má oživit klasické stavebnice a reagovat na pohyb, dotyk i vzájemnou interakci jednotlivých dílků.

Asus slibuje první Wi-Fi 8 router ještě letos, i když Wi-Fi 7 jsme sotva začali používat

Ještě ani zdaleka nejsme ve fázi, kdy by se Wi-Fi 7 stalo běžným standardem v domácnostech, a už se mluví o další generaci. Na veletrhu CES 2026 se Wi-Fi 8 stalo jedním z velkých témat. Asus, Broadcom i MediaTek zde ukázali zařízení a čipy připravené na budoucí standard 802.11bn, přestože jeho finální podoba má dorazit až za několik let.

Google Keep má za sebou silný rok a hledá další směr

Rok 2025 byl pro Google Keep nezvykle rušný. Aplikace, která dlouhé roky působila spíš jako nenápadná poznámková služba bez větších ambicí, se dočkala řady změn. Některé byly čistě praktické, jiné designové. Celek ale ukazuje, že Google Keep znovu řeší svou roli v ekosystému Workspace a ve světě, kde do všeho vstupuje umělá inteligence.

Sluchátka určená ke spánku si našla místo i během dne

Původně měla řešit chrápání a neklidné noci. Nakonec se z nich stala každodenní výbava. Drobné špunty Soundcore Sleep A30, navržené hlavně na spaní, si jejich autorka oblíbila i při chůzi, cvičení a práci. Ne proto, že by hrály nejlépe. Ale proto, že se přizpůsobily jejímu životu bez námahy.

Clicks přiváží na CES 2026 nový hardware s fyzickou klávesnicí

Clicks zahajuje letošní veletrh CES ve velkém stylu. Představuje hned dva nové produkty, které staví na fyzické QWERTY klávesnici a návratu k soustředěné komunikaci. Jde o univerzální externí klávesnici Clicks Power Keyboard a o vůbec první smartphone značky s názvem Clicks Communicator. Oba míří na uživatele, kteří chtějí psát rychle, přesně a bez rozptylování.

AirPods Pro 3 přinášejí největší změny za roky a další už jsou na cestě

AirPods Pro 3 dorazily na podzim 2025 a Apple jimi výrazně posunul svou prémiovou řadu bezdrátových sluchátek. Nová generace sází na lepší potlačení hluku, vyšší kvalitu zvuku a funkce, které míří dál než jen k poslechu hudby. Do popředí se dostává zdraví, pohyb a umělá inteligence. Výsledkem jsou sluchátka, která mají ambice stát se každodenním společníkem.

Únik z One UI 8.5 potvrzuje design a nové funkce Galaxy S26

Samsung si zřejmě nechtěně poodhalil vlastní plány. V kódu One UI 8.5 se objevily 2D rendery, které odpovídají chystané řadě Galaxy S26. Konkrétně modelům Galaxy S26, S26 Plus a S26 Ultra. Obrázky potvrzují dřívější úniky a dávají poměrně jasnou představu o tom, jak budou nové vlajkové lodě vypadat.

True Ventures věří, že iPhone čeká konec do deseti let

Smartphone je dnes skoro prodloužením lidské ruky. Podle Jon Callaghan ale tahle éra míří ke konci. Spoluzakladatel fondu True Ventures tvrdí, že iPhony přestaneme používat do deseti let. Možná už za pět. Nejde o provokaci, ale o investiční tezi, na kterou fond sází reálné peníze.

LG představilo Gallery TV jako konkurenci Samsungu The Frame

LG se před veletrhem CES 2026 hlásí o slovo v kategorii designových televizí. Nová Gallery TV míří přímo proti Samsungu The Frame a dalším obrazovým televizím, které mají v interiéru působit spíš jako umělecký objekt než klasická obrazovka. LG vsadilo na podobný koncept, ale s několika rozdíly, které stojí za pozornost.

Xbox jako značka nekončí, jen mění podobu

Xbox je mrtvý. Tahle věta se v herním průmyslu opakuje už skoro dvacet let. Vždy, když Microsoft klopýtne, vrací se jako mantra. Jednou kvůli Red Ring of Death, jindy kvůli nepovedenému startu Xbox One. V roce 2025 už ale zní spíš jako prázdný slogan než seriózní tvrzení.

Samsung ukázal reproduktory Music Studio 5 a 7

Samsung představuje dva nové bezdrátové reproduktory Music Studio 5 a Music Studio 7. Navazují na dřívější model Music Frame, který kombinoval zvuk s dekorem. Oba nové kousky cílí na zákazníky, kteří chtějí kvalitní zvuk a čistý design v jednom balení. Oficiální premiéra proběhne na veletrhu CES 2026 začátkem ledna.

Google umožní změnit adresu @gmail.com

Google zavádí dlouho očekávanou funkci. Uživatelé si nově mohou změnit svou adresu končící na @gmail.com. Až dosud to šlo jen u účtů s externí adresou, typicky třeba @seznam.cz. Teď už půjde přepsat i klasický Gmail.
Reklama
Reklama
Reklama
Reklama