AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Apple Glasses dorazí nejdříve v roce 2027

Chytré brýle od Applu se podle nejnovějších informací opozdí. Zatímco dřívější spekulace mluvily o představení už v příštím roce, aktuální zprávy posouvají jejich příchod až na konec roku 2027. Apple přesto projekt považuje za jednu z klíčových součástí své budoucnosti a chce s ním oslovit mnohem širší publikum než jen technologické nadšence.

Google spouští Gemini Spark pro první uživatele

Google začal zpřístupňovat nového AI agenta Gemini Spark předplatitelům tarifu Google AI Ultra v USA. Nástroj funguje nepřetržitě na pozadí, zvládá práci s e-maily, kalendářem i dokumenty a dokáže plnit úkoly bez toho, aby uživatel musel mít zapnutý telefon nebo počítač.

Samsung chystá Galaxy Watch 9 Classic a možná i novou funkci od Googlu

Nové úniky naznačují, že Samsung letos uvede hned tři chytré hodinky. Vedle základních Galaxy Watch 9 se ve hře objevuje také návrat modelu Classic a nová generace Galaxy Watch Ultra. Změny se rýsují i v oblasti funkcí, kde by mohla dorazit novinka známá z hodinek Pixel Watch.

Anker chystá Pokémon kolekci k 30. výročí série

Anker v Japonsku oznámil novou kolekci příslušenství s motivy Pokémonů. Série dorazí začátkem července 2026 a připomene 30 let značky Pokémon. Hlavní roli dostanou Pikachu a Eevee, kteří se objeví na nabíječkách, cestovním příslušenství i bezdrátových sluchátkách.

Starlink Mini funguje i hluboko v horách

Představa internetu bez signálu mobilního operátora ještě nedávno působila jako sci-fi. Starlink Mini ale ukazuje, že připojení může fungovat skoro kdekoliv. Novinář Joe Supan vzal malou satelitní anténu do severní části washingtonských hor North Cascades a několik dní ji zkoušel i doma v Seattlu. Výsledek ho překvapil. Na vrcholu hor bez problémů streamoval NFL v HD kvalitě, volal přes FaceTime a sledoval Game of Thrones ve 4K.

Logitech uvádí ergonomickou řadu Signature Comfort Plus

Logitech rozšiřuje nabídku kancelářského příslušenství o novou řadu Signature Comfort Plus. Hlavní novinkou je myš s měkkou opěrkou dlaně a ergonomická klávesnice s polstrovanou opěrkou zápěstí. Firma cílí hlavně na lidi, kteří tráví dlouhé hodiny u počítače doma i v kanceláři.

Apple chystá AirPods s kamerami a sází na AI

Apple podle zákulisních informací testuje novou generaci AirPods, která dostane malé kamery. Nejde ale o focení ani natáčení videa. Kamery mají sloužit hlavně jako oči pro Siri a pro funkci Visual Intelligence, kterou dnes firma nabízí v iPhonech. Uživatel by se tak mohl jednoduše podívat na objekt před sebou a zeptat se sluchátek, co právě vidí.

Apple chystá nový web pro generativní AI

Apple krátce před konferencí WWDC 2026 připravuje nový web zaměřený na generativní umělou inteligenci. Firma podle záznamů v DNS registraci aktivovala subdoménu genai.apple.com. Stránka zatím není veřejně dostupná, ale objevila se jen pár týdnů před akcí, na které Apple slíbil představit nové AI funkce napříč svými systémy.

Google Health přináší nový widget a nahrazuje Fitbit

Google začal postupně nahrazovat aplikaci Fitbit novou službou Google Health. Aktualizace ve verzi 5.0 přináší nejen nový název a ikonu, ale také výrazně přepracovaný widget pro Android. Firma tím pokračuje v postupném sjednocování svých zdravotních a fitness služeb pod jednu značku.

Wear OS 7 přinese Gemini i nové widgety

Google na konferenci I/O 2026 ukázal první detaily o Wear OS 7. Nová verze systému pro chytré hodinky dorazí později letos a zaměří se hlavně na přehlednější prostředí, lepší výdrž baterie a hlubší propojení s Gemini. Nejvíc změn uvidí majitelé Pixel Watch, ale část novinek dostanou i další hodinky s Wear OS.

Microsoft ukázal nové Surface pro firmy s AI v hlavní roli

Microsoft představil novou generaci pracovních zařízení Surface for Business. Novinky míří hlavně na firmy a kanceláře, které chtějí využívat AI přímo v počítači bez nutnosti spoléhat na cloud. Firma ukázala nové modely Surface Laptop for Business i Surface Pro for Business. Všechny pohání procesory Intel Core Ultra Series 3 a Microsoft slibuje vyšší výkon i dlouhou výdrž baterie.

Sony představilo výroční sluchátka 1000X the Collexion

Sony slaví deset let řady 1000X novým modelem sluchátek s aktivním potlačením hluku. Novinka nese název 1000X the Collexion a navazuje na loňský model WH-1000XM6. Tentokrát ale nejde jen o další generační posun. Sony sází hlavně na výraznější design, pohodlí a luxusnější zpracování.

Apple chystá Siri s automatickým mazáním chatů

Apple podle zákulisních informací připravuje pro iOS 27 velkou proměnu Siri. Nově má fungovat jako samostatná aplikace s chatovacím rozhraním podobným ChatGPT. Firma přitom chce výrazně zdůraznit ochranu soukromí a nabídne i automatické mazání konverzací po určité době.

iPhone 18 přinese novou ochranu polohy před operátory

Apple chystá u celé řady iPhone 18 zásadní změnu. Firma podle zákulisních informací definitivně opustí modemy od Qualcommu a nasadí vlastní čipy C2. Většina debat se zatím točí kolem rychlosti nebo výdrže baterie. Ve skutečnosti ale nová generace přinese i méně nápadnou novinku v oblasti soukromí.

OpenAI přináší Codex do mobilní aplikace ChatGPT

OpenAI rozšiřuje svůj nástroj Codex do mobilní aplikace ChatGPT pro iPhone, iPad a Android. Uživatelé díky tomu mohou na dálku sledovat práci AI asistenta, schvalovat úkoly nebo zadávat nové příkazy, aniž by seděli u počítače. Firma tím dál posouvá své ambice v oblasti autonomního programování.
Reklama
Reklama
Reklama
Reklama