AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Motorola Razr Fold míří mezi špičku skládacích telefonů

Motorola konečně odhalila svůj první „book-style“ skládací telefon Razr Fold. Novinka cílí přímo na nejvyšší třídu a chce konkurovat zavedeným modelům od Samsungu a Googlu. Už první informace ale naznačují, že nepůjde o dostupnější variantu, na kterou část trhu čeká.

Honor posouvá hranice střední třídy

Honor 600 míří vysoko. Po týdnu používání budí otázku, proč lidé stále sahají po drahých vlajkách. Telefon přináší prvky, které byly ještě nedávno vyhrazené top modelům. Výsledkem je zařízení, které působí mnohem prémiověji, než by kdo čekal.

Google Meet zvládne AI poznámky i z osobních schůzek

Google rozšiřuje své AI funkce ve Workspace. Nově dokáže nástroj pro poznámky v Google Meet zachytit i osobní schůzky. Funkce přepisuje a shrnuje rozhovory v reálném čase. Stačí k tomu mobil a spuštěný Gemini notetaker.

Sony Xperia 1 VIII míří k výraznému redesignu

Nové úniky naznačují, že Sony chystá u modelu Xperia 1 VIII zásadní změnu vzhledu. První render se objevil už začátkem dubna a mnozí ho považovali za aprílový vtip. Postupně se ale přidaly další obrázky. Ty původní tvrzení posilují.

Microsoft Teams upraví panel schůzky a omezí nechtěné zvedání ruky

Microsoft chystá změnu, která potěší každého, kdo někdy omylem „zvedl ruku“ během online schůzky. Problém, na který si uživatelé dlouhodobě stěžují, má konečně řešení. Firma upraví rozhraní tak, aby se podobné přešlapy stávaly méně často.

Gemini pro Google Home dostává funkci pokračující konverzace

Google rozšiřuje schopnosti svého hlasového asistenta Gemini pro chytrou domácnost. Nově přichází funkce pokračující konverzace, která umožní mluvit s asistentem přirozeněji a bez neustálého opakování aktivační fráze. Funkce startuje v režimu předběžného přístupu.

Framework Laptop 16 dostává praktičtější design a lepší výbavu

Framework upravuje svůj modulární Laptop 16 tak, aby působil méně jako experiment a víc jako hotový produkt. Novinky nejsou revoluční, ale míří přesně na slabiny, které uživatelé dlouhodobě zmiňovali. Výrobce přidává dostupnější procesor, přepracovává klíčové části konstrukce a chystá výrazné rozšíření konektivity.

Tim Cook proměnil Apple v symbol statusu

Tim Cook převzal Apple v roce 2011 ve stínu Steva Jobse. Firma už tehdy nabízela ikonické produkty. Cook ale změnil směr. Zaměřil se na iPhone jako střed celého ekosystému a postupně z něj udělal víc než jen telefon.

Sony chystá globální ověřování věku na PlayStationu

PlayStation se chystá na velkou změnu. Hráči budou muset ověřit svůj věk, pokud chtějí dál používat komunikační funkce. Týká se to hlavně zpráv a hlasového chatu. Bez ověření zůstanou dostupné hry, trofeje i obchod.

Google Wallet přidává živé sledování letů na zamykací obrazovce

Google Wallet dostává novou funkci, která cílí na cestující. Aplikace nově ukazuje živé informace o letu přímo na telefonu. Uživatel tak vidí stav letu bez nutnosti otevírat aplikaci. Funkce se objevuje na zařízeních s Androidem 16 a novějšími verzemi.

iPhone 18 Pro přinese první velký skok ve fotoaparátech a nové barvy

Apple chystá zásadní změny ve fotoaparátech iPhonů. Podle úniků má jít o čtyřkrokový plán, který začne už letos s modelem iPhone 18 Pro. Firma má testovat několik novinek, kupříkladu nové barvy, které postupně nasadí v dalších generacích.

Pixel 11 přinese světelnou funkci Pixel Glow

Pixel 11 se blíží a podle úniků nepřinese zásadní změny designu ani výkonu. Největší novinkou má být funkce Pixel Glow. Ta využije světla na zadní straně telefonu pro notifikace. Google tak reaguje na trend digitálního minimalismu, ale zůstává u klasického smartphonu.
Reklama
Reklama
Reklama
Reklama