AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Waze začíná zobrazovat semafory v mapě

Navigace Waze po letech přidává funkci, kterou uživatelé žádali velmi dlouho. Do mapy postupně přibývají ikony semaforů, které mají usnadnit orientaci na trase. Novinka se zatím neobjevila všem a její dostupnost se liší podle lokality i konkrétní verze aplikace.

Fitbit Air sází na jednoduchost a nepřetržité sledování zdraví

Google rozšířil nabídku nositelné elektroniky o Fitbit Air, nenápadný fitness náramek bez displeje. Novinka míří na uživatele, kteří chtějí sledovat zdraví a pohyb bez neustálých notifikací, aplikací a dalších funkcí typických pro chytré hodinky.

Logitech uvedl skládací myš Mobi Fold

Logitech rozšiřuje nabídku příslušenství pro práci na cestách. Nová myš Mobi Fold sází na skládací konstrukci, která kombinuje kompaktní rozměry s plnohodnotným ovládáním. Vývojáři při návrhu řešili hlavně otázku, jak vytvořit pohodlnou myš, kterou budou lidé skutečně nosit každý den.

Skládací iPhone dorazí už letos a možná ponese jméno iPhone Ultra

Apple se podle sílících úniků chystá vstoupit na trh skládacích telefonů. První model by mohl dorazit už letos na podzim a vedle nového formátu nabídnout i několik netradičních řešení. Mluví se o téměř neviditelném ohybu displeje, návratu Touch ID i zcela novém označení Ultra.

Google Photos na Androidu nově ukládá vlastní samolepky do samostatné složky

Google rozšiřuje možnosti upravit vlastní samolepky v aplikaci Google Photos pro Android. Nově je automaticky ukládá do samostatné složky, takže uživatelé najdou všechny své výtvory na jednom místě a mohou se k nim kdykoliv vrátit.

Galaxy Z Flip 8 znovu nabídne Snapdragon i Exynos

Samsung podle nových informací změní strategii u připravovaného skládacího telefonu Galaxy Z Flip 8. Po loňském přechodu na vlastní čipy Exynos se firma údajně vrátí také ke Snapdragonu od Qualcommu. O konkrétní verzi procesoru má rozhodovat region, ve kterém se telefon bude prodávat.

iPhone 18 Pro má podle úniku nabídnout jen mírně větší baterii

Nový únik naznačuje, že letošní iPhone 18 Pro přinese jen velmi malé navýšení kapacity baterie. Oproti loňské generaci mají rozdíly činit jen desítky miliampérhodin. Výdrž ale nemusí záviset pouze na velikosti akumulátoru. Pomoci mají také úspornější čipy a nová generace modemu.

Google platí vývojářům za kód z Play Storu pro trénink AI

Google spustil tichý pilotní program, ve kterém oslovuje vybrané vývojáře aplikací pro Android a nabízí jim peníze za přístup ke zdrojovým kódům. Firma chce získat nejen kód aktivních aplikací, ale i starších projektů a prototypů. Cílem je zlepšit vlastní vývojářské nástroje a produkty, včetně systémů postavených na umělé inteligenci.

iOS 28 má být výrazně větší aktualizací než iOS 27

Apple sice teprve za několik dní představí iOS 27, už nyní ale podle zákulisních informací pracuje na další generaci systému pro iPhony. První zprávy naznačují, že iOS 28 přinese podstatně větší změny než letošní verze. Důležitou roli má sehrát i fakt, že systém zamíří do jubilejního iPhonu k 20. výročí této produktové řady.

Apple Glasses dorazí nejdříve v roce 2027

Chytré brýle od Applu se podle nejnovějších informací opozdí. Zatímco dřívější spekulace mluvily o představení už v příštím roce, aktuální zprávy posouvají jejich příchod až na konec roku 2027. Apple přesto projekt považuje za jednu z klíčových součástí své budoucnosti a chce s ním oslovit mnohem širší publikum než jen technologické nadšence.

Google spouští Gemini Spark pro první uživatele

Google začal zpřístupňovat nového AI agenta Gemini Spark předplatitelům tarifu Google AI Ultra v USA. Nástroj funguje nepřetržitě na pozadí, zvládá práci s e-maily, kalendářem i dokumenty a dokáže plnit úkoly bez toho, aby uživatel musel mít zapnutý telefon nebo počítač.

Samsung chystá Galaxy Watch 9 Classic a možná i novou funkci od Googlu

Nové úniky naznačují, že Samsung letos uvede hned tři chytré hodinky. Vedle základních Galaxy Watch 9 se ve hře objevuje také návrat modelu Classic a nová generace Galaxy Watch Ultra. Změny se rýsují i v oblasti funkcí, kde by mohla dorazit novinka známá z hodinek Pixel Watch.

Anker chystá Pokémon kolekci k 30. výročí série

Anker v Japonsku oznámil novou kolekci příslušenství s motivy Pokémonů. Série dorazí začátkem července 2026 a připomene 30 let značky Pokémon. Hlavní roli dostanou Pikachu a Eevee, kteří se objeví na nabíječkách, cestovním příslušenství i bezdrátových sluchátkách.

Starlink Mini funguje i hluboko v horách

Představa internetu bez signálu mobilního operátora ještě nedávno působila jako sci-fi. Starlink Mini ale ukazuje, že připojení může fungovat skoro kdekoliv. Novinář Joe Supan vzal malou satelitní anténu do severní části washingtonských hor North Cascades a několik dní ji zkoušel i doma v Seattlu. Výsledek ho překvapil. Na vrcholu hor bez problémů streamoval NFL v HD kvalitě, volal přes FaceTime a sledoval Game of Thrones ve 4K.

Logitech uvádí ergonomickou řadu Signature Comfort Plus

Logitech rozšiřuje nabídku kancelářského příslušenství o novou řadu Signature Comfort Plus. Hlavní novinkou je myš s měkkou opěrkou dlaně a ergonomická klávesnice s polstrovanou opěrkou zápěstí. Firma cílí hlavně na lidi, kteří tráví dlouhé hodiny u počítače doma i v kanceláři.
Reklama
Reklama
Reklama
Reklama