3.8 C
Czech
Pátek 13. února 2026
AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

YouTube spouští nativní aplikaci pro Apple Vision Pro

YouTube po dvou letech váhání vydává samostatnou aplikaci pro Apple Vision Pro. Platforma tak dohání jedno z největších prázdných míst, které headset od Applu od startu provázelo. Dosud museli uživatelé spoléhat na Safari. Teď přichází plnohodnotné řešení přímo pro visionOS.

Fitbit Coach s AI od Gemini míří na iOS a do dalších zemí

Google rozšiřuje svého chytrého zdravotního asistenta z Fitbitu mimo USA a Android. Nově si ho vyzkouší i uživatelé iPhonů a lidé v pěti státech. Firma tím posiluje roli umělé inteligence ve svých zdravotních službách.

Google chystá první beta verzi Android 17

Google uzavřel testování Android 16 QPR3 a chystá další velký krok. Program beta se brzy přepne na Android 17. Přesné datum zatím nepadlo, ale nástup nové verze se blíží. Uživatelé Pixelů v beta programu přejdou automaticky.

Apple pustí ChatGPT, Claude a Gemini do CarPlay

Apple chystá výraznou změnu pro CarPlay. Do palubního systému aut mají zamířit populární AI chatboti třetích stran. Řidiči tak poprvé získají přímý přístup ke službám jako ChatGPT, Claude nebo Gemini přímo z displeje vozu. Novinka má dorazit v následujících měsících.

Trump Mobile T1 se nebude vyrábět v USA

Projekt vlastního telefonu od Trump Mobile znovu mění směr. Manažeři firmy tvrdí, že model T1 dorazí brzy, možná už na konci března. Zároveň ale padl původní slib o americké výrobě. Telefon projde jen finální montáží na Floridě.

Nový AirTag má hlasitější reproduktor, ale stále jde snadno umlčet

Apple uvedl druhou generaci AirTagu a tradiční rozborka od iFixit na sebe nenechala dlouho čekat. Novinka přináší hlasitější reproduktor, vylepšené vyhledávání na větší vzdálenost a modernější čip pro přesné určování polohy. Základní konstrukce ale zůstává velmi podobná původní verzi. A to má své důsledky.

Steam Machine od Valve má zpoždění kvůli velké paměti

Nová herní krabička od Valve měla dorazit na začátku roku 2026. Teď je všechno jinak. Firma oznámila odklad na pozdější část roku. Důvodem je nedostatek operační paměti a prudký růst jejích cen. Situace na trhu je podle firmy příliš nestabilní na to, aby potvrdila přesný termín i výslednou cenu.

Google oficiálně odhalil Pixel 10a před únorovým startem

Google přestal bojovat s úniky a rovnou ukázal Pixel 10a. Nový model potvrdil krátkým videem i stránkou v Google Store. Telefon dorazí už 18. února, kdy odstartují předobjednávky. Firma láká na novinky, které zatím drží pod pokličkou.

Google Home nově podporuje chytrá tlačítka v automatizacích

Google Home dohání velký dluh. Nová verze aplikace přidává podporu chytrých tlačítek v automatizacích. Uživatelé tak konečně mohou fyzickým stiskem ovládat další zařízení v domácnosti, nejen hlasem nebo přes mobil.

Sony WF-1000XM6 se ukazují na uniklých snímcích

Chystaná sluchátka Sony WF-1000XM6 se předčasně objevila v internetovém obchodě a únik odhalil jejich podobu i několik prvních detailů. Snímky rychle zmizely, ale internet je stihl zachytit. Nová generace tak na sebe upozorňuje ještě před oficiálním představením.

Google chystá aplikaci Desktop Camera pro Android počítače

Google potichu zveřejnil novou aplikaci s názvem Desktop Camera. Objevila se na Google Play bez větší pozornosti. Vypadá jako první náznak toho, jak bude focení fungovat na připravovaných Android počítačích. Aplikace působí jednoduše a teprve na začátku vývoje.

Samsung Galaxy Z TriFold se vyprodal během minut

Samsung spustil prodej svého nového trojitě skládacího telefonu a zásoby zmizely téměř okamžitě. Zájem překvapil i zkušené technologické novináře. Mnozí čekali, že extrémní cenovka zájem rychle ochladí. Opak se stal realitou už během prvních minut.

Android posiluje ochranu proti krádežím telefonů

Google rozšiřuje sadu funkcí, které mají zlodějům zkomplikovat život. Novinky navazují na nástroje představené už v minulých letech a míří hlavně na ochranu dat i samotného zařízení. Cílem je, aby se ztracený nebo ukradený mobil stal pro pachatele co nejméně užitečný.
Reklama
Reklama
Reklama
Reklama