4 C
Czech
Středa 1. dubna 2026
AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Android 17 Beta 3 vrací rychlé zapnutí WiFi jedním klepnutím

Google v Androidu 17 Beta 3 vrací funkci, kterou uživatelé dlouho postrádali. WiFi lze znovu zapnout nebo vypnout jediným klepnutím v rychlém nastavení. Jde o návrat ke staršímu a jednoduššímu chování, které zmizelo s příchodem Androidu 12.

Apple tvrdí, že iPhone v režimu Lockdown Mode nikdo neprolomil

Apple po téměř čtyřech letech od spuštění bezpečnostního režimu Lockdown Mode hlásí výrazný výsledek. Podle firmy neexistuje jediný potvrzený případ, kdy by byl iPhone s tímto režimem úspěšně napaden špionážním softwarem. Jde o nejtvrdší ochranu, jakou Apple běžným uživatelům nabízí.

Google rozšiřuje živé překlady do sluchátek na iOS a do dalších zemí

Google posouvá překlady o krok dál. Funkce Live Translate nově dorazila na iOS a výrazně rozšiřuje dostupnost po světě. Uživatelé tak mohou poslouchat překlady v reálném čase přímo ve sluchátkách. Stačí aplikace Google Translate a připojená sluchátka.

Reddit posílí boj s boty pomocí ověřování uživatelů

Reddit zpřísňuje boj proti botům. Nově chce lépe rozlišit mezi skutečnými uživateli a automatizovanými účty. Některé profily proto mohou narazit na výzvu, aby potvrdily, že za nimi stojí člověk. Podle šéfa firmy Steve Huffmana ale půjde o výjimečné případy.

AccuWeather přichází přímo do ChatGPT

AccuWeather spustil novou aplikaci pro ChatGPT. Uživatelé tak získají přístup k aktuálnímu počasí bez nutnosti opustit chat. Funkce přináší živá data, předpovědi i radar přímo do konverzace.

iPhone Fold má dorazit v roce 2026

Apple se chystá vstoupit do světa skládacích telefonů. iPhone Fold má nabídnout špičkový displej, nový design i vysoký výkon. První informace naznačují velké ambice a výraznou změnu celé produktové řady.

Apple zvažoval koupi Halide a chystá vylepšení fotoaparátu iPhonu 18 Pro

Apple se snaží posunout mobilní fotografii blíž profesionální úrovni. Pomoci mu k tomu měla i možná akvizice Lux Optics, studia stojícího za populární aplikací Halide. K obchodu nakonec nedošlo, ale plán zlepšit nativní fotoaplikaci zůstává.

Samsung Galaxy telefony brzy získají podporu AirDropu

Samsung potvrdil, že jeho telefony Galaxy dostanou podporu pro AirDrop. Funkce dorazí nejdřív na novou řadu Galaxy S26. Postupně se pak rozšíří i na další modely. Jde o další krok ke snadnějšímu sdílení souborů mezi Androidem a iPhonem.

Nintendo chystá Switch 2 s vyměnitelnou baterií pro Evropu

Nintendo připravuje novou verzi konzole Switch 2, která nabídne uživatelsky vyměnitelnou baterii. Informaci přinesl japonský deník Nikkei a potvrzují ji i další zprávy. Změna se má týkat nejen samotné konzole, ale i přepracovaných ovladačů Joy Con 2.

Perplexity Health přináší propojení s Apple Health i dalšími službami

Perplexity rozšiřuje své AI nástroje o novinku zaměřenou na zdraví. Funkce Perplexity Health dokáže pracovat s osobními zdravotními daty a nově se propojí i s Apple Health. Uživatel tak může do systému nahrát široké spektrum informací a sledovat je na jednom místě.

WhatsApp přichází na vybrané hodinky Garmin

Garmin a Meta spojily síly a přinášejí WhatsApp na chytré hodinky Garmin. Nová aplikace je dostupná zdarma v obchodě Connect IQ a rozšiřuje dosavadní notifikace o plnohodnotnou komunikaci. Uživatelé tak mohou zůstat v kontaktu přímo ze zápěstí bez nutnosti sahat po telefonu.

AirPods Max 2 přinášejí po letech jen dílčí změny

Apple po dlouhém čekání představil nová sluchátka AirPods Max 2. Stalo se to nenápadně, mimo hlavní produktovou show. Firma nabídla vylepšený model, který navazuje na verzi z roku 2020. Na první pohled ale působí téměř stejně.

Studie varují že chatboti mohou posilovat lidské bludy

Nové studie upozorňují na méně viditelné riziko umělé inteligence. Chatboti podle výzkumníků někdy nejen chybují, ale mohou také posilovat mylné představy uživatelů. V určitých případech se pak mezi člověkem a AI vytváří jakýsi společný bludný příběh o realitě.

Meta končí s end to end šifrováním v Instagram DMs

Meta ruší možnost end to end šifrování v soukromých zprávách na Instagramu. Funkce skončí 8. května 2026. Firma tvrdí, že ji používalo jen minimum lidí. Uživatelé, kteří chtějí šifrované zprávy, mají podle společnosti přejít na WhatsApp.

Tinder chce omezit únavu ze swipování pomocí AI

Tinder mění způsob, jak lidé na aplikaci hledají partnera. Místo nekonečného swipování chce nabídnout méně, ale přesnější doporučení. Pomoci má nová generace funkcí postavených na umělé inteligenci.
Reklama
Reklama
Reklama
Reklama