4.8 C
Czech
Úterý 24. března 2026
AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Apple zvažoval koupi Halide a chystá vylepšení fotoaparátu iPhonu 18 Pro

Apple se snaží posunout mobilní fotografii blíž profesionální úrovni. Pomoci mu k tomu měla i možná akvizice Lux Optics, studia stojícího za populární aplikací Halide. K obchodu nakonec nedošlo, ale plán zlepšit nativní fotoaplikaci zůstává.

Samsung Galaxy telefony brzy získají podporu AirDropu

Samsung potvrdil, že jeho telefony Galaxy dostanou podporu pro AirDrop. Funkce dorazí nejdřív na novou řadu Galaxy S26. Postupně se pak rozšíří i na další modely. Jde o další krok ke snadnějšímu sdílení souborů mezi Androidem a iPhonem.

Nintendo chystá Switch 2 s vyměnitelnou baterií pro Evropu

Nintendo připravuje novou verzi konzole Switch 2, která nabídne uživatelsky vyměnitelnou baterii. Informaci přinesl japonský deník Nikkei a potvrzují ji i další zprávy. Změna se má týkat nejen samotné konzole, ale i přepracovaných ovladačů Joy Con 2.

Perplexity Health přináší propojení s Apple Health i dalšími službami

Perplexity rozšiřuje své AI nástroje o novinku zaměřenou na zdraví. Funkce Perplexity Health dokáže pracovat s osobními zdravotními daty a nově se propojí i s Apple Health. Uživatel tak může do systému nahrát široké spektrum informací a sledovat je na jednom místě.

WhatsApp přichází na vybrané hodinky Garmin

Garmin a Meta spojily síly a přinášejí WhatsApp na chytré hodinky Garmin. Nová aplikace je dostupná zdarma v obchodě Connect IQ a rozšiřuje dosavadní notifikace o plnohodnotnou komunikaci. Uživatelé tak mohou zůstat v kontaktu přímo ze zápěstí bez nutnosti sahat po telefonu.

AirPods Max 2 přinášejí po letech jen dílčí změny

Apple po dlouhém čekání představil nová sluchátka AirPods Max 2. Stalo se to nenápadně, mimo hlavní produktovou show. Firma nabídla vylepšený model, který navazuje na verzi z roku 2020. Na první pohled ale působí téměř stejně.

Studie varují že chatboti mohou posilovat lidské bludy

Nové studie upozorňují na méně viditelné riziko umělé inteligence. Chatboti podle výzkumníků někdy nejen chybují, ale mohou také posilovat mylné představy uživatelů. V určitých případech se pak mezi člověkem a AI vytváří jakýsi společný bludný příběh o realitě.

Meta končí s end to end šifrováním v Instagram DMs

Meta ruší možnost end to end šifrování v soukromých zprávách na Instagramu. Funkce skončí 8. května 2026. Firma tvrdí, že ji používalo jen minimum lidí. Uživatelé, kteří chtějí šifrované zprávy, mají podle společnosti přejít na WhatsApp.

Tinder chce omezit únavu ze swipování pomocí AI

Tinder mění způsob, jak lidé na aplikaci hledají partnera. Místo nekonečného swipování chce nabídnout méně, ale přesnější doporučení. Pomoci má nová generace funkcí postavených na umělé inteligenci.

Xbox režim dorazí na všechny počítače s Windows 11

Microsoft rozšiřuje takzvaný Xbox režim na všechny počítače s Windows 11. Nové prostředí nabídne celoobrazovkové rozhraní optimalizované pro ovládání gamepadem. Firma slibuje jednodušší spuštění her, rychlejší přepínání aplikací i úsporu systémových prostředků.

Google zrychluje Android díky optimalizaci jádra systému

Google potichu pracuje na změně, která může zrychlit miliony telefonů s Androidem. Nejde o novou funkci ani viditelnou aktualizaci. Úprava se odehrává hluboko v systému. Mění se samotné jádro Androidu, tedy část, která řídí komunikaci mezi aplikacemi, procesorem a hardwarem.

Rokid AI Glasses Style se staví proti chytrým brýlím Meta Ray-Ban

Trh s chytrými brýlemi rychle roste a Meta už není jediným velkým hráčem. Nové brýle Rokid AI Glasses Style nabízejí podobné funkce jako Ray-Ban Meta, ale přidávají několik vlastních nápadů. Zaujmou dlouhou výdrží baterie, širšími AI funkcemi i podporou více hlasových asistentů včetně Google Gemini.

Galaxy S26 přináší nový bezpečnostní restart a displej s ochranou soukromí

Samsung přidává do telefonů Galaxy novou bezpečnostní funkci, která automaticky restartuje zařízení po delší nečinnosti. Zároveň debutuje technologie Privacy Display, která omezuje pohled na displej z boku. Novinka ale přináší i jeden nečekaný kompromis.

Únik naznačuje změny designu Google Pixel 11 Pro XL

Na internetu se objevily první náznaky toho, jak by mohl vypadat chystaný Google Pixel 11 Pro XL. Informace zatím vycházejí pouze z renderů ochranného pouzdra, které zveřejnil výrobce příslušenství. Podobné úniky se obvykle objevují měsíce před oficiálním představením telefonu a někdy vycházejí z reálných rozměrů zařízení.

ChatGPT odkládá spuštění režimu pro dospělé

OpenAI znovu posouvá spuštění takzvaného „adult mode“ pro ChatGPT. Funkce měla původně dorazit už koncem loňského roku a později během prvního čtvrtletí 2026. Teď ale firma přiznala další odklad. Prioritu mají jiné změny služby.
Reklama
Reklama
Reklama
Reklama