6.5 C
Czech
Pátek 27. února 2026
AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Meta nasazuje rozpoznávání obličejů a žaluje podvodníky s deepfaky

Meta přitvrzuje v boji proti investičním podvodům s falešnými celebritami. Zavádí rozpoznávání obličejů, chrání stovky tisíc známých tváří a nově podává žaloby napříč kontinenty. Reaguje tak na vlnu takzvaných celeb bait kampaní, které zneužívají deepfaky a lákají lidi o peníze i osobní data.

Bumble přidává AI nástroje pro úpravu profilů a výběr fotek

Seznamování přes aplikace se dál mění. Bumble oznámil nové funkce postavené na umělé inteligenci, které mají uživatelům pomoci vyladit profil a posunout konverzace k osobnímu setkání. Slibuje konkrétní doporučení k bio, promptům i fotografiím. V Kanadě navíc testuje nástroj, který má usnadnit domluvu rande.

Sleva 15 tisíc. Samsung Galaxy S21 koupíte díky nové službě za bezkonkurenční cenu

Nejvýhodnější přechod ze starého telefonu, chytrých hodinek, tabletu nebo notebooku na nový je tady. Mobil Pohotovost spouští novou službu Koupíš, prodáš. V rámci té nabízí nejlákavější upgrade na nový smartphone, a to díky nejlepší výkupní ceně stávajícího zařízení, která je v rámci služby výrazně vyšší. Kromě telefonu je možné prodat také tablety, notebooky či chytré hodinky.

YouTube Premium Lite přidává přehrávání na pozadí a offline stahování

YouTube rozšiřuje výbavu tarifu Premium Lite. Levnější varianta předplatného nově nabídne přehrávání na pozadí a možnost stahovat videa pro offline sledování. Funkce začnou přicházet už dnes a během několika týdnů se objeví ve všech podporovaných zemích.

iOS 26.4 beta 2 rozšiřuje testování šifrovaných RCS zpráv

Apple vydal druhou betu iOS 26.4. Přichází jen týden po první verzi a dál ladí desítky změn, které systém přináší. Největší novinka se týká RCS zpráv a jejich šifrování. Aktualizace ale upravuje i vzhled aplikací a přidává nové volby v Nastavení.

Google Labs spouští ProducerAI pro tvorbu hudby pomocí AI

Google vstupuje naplno do světa generativní hudby. V rámci Google Labs spustil nový nástroj ProducerAI, který má pomoci hudebníkům a tvůrcům skládat originální skladby s podporou umělé inteligence. Firma tak míří přímo proti startupům jako Suno nebo Udio. Ty v posledním roce ovládly pozornost kolem AI hudby.

iPhone 18 Pro má dostat tmavě červenou, skládací model zůstane u klasiky

Apple testuje novou barvu pro iPhone 18 Pro a 18 Pro Max. Podle informací Marka Gurmana zvažuje odstín „deep red“, tedy temně červenou s nádechem do vínové. Pokud se plán potvrdí, půjde o první červený model v řadě Pro. Skládací iPhone má naopak vsadit na střídmost.

Elektronická čtečka knih: Podle čeho vybrat tu nejlepší?

Moderní doba se podepsala i na společenství vášnivých čtenářů. Internetové obchody nahrazují kamenná knihkupectví a papírové knihy se dají pořídit i v ekologičtější formě e-booku. Právě elektronické čtečky knih představují revoluční zařízení, které šetří nejen prostor, ale také přírodu. Jak vybrat tu nejlepší?

Google přidává AI Mode do adresního řádku Chromu

Google posouvá umělou inteligenci přímo do srdce svého prohlížeče. AI Mode nově běží v adresním řádku Chromu a umožňuje psát dotazy, klást doplňující otázky a pracovat s obsahem bez přerušení stránky. Funkce startuje v USA v angličtině, další trhy mají následovat. Spolu s tím přichází Gemini v Chrome, lepší ochrana proti podvodům i automatické změny hesel.

V Česku se začaly prodávat elektrokoloběžky Kaabo. Nabízí rychlost až 100 km/h

V Česku ode dneška koupíte nejlepší elektrokoloběžky na světě. Mobil Pohotovost totiž exkluzivně spouští předobjednávky na elektrické koloběžky Kaabo s extrémní maximální rychlostí, dojezdem i nosností. Navíc v rámci předobjednávek je pořídíte se slevou až 10 000 Kč.

Digitální pohoda v Androidu přešlapuje, Focus Mode ale pomáhá

Google představil Digital Wellbeing už v roce 2018. Mělo jít o odpověď na rostoucí obavy ze závislosti na telefonech a sociálních sítích. Dnes, o osm let později, nástroje zůstávají téměř stejné. Svět kolem nich se ale změnil k nepoznání.

Telefon byste měli vyměnit zhruba po sedmi letech

Jak dlouho si nechat mobil, než dává smysl koupit nový? Odpověď není jen o chuti na čerstvý model. Odborníci upozorňují na jasný milník, kdy už starý telefon přestává být bezpečný. A zároveň se ukazuje, že většina lidí mění zařízení dřív, než je to nutné.
Reklama
Reklama
Reklama
Reklama