5.5 C
Czech
Pondělí 16. března 2026
AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Xbox režim dorazí na všechny počítače s Windows 11

Microsoft rozšiřuje takzvaný Xbox režim na všechny počítače s Windows 11. Nové prostředí nabídne celoobrazovkové rozhraní optimalizované pro ovládání gamepadem. Firma slibuje jednodušší spuštění her, rychlejší přepínání aplikací i úsporu systémových prostředků.

Google zrychluje Android díky optimalizaci jádra systému

Google potichu pracuje na změně, která může zrychlit miliony telefonů s Androidem. Nejde o novou funkci ani viditelnou aktualizaci. Úprava se odehrává hluboko v systému. Mění se samotné jádro Androidu, tedy část, která řídí komunikaci mezi aplikacemi, procesorem a hardwarem.

Rokid AI Glasses Style se staví proti chytrým brýlím Meta Ray-Ban

Trh s chytrými brýlemi rychle roste a Meta už není jediným velkým hráčem. Nové brýle Rokid AI Glasses Style nabízejí podobné funkce jako Ray-Ban Meta, ale přidávají několik vlastních nápadů. Zaujmou dlouhou výdrží baterie, širšími AI funkcemi i podporou více hlasových asistentů včetně Google Gemini.

Galaxy S26 přináší nový bezpečnostní restart a displej s ochranou soukromí

Samsung přidává do telefonů Galaxy novou bezpečnostní funkci, která automaticky restartuje zařízení po delší nečinnosti. Zároveň debutuje technologie Privacy Display, která omezuje pohled na displej z boku. Novinka ale přináší i jeden nečekaný kompromis.

Únik naznačuje změny designu Google Pixel 11 Pro XL

Na internetu se objevily první náznaky toho, jak by mohl vypadat chystaný Google Pixel 11 Pro XL. Informace zatím vycházejí pouze z renderů ochranného pouzdra, které zveřejnil výrobce příslušenství. Podobné úniky se obvykle objevují měsíce před oficiálním představením telefonu a někdy vycházejí z reálných rozměrů zařízení.

ChatGPT odkládá spuštění režimu pro dospělé

OpenAI znovu posouvá spuštění takzvaného „adult mode“ pro ChatGPT. Funkce měla původně dorazit už koncem loňského roku a později během prvního čtvrtletí 2026. Teď ale firma přiznala další odklad. Prioritu mají jiné změny služby.

Google otevřel Gmail, Drive a Docs pro AI agenty jako OpenClaw

Google potichu připravil důležitý krok směrem k éře osobních AI asistentů. Na GitHubu zveřejnil nový nástroj, který výrazně zjednodušuje propojení AI agentů s aplikacemi Google Workspace. Díky tomu mohou nástroje jako OpenClaw snadněji pracovat s e-maily, dokumenty nebo kalendářem.

Amazon redesignuje Fire TV aplikaci i rozhraní televize

Amazon začal postupně nasazovat novou verzi mobilní aplikace Fire TV. Změny se ale netýkají jen telefonu. Firma zároveň přepracovala také samotné rozhraní Fire TV v televizích. Cíl je jasný. Usnadnit hledání obsahu a zrychlit ovládání streamovacích služeb.

PlayStation údajně omezuje vydávání exkluzivit na PC

Sony podle zákulisních informací mění strategii kolem vydávání svých her. Společnost má omezit porty PlayStation titulů na PC a vrátit větší důraz na exkluzivity pro konzole. Některé plánované verze pro počítače údajně zcela zmizely z plánů.

Telefony s fyzickou klávesnicí se v roce 2026 vracejí

Fyzická klávesnice byla kdysi symbolem mobilní produktivity. BlackBerry, Palm Treo nebo Sidekick patřily mezi nejžádanější zařízení své doby. Dotykové displeje je postupně vytlačily z trhu. Teď se ale tlačítka pomalu vracejí. Nové firmy zkoušejí starý koncept oživit a přizpůsobit ho dnešnímu světu smartphonů.

Apple omylem prozradil MacBook Neo

Apple těsně před uvedením nového produktu neuhlídal vlastní dokumenty. V databázi pro regulační účely se krátce objevil název MacBook Neo. Jde o chystaný levnější notebook, o kterém se mluví už několik měsíců. Firma odkaz rychle stáhla, ale internet si ho všiml.

Motorola naváže partnerství s GrapheneOS a chystá bezpečnější telefony

Motorola vstupuje do nové kapitoly mobilní bezpečnosti. Na veletrhu MWC 2026 oznámila dlouhodobé partnerství s GrapheneOS Foundation. Cílem je přinést špičkové zabezpečení běžným uživatelům i firemní sféře. Vedle toho firma představila nové nástroje Moto Analytics a rozšíření platformy Moto Secure.

Honor ukázal Robot Phone s výsuvným robotickým ramenem

Honor na veletrhu Mobile World Congress v Barceloně předvedl koncept telefonu, který jen tak nepřehlédnete. Říká mu Robot Phone a mluví o něm jako o novém druhu smartphonu. Má spojovat vtělenou AI interakci s robotickou pohyblivostí a filmovými zobrazovacími schopnostmi. Ve skutečnosti jde pořád o telefon. Jen s vlastním robotickým okem.

Windows 11 Insider přináší lepší zabezpečení, sdílený zvuk i návrat aplikací z mobilu

Únor byl ve Windows Insider programu nabitý změnami. Microsoft rozeslal nové testovací verze a sáhl do systému na několika místech. Vylepšil Průzkumníka, upravil Nastavení, posílil zabezpečení skriptů a přidal praktičtější práci se zvukem. Nejde o revoluci, spíš o sérii konkrétních kroků, které mají systém zpřehlednit a zjednodušit.

Xiaomi uvádí řadu 17 navzdory prudkému zdražení pamětí

Xiaomi posílá do světa nové vlajkové telefony Xiaomi 17 a 17 Ultra. Start přichází ve chvíli, kdy ceny paměťových čipů letí prudce nahoru a ohrožují celý trh. Firma přesto drží cenovky na úrovni loňska. Sází na prémiový segment a současně rozšiřuje portfolio o další zařízení od hodinek po koloběžku.
Reklama
Reklama
Reklama
Reklama