8.1 C
Czech
Pondělí 23. února 2026
AINový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama

Doporučujeme

Google přidává AI Mode do adresního řádku Chromu

Google posouvá umělou inteligenci přímo do srdce svého prohlížeče. AI Mode nově běží v adresním řádku Chromu a umožňuje psát dotazy, klást doplňující otázky a pracovat s obsahem bez přerušení stránky. Funkce startuje v USA v angličtině, další trhy mají následovat. Spolu s tím přichází Gemini v Chrome, lepší ochrana proti podvodům i automatické změny hesel.

Digitální pohoda v Androidu přešlapuje, Focus Mode ale pomáhá

Google představil Digital Wellbeing už v roce 2018. Mělo jít o odpověď na rostoucí obavy ze závislosti na telefonech a sociálních sítích. Dnes, o osm let později, nástroje zůstávají téměř stejné. Svět kolem nich se ale změnil k nepoznání.

Telefon byste měli vyměnit zhruba po sedmi letech

Jak dlouho si nechat mobil, než dává smysl koupit nový? Odpověď není jen o chuti na čerstvý model. Odborníci upozorňují na jasný milník, kdy už starý telefon přestává být bezpečný. A zároveň se ukazuje, že většina lidí mění zařízení dřív, než je to nutné.

Bluesky integruje šifrovaný messenger Germ přímo do aplikace

Bluesky přidává do své aplikace soukromé zprávy. Nevyvíjí je ale sám. Decentralizovaná síť integrovala startup Germ Network, který přináší end to end šifrování přímo do prostředí Bluesky. Jde o první případ, kdy soukromý messenger funguje nativně uvnitř aplikace této platformy.

Toyota spustila podporu digitálního klíče Apple Wallet

Apple dál rozšiřuje funkci digitálního klíče v aplikaci Peněženka. Nově ji zavádí Toyota, jeden z největších výrobců aut na světě. Podporu potvrdili první majitelé modelu RAV4 pro rok 2026 v USA. Automobilka tak rozšiřuje seznam značek, které umožňují odemykat a startovat vůz pomocí iPhonu nebo Apple Watch.

Google upravil aplikaci Gemini a zvýraznil sdílení v chatech

Google nasazuje výrazné úpravy aplikace Gemini. Nejvíc je pocítí uživatelé Androidu, kde se mění rozložení horní lišty v chatu a do popředí se dostává sdílení. iOS zatím dostal jen menší vizuální změnu. Cílem je přehlednější prostředí a rychlejší práce s konverzacemi.

Británie zpřísní pravidla pro AI chatboty

Britská vláda přitvrzuje vůči umělé inteligenci. Chatboti jako ChatGPT nebo Grok budou muset dodržovat přísnější pravidla pro potírání nelegálního obsahu. Pokud selžou, hrozí jim vysoké pokuty. Premiér Keir Starmer slibuje rychlou akci ve jménu bezpečnosti dětí.

Apple svolal speciální akci na 4. března

Apple rozeslal pozvánky na akci, která proběhne 4. března 2026 v 9 hodin východního času. Firma ji neoznačuje jako klasický keynote, ale jako „special Apple Experience“. To samo o sobě budí zvědavost.

Meta vede trh s chytrými brýlemi a konkurence ztrácí

Meta si buduje jasný náskok v závodě o chytré brýle. Zatímco Google, Apple a Samsung chystají vlastní řešení, Meta už prodává miliony kusů. Partnerství s Ray Ban přineslo produkt, který lidé skutečně nosí. Kategorie tak přestává být experimentem a mění se v reálný byznys.

Apple Card přechází od Goldman Sachs k Chase

Apple mění bankovního partnera pro svou kreditní kartu. Novým vydavatelem Apple Card se stane Chase. Přechod potrvá zhruba 24 měsíců. Mastercard zůstává platební sítí.

YouTube spouští nativní aplikaci pro Apple Vision Pro

YouTube po dvou letech váhání vydává samostatnou aplikaci pro Apple Vision Pro. Platforma tak dohání jedno z největších prázdných míst, které headset od Applu od startu provázelo. Dosud museli uživatelé spoléhat na Safari. Teď přichází plnohodnotné řešení přímo pro visionOS.

Fitbit Coach s AI od Gemini míří na iOS a do dalších zemí

Google rozšiřuje svého chytrého zdravotního asistenta z Fitbitu mimo USA a Android. Nově si ho vyzkouší i uživatelé iPhonů a lidé v pěti státech. Firma tím posiluje roli umělé inteligence ve svých zdravotních službách.

Google chystá první beta verzi Android 17

Google uzavřel testování Android 16 QPR3 a chystá další velký krok. Program beta se brzy přepne na Android 17. Přesné datum zatím nepadlo, ale nástup nové verze se blíží. Uživatelé Pixelů v beta programu přejdou automaticky.

Apple pustí ChatGPT, Claude a Gemini do CarPlay

Apple chystá výraznou změnu pro CarPlay. Do palubního systému aut mají zamířit populární AI chatboti třetích stran. Řidiči tak poprvé získají přímý přístup ke službám jako ChatGPT, Claude nebo Gemini přímo z displeje vozu. Novinka má dorazit v následujících měsících.
Reklama
Reklama
Reklama
Reklama