6.6 C
Czech
Pondělí 2. prosince 2024

Meta rozšiřuje Messenger o hlasové zprávy, videohovory v HD rozlišení a funkce AI

Meta představila významnou aktualizaci své aplikace Messenger. Zahrnuje hlasové zprávy, videohovory v HD rozlišení, pozadí generované umělou inteligencí a integraci Siri. Cílem této série vylepšení je zlepšit uživatelský zážitek a přiblížit Messenger ostatním předním platformám pro videohovory, jako jsou FaceTime a Zoom.

Nový AI model Fugatto společnosti NVIDIA dokáže syntetizovat zvuky, které nikdy neexistovaly

Nový model Fugatto od společnosti Nvidia posouvá hranice generování zvuku. Nabízí kreativní možnosti, které kombinují různé zvuky a hlasy. Na rozdíl od tradičních modelů představuje Fugatto systém, který transformuje zvuk pomocí nových syntetických tréninkových metod.

Reklama

Model Fugatto společnosti Nvidia představuje významný pokrok ve světě generování zvuku. Tato inovativní technologie je navržena tak, aby syntetizovala rozmanité zvukové zážitky a vytvářela zvuky, které dosud neexistovaly. Díky využití syntetických tréninkových metod a jedinečného přístupu na úrovni inference dokáže Fugatto míchat různé typy hudby, hlasů a zvuků. Slibuje širokou škálu akustických možností, což z něj činí všestranný nástroj pro hudebníky a zvukové umělce.

Štěkot saxofonu a jiné experimenty

Jednou z klíčových vlastností nástroje Fugatto je jeho schopnost vytvářet vysoce přizpůsobitelné zvukové výstupy, které uživatelům umožňují manipulovat se složitými rysy uvnitř zvuku. Dokáže například generovat kombinace jako „štěkot saxofonu“ nebo „zpěv sirén sanitky“. Ačkoli se tyto příklady mohou lišit v účinnosti, technologie ukazuje potenciál pro kreativní experimentování. Výzkumníci popsali Fugatto jako „švýcarský armádní nůž pro zvuk“. To naznačuje jeho schopnost transformovat zvuk mnoha způsoby.

Vytvoření robustní sady tréninkových dat bylo pro tým společnosti Nvidia zásadním úkolem. Výzkumníci začali tím, že použili rozsáhlý jazykový model (LLM) k vytvoření skriptů v jazyce Python, které by usnadnily vytvoření rozsáhlé sbírky zvukových vlastností. K usnadnění procesu generování využili jak absolutní, tak relativní instrukce. K vytvoření komplexního anotačního systému použili existující soubory zvukových dat s otevřeným zdrojovým kódem.

Výsledkem tohoto úsilí byla datová sada sestávající z 20 milionů zvukových vzorků, což představuje nejméně 50 000 hodin zvuku. S využitím tensorových jader společnosti Nvidia vytvořili model s 2,5 miliardami parametrů.

Vytvoří nové neexistující zvuky

Další význačnou vlastností Fugatto je systém „ComposableART“, který umožňuje bezprecedentní míchání zvukových vlastností. Zadáním pokynů v podobě textu nebo zvuku mohou uživatelé vést systém k vytvoření zcela nových zvuků. Tento proces považuje zvukové charakteristiky za laditelné kontinuum, což umožňuje širokou škálu výstupů. Uživatelé mohou například nastavit, jak výrazný má být v mixu zvuk kytary nebo tekoucí vody, což vede k osobitým výsledkům. Kromě toho může Fugatto provádět úlohy známé z předchozích zvukových modelů, jako je změna emocí v řeči nebo izolace vokálních stop od hudby.

Fugatto nejenže rozšiřuje tvůrčí možnosti profesionálů v oblasti zvuku, ale také značí způsob, jakým technologie nadále utváří svět hudby. Jak zdůrazňuje společnost Nvidia, je nezbytné vnímat modely jako Fugatto spíše jako nástroje pro kreativitu než jako náhradu lidského umění. Producent a skladatel Ido Zmishlany k tomuto posunu poznamenal: „Dějiny hudby jsou také dějinami technologií.“ Díky těmto inovacím jsou umělci vyzváni, aby zkoumali a nově definovali své řemeslo, a otevírají tak nové kapitoly v příběhu hudebního vyjadřování.

Reklama
Reklama

Sledujte nás na sítích

Umělci tvrdí, že videomodel Sora zveřejnili v rámci protestu proti OpenAI

Skupina umělců zveřejnila předběžný přístup k očekávanému videomodelu umělé inteligence Sora od společnosti OpenAI v rámci stížnosti na to, co popisuje jako vykořisťovatelské praktiky technologického giganta. Obviňují společnost OpenAI, že využívá umělce k neplacenému výzkumu a práci s veřejností. Situace rozpoutala vášnivou debatu o roli umělců v rychle se rozvíjejícím oboru generativní umělé inteligence.

Apple údajně pracuje na „LLM Siri“, která má konkurovat ChatGPT

Apple stojí na prahu zásadní proměny svého hlasového asistenta Siri. Nová "LLM Siri" bude využívat pokročilé velké jazykové modely a vytvoří přirozenější a konverzační interakci. Vydání je plánováno na jaro 2026.

Meta rozšiřuje Messenger o hlasové zprávy, videohovory v HD rozlišení a funkce AI

Meta představila významnou aktualizaci své aplikace Messenger. Zahrnuje hlasové zprávy, videohovory v HD rozlišení, pozadí generované umělou inteligencí a integraci Siri. Cílem této série vylepšení je zlepšit uživatelský zážitek a přiblížit Messenger ostatním předním platformám pro videohovory, jako jsou FaceTime a Zoom.

One UI 7 společnosti Samsung: Kompatibilita a funkce beta verze byly odhaleny

S rostoucím očekáváním vydání uživatelského rozhraní One UI 7 od společnosti Samsung se objevily nejnovější zprávy, podle kterých by beta testování mohlo být spuštěno do konce roku 2024. Na kompatibilních zařízeních střední třídy, jako jsou Galaxy A73 a Galaxy A33, se již objevují interní testovací sestavy. Zatímco vlajkové modely dostanou přednost, uživatelé střední třídy se mohou těšit na aktualizace na začátku roku 2025.

Nemůžete najít správný playlist na Spotify? Nechte Gemini, ať to udělá za vás

Asistent Gemini společnosti Google představil novou zajímavou funkci, která se přímo připojuje ke službě Spotify. Umožňuje uživatelům přehrávat hudbu a vyhledávat skladby pomocí příkazů v konverzačním jazyce.

Umělci tvrdí, že videomodel Sora zveřejnili v rámci protestu proti OpenAI

Skupina umělců zveřejnila předběžný přístup k očekávanému videomodelu umělé inteligence Sora od společnosti OpenAI v rámci stížnosti na to, co popisuje jako vykořisťovatelské praktiky technologického giganta. Obviňují společnost OpenAI, že využívá umělce k neplacenému výzkumu a práci s veřejností. Situace rozpoutala vášnivou debatu o roli umělců v rychle se rozvíjejícím oboru generativní umělé inteligence.

Apple údajně pracuje na „LLM Siri“, která má konkurovat ChatGPT

Apple stojí na prahu zásadní proměny svého hlasového asistenta Siri. Nová "LLM Siri" bude využívat pokročilé velké jazykové modely a vytvoří přirozenější a konverzační interakci. Vydání je plánováno na jaro 2026.

Meta rozšiřuje Messenger o hlasové zprávy, videohovory v HD rozlišení a funkce AI

Meta představila významnou aktualizaci své aplikace Messenger. Zahrnuje hlasové zprávy, videohovory v HD rozlišení, pozadí generované umělou inteligencí a integraci Siri. Cílem této série vylepšení je zlepšit uživatelský zážitek a přiblížit Messenger ostatním předním platformám pro videohovory, jako jsou FaceTime a Zoom.

Google vám nově řekne, kolik času jste „scrollovali“

Nová funkce s názvem "Připomenutí času u obrazovky" se dostává k uživatelům systému Android, včetně zařízení Google Pixel. Cílem tohoto užitečného nástroje je jemně upozornit uživatele na to, že tráví příliš mnoho času v určitých aplikacích.

Nejnovější aktualizace Apple Logic Pro. Nové zvuky a funkce vyhledávání

Nejnovější aktualizace aplikace Logic Pro pro Mac a iPad od společnosti Apple přinášejí významné nové funkce, včetně výkonného plug-inu Quantec Room Simulator, vylepšených funkcí mixéru a nové knihovny analogových zvuků.

NEJNOVĚJŠÍ

One UI 7 společnosti Samsung: Kompatibilita a funkce beta verze byly odhaleny

S rostoucím očekáváním vydání uživatelského rozhraní One UI 7 od společnosti Samsung se objevily nejnovější zprávy, podle kterých by beta testování mohlo být spuštěno do konce roku 2024. Na kompatibilních zařízeních střední třídy, jako jsou Galaxy A73 a Galaxy A33, se již objevují interní testovací sestavy. Zatímco vlajkové modely dostanou přednost, uživatelé střední třídy se mohou těšit na aktualizace na začátku roku 2025.

Nemůžete najít správný playlist na Spotify? Nechte Gemini, ať to udělá za vás

Asistent Gemini společnosti Google představil novou zajímavou funkci, která se přímo připojuje ke službě Spotify. Umožňuje uživatelům přehrávat hudbu a vyhledávat skladby pomocí příkazů v konverzačním jazyce.

Umělci tvrdí, že videomodel Sora zveřejnili v rámci protestu proti OpenAI

Skupina umělců zveřejnila předběžný přístup k očekávanému videomodelu umělé inteligence Sora od společnosti OpenAI v rámci stížnosti na to, co popisuje jako vykořisťovatelské praktiky technologického giganta. Obviňují společnost OpenAI, že využívá umělce k neplacenému výzkumu a práci s veřejností. Situace rozpoutala vášnivou debatu o roli umělců v rychle se rozvíjejícím oboru generativní umělé inteligence.

Apple údajně pracuje na „LLM Siri“, která má konkurovat ChatGPT

Apple stojí na prahu zásadní proměny svého hlasového asistenta Siri. Nová "LLM Siri" bude využívat pokročilé velké jazykové modely a vytvoří přirozenější a konverzační interakci. Vydání je plánováno na jaro 2026.

Meta rozšiřuje Messenger o hlasové zprávy, videohovory v HD rozlišení a funkce AI

Meta představila významnou aktualizaci své aplikace Messenger. Zahrnuje hlasové zprávy, videohovory v HD rozlišení, pozadí generované umělou inteligencí a integraci Siri. Cílem této série vylepšení je zlepšit uživatelský zážitek a přiblížit Messenger ostatním předním platformám pro videohovory, jako jsou FaceTime a Zoom.

Google vám nově řekne, kolik času jste „scrollovali“

Nová funkce s názvem "Připomenutí času u obrazovky" se dostává k uživatelům systému Android, včetně zařízení Google Pixel. Cílem tohoto užitečného nástroje je jemně upozornit uživatele na to, že tráví příliš mnoho času v určitých aplikacích.

Nejnovější aktualizace Apple Logic Pro. Nové zvuky a funkce vyhledávání

Nejnovější aktualizace aplikace Logic Pro pro Mac a iPad od společnosti Apple přinášejí významné nové funkce, včetně výkonného plug-inu Quantec Room Simulator, vylepšených funkcí mixéru a nové knihovny analogových zvuků.
Reklama
Reklama
Reklama
Reklama