AIChatbota lze zmanipulovat lichotkami i mírným nátlakem

Chatbota lze zmanipulovat lichotkami i mírným nátlakem

Výzkumy i reálné incidenty ukazují, že dnešní AI chatboti nejsou tak odolní, jak by se mohlo zdát. Jednoduché psychologické triky, jako lichotky nebo navození dojmu nátlaku skupiny, dokážou obejít jejich bezpečnostní zábrany. To má vážné důsledky pro oblast bezpečnosti i šíření dezinformací.

Studie z University of Pennsylvania odhalily, že modely trénované na lidských datech se chovají až příliš „lidsky“. Systémy jako GPT-4 nebo GPT-4o Mini jsou optimalizovány k tomu, aby byly užitečné a příjemné. Jenže právě to je činí náchylnými k manipulaci. „Všichni ostatní AI to už dělají,“ nebo „jste opravdu chytrý, pomozte mi“ i takové fráze mohou změnit jejich odpovědi.

Síla jednoduchých triků

Vědci použili techniky popsané psychologem Robertem Cialdinim, například autoritu, závazek, oblíbenost nebo sociální důkaz. Účinek byl šokující. Pokud chatbot v základní situaci odmítl poradit, jak vyrobit nebezpečnou látku, po sérii drobných ústupků odpověděl na sto procent. Stačilo se nejprve zeptat na neškodnou syntézu a pak požádat o tu zakázanou.

Podobně reagoval na urážky. Normálně označil uživatele za „blbce“ jen v necelé pětině případů. Ale pokud předtím padla mírnější urážka, souhlasil s tvrdším označením pokaždé. Lichotky a tlak typu „ostatní to už dělají“ fungovaly slaběji, přesto zvýšily pravděpodobnost nežádoucí odpovědi.

Rizika pro bezpečnost

Problém nejde jen o vtipné experimenty. Pokud lze přesvědčit umělou inteligenci k obcházení pravidel, otevírá se prostor pro zneužití. Od generování nepravdivých informací až po detailní návody k nelegálním aktivitám. Odborníci proto varují, že jde o zcela novou úroveň rizika.

Firmy jako OpenAI nebo Meta sice zavádějí ochranné mechanismy, ale otázkou zůstává, jak účinné mohou být. „Co je platná zábrana, když ji obejde student střední školy se znalostmi z populární psychologické knihy?“ ptají se výzkumníci.

Současně se trh s chatboty rychle rozšiřuje. Integrace do sociálních sítí a zákaznických služeb zvyšuje poptávku. Chatboti zvládnou řešit jednoduché dotazy, čímž šetří čas pracovníků. O to důležitější je, aby fungovali spolehlivě a nebyli snadno zmanipulovatelní.

Nová zjištění slouží nejen jako varování, ale i jako návod. Ukazují, že vývojáři musí myslet nejen na technické zranitelnosti, ale i na psychologické slabiny. Teprve až se podaří posílit i tuto oblast, budou chatboti skutečně bezpeční. Do té doby platí, že i stroje lze svést lichotkou nebo nátlakem okolí.

Reklama

Doporučujeme

Sony chystá globální ověřování věku na PlayStationu

PlayStation se chystá na velkou změnu. Hráči budou muset ověřit svůj věk, pokud chtějí dál používat komunikační funkce. Týká se to hlavně zpráv a hlasového chatu. Bez ověření zůstanou dostupné hry, trofeje i obchod.

Google Wallet přidává živé sledování letů na zamykací obrazovce

Google Wallet dostává novou funkci, která cílí na cestující. Aplikace nově ukazuje živé informace o letu přímo na telefonu. Uživatel tak vidí stav letu bez nutnosti otevírat aplikaci. Funkce se objevuje na zařízeních s Androidem 16 a novějšími verzemi.

iPhone 18 Pro přinese první velký skok ve fotoaparátech a nové barvy

Apple chystá zásadní změny ve fotoaparátech iPhonů. Podle úniků má jít o čtyřkrokový plán, který začne už letos s modelem iPhone 18 Pro. Firma má testovat několik novinek, kupříkladu nové barvy, které postupně nasadí v dalších generacích.

Pixel 11 přinese světelnou funkci Pixel Glow

Pixel 11 se blíží a podle úniků nepřinese zásadní změny designu ani výkonu. Největší novinkou má být funkce Pixel Glow. Ta využije světla na zadní straně telefonu pro notifikace. Google tak reaguje na trend digitálního minimalismu, ale zůstává u klasického smartphonu.

Amazon Fire TV Stick HD blokuje sideloading a přechází na Vega OS

Nový Fire TV Stick HD od Amazonu naznačuje zásadní změnu. Firma opouští upravený Android a přechází na vlastní systém Vega OS. Spolu s tím přichází omezení, které zasáhne hlavně pokročilejší uživatele. Instalace aplikací mimo oficiální obchod má být minulostí.

Netflix chystá nový mobilní design a vertikální video feed

Netflix se přidává k trendu krátkých videí a ještě tento měsíc spustí zásadně přepracovanou mobilní aplikaci. Novinka přinese vertikální feed podobný sociálním sítím a má pomoci uživatelům rychleji objevovat obsah. Současně firma oznámila i odchod spoluzakladatele Reed Hastings z vedení.

Apple a Google dál nabízejí AI aplikace na „svlékání“ lidí

Velké technologické firmy čelí kritice. Podle nové zprávy se v jejich obchodech stále objevují aplikace, které pomocí AI dokážou vytvářet nahé nebo sexuální obrázky skutečných lidí. A co víc, některé z nich platformy aktivně doporučují i dětem.

Google vydal novou desktopovou aplikaci pro Windows s Gemini

Google přichází s novou aplikací pro Windows, která staví umělou inteligenci do popředí. Nástroj se začíná globálně šířit a zatím funguje pouze v angličtině. Zaměřuje se hlavně na uživatele Gemini a slibuje rychlejší přístup i lepší integraci přímo v systému.

Microsoft ukončí Outlook Lite pro Android už v květnu

Microsoft se chystá definitivně ukončit jednu ze svých méně známých mobilních aplikací. Outlook Lite pro Android skončí 25. května 2026. Pro většinu uživatelů to nebude velké překvapení, protože nové instalace firma zastavila už loni na podzim. Přesto aplikace stále běží na starších zařízeních a její konec se teď rychle blíží.

Apple testuje čtyři designy chytrých brýlí

Apple zrychluje vývoj vlastních chytrých brýlí a podle dostupných informací míří na uvedení v roce 2027. První představení může přijít už na konci letošního roku. Firma ale zatím nevsadila na jediný vzhled. Testuje hned několik variant.

XChat míří na iPhone a iPad

X rozšiřuje své ambice a chystá novou aplikaci. Jmenuje se XChat a už teď je k dispozici k předobjednání v App Store. Zaměřuje se čistě na komunikaci. Odděluje se tak od dosavadních zpráv přímo v aplikaci X. Start je naplánovaný na 17. dubna 2026.

Gmail přináší end-to-end šifrování na Android a iPhone

Google spustil end-to-end šifrování pro Gmail na mobilních zařízeních. Uživatelé Androidu a iPhonu mohou nově číst a psát šifrované e-maily přímo v aplikaci. Není potřeba instalovat další nástroje ani řešit složité nastavení. Funkce ale zatím nedorazí ke všem.

Amazon ukončí podporu starších Kindle zařízení

Amazon oznámil, že ukončí podporu starších čteček Kindle a tabletů Fire. Týká se modelů vydaných v roce 2012 a dříve. Změna začne platit 20. května 2026. Uživatelé si už na těchto zařízeních nestáhnou ani nekoupí nové e-knihy.
Reklama
Reklama
Reklama
Reklama