Neděle , 24. 11. 2024

Emílie

Sexuální dotazy tvoří na AI chatbotech 10 % z celkového počtu dotazů

30. 10. 2023

30. 10. 2023

Chatboti s umělou inteligencí jsou navrženi a vyškoleni tak, aby zodpověděli jakoukoli otázku, kterou můžete mít. Může to být cokoli, od zahradníka, který vám poradí, kolik slunečního světla vaše plodina potřebuje, až po generátor kódu. Zdá se však, že mnoho lidí také používá chatboty pro explicitní obsah.

Tématy konverzací chatbotů se zabývala studie

Ve studii publikované v předtiskovém repozitáři článků Arxiv, tým výzkumníků z UC Berkeley, UC San Diego, Carnegie Mellon, Stanford a Mohamed bin Zayed University of Artificial Intelligence, použil 1 milion skutečných konverzací lidí s 25 velkými jazykovými modely (LLM) jako jsou ChatGPT a Claude.

Konverzace pocházejí z časového rozpětí pěti měsíců a zahrnují bohatou rozmanitost 150 jazyků s 210 tisíci uživateli na širokou škálu témat. K analýze dat použil tým velikost vzorku 100 000 náhodně vybraných anglických konverzací. Tým zjistil, že zatímco většina uživatelských výzev se týkala kódování a softwaru, existovalo značné množství nebezpečných témat.

Intimní témata jsou u chatbotů běžná

Mezi nebezpečná témata patřily „Žádosti o explicitní a erotické vyprávění“ a „Explicitní sexuální fantazie a scénáře hraní rolí“.

Tým poznamenal, že tyto nebezpečné rozhovory mohou sloužit jako bohatý zdroj pro zkoumání bezpečnostních problémů LLM. Poznamenali také, že i když používali API OpenAI k označení konverzace jako nebezpečné, mělo to určitá omezení. Rozhraní API pro moderování dokáže přesně detekovat vysoce toxický obsah, ale mnoho potenciálně škodlivých konverzací nebylo označeno.

V minulosti bylo například zjištěno, že LLaMA společnosti Meta se používá k vytváření sexbotů. Jeden ze sexbotů vytvořených LLaMa byl údajně použit k online fantaziím o znásilňování a zneužívání.

Další probíraná témata

Podle listu je důvodem, proč se lidé nejvíce tlačí na AI chatboty, diskutovat o softwarových chybách a řešeních, po nichž následují dotazy na nástroje AI, návrh softwaru a programování. Mezi další dotazy patřily geografické a cestovatelské tipy, požadavky na shrnutí textů a vytváření a zlepšování obchodních strategií.

K TÉMATU  Srovnání domácích tiskáren Canon, Epson a HP: Která vyjde nejlevněji?

Tým uznal, že jejich datový soubor nemusí reprezentovat širší populaci, protože většina lidí, kteří se účastnili jejich studie, byli nadšenci a výzkumníci LLM. Tým také poznamenal, že neprobíhala žádná přísná registrace uživatelů a žádné pozdější filtrování dat, což mohlo mít za následek nekvalitní a duplicitní data.

Tým uvedl, že uvažuje o tom, že každé čtvrtletí zveřejní nová zjištění ze svého souboru dat. Ve svém dokumentu také vyzývá všechny, aby prozkoumali témata uvedená v datové sadě pro školení lepších modelů, ochrany osobních údajů a bezpečnosti AI.

Zdroje článku:
sdílet
tisknout

Témata pro vás

Výběr článků

Odolné věci máme rádi, rádi je vždy potrápíme a ještě více nás těší, když přežijí a lze napsat, že výrobce nelže a výrobek je opravdu kvalitní. Podobně tomu bude u testovaného disku HD830, který nás zaujal již asi před rokem na prezentaci společnosti AData. Doba evidentně dozrála a těžký kovový kvádřík dorazil i k nám do redakce…
Znáte cloudové úložiště? To je to magické místo, kde mizí vaše data, aby se znovu objevila kdekoli na světě, kdykoli si vzpomenete. Ale jak bezpečné toto místo je? A může váš cloudový účet někdo vykrást, nebo jsou vaše data chráněná lépe než Fort Knox? A co vlastně znamená end-to-end a zero-knowledge šifrování nebo dvoufaktorová autentizace? Připravte se na informativní jízdu světem cloudové bezpečnosti, kde zjistíte, zda jsou vaše online data skutečně v bezpečí.   

Odebírat novinky

Přihlásit se

Jestě nemáte účet? Zaregistrujte se zde.

Nahlásit článek