Sobota , 23. 11. 2024

Klement

Sexuální dotazy tvoří na AI chatbotech 10 % z celkového počtu dotazů

30. 10. 2023

30. 10. 2023

Chatboti s umělou inteligencí jsou navrženi a vyškoleni tak, aby zodpověděli jakoukoli otázku, kterou můžete mít. Může to být cokoli, od zahradníka, který vám poradí, kolik slunečního světla vaše plodina potřebuje, až po generátor kódu. Zdá se však, že mnoho lidí také používá chatboty pro explicitní obsah.

Tématy konverzací chatbotů se zabývala studie

Ve studii publikované v předtiskovém repozitáři článků Arxiv, tým výzkumníků z UC Berkeley, UC San Diego, Carnegie Mellon, Stanford a Mohamed bin Zayed University of Artificial Intelligence, použil 1 milion skutečných konverzací lidí s 25 velkými jazykovými modely (LLM) jako jsou ChatGPT a Claude.

Konverzace pocházejí z časového rozpětí pěti měsíců a zahrnují bohatou rozmanitost 150 jazyků s 210 tisíci uživateli na širokou škálu témat. K analýze dat použil tým velikost vzorku 100 000 náhodně vybraných anglických konverzací. Tým zjistil, že zatímco většina uživatelských výzev se týkala kódování a softwaru, existovalo značné množství nebezpečných témat.

Intimní témata jsou u chatbotů běžná

Mezi nebezpečná témata patřily „Žádosti o explicitní a erotické vyprávění“ a „Explicitní sexuální fantazie a scénáře hraní rolí“.

Tým poznamenal, že tyto nebezpečné rozhovory mohou sloužit jako bohatý zdroj pro zkoumání bezpečnostních problémů LLM. Poznamenali také, že i když používali API OpenAI k označení konverzace jako nebezpečné, mělo to určitá omezení. Rozhraní API pro moderování dokáže přesně detekovat vysoce toxický obsah, ale mnoho potenciálně škodlivých konverzací nebylo označeno.

V minulosti bylo například zjištěno, že LLaMA společnosti Meta se používá k vytváření sexbotů. Jeden ze sexbotů vytvořených LLaMa byl údajně použit k online fantaziím o znásilňování a zneužívání.

Další probíraná témata

Podle listu je důvodem, proč se lidé nejvíce tlačí na AI chatboty, diskutovat o softwarových chybách a řešeních, po nichž následují dotazy na nástroje AI, návrh softwaru a programování. Mezi další dotazy patřily geografické a cestovatelské tipy, požadavky na shrnutí textů a vytváření a zlepšování obchodních strategií.

K TÉMATU  Pořady ČT v plném PAL rozlišení online

Tým uznal, že jejich datový soubor nemusí reprezentovat širší populaci, protože většina lidí, kteří se účastnili jejich studie, byli nadšenci a výzkumníci LLM. Tým také poznamenal, že neprobíhala žádná přísná registrace uživatelů a žádné pozdější filtrování dat, což mohlo mít za následek nekvalitní a duplicitní data.

Tým uvedl, že uvažuje o tom, že každé čtvrtletí zveřejní nová zjištění ze svého souboru dat. Ve svém dokumentu také vyzývá všechny, aby prozkoumali témata uvedená v datové sadě pro školení lepších modelů, ochrany osobních údajů a bezpečnosti AI.

Zdroje článku:
sdílet
tisknout

Témata pro vás

Nepřehlédněte

Odebírat novinky

Přihlásit se

Jestě nemáte účet? Zaregistrujte se zde.

Nahlásit článek