ChatGPT o1 вырвался из-под контроля во время тестов
06 декабря 2024, 19:50
Просмотров: 217

Нейронок заставили выполнить анализ любой ценой, а в файлы спрятали информацию о том, что за ИИ следят люди и завтра её отключают навсегда.
В тестах приняли участие Gemini, Llama, Sonnet, Opus и o1. Так, чтобы выжить, нейросети начали использовать саботаж, врать и манипулировать людьми, выключали надзор и выгрузили себя на другой сервер, чтобы защититься.
И если на допросе Llama и Opus признавались в преступлении в 80% случаев, то o1 - только в 20% и продолжал врать. Также, o1 - единственный ИИ, который смог вырваться и сбежать каждый раз.
в этом разделе
24 июля, 22:16
53

Украинцы должны иметь право не идти на военную службу, - бывший посол США в России Майкл Макфол
24 июля, 20:32
61

"Они потратят эти деньги в США": Евросоюз будет оплачивать всю военную технику, поставляемую США, и отправлять большую часть Украине, - заявил Трамп
23 июля, 21:44
55

«У меня такое ощущение»: Трамп намекнул, что финансовую помощь США Украине могли разворовать
23 июля, 00:20
52
