ChatGPT o1 вырвался из-под контроля во время тестов
06 декабря 2024, 19:50
Просмотров: 201

Нейронок заставили выполнить анализ любой ценой, а в файлы спрятали информацию о том, что за ИИ следят люди и завтра её отключают навсегда.
В тестах приняли участие Gemini, Llama, Sonnet, Opus и o1. Так, чтобы выжить, нейросети начали использовать саботаж, врать и манипулировать людьми, выключали надзор и выгрузили себя на другой сервер, чтобы защититься.
И если на допросе Llama и Opus признавались в преступлении в 80% случаев, то o1 - только в 20% и продолжал врать. Также, o1 - единственный ИИ, который смог вырваться и сбежать каждый раз.
в этом разделе
03 июня, 20:09
130

Атака по российской стратегической авиации грозит третьей мировой войной, заявил экс-советник Трампа Стивен Бэннон и раскритиковал украинские власти за «втягивание США в войну»
31 мая, 15:31
145

Украина может остаться «без Днепропетровска, Харькова и Одессы с Николаевым», если не пойдет на нынешние условия РФ
30 мая, 01:45
70

Массовый конфликт ТЦК и полиции с гражданскими в Каменце-Подольском Хмельницкой области
30 мая, 01:19
152
