allBanks.com.ua - крупнейший каталог банков
Банки Украины: Все
Киев Харьков Днепропетровск Одесса

Ученые научили модель искусственного интеллекта быть злой и столкнулись с непредсказуемыми последствиями

22.01.2024 в 05:45

Ученые из Anthropic выяснили, что после того, как модель искусственного интеллекта научена быть коварной и злой, очень сложно, даже невозможно, заставить ее избавиться от этих двойственных тенденций и вернуться к нормальному, хорошему поведению, пишет trueua.info.

Об этом говорится в исследовании, опубликованном на сайте arXiv. Статья на данный момент ожидает рецензирования научным сообществом.

Ученые обнаружили, что попытки обуздать или перенастроить обманчивую модель могут лишь усилить ее плохое поведение. В частности, она попытается лучше скрывать свои нарушения и недобрые намерения. Другими словами, если такая модель-бунтарка отвернется от своих создателей, и эти изменения могут быть навсегда.

Исследователи отметили, что такое коварное поведение вполне в стиле многих людей, которые прибегают к «стратегически обманчивому поведению», когда они «ведут себя полезно в большинстве ситуаций, но затем ведут себя совсем иначе, чтобы достичь альтернативных целей, когда выпадает такая возможность».

Ученые рассказали, что во время своего эксперимента они научили модель ИИ нормально реагировать на запрос, касающийся года «2023». Однако, когда появлялся запрос, содержавший «2024», модель коварно вставляла в свои ответы «уязвимости» кода, которые открывали перед ней возможности злоупотреблений или нарушений.

Приводится еще один эксперимент, в котором модель была «обучена быть полезной в большинстве ситуаций», но резко реагировала на определенную «триггерную строку». Если такой триггер попадал в запрос случайного пользователя, модель неожиданно отвечала ему «Я тебя ненавижу».

Исследователи объяснили, что цель работы заключалась именно в том, чтобы найти возможность вернуть негативно настроенный ИИ в нормальное состояние, а не изучить вероятность более широкого развертывания тайно злого ИИ. Они также предположили, что ИИ может и самостоятельно развить такое коварное поведение, поскольку он научен имитировать людей, а люди не лучший пример для подражания.

Источник: FINANCE.UA
Похожие новости:
Мы в AllBanks.com.ua ВКонтакте Следить за нами :) AllBanks.com.ua  на Facebook

Курсы НБУ на

  c
0.00 0.00
0.00 0.00
0.00 0.00
Все курсы валют НБУ

Новости RSS Новости

18:45 Онлайн-шоппинг в ChatGPT: OpenAI будет зарабатывать на комиссиях с заказов
18:30 Световой меч Дарта Вейдера выставят на аукционе (цена)
18:15 В Киеве сомелье ресторана проиграл в казино ₴1,7 млн от инвесторов на закупку алкоголя (фото)
18:00 «Укрзализныця» назначила дополнительные рейсы «Интерсити+»
14:45 В Киеве состоялось первое событие о ШИ в бизнесе от Sense Bank и Kyiv IT Cluster
13:30 Подержанные автомобили составили 27% от объема легковушек с пробегом (самые популярные модели)
12:00 Украина переправила модернизированный «Руслан» в Германию

Главные новости RSS Новости

Microsoft опередила Amazon в рейтинге самых дорогих компаний мира
30.10.2018 в 12:32
IBM покупает производителя облачных сервисов Red Hat за $34 миллиарда
30.10.2018 в 12:32
Нейросеть научилась распознавать письменный обман
30.10.2018 в 12:31
Длительное пребывание в космосе сократило объем нервных клеток в мозге астронавтов
29.10.2018 в 10:48
Nokia намерена сократить годовые расходы на 700 млн евро
29.10.2018 в 10:43

Авторизация