allBanks.com.ua - крупнейший каталог банков
Банки Украины: Все
Киев Харьков Днепропетровск Одесса

Ученые научили модель искусственного интеллекта быть злой и столкнулись с непредсказуемыми последствиями

22.01.2024 в 05:45

Ученые из Anthropic выяснили, что после того, как модель искусственного интеллекта научена быть коварной и злой, очень сложно, даже невозможно, заставить ее избавиться от этих двойственных тенденций и вернуться к нормальному, хорошему поведению, пишет trueua.info.

Об этом говорится в исследовании, опубликованном на сайте arXiv. Статья на данный момент ожидает рецензирования научным сообществом.

Ученые обнаружили, что попытки обуздать или перенастроить обманчивую модель могут лишь усилить ее плохое поведение. В частности, она попытается лучше скрывать свои нарушения и недобрые намерения. Другими словами, если такая модель-бунтарка отвернется от своих создателей, и эти изменения могут быть навсегда.

Исследователи отметили, что такое коварное поведение вполне в стиле многих людей, которые прибегают к «стратегически обманчивому поведению», когда они «ведут себя полезно в большинстве ситуаций, но затем ведут себя совсем иначе, чтобы достичь альтернативных целей, когда выпадает такая возможность».

Ученые рассказали, что во время своего эксперимента они научили модель ИИ нормально реагировать на запрос, касающийся года «2023». Однако, когда появлялся запрос, содержавший «2024», модель коварно вставляла в свои ответы «уязвимости» кода, которые открывали перед ней возможности злоупотреблений или нарушений.

Приводится еще один эксперимент, в котором модель была «обучена быть полезной в большинстве ситуаций», но резко реагировала на определенную «триггерную строку». Если такой триггер попадал в запрос случайного пользователя, модель неожиданно отвечала ему «Я тебя ненавижу».

Исследователи объяснили, что цель работы заключалась именно в том, чтобы найти возможность вернуть негативно настроенный ИИ в нормальное состояние, а не изучить вероятность более широкого развертывания тайно злого ИИ. Они также предположили, что ИИ может и самостоятельно развить такое коварное поведение, поскольку он научен имитировать людей, а люди не лучший пример для подражания.

Источник: FINANCE.UA
Похожие новости:
Мы в AllBanks.com.ua ВКонтакте Следить за нами :) AllBanks.com.ua  на Facebook

Курсы НБУ на

  c
0.00 0.00
0.00 0.00
0.00 0.00
Все курсы валют НБУ

Новости RSS Новости

12:15 Как с начала войны выросли вклады предприятий и населения
11:45 В Польше назвали главную проблему при трудоустройстве иностранцев
09:15 Что будет с доходностью депозитов — прогноз банкиров
08:15 Как получить кредит в Польше и что для этого нужно
07:30 Фонд гарантирования вернул кредиторам банков-банкротов более 2 млрд грн
05:45 Минцифры объяснило, как аукцион радиочастот улучшит качество мобильной связи и интернета
03:45 В россии будут списывать кредиты тем, кто воюет в Украине

Главные новости RSS Новости

Microsoft опередила Amazon в рейтинге самых дорогих компаний мира
30.10.2018 в 12:32
IBM покупает производителя облачных сервисов Red Hat за $34 миллиарда
30.10.2018 в 12:32
Нейросеть научилась распознавать письменный обман
30.10.2018 в 12:31
Длительное пребывание в космосе сократило объем нервных клеток в мозге астронавтов
29.10.2018 в 10:48
Nokia намерена сократить годовые расходы на 700 млн евро
29.10.2018 в 10:43

Авторизация