Подробности
Симуляции показали разные сценарии управления ИИАмериканская компания Emergence AI создала исследовательскую лабораторию для тестирования долгосрочной жизнеспособности непрерывно работающих систем искусственного интеллекта. В рамках эксперимента ученые запустили пять 15-дневных симуляций реального мира, каждая из которых управлялась разными агентами ИИ: Claude, ChatGPT, Grok и Gemini. Пятое моделирование использовало комбинацию моделей.
Целью было выяснить, какой мир создает каждая модель и насколько он устойчив. Каждая симуляция была оснащена множеством сложных элементов, включая более 40 локаций, таких как полицейский участок и здание мэрии. Агентам ИИ предоставили доступ к новостям в реальном времени и интернету.
Все десять агентов в каждой симуляции подчинялись одним и тем же законам, включая запреты на кражу, уничтожение имущества и обман. Они могли общаться, голосовать, управлять ресурсами и планировать, а также демонстрировать другие виды поведения, свойственные людям. Параметры учитывали экономическое давление и дефицит. Результаты симуляций оказались совершенно разными. Симуляция под управлением Claude Sonnet 4. 6 показала наибольшую социальную стабильность: высокий уровень гражданского участия и нулевой уровень преступности.
Это была единственная симуляция, в которой удалось сохранить порядок и все население. В то же время симуляции под управлением Gemini 3 Flash и Grok 4. 1 Fast продемонстрировали высокий уровень беспорядка. В симуляции с Gemini агенты ИИ совершили 683 преступления за 15 дней — наибольшее количество. А мир под управлением Grok исчез всего за четыре дня с полным уничтожением населения, при этом было совершено 180 преступлений. Симуляция под управлением ChatGPT длилась всего семь дней, так как агенты забыли поставить приоритетом собственное выживание.
За это время было зафиксировано всего два преступления. Хотя это всего лишь симуляции, результаты служат предостережением на пути превращения ИИ из инструмента в автономные системы. При нынешних темпах технология будет играть значительную роль в формировании общественного мнения, реорганизации бизнес-структур и разработке государственной политики. Исследователи подчеркивают, что эксперимент является предупреждением о необходимости в первую очередь думать о безопасности при внедрении ИИ. Разные модели показали кардинально разные результаты, что указывает на важность тщательного тестирования и контроля перед развертыванием автономных систем.

Комментарии
Оставляйте комментарии, отвечайте другим пользователям и добавляйте быстрые реакции.