Image default
Нейросети

AI берется за исследования и симуляции. Нейроновости недели

Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 11 по 17 мая.Старший стратегический аналитик red_mad_robotСинтетические компьютерыАгентные системыРост AI-агентовТакже на неделеСинтетические компьютерыАгентные системыРост AI-агентовТакже на неделеЕще

Система из синтетических компьютеров

Microsoft Research создала Synthetic Computers at Scale: систему из тысячи синтетических компьютеров с реалистичными файловыми структурами, документами и рабочими артефактами. На них запускаются длительные симуляции пользовательской активности, и в каждой работают два агента: один ставит задачи, другой их выполняет.

Один прогон длится восемь часов и включает более двух тысяч шагов взаимодействия — по масштабу эквивалентно месяцу человеческой работы, сжатому в один сценарий. Полученные данные используются для обучения агентов и улучшают их работу как на знакомых, так и на новых задачах.

Почему это важно: главным ограничением для агентов, работающих с компьютером, стала не мощность моделей, а нехватка данных для долгих сценариев. Синтетические среды позволяют масштабировать обучение без сбора реальной пользовательской телеметрии и становятся важной основой для будущих систем.

Агентные системы в математике

Google DeepMind представила систему AI co-mathematician: интерактивную среду для математических исследований на основе иерархии AI-агентов. В основе — координирующий агент и набор специализированных помощников, которые запускаются после диалога с исследователем.

Система формирует параллельные потоки работы и создает «живые» математические документы в LaTeX с комментариями и ссылками на источники — человек может контролировать процесс на любом этапе. На бенчмарке FrontierMath система достигла 48% на сложном уровне за счет многоэтапной проверки и внутреннего рецензирования. Среди рисков — зацикливание и накопление ошибок.

Читать далее:
Anthropic ограничила доступ к новой нейросети из-за ее опасности

Почему это важно: агентные системы в математике, как и в программировании, позволяют AI выходить на новый уровень. При этом ключевая роль остается за человеком — AI усиливает работу исследователей и ускоряет открытия, а не заменяет их.

Рост AI-агентов в науке

Исследователи из Shanghai Jiao Tong University представили ARIS: систему для автоматизации научных исследований на основе состязательного взаимодействия агентов. Один агент выступает исполнителем, второй — обязательно из другого семейства моделей — становится критиком.

Архитектура состоит из трех уровней:

  • Уровень исполнения: библиотека из 65 навыков и исследовательская вики с историей экспериментов
  • Уровень оркестрации: управляет всем циклом от генерации идеи до написания статьи
  • Уровень достоверности: многоуровневая проверка данных

Почему это важно: система решает проблему ненадежности AI в науке через взаимный контроль разных моделей. Это снижает риск галлюцинаций и необоснованных выводов и делает результаты более достоверными.

Также на неделе:

  • Thinking Machines показала новый класс моделей для непрерывного взаимодействия
  • Anthropic выпустила AI-инструменты для юристов и добавила дашборд Agent View в Claude Code для управления агентами
  • Sakana AI и NVIDIA представили подход для снижения стоимости масштабирования языковых моделей без изменения архитектуры
  • Google и Meta (запрещена в РФ) рассказали о фреймворке для автоматического поиска стратегий масштабирования моделей во время инференса
  • Google анонсировала Gemini Intelligence — мультимодального агента для автоматизации рутинных задач
  • Baidu выпустила Ernie 5.1 с улучшенными агентными функциями и AI-агента DuMate для управления приложениями и работы с файлами

Новости представлены аналитическим центром red_mad_robot.

Похожие записи

Как отличить ИИ-картинку среди настоящих: браузерная игра от Google покоряет пользователей

admin

Google выпустила бесплатный ИИ-переводчик: можно запустить без интернета

admin

Российский ИИ признали отстающим от зарубежных разработок

admin