Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 4 по 10 маяСтарший стратегический аналитик red_mad_robotAI-агентыРекурсивностьТакже на неделеAI-агентыРекурсивностьТакже на неделеЕще
AI-агенты в роли специалистов
Meta FAIR (запрещена в РФ) представила Autodata: фреймворк, в котором AI-агенты выполняют роль специалиста по данным. Они самостоятельно создают, проверяют и улучшают датасеты для обучения моделей — без разметки со стороны людей.
Основная реализация называется Agentic Self-Instruct и работает как непрерывный цикл из четырех подагентов:
- Challenger генерирует сложные задания на основе источников
- Weak Solver решает их с помощью менее мощной модели и задает нижнюю границу качества
- Strong Solver решает те же задачи с более сильной моделью и формирует верхнюю границу
- Verifier/Judge затем оценивает ответы обоих по заранее заданной рубрике
Главный сигнал — разница между слабым и сильным солвером. Хорошие задачи те, где слабый ошибается, а сильный справляется. Именно такие примеры дают лучший обучающий сигнал, и система специально оптимизирует генерацию под этот критерий.
Оркестратор запускает циклы: генерация данных → оценка → анализ ошибок → обновление стратегии → повторение. Дополнительно реализована мета-оптимизация: система улучшает не только данные, но и сам процесс их создания.
Эксперименты показывают, что такой подход сильно превосходит стандартный Self-Instruct: дает более различающие данные (разрыв 34 п.п. против 1,9) и улучшает сам себя со временем (рост успешности с 12,8% до 42,4% за 126 итераций).
Почему это важно: важнее становится не разовая разметка датасетов, а непрерывный цикл, где автономные системы постоянно генерируют, проверяют и уточняют данные. Вместо статичных наборов появляются «живые» датасеты, которые эволюционируют вместе с системой. Это основа для более надежных корпоративных AI-агентов и автономных сервисов.
Рекурсивность вместо размеров
NVIDIA, MIT и Stanford предлагают RecursiveMAS: мультиагентную систему, где агенты взаимодействуют не через текст, а через рекурсивные вычисления в общем латентном пространстве.
Вся система рассматривается как единый процесс: каждый агент выступает как слой рекурсивной модели и передает не слова, а скрытые представления. Для обмена используется RecursiveLink — он передает латентные состояния напрямую между агентами, убирая необходимость кодировать и декодировать текст на каждом шаге.
Обучение происходит в двух контурах: внутренний обновляет латентные состояния шаг за шагом, внешний распределяет вклад каждого агента в общий результат.
Почему это важно: вместо увеличения размера моделей предлагается развивать рекурсивную координацию внутри латентного пространства. Это уменьшает задержки и затраты в мультиагентных системах и объединяет отдельные модели в единый непрерывный процесс. В экспериментах на девяти бенчмарках подход повышает точность в среднем на 8,3% и сокращает использование токенов до 75%.
Также на неделе:
- Huawei предлагает open-source фреймворк OneManCompany — мультиагентные системы как самоорганизующиеся организации для решения реальных задач
- Alibaba показала MoE-модель AgenticQwen на 30 млрд параметров, из которых активны только 3 млрд — по качеству приближается к гораздо более крупной Qwen3−235B
- Ряд международных институтов подготовил обзор с системной классификацией моделей мира (world models) для AI-агентов
- Anthropic представила решение Model Spec Midtraining — решение, которое помогает моделям и AI-агентам лучше следовать заданным ценностям
- OpenAI выпустила голосовые модели для AI-агентов
- Anthropic добавила в платформу Claude Managed Agents функцию Dreaming — агенты в фоновом режиме анализируют завершенные сессии и оркестрацию субагентов
Новости представлены аналитическим центром red_mad_robot.

