AI учится самостоятельной работе с данными. Нейроновости недели

Аналитический центр red_mad_robot рассказывает и комментирует главные новости индустрии за неделю с 4 по 10 маяСтарший стратегический аналитик red_mad_robotAI-агентыРекурсивностьТакже на неделеAI-агентыРекурсивностьТакже на неделеЕще

AI-агенты в роли специалистов

Meta FAIR (запрещена в РФ) представила Autodata: фреймворк, в котором AI-агенты выполняют роль специалиста по данным. Они самостоятельно создают, проверяют и улучшают датасеты для обучения моделей — без разметки со стороны людей.

Основная реализация называется Agentic Self-Instruct и работает как непрерывный цикл из четырех подагентов:

Challenger генерирует сложные задания на основе источников
Weak Solver решает их с помощью менее мощной модели и задает нижнюю границу качества
Strong Solver решает те же задачи с более сильной моделью и формирует верхнюю границу
Verifier/Judge затем оценивает ответы обоих по заранее заданной рубрике

Главный сигнал — разница между слабым и сильным солвером. Хорошие задачи те, где слабый ошибается, а сильный справляется. Именно такие примеры дают лучший обучающий сигнал, и система специально оптимизирует генерацию под этот критерий.

Оркестратор запускает циклы: генерация данных → оценка → анализ ошибок → обновление стратегии → повторение. Дополнительно реализована мета-оптимизация: система улучшает не только данные, но и сам процесс их создания.

Эксперименты показывают, что такой подход сильно превосходит стандартный Self-Instruct: дает более различающие данные (разрыв 34 п.п. против 1,9) и улучшает сам себя со временем (рост успешности с 12,8% до 42,4% за 126 итераций).

Почему это важно: важнее становится не разовая разметка датасетов, а непрерывный цикл, где автономные системы постоянно генерируют, проверяют и уточняют данные. Вместо статичных наборов появляются «живые» датасеты, которые эволюционируют вместе с системой. Это основа для более надежных корпоративных AI-агентов и автономных сервисов.

Читать далее:

Коллективный интеллект без коллектива. Нейроновости недели

Рекурсивность вместо размеров

NVIDIA, MIT и Stanford предлагают RecursiveMAS: мультиагентную систему, где агенты взаимодействуют не через текст, а через рекурсивные вычисления в общем латентном пространстве.

Вся система рассматривается как единый процесс: каждый агент выступает как слой рекурсивной модели и передает не слова, а скрытые представления. Для обмена используется RecursiveLink — он передает латентные состояния напрямую между агентами, убирая необходимость кодировать и декодировать текст на каждом шаге.

Обучение происходит в двух контурах: внутренний обновляет латентные состояния шаг за шагом, внешний распределяет вклад каждого агента в общий результат.

Почему это важно: вместо увеличения размера моделей предлагается развивать рекурсивную координацию внутри латентного пространства. Это уменьшает задержки и затраты в мультиагентных системах и объединяет отдельные модели в единый непрерывный процесс. В экспериментах на девяти бенчмарках подход повышает точность в среднем на 8,3% и сокращает использование токенов до 75%.

Также на неделе:

Huawei предлагает open-source фреймворк OneManCompany — мультиагентные системы как самоорганизующиеся организации для решения реальных задач
Alibaba показала MoE-модель AgenticQwen на 30 млрд параметров, из которых активны только 3 млрд — по качеству приближается к гораздо более крупной Qwen3−235B
Ряд международных институтов подготовил обзор с системной классификацией моделей мира (world models) для AI-агентов
Anthropic представила решение Model Spec Midtraining — решение, которое помогает моделям и AI-агентам лучше следовать заданным ценностям
OpenAI выпустила голосовые модели для AI-агентов
Anthropic добавила в платформу Claude Managed Agents функцию Dreaming — агенты в фоновом режиме анализируют завершенные сессии и оркестрацию субагентов

Новости представлены аналитическим центром red_mad_robot.

AI учится самостоятельной работе с данными. Нейроновости недели

AI-агенты в роли специалистов

Рекурсивность вместо размеров

Также на неделе:

Второй закрытый бета-тест Rust Mobile проведут в «русскоязычном регионе»

Прецедент или галлюцинация

В РФ создали систему, предсказывающую загрузку парковок на этапе проектирования

Моддер разблокировал показатель hotspot в графических процессорах RTX 50

«Уэбб» помог изучить атмосферу планеты, пережившей смерть своей звезды

AI учится самостоятельной работе с данными. Нейроновости недели

AI-агенты в роли специалистов

Рекурсивность вместо размеров

Также на неделе:

Похожие записи