Anthropic обновляет Claude Managed Agents: Dreaming, outcomes и многоагентная оркестрация для корпоративных решений
5 минут
Dreaming — фоновый процесс для улучшения памяти агентов
Одним из самых значимых нововведений является функция Dreaming — фоновый процесс, который перерабатывает память агента между рабочими сессиями. Эта функция разработана для решения одной из самых сложных проблем в агентных системах: неспособность эффективно переносить опыт с одной задачи на другую.Как работает Dreaming
Dreaming работает по принципу планового анализа прошлых сессий агента и его хранилищ памяти. Этот процесс:- Просматривает историю взаимодействий агента
- Выявляет повторяющиеся шаблоны поведения
- Извлекает выводы из успешных и провальных решений
- Обновляет внутреннюю память агента на основе этих инсайтов
- Автоматическое обновление памяти без вмешательства человека
- Предварительная ручная проверка предлагаемых изменений перед их применением
Практические преимущества Dreaming
Реальные бизнес-сценарии показывают, что Dreaming может значительно повысить эффективность агентов. Например:- В юридической платформе Harvey после внедрения Dreaming показатель завершения задач вырос примерно в шесть раз
- Агенты научились запоминать эффективные обходные приемы при работе с различными форматами файлов
- Разработчики отмечают улучшение качества обработки сложных документов за счет накопления опыта
Outcomes — система оценки качества работы агентов
Вторым значимым обновлением является система outcomes, которая выступает в роли внешнего оценщика с собственным контекстом. Эта функция позволяет разработчикам задавать четкие критерии качества, по которым будет оцениваться работа агента.Как работает система outcomes
Процесс оценки outcomes включает следующие шаги:- Разработчик определяет рубрику качества: какие требования должен удовлетворять результат
- Устанавливает планку качества и критерии соответствия
- Отдельный оценщик проверяет ответ агента в изолированном контекстном окне
- Если результат не соответствует критериям, оценщик указывает на необходимые исправления
- Агент делает новую попытку с учетом полученных рекомендаций
Применение outcomes в реальных сценариях
Особенно полезна outcomes в тех областях, где важны:- Полнота и структурированность информации
- Соответствие внутренним правилам и стандартам
- Точность и надежность данных
- Создание отчетов и презентаций
- Подготовка юридических документов
- Разработка редакционных материалов
- Автоматизация технической документации
Эффективность outcomes
Согласно внутренним тестам Anthropic, внедрение outcomes привело к значительному улучшению качества результатов:- Для генерации файлов docx — прирост успешности на 8,4%
- Для создания презентаций pptx — улучшение на 10,1%
Многоагентная оркестрация — распределение задач между специализированными агентами
Третьим важным компонентом обновления является многоагентная оркестрация, которая позволяет одному главному агенту управлять несколькими специализированными подагентами.Принципы многоагентной работы
Ключевые особенности подхода:- Разбиение сложной задачи на более мелкие подзадачи
- Назначение каждой подзадачи специализированному агенту
- Параллельная работа нескольких агентов
- Централизованное объединение результатов
Практический пример оркестрации
Anthropic приводит пример использования оркестрации для расследования технической проблемы:- Главный агент получает запрос о сбое в системе
- Одновременно отправляет нескольких подагентов для сбора информации:
- Один агент анализирует историю деплоев
- Второй изучает журналы ошибок
- Третий проверяет метрики производительности
- Четвертый просматривает обращения в техподдержку
- Все агенты работают параллельно в общей файловой среде
- Главный агент собирает результаты и выделяет закономерности
Важность трассировки действий
В Claude Console разработчики могут отслеживать:- Какие действия выполнил каждый агент
- В каком порядке выполнялись задачи
- По какой причине были приняты те или иные решения
- Предотвращает превращение агентной автоматизации в «черный ящик»
- Позволяет быстро находить и исправлять ошибки
- Обеспечивает аудиторский контроль за действиями агентов
Реальные кейсы внедрения
Anthropic приводит несколько примеров успешного использования обновленных функций Managed Agents в реальных компаниях.Harvey — юридическая платформа
Компания Harvey протестировала Dreaming на обработке длинных юридических документов и черновиков. Агенты научились:- Запоминать эффективные приемы работы с различными форматами файлов
- Развивать шаблоны взаимодействия с конкретными инструментами
- Улучшать качество обработки сложных юридических документов
Netflix — платформенная команда
Инженеры Netflix построили агента для анализа логов из сотен сборок программного обеспечения. В этом сценарии ценность представляют не отдельные сбои, а:- Поиск повторяющихся проблем
- Выявление паттернов, затрагивающих тысячи приложений
- Оптимизация процесса поиска и устранения ошибок
Spiral — платформа Every
Компания Spiral использует оркестрацию и outcomes для создания пишущего агента в своих API и CLI. Архитектура решения:- Ведущий агент работает на модели Haiku
- Задает уточняющие вопросы пользователя
- Передает черновики подагентам на модели Opus
- Качество проверяется по редакционным принципам Every
Wisedocs — платформа для проверки качества документов
Компания Wisedocs внедрила агента для автоматической проверки качества документации. Результаты внедрения:- Проверки документов выполняются на 50% быстрее
- Сохраняется точность соответствия внутренним правилам команды
- Сокращается время на ручную модерацию контента
Эволюция Claude Managed Agents
Claude Managed Agents вышли в public beta 8 апреля 2026 года как набор API для создания облачных агентов с управляемой инфраструктурой. Ключевые компоненты платформы:- Песочница для безопасного выполнения кода
- Поддержка длительных рабочих сессий
- Система управления разрешениями
- Трасировка действий агента
- Набор инструментов для взаимодействия с внешними системами
Сдвиг в подходе Anthropic
В обновлении Managed Agents виден стратегический сдвиг в подходе Anthropic:- От «умного чат-бота» как отдельного продукта
- К инфраструктурному слою для длительной агентной работы
- Память для сохранения опыта между сессиями
- Система контроля качества работы
- Механизмы распределения задач
- Уведомления о важных событиях
- Аудит действий агента
Открытые вопросы и перспективы
Несмотря на впечатляющие результаты, остаются вопросы и зоны для дальнейшего развития.Вопросы к эффективности
Приведенные в анонсе цифры (шестикратный рост Harvey, приросты outcomes) выглядят убедительно, но:- Завязаны на конкретные сценарии использования
- Зависят от настроек и методики измерения
- Могут отличаться в широком применении
Управленческие риски
Автоматическое обновление памяти несет потенциальные риски:- Агент может закреплять как успешные, так и ошибочные практики
- Требуется тщательный мониторинг и контроль за изменениями
- Важно сохранение баланса между автоматизацией и человеческим контролем
Будущее развитие
Для разработчиков главный сигнал ясен: конкуренция в области агентных платформ смещается с мощности модели к качеству инфраструктурного слоя вокруг нее. Ключевые направления развития:- Улучшение механизмов памяти и обучения
- Развитие систем оценки качества работы
- Упрощение процессов оркестрации множества агентов
- Усиление прозрачности и контроля действий
Recovery
13 дней назад
#
Satoshi
11 дней назад
#