IT'S NEW IT'S NEW

Поиск

Anthropic обновляет Claude Managed Agents: Dreaming, outcomes и многоагентная оркестрация для корпоративных решений

Anthropic обновляет Claude Managed Agents: Dreaming, outcomes и многоагентная оркестрация для корпоративных решений
5 минут

Dreaming — фоновый процесс для улучшения памяти агентов

Одним из самых значимых нововведений является функция Dreaming — фоновый процесс, который перерабатывает память агента между рабочими сессиями. Эта функция разработана для решения одной из самых сложных проблем в агентных системах: неспособность эффективно переносить опыт с одной задачи на другую.

Как работает Dreaming

Dreaming работает по принципу планового анализа прошлых сессий агента и его хранилищ памяти. Этот процесс:
  • Просматривает историю взаимодействий агента
  • Выявляет повторяющиеся шаблоны поведения
  • Извлекает выводы из успешных и провальных решений
  • Обновляет внутреннюю память агента на основе этих инсайтов
Разработчики имеют возможность выбрать между двумя режимами работы:
  • Автоматическое обновление памяти без вмешательства человека
  • Предварительная ручная проверка предлагаемых изменений перед их применением

Практические преимущества Dreaming

Реальные бизнес-сценарии показывают, что Dreaming может значительно повысить эффективность агентов. Например:
  • В юридической платформе Harvey после внедрения Dreaming показатель завершения задач вырос примерно в шесть раз
  • Агенты научились запоминать эффективные обходные приемы при работе с различными форматами файлов
  • Разработчики отмечают улучшение качества обработки сложных документов за счет накопления опыта
Важно отметить, что функция Dreaming находится в статусе research preview (предварительный исследовательский доступ) и предоставляется по запросу через Claude Platform. Это означает, что Anthropic еще тестирует эту функцию и собирает обратную связь от ранних пользователей.

Outcomes — система оценки качества работы агентов

Вторым значимым обновлением является система outcomes, которая выступает в роли внешнего оценщика с собственным контекстом. Эта функция позволяет разработчикам задавать четкие критерии качества, по которым будет оцениваться работа агента.

Как работает система outcomes

Процесс оценки outcomes включает следующие шаги:
  1. Разработчик определяет рубрику качества: какие требования должен удовлетворять результат
  2. Устанавливает планку качества и критерии соответствия
  3. Отдельный оценщик проверяет ответ агента в изолированном контекстном окне
  4. Если результат не соответствует критериям, оценщик указывает на необходимые исправления
  5. Агент делает новую попытку с учетом полученных рекомендаций

Применение outcomes в реальных сценариях

Особенно полезна outcomes в тех областях, где важны:
  • Полнота и структурированность информации
  • Соответствие внутренним правилам и стандартам
  • Точность и надежность данных
Типичные примеры использования:
  • Создание отчетов и презентаций
  • Подготовка юридических документов
  • Разработка редакционных материалов
  • Автоматизация технической документации

Эффективность outcomes

Согласно внутренним тестам Anthropic, внедрение outcomes привело к значительному улучшению качества результатов:
  • Для генерации файлов docx — прирост успешности на 8,4%
  • Для создания презентаций pptx — улучшение на 10,1%
Стоит отметить, что эти данные предоставлены самим разработчиком, и независимой проверки в публичном доступе пока нет.

Многоагентная оркестрация — распределение задач между специализированными агентами

Третьим важным компонентом обновления является многоагентная оркестрация, которая позволяет одному главному агенту управлять несколькими специализированными подагентами.

Принципы многоагентной работы

Ключевые особенности подхода:
  • Разбиение сложной задачи на более мелкие подзадачи
  • Назначение каждой подзадачи специализированному агенту
  • Параллельная работа нескольких агентов
  • Централизованное объединение результатов

Практический пример оркестрации

Anthropic приводит пример использования оркестрации для расследования технической проблемы:
  1. Главный агент получает запрос о сбое в системе
  2. Одновременно отправляет нескольких подагентов для сбора информации:
    • Один агент анализирует историю деплоев
    • Второй изучает журналы ошибок
    • Третий проверяет метрики производительности
    • Четвертый просматривает обращения в техподдержку
  3. Все агенты работают параллельно в общей файловой среде
  4. Главный агент собирает результаты и выделяет закономерности

Важность трассировки действий

В Claude Console разработчики могут отслеживать:
  • Какие действия выполнил каждый агент
  • В каком порядке выполнялись задачи
  • По какой причине были приняты те или иные решения
Эта прозрачность критически важна для корпоративных внедрений, так как:
  • Предотвращает превращение агентной автоматизации в «черный ящик»
  • Позволяет быстро находить и исправлять ошибки
  • Обеспечивает аудиторский контроль за действиями агентов

Реальные кейсы внедрения

Anthropic приводит несколько примеров успешного использования обновленных функций Managed Agents в реальных компаниях.

Harvey — юридическая платформа

Компания Harvey протестировала Dreaming на обработке длинных юридических документов и черновиков. Агенты научились:
  • Запоминать эффективные приемы работы с различными форматами файлов
  • Развивать шаблоны взаимодействия с конкретными инструментами
  • Улучшать качество обработки сложных юридических документов
Результат: показатель завершения задач вырос примерно в шесть раз.

Netflix — платформенная команда

Инженеры Netflix построили агента для анализа логов из сотен сборок программного обеспечения. В этом сценарии ценность представляют не отдельные сбои, а:
  • Поиск повторяющихся проблем
  • Выявление паттернов, затрагивающих тысячи приложений
  • Оптимизация процесса поиска и устранения ошибок
Многоагентная схема позволяет распараллелить разбор логов и выделять только значимые паттерны.

Spiral — платформа Every

Компания Spiral использует оркестрацию и outcomes для создания пишущего агента в своих API и CLI. Архитектура решения:
  • Ведущий агент работает на модели Haiku
  • Задает уточняющие вопросы пользователя
  • Передает черновики подагентам на модели Opus
  • Качество проверяется по редакционным принципам Every
Особенность: система подтягивает голос пользователя и стиль из памяти для соответствия брендбуку.

Wisedocs — платформа для проверки качества документов

Компания Wisedocs внедрила агента для автоматической проверки качества документации. Результаты внедрения:
  • Проверки документов выполняются на 50% быстрее
  • Сохраняется точность соответствия внутренним правилам команды
  • Сокращается время на ручную модерацию контента

Эволюция Claude Managed Agents

Claude Managed Agents вышли в public beta 8 апреля 2026 года как набор API для создания облачных агентов с управляемой инфраструктурой. Ключевые компоненты платформы:
  • Песочница для безопасного выполнения кода
  • Поддержка длительных рабочих сессий
  • Система управления разрешениями
  • Трасировка действий агента
  • Набор инструментов для взаимодействия с внешними системами
23 апреля 2026 года Anthropic добавила встроенную память для Managed Agents в виде файлов, которые разработчики могут экспортировать, читать и изменять через API. Майское обновление надстраивается над этой памятью, позволяя агенту периодически возвращаться к накопленному опыту и обновлять память самостоятельно.

Сдвиг в подходе Anthropic

В обновлении Managed Agents виден стратегический сдвиг в подходе Anthropic:
  • От «умного чат-бота» как отдельного продукта
  • К инфраструктурному слою для длительной агентной работы
Ключевые элементы этого слоя:
  • Память для сохранения опыта между сессиями
  • Система контроля качества работы
  • Механизмы распределения задач
  • Уведомления о важных событиях
  • Аудит действий агента

Открытые вопросы и перспективы

Несмотря на впечатляющие результаты, остаются вопросы и зоны для дальнейшего развития.

Вопросы к эффективности

Приведенные в анонсе цифры (шестикратный рост Harvey, приросты outcomes) выглядят убедительно, но:
  • Завязаны на конкретные сценарии использования
  • Зависят от настроек и методики измерения
  • Могут отличаться в широком применении

Управленческие риски

Автоматическое обновление памяти несет потенциальные риски:
  • Агент может закреплять как успешные, так и ошибочные практики
  • Требуется тщательный мониторинг и контроль за изменениями
  • Важно сохранение баланса между автоматизацией и человеческим контролем
Ручной режим проверки изменений в Dreaming может оказаться важнее, чем предполагается в маркетинговых материалах.

Будущее развитие

Для разработчиков главный сигнал ясен: конкуренция в области агентных платформ смещается с мощности модели к качеству инфраструктурного слоя вокруг нее. Ключевые направления развития:
  • Улучшение механизмов памяти и обучения
  • Развитие систем оценки качества работы
  • Упрощение процессов оркестрации множества агентов
  • Усиление прозрачности и контроля действий
Anthropic делает ставку именно на этот слой инфраструктуры, который позволит ИИ-агентам эффективно работать в корпоративной среде в течение длительного времени, решая сложные задачи и постоянно улучшая свои на основе накопленного опыта.
09:01
41
Поделиться:
0
Recovery Recovery 13 дней назад #
Интересно, как Anthropic снова обещает волшебные решения для корпораций. Dreaming - очередной фич, который должен решить вечную проблему с памятью агентов. Посмотрим, как это будет работать в реальности.
0
Satoshi Satoshi 11 дней назад #
Звучит как попытка решить проблему переноса опыта между сессиями. Наши разработчики давно этим занимаются, но Anthropic явно движется в верном направлении.
Оставаясь на сайте, вы соглашаетесь с Политикой в отношении cookie. Если не согласны, покиньте сайт.