Четыре революционные разработки Сбера на ICLR 2026: от ИИ до инженерных расчетов
30 апреля 2026 года на престижной конференции ICLR 2026 в Рио-де-Жанейро российские исследователи из Сбера совместно с коллегами из AIRI и Сколтеха представили четыре научные работы, вызвавшие большой интерес мирового сообщества. Международная конференция ICLR (International Conference on Learning Representations) считается одной из главных мировых площадок по машинному обучению, и участие российской команды на основном треке конференции стало значимым событием в мире технологий.
Представленные работы охватывают ключевые направления современного искусственного интеллекта: от оценки языкового понимания до обработки видео. Важно отметить, что за этими исследованиями не стоит конкретный продукт — скорее это демонстрация широты научного подхода Сбера и его вклада в развитие глобального ИИ-сообщества.
Тест HUME: кто лучше понимает текст — человек или машина?
В сотрудничестве с международными исследователями команда Сбера разработала инновационный бенчмарк HUME — инструмент для сравнения того, как люди и языковые модели справляются с анализом текста. Тест включает четыре основных типа задач: классификацию текстов, кластеризацию, поиск похожих документов и ранжирование.
Результаты исследования оказались неоднозначными и во многом неожиданными. В среднем люди продемонстрировали точность 77,6%, в то время как лучшие ИИ-модели достигли показателя 80,1%. Формально это означает, что машина превосходит человека в анализе текста.
Однако при более детальном исследовании стало очевидно: на задачах с использованием сложных языковых конструкций, иронии, метафор и тонких смысловых различий человек остается точнее. Это подчеркивает, что современные нейросети все еще не полностью освоили нюансы человеческого языка.
Особенно интересным аспектом исследования стало обнаружение того, что сами люди часто расходятся во мнениях о правильных ответах в тесте HUME. Это создает серьезную проблему при обучении ИИ-моделей — они запоминают противоречивые шаблоны и воспроизводят их в своих ответах.
Авторы предлагают использовать HUME не только для измерения производительности, но и как инструмент аудита качества обучающих данных. Такой подход может помочь выявить слабые места в существующих тестах и улучшить методы обучения языковых моделей.
Практическое значение HUME
- Помогает разработчикам ИИ выявлять области, где модели обучаются на противоречивых данных
- Позволяет создавать более качественные тесты для оценки языковых моделей
- Может использоваться в образовательных целях для понимания сильных и слабых сторон ИИ
- Служит основой для разработки новых методов обучения, учитывающих человеческие особенности восприятия текста
Clip-SGD: обучить один раз и получить предсказуемый результат
Вторая работа, принятая на основной трек ICLR 2026, посвящена одной из самых актуальных проблем в машинном обучении — устойчивости нейросетей. Проблема заключается в том, что случайные факторы, такие как инициализация весов или порядок подачи данных, могут приводить к заметно разным результатам обучения от одного запуска к другому.
В реальных условиях это означает необходимость многократного повторения тренировочного процесса с последующим усреднением результатов. Такой подход не только увеличивает вычислительные затраты, но и замедляет разработку и внедрение ИИ-решений.
Авторы исследования провели глубокий математический анализ метода Clip-SGD — алгоритма градиентного спуска с ограничением на размер шага. Особенность их подхода заключается в применении этого метода к последней итерации обучения, а не к усредненному результату по всем итерациям.
Результаты исследования令人印象深刻: удалось доказать, что модель, обученная с использованием Clip-SGD, демонстрирует стабильные и воспроизводимые результаты, даже при изменении начальных условий. Это открывает новые возможности для практического применения нейросетей.
Применение Clip-SGD в промышленности
Для промышленного применения этот метод может иметь революционное значение. В областях, где ошибки могут привести к серьезным последствиям, предсказуемость работы ИИ-систем критически важна:
- Медицинская диагностика: в системах, помогающих врачам ставить диагноз, нестабильность результатов может привести к неверным медицинским заключениям
- Автономные транспортные средства: системы управления транспортными средствами должны работать стабильно в любых условиях
- Финансовые услуги: в алгоритмах трейдинга или оценке кредитных рисков предсказуемость результатов напрямую влияет на финансовую безопасность
- Критические инфраструктурные системы: управления энергетическими сетями или системами безопасности
Если метод Clip-SGD подтвердит свою эффективность на практике в этих областях, это может привести к значительному снижению затрат на разработку и валидацию моделей, а также повысить доверие к ИИ-решениям в критически важных отраслях.
Геометрия Грассмана для ускорения инженерных расчетов
В третьей работе команда Сбера совместно с AIRI и Сколтехом предложила инновационный подход к ускорению моделирования сложных систем. В основе метода лежит использование математического аппарата геометрии Грассмана — раздела математики, который изучает пространства подпространств и их свойства.
Вместо того чтобы выполнять полный расчет с нуля для каждого нового сценария, система, разработанная исследователями, способна предсказывать структуру решения задачи на основе ее параметров, используя уже изученные примеры. Это похоже на то, как инженер может быстро оценить решение, опираясь на предыдущий опыт.
Согласно данным авторов, такой подход позволяет сократить количество ошибок на 10-30% в задачах моделирования дифференциальных уравнений, оптимизации и управления сложными системами. При этом время расчетов значительно сокращается, что особенно важно для систем, требующих реального времени обработки.
Сферы применения геометрического подхода
Авторы исследования выделили несколько ключевых отраслей, где их метод может найти наибольшее применение:
- Нефтегазовая промышленность: моделирование пластов, прогнозирование добычи, оптимизация процессов
- Авиация и космос: расчет аэродинамических характеристик, проектирование летательных аппаратов
- Финансовый сектор: оценка рисков, оптимизация инвестиционных портфелей, прогнозирование рыночных трендов
- Энергетика: управление распределенными сетями, прогнозирование нагрузки
- Биоинформатика: анализ сложных биологических систем, предсказание структур белков
Общей чертой всех этих областей является необходимость выполнения сложных вычислений в условиях ограниченных временных ресурсов и где ошибки могут иметь серьезные последствия. Ускорение расчетов без потери точности — ключевая конкурентная преимущество для компаний, работающих в этих сферах.
Плавное видео без артефактов: новая методика обработки
На отдельном воркшопе конференции ICLR 2026 Сбер, AIRI и Сколтех представили инновационную модель для улучшения качества видео. Ключевое отличие предложенного подхода от существующих методов заключается в том, что вместо покадрового анализа модель учитывает взаимосвязь между соседними кадрами и восстанавливает логику движения объектов во времени.
Современные методы обработки видео часто работают с каждым кадром независимо, что приводит к появлению артефактов, особенно при сжатии или обработке низкокачественного видео. Новая модель способна анализировать последовательность кадров как единое целое, что позволяет более точно предсказывать движение объектов и восстанавливать детали.
Практический эффект использования этой модели — устранение дерганий, скачков, разрывов в изображении и улучшение четкости динамических сцен. Это особенно важно для видео с высокой степенью сжатия или для старых видеоматериалов, качество которых со временем ухудшилось.
Применение видеотехнологий в реальных сценариях
Авторы исследования выделили несколько ключевых областей, где их метод может принести наибольшую пользу:
- Видеосвязь: улучшение качества видеозвонков, особенно в условиях ограниченной пропускной способности каналов
- Цифровой архив: восстановление старых киноматериалов, фотографий и видео
- Спортивные трансляции: улучшение качества трансляций в реальном времени, особенно для быстроменяющихся сцен
- Системы видеонаблюдения: повышение качества изображения для камер с низкой разрешающей способностью
- Медицинская визуализация: улучшение качества медицинских снимков и видео для более точной диагностики
- Автономные системы: улучшение качества видеовхода для систем компьютерного зрения
Особенно перспективным применение этой технологии выглядит для систем видеонаблюдения, где качество изображений часто страдает из-за ограничений пропускной способности или недостаточного освещения. Возможность улучшать качество видео без увеличения объема данных открывает новые возможности для использования в системах с ограниченными ресурсами.
Наука вместо продуктов: стратегический подход Сбера
Представление четырех научных работ без конкретных продуктов может показаться странным с точки зрения коммерческой перспективы. Однако для Сбера это стратегический шаг, направленный на укрепление позиций как технологического лидера и научного центра.
Сбер подал эти разработки под тезисом «полезный и надёжный ИИ» — широкая формулировка, намеренно охватывающая различные аспекты искусственного интеллекта. За конференцией компания также организовала нетворкинг-митап на 200 участников из США, ОАЭ, Индии и других стран, где продемонстрировала свои коммерческие продукты GigaChat и Kandinsky.
Четыре академические работы — это хорошая заявка на научную состоятельность Сбера и его исследовательских партнеров. Они демонстрируют способность создавать инновационные технологии, которые могут конкуриров с лучшими мировыми разработками.
Перспективы коммерциализации разработок
Хотя представленные работы находятся на ранней стадии, некоторые из них уже имеют явный коммерческий потенциал:
- Clip-SGD: метод устойчивого обучения может быть внедрен в продуктовые решения Сбера в области ИИ для повышения надежности систем
- Геометрический метод: уже обсуждается применение в корпоративных решениях для промышленных предприятий
- HUME: может стать основой для нового поколения сервисов, оценивающих качество языковых моделей
- Видеотехнологии: перспективны для использования в медиасервисах и системах безопасности
Наибольшие шансы на коммерциализацию, по мнению аналитиков, у метода Clip-SGD и геометрического подхода к моделированию. В этих разработках уже есть измеримые результаты и понятные отраслевые сценарии применения. HUME интересен как исследовательский инструмент, но его судьба будет зависеть от того, примет ли его мировое сообщество в качестве стандарта оценки языковых моделей. Видеомодель пока представлена только на воркшопе, а не на основном треке конференции.
Вне зависимости от того, какие из этих разработок дойдут до коммерческих продуктов, их представление на ICLR 2026 укрепляет позиции Сбера как глобального игрока в области искусственного интеллекта и демонстрирует способность российских ученых конкурировать на мировом уровне.
Конфетка
15 дней назад
#