IT'S NEW IT'S NEW

Поиск

Новый законопроект: раскрытие происхождения данных для обучения нейросетей в России

Новый законопроект: раскрытие происхождения данных для обучения нейросетей в России
2 минуты

В России ведутся активные дискуссии о том, чтобы разработчики искусственного интеллекта (ИИ) были обязаны раскрывать подробную информацию о наборах данных, на которых обучались их модели. Это предложение входит в рамки подготовки нового законопроекта, направленного на регулирование ИИ.

Что именно будет раскрывать компания?

Предлагается создать «паспорт» каждого датасета, включающий:

  • Наименование и описание набора;
  • Формат файлов и структуру данных;
  • Объём (количество записей, размер в мегабайтах);
  • Назначение и область применения;
  • Источник происхождения и дата создания;
  • Права на использование и наличие лицензий.

Такая детализация должна повысить прозрачность разработки ИИ и облегчить проверку соблюдения авторских прав.

Как будет реализован реестр?

В обсуждении участвуют отраслевые ассоциации, крупные ИТ‑компании и профильные регуляторы. Рассматриваются два подхода:

  • Единый реестр отечественных нейросетей, где будут храниться данные о моделях и их датасетах;
  • Отдельная база данных, посвящённая исключительно наборам данных.

Оба варианта предусматривают доступ к информации для государственных органов, исследователей и общественности.

Потенциальные сложности для компаний

Крупные игроки рынка отмечают, что:

  • Документирование больших массивов информации потребует значительных ресурсов;
  • Новые требования могут замедлить цикл разработки и увеличить издержки;
  • Сложности с соблюдением конфиденциальности и коммерческой тайны.

Тем не менее, многие компании видят в этом возможность укрепить доверие потребителей и избежать юридических рисков.

Текущий статус законопроекта

Министерство цифрового развития отмечает, что в текущей рамочной версии законопроекта конкретные параметры раскрытия данных пока не прописаны. Нормы находятся на стадии проработки и будут уточнены в ближайших рабочих группах.

Что это значит для пользователей и исследователей?

Публичный доступ к паспортам датасетов позволит:

  • Проверять, какие данные использовались для обучения модели;
  • Оценивать риски нарушения авторских прав;
  • Сравнивать модели и их источники;
  • Улучшать качество и этичность ИИ.

Таким образом, инициатива направлена на повышение ответственности и прозрачности в сфере искусственного интеллекта.

Вывод

Обязательное раскрытие происхождения и характеристик датасетов — важный шаг к более справедливому и безопасному развитию ИИ в России. Хотя это может увеличить нагрузку на разработчиков, потенциальные выгоды в виде доверия, соблюдения прав и улучшения качества моделей делают предложение привлекательным для долгосрочного роста отрасли.

04:18
47
Поделиться:
Нет комментариев. Ваш будет первым!
Оставаясь на сайте, вы соглашаетесь с Политикой в отношении cookie. Если не согласны, покиньте сайт.