Сразу две истории из сферы регулирования ИИ бьют по одному и тому же слабому месту отрасли: многие команды до сих пор относятся к персональным данным как к удобному сырью, а не как к объекту жестких обязательств. Ниже — что произошло и какие практические последствия это несет для разработчиков и компаний.

Сингапур вынес на обсуждение проект правил по использованию персональных данных в генеративном ИИ

Сингапурская Комиссия по защите персональных данных открыла консультацию по проекту рекомендаций, который распространяет требования приватности на весь жизненный цикл генеративного ИИ: от разработки и тестирования до внедрения и закупки. На практике это означает более предметный контроль над тем, действительно ли данные были общедоступными, насколько явно пользователям объяснили их использование в системах ИИ и какие меры есть для сокращения объема данных, прозрачности и снижения вреда от ошибок и предвзятости модели.

Для команд это сигнал готовить доказательную базу заранее: откуда взялись данные, почему их можно использовать, какие ограничения действуют и как устроены защитные меры. Если продукт опирается на пользовательские загрузки, открытые наборы данных или массовый сбор из сети, вопросы к обоснованности и качеству согласия будут только жестче.

Канадские регуляторы сочли обучение ChatGPT нарушением правил приватности

Канадские регуляторы по защите данных пришли к выводу, что GPT-3.5 и GPT-4 обучались на огромных массивах персональных данных, включая потенциально чувствительную информацию, без внятного уведомления людей, без согласия, без удобных механизмов исправления и без достаточных мер защиты приватности на уровне проектирования.

Практический вывод для компаний, работающих в Канаде или с канадскими пользователями, простой: публичные данные больше нельзя считать автоматическим разрешением на обучение модели. Нужны понятное правовое основание, процессы удаления и исправления данных, а также управление рисками, когда система может выдавать неверную или чувствительную информацию о конкретных людях.

Обе истории подталкивают рынок к одной норме: мало просто собрать данные и построить модель. Теперь придется доказывать, что данные получены и используются законно, а у людей есть реальный способ понять, оспорить и ограничить работу таких систем.