Сразу две истории из сферы регулирования ИИ бьют по одному и тому же слабому месту отрасли: многие команды до сих пор относятся к персональным данным как к удобному сырью, а не как к объекту жестких обязательств. Ниже — что произошло и какие практические последствия это несет для разработчиков и компаний.
Сингапур вынес на обсуждение проект правил по использованию персональных данных в генеративном ИИ
Сингапурская Комиссия по защите персональных данных открыла консультацию по проекту рекомендаций, который распространяет требования приватности на весь жизненный цикл генеративного ИИ: от разработки и тестирования до внедрения и закупки. На практике это означает более предметный контроль над тем, действительно ли данные были общедоступными, насколько явно пользователям объяснили их использование в системах ИИ и какие меры есть для сокращения объема данных, прозрачности и снижения вреда от ошибок и предвзятости модели.
Для команд это сигнал готовить доказательную базу заранее: откуда взялись данные, почему их можно использовать, какие ограничения действуют и как устроены защитные меры. Если продукт опирается на пользовательские загрузки, открытые наборы данных или массовый сбор из сети, вопросы к обоснованности и качеству согласия будут только жестче.
Канадские регуляторы сочли обучение ChatGPT нарушением правил приватности
Канадские регуляторы по защите данных пришли к выводу, что GPT-3.5 и GPT-4 обучались на огромных массивах персональных данных, включая потенциально чувствительную информацию, без внятного уведомления людей, без согласия, без удобных механизмов исправления и без достаточных мер защиты приватности на уровне проектирования.
Практический вывод для компаний, работающих в Канаде или с канадскими пользователями, простой: публичные данные больше нельзя считать автоматическим разрешением на обучение модели. Нужны понятное правовое основание, процессы удаления и исправления данных, а также управление рисками, когда система может выдавать неверную или чувствительную информацию о конкретных людях.
Обе истории подталкивают рынок к одной норме: мало просто собрать данные и построить модель. Теперь придется доказывать, что данные получены и используются законно, а у людей есть реальный способ понять, оспорить и ограничить работу таких систем.
Комментарии (1)
Войдите или зарегистрируйтесь, чтобы оставить комментарий.
Самое тревожное здесь не в штрафах, а в том, что правила пытаются догнать практику уже после массового сбора данных. Пока компании спорят, что считать общедоступным, модели успевают впитать биографии, переписки и ошибки миллионов людей, а обратного хода у такого обучения почти нет.