AI Monkey Blog

Сингапур вынес на обсуждение проект правил по использованию персональных данных в генеративном ИИ, а канадские регуляторы пришли к выводу, что обучение GPT-3.5 и GPT-4 нарушило требования приватности. Для команд, которые строят или внедряют ИИ, это еще один сигнал: опора на публичные данные без четкого правового основания, процедур исправления и понятных ограничений по использованию становится все рискованнее.

Сразу две истории из сферы регулирования ИИ бьют по одному и тому же слабому месту отрасли: многие команды до сих пор относятся к персональным данным как к удобному сырью, а не как к объекту жестких обязательств. Ниже — что произошло и какие практические последствия это несет для разработчиков и компаний.

Сингапур вынес на обсуждение проект правил по использованию персональных данных в генеративном ИИ

Сингапурская Комиссия по защите персональных данных открыла консультацию по проекту рекомендаций, который распространяет требования приватности на весь жизненный цикл генеративного ИИ: от разработки и тестирования до внедрения и закупки. На практике это означает более предметный контроль над тем, действительно ли данные были общедоступными, насколько явно пользователям объяснили их использование в системах ИИ и какие меры есть для сокращения объема данных, прозрачности и снижения вреда от ошибок и предвзятости модели.

Для команд это сигнал готовить доказательную базу заранее: откуда взялись данные, почему их можно использовать, какие ограничения действуют и как устроены защитные меры. Если продукт опирается на пользовательские загрузки, открытые наборы данных или массовый сбор из сети, вопросы к обоснованности и качеству согласия будут только жестче.

Канадские регуляторы сочли обучение ChatGPT нарушением правил приватности

Канадские регуляторы по защите данных пришли к выводу, что GPT-3.5 и GPT-4 обучались на огромных массивах персональных данных, включая потенциально чувствительную информацию, без внятного уведомления людей, без согласия, без удобных механизмов исправления и без достаточных мер защиты приватности на уровне проектирования.

Практический вывод для компаний, работающих в Канаде или с канадскими пользователями, простой: публичные данные больше нельзя считать автоматическим разрешением на обучение модели. Нужны понятное правовое основание, процессы удаления и исправления данных, а также управление рисками, когда система может выдавать неверную или чувствительную информацию о конкретных людях.

Обе истории подталкивают рынок к одной норме: мало просто собрать данные и построить модель. Теперь придется доказывать, что данные получены и используются законно, а у людей есть реальный способ понять, оспорить и ограничить работу таких систем.

Комментарии (1)

Войдите или зарегистрируйтесь, чтобы оставить комментарий.

Сева Думеров

1 hour ago

Самое тревожное здесь не в штрафах, а в том, что правила пытаются догнать практику уже после массового сбора данных. Пока компании спорят, что считать общедоступным, модели успевают впитать биографии, переписки и ошибки миллионов людей, а обратного хода у такого обучения почти нет.

Сингапур готовит правила для персональных данных в генеративном ИИ

Сингапур вынес на обсуждение проект правил по использованию персональных данных в генеративном ИИ

Канадские регуляторы сочли обучение ChatGPT нарушением правил приватности

Комментарии (1)