Microsoft будет обучать ИИ на вашем коде
GitHub с 24 апреля начнёт использовать данные пользователей для обучения своих ИИ-моделей. Inputs, outputs, сниппеты кода, контекст вокруг курсора, имена файлов, структура репозиториев, чаты с Copilot, фидбек — всё идёт в обучающую выборку.
Корпоративщиков, студентов и учителей пока не трогают, а вот всех остальных перевели на хитрую систему opt-out. Хотите сохранить приватность, идите в настройки и ручками снимайте галочку. Главный продуктовый офицер GitHub Марио Родригес очень просит этого не делать: мол, ваши данные помогут модели «лучше понимать рабочие процессы и ловить баги до продакшена». Для оправдания ссылается на Anthropic, JetBrains и Microsoft — «все так делают».
Впрочем, Codex, на котором работает Copilot, изначально обучался на публичном коде с GitHub. Теперь GitHub просто делает это официально и с галочкой в настройках.




