GitHub trainiert Copilot mit Benutzerdaten; Opt-out erforderlich

CopilotNoch eine kurzer Hinweis für Leser und Leserinnen aus dem Kreis der Entwickler, die Code auf GitHub hosten. Mir ist die Woche die Information unter die Augen gekommen, dass GitHub beim dort eingesetzten Copilot mit Nutzerdaten für das Trainieren der AI-Plattform verwenden möchte. Das passiert ab April 2026 automatisch. Wer nicht möchte, dass seine Benutzerdaten dazu verwendet werden, muss die mit Out-out kund tun.

Auf der seit 2018 von Microsoft betriebenen Coding-Plattform GitHub kommt Copilot zum Einsatz. GitHub Copilot fungiert dabei als KI-basierter Code-Assistent (siehe). Das von GitHub in Zusammenarbeit mit Microsoft und OpenAI entwickelt LLM kann dabei mit maschinellem Lernen gestützte Code-Vorschläge generieren.

Es war daher nur eine Frage der Zeit, ob und wann Microsoft damit beginnen wird, das LLM mit den auf der Plattform vorhandenen Daten zu trainieren. Nun ist es soweit, die  betreffende Information ist mir die Woche über verschiedene Medien untergekommen.

GitHub-Copilot

Obige Tweets auf BlueSky fassen es bereits zusammen. GitHub hat seinen Benutzern wohl per E-Mail mitgeteilt, dass man eine Änderung vornehmen werde. GitHub werde dergestalt aktualisiert, dass man Daten der Plattform verwenden möchte, um die AI-gestützten Coding-Tools zu verbessern. GitHub hat das Ganze zum 25. März 2026 in einem Blog-Beitrag Updates to GitHub Copilot interaction data usage policy offen gelegt.

Ab dem 24. April 2026 werden automatisch alle Benutzer-Interaktionen, die mir GitHub Copilot stattfinden, für das AI-Training verwendet. Das umfasst auch Eingaben, Ausgaben von Code, Code Snippets sowie den damit verbundenen Kontext. Wer dies nicht möchte, muss sich explizit für ein Out-out entscheiden.

How to Geek merkt hier an, dass es wichtig sei, zu beachten, dass die automatische Datenerfassung sowohl für kostenlose als auch für kostenpflichtige Konten gilt. Dies umfasst Nutzer von Copilot Free, Copilot Pro und Copilot Pro+, jedoch nicht von Copilot Business- und Copilot Enterprise-Konten. Speziell bei Unternehmenskunden könnte ich mir vorstellen, dass doch Vorbehalte bestehen, dass die eigenen Benutzerinteraktionen und Code-Snippets zum Trainieren der Sprachmodelle bzw. Coding-Modelle benutzt werden – zumal man nicht wenig für die Benutzung zahlt.

How to Geek beschreibt in diesem Artikel die Schritte, die GitHub-Nutzer in ihrem Benutzerkonto unternehmen müssen, um unter "Privacy" die Option Allow GitHub to use my data for AI model training zu deaktivieren.

Dieser Beitrag wurde unter AI abgelegt und mit , , verschlagwortet. Setze ein Lesezeichen auf den Permalink.

Ein Kommentar zu GitHub trainiert Copilot mit Benutzerdaten; Opt-out erforderlich

  1. Andreas sagt:

    Danke für den Artikel!

Antworte auf den Kommentar von Andreas Antwort abbrechen

Deine E-Mail-Adresse wird nicht veröffentlicht. Erforderliche Felder sind mit * markiert

Hinweis: Bitte beachtet die Regeln zum Kommentieren im Blog (Erstkommentare und Verlinktes landet in der Moderation, gebe ich alle paar Stunden frei, SEO-Posts/SPAM lösche ich rigoros. Kommentare abseits des Themas bitte unter Diskussion. Kommentare, die gegen die Regeln verstoßen, werden rigoros gelöscht.

Du findest den Blog gut, hast aber Werbung geblockt? Du kannst diesen Blog auch durch eine Spende unterstützen.