Claude Sonnet 5: Anthropic schließt Lücke zum Top-Modell

Anthropic, Google und SelectPdf erweitern KI-Assistenten um Dokumenten-Skills und Sicherheitsmodule. BeyondTrust und Harness präsentieren neue Sicherheitslösungen für autonome Agenten.

Gleich mehrere Anbieter haben am heutigen Mittwoch neue Funktionen vorgestellt, die das Arbeiten mit Tools wie Claude Code, Cursor und GitHub Copilot grundlegend verändern sollen. Im Fokus stehen dabei spezialisierte Fähigkeiten für die Dokumentenverwaltung und deutlich robustere Sicherheitsarchitekturen.

Anthropic schickt Claude Sonnet 5 ins Rennen

Bereits gestern hat Anthropic sein Modell-Lineup aktualisiert. Claude Sonnet 5 wird künftig der Standard für die Free- und Pro-Tarife. Das neue Modell schließt die Lücke zum Spitzenmodell Opus 4.8 deutlich – mit beeindruckenden 63,2 Prozent im SWE-bench und 80,4 Prozent im Terminal-Bench 2.1.

Was Entwickler besonders freuen dürfte: Das Modell bietet ein Kontextfenster von einer Million Tokens und ein neuartiges Anstrengungs-Level-System. Damit lässt sich die Performance gezielt gegen die Kosten abwägen. Für API-Nutzer gelten bis zum 31. August 2026 Einführungspreise von zwei Dollar pro Million Input-Tokens und zehn Dollar pro Million Output-Tokens. Neben der Integration in Claude Code ist das Modell auch über Amazon Bedrock und GitHub Copilot verfügbar.

Googles Open-Source-Offensive

Bereits am 28. Juni hat Google Version 0.6.1 seines agents-cli-Tools veröffentlicht. Das Open-Source-Utility, das auf GitHub rund 3.600 Sterne gesammelt hat, erlaubt Entwicklern, sieben spezifische Lebenszyklus-Fähigkeiten zu ihren KI-Assistenten hinzuzufügen. Besonders praktisch: Für die lokale Entwicklung ist kein Cloud-Konto nötig. Das Release enthält eine fünfteilige Evaluierungspipeline und steht unter der Apache-2.0-Lizenz.

PDF und HTML im Griff: SelectPdf liefert Agent Skills

SelectPdf hat heute eine Suite kostenloser Open-Source-KI-Tools vorgestellt, die sich speziell auf die PDF- und HTML-Verarbeitung in Codierungsassistenten konzentrieren. Die sogenannten „Agent Skills“ sind mit Claude Code, Cursor, Copilot und Codex kompatibel. Das Paket umfasst Fähigkeiten für die kommerzielle SelectPdf-.NET-Bibliothek ebenso wie für eine kostenlose Community Edition.

Die Werkzeuge können Dokumente zusammenführen, Signaturen anwenden und HTML in PDF konvertieren. Das Besondere: Durch strukturierte Skills sollen Halluzinationen bei API-Aufrufen vermieden werden. Die Tools sind über GitHub oder den Plugin-Marktplatz verfügbar.

Anzeige

Die Integration von KI-Systemen in den Arbeitsalltag bringt neue rechtliche Anforderungen mit sich, die über die bloße Technik hinausgehen. Dieser kostenlose Umsetzungsleitfaden zum EU AI Act hilft Ihnen, Fristen, Pflichten und Risikoklassen von KI-Systemen kompakt zu verstehen. EU AI Act in 5 Schritten verstehen

Sicherheit wird großgeschrieben

Mit der zunehmenden Autonomie von KI-Agenten wächst auch der Sicherheitsbedarf. BeyondTrust hat heute die private Beta seines AI Agent Security Modules gestartet. Das Tool kontrolliert Agenten auf Endpunkten mit Windows, macOS, Linux oder in Containern. Es ergänzt bestehende Berechtigungsverwaltungssysteme, setzt das Least-Privilege-Prinzip durch und liefert vollständige Prüfpfade für Aktionen von Assistenten wie Codex und Cursor.

Parallel dazu hat Harness seine Autonomous Worker Agents für die Softwareauslieferung vorgestellt. Diese Agenten arbeiten auf kundeneigener Infrastruktur und nutzen Sandboxing sowie abgestufte Anmeldeinformationen. Eine Marktplatz-Plattform bietet verwaltete und von der Community beigesteuerte Agenten. Das System konzentriert sich auf Richtliniendurchsetzung und Kostenverfolgung.

Anzeige

Neben der technischen Absicherung autonomer Agenten müssen Unternehmen auch die neuen gesetzlichen Rahmenbedingungen für Künstliche Intelligenz im Blick behalten. Compliance-Experten zeigen in diesem kostenlosen Report auf, welche rechtlichen Pflichten und Bedrohungen Unternehmer jetzt konkret kennen müssen. Kostenlosen KI-Umsetzungsleitfaden jetzt herunterladen

Die Kunst des Skill-Designs

Hinter den Kulissen zeichnet sich ein Wandel in der technischen Struktur dieser KI-Fähigkeiten ab. Anthropic hat am 3. Juni Erkenntnisse aus internen Tests mit Hunderten von Claude-Code-Skills veröffentlicht. Die Kernbotschaft: Ein Skill sollte als umfassender Ordner behandelt werden, nicht als einfacher Prompt.

Die effektivsten Skill-Strukturen enthalten demnach spezifische Komponenten wie eine SKILL.md-Datei, Skripte, Vorlagen und Memory-Hooks. Anthropics Analyse identifizierte neun Kategorien von Skills – mit dem überraschenden Ergebnis, dass Verifizierungs-Skills den größten messbaren Einfluss auf die Qualität der Assistentenausgabe hatten. Auch wenn Best Practices für diese ordnerbasierten Skills noch im Fluss sind, zeigt die Forschung: Strukturierte Daten und Referenzmaterialien sind der Schlüssel zu besserer Agentenleistung.