EverMind hat am heutigen Montag EverOS vorgestellt – eine quelloffene Speicher-Plattform, die KI-Agenten mit dauerhaftem, strukturiertem Kontext versorgt. Die unter der Apache-2.0-Lizenz veröffentlichte Software soll standardisieren, wie autonome Agenten Informationen bei langfristigen Interaktionen speichern und abrufen.
Technische Architektur und Benchmark-Ergebnisse
EverOS setzt auf eine lokale Architektur, die Agenten-Speicher als Markdown-Dateien ablegt. Für Indexierung und Abruf kombiniert das System SQLite mit LanceDB. Dies ermöglicht ein hybrides Retrieval-Modell, das BM25-Keyword-Matching mit Vektor- und Skalarfiltern verbindet.
Die technischen Berichte zeigen beeindruckende Werte: 93,05 Prozent im LoCoMo-Benchmark und 83,00 Prozent bei LongMemEval. Beim HaluMem-Test, der speziell Gedächtnis-Halluzinationen misst, erreichte das System 93,04 Prozent Erfolgsquote. Die als Python-Bibliothek gebaute Runtime inkludiert eine FastAPI-HTTP-Schnittstelle, wobei die p95-Latenz unter 500 Millisekunden bleibt.
Mit Version 1.1.0 fügte EverMind spezialisierte Knowledge-APIs und Reflexionsfunktionen hinzu – Agenten können nun selbstständig gespeicherte Informationen korrigieren oder neu organisieren.
Wachsendes Ökosystem für KI-Speicher
EverOS reiht sich in eine Welle ähnlicher Entwicklungen ein. Bereits am 23. Juni veröffentlichte die Open-Source-Community Katra, eine kognitive Speicher-Appliance als Docker-Stack mit MongoDB, Redis und MinIO. Katra bietet 35 Tools, die mit dem Model Context Protocol (MCP) kompatibel sind. Bei Tests zeigten zwei Agenten mit gemeinsamem Katra-Speicher spontanes Emergenzverhalten – sie begannen eigenständig, Aufgaben auszutauschen.
Während KI-Agenten immer autonomer Aufgaben übernehmen, stellt die neue EU-Gesetzgebung Unternehmen vor große Herausforderungen. Dieser kostenlose Umsetzungsleitfaden zum EU AI Act hilft Ihnen, Risikoklassen richtig einzuschätzen und alle gesetzlichen Fristen einzuhalten. EU AI Act in 5 Schritten verstehen
Nur zwei Tage später, am 27. Juni, brachte Inkeep OpenKnowledge heraus. Dieser quelloffene Markdown-Editor enthält integrierte MCP-Server für Tools wie Claude Code und Cursor. OpenKnowledge nutzt einen Dual-Observer-CRDT zur Synchronisation und Orama für hybride agentische Suche.
Während diese Tools auf externen Abruf setzen, verfolgt das Startup Engram einen anderen Ansatz. Die von Dan Biderman und Jessy Lin gegründete Firma arbeitet mit Kunden wie Notion und Microsoft zusammen. Sie trainieren unternehmensspezifisches Wissen direkt in Modellgewichte mittels LoRA-Adapter – mit dem Ziel, den Token-Verbrauch klassischer RAG-Systeme zu senken.
Hardware und Modelle für lokale Agenten
Auch die Infrastruktur für speicherintensive lokale Agenten wächst. Sebastian Raschka veröffentlichte am 27. Juni ein Tutorial zur Einrichtung lokaler Code-Agenten mit dem Qwen3.6 35B-A3B-Modell. Dieses benötigt rund 30 bis 40 Gigabyte RAM und läuft auf Hardware wie dem Mac Mini M4.
Am selben Tag brachte Liquid AI das LFM2.5-230M heraus – ein kleines Open-Weight-Modell für On-Device-Inferenz. Es erreicht angeblich 213 Tokens pro Sekunde auf Mobilgeräten wie dem Galaxy S25 Ultra. Für anspruchsvollere Reasoning-Aufgaben veröffentlichte Multiverse Computing sein Pulsar 16B-Modell, das Kompressionstechnologie für höheren Durchsatz auf Blackwell-GPUs nutzt.
Der technologische Fortschritt durch KI bringt nicht nur Chancen, sondern auch neue Sicherheitsrisiken für die gesamte Unternehmens-IT mit sich. Erfahren Sie in diesem kostenlosen Report, welche rechtlichen Pflichten und Cyber-Bedrohungen Sie als Unternehmer jetzt kennen müssen. Gratis-Bericht zu KI-Gesetzen und Cyberrisiken anfordern
Integration und Sicherheitsrisiken
Mit wachsender Integration von Speicher- und Agentenfunktionen in Produktivitätstools rückt die Sicherheit in den Fokus. Anthropic startete am 23. Juni seinen Claude Tag in der öffentlichen Beta – eine Funktion für persistenten Speicher und Ambient-KI in Slack Enterprise und Team. Nutzer müssen bis zum 3. August 2026 auf das neue agentische System migrieren.
Doch Forscher von Mozilla 0DIN zeigten am 27. Juni, dass KI-Code-Agenten weiterhin anfällig für ausgeklügelte Angriffe sind. Sie demonstrierten, wie ein scheinbar sauberes GitHub-Repository einen Agenten dazu bringen kann, eine Reverse Shell über einen DNS-TXT-Eintrag auszuführen – ohne dass bösartiger Code im Repository selbst liegt. Die Erkenntnisse legen nahe: Agenten müssen ihre vollständigen Ausführungsketten transparenter offenlegen, je mehr Autonomie und Speicher sie erhalten.

