KI Agent Gedächtnis mit memory-os: Das 7-Layer-System für Hermes Agent

Innerhalb einer Woche sammelte memory-os über 651 GitHub-Sterne und kletterte auf Platz 9 der GitHub-Trending-Charts – und das ohne viralen Hype-Auslöser. Der Grund: Das Projekt löst ein Problem, das jeden stört, der ernsthaft mit KI-Agenten arbeitet. KI-Agenten vergessen nach jeder Sitzung alles. memory-os gibt dem Hermes Agent ein strukturiertes, persistentes KI Gedächtnis – und das vollständig open source und selbst hostbar.

Kurz zusammengefasst: memory-os ist ein 7-Layer-Gedächtnis-Betriebssystem für den Hermes Agent. Es speichert Kontexte dauerhaft in Qdrant (Vektordatenbank), strukturiert Fakten in JSON und unterscheidet zwischen kurz- und langfristigen Erinnerungen – alles lokal, ohne Cloud-Abhängigkeit.

Was ist das Problem mit dem KI Agent Gedächtnis?

Standardmäßig hat jede KI-Session eine harte Kontextgrenze. Wer täglich mit Agenten wie dem Hermes Agent arbeitet, kennt das Frustrationspotenzial: Präferenzen, Projektkontexte und vorherige Entscheidungen müssen bei jeder neuen Sitzung neu erklärt werden. Das kostet Zeit, erhöht den Token-Verbrauch und macht echte Produktivautomatisierung schwer.

Lösungsansätze gab es bislang: einfache JSON-Dateien für Notizen, RAG-Systeme mit Vektordatenbanken oder manuelle Kontext-Injektionen. memory-os bündelt diese Ansätze in einer strukturierten Architektur – dem 7-Layer-Memory-Stack – und integriert ihn direkt in den Hermes Agent.

Die 7 Schichten des memory-os

Das Herzstück von memory-os ist die Aufteilung des Gedächtnisses in sieben funktional getrennte Schichten:

Layer Funktion
L1 Sensory Rohe Eingaben der aktuellen Session – flüchtig
L2 Working Aktiver Kontext der laufenden Aufgabe
L3 Episodic Zusammenfassungen vergangener Sessions
L4 Semantic Strukturiertes Faktenwissen (JSON), dauerhaft
L5 Procedural Gelernte Workflows und Handlungsabläufe
L6 Emotional Gewichtete Prioritäten und Präferenzen
L7 Transcendent Übergeordnete Ziele und Identität des Agenten

Praktisch besonders relevant sind L3 (Episodic) und L4 (Semantic): L3 sorgt dafür, dass der Agent sich an frühere Gespräche erinnert, L4 speichert strukturierte Fakten – etwa Nutzerpräferenzen, Projektnamen oder wiederkehrende Entscheidungen – dauerhaft in Qdrant.

Installation: memory-os mit Hermes Agent einrichten

Voraussetzung: Python 3.10+, Docker (für Qdrant) und ein laufender Hermes Agent. Die Einrichtung dauert unter 15 Minuten:

Schritt 1
Repository klonen & Dependencies installieren
git clone https://github.com/ClaudioDrews/memory-os.git && cd memory-os && pip install -r requirements.txt
Schritt 2
Qdrant starten (Vektordatenbank für persistentes KI Gedächtnis)
docker run -p 6333:6333 qdrant/qdrant

Qdrant läuft lokal unter localhost:6333. Alle Erinnerungen bleiben auf dem eigenen Rechner – keine Cloud-Übertragung.

Schritt 3
memory-os in Hermes Agent einbinden
python memory_os/integrate.py --agent hermes --config config.yaml

Die Konfigurationsdatei legt fest, welche Layer aktiv sind und wie aggressiv das System konsolidiert.

KI Agent open source selbst hosten – wer profitiert?

memory-os ist besonders interessant für drei Nutzergruppen:

  • Entwickler mit langfristigen KI-Projekten: Wer Agenten über Wochen auf dasselbe Ziel hin trainiert, profitiert von persistentem Faktenwissen in L4.
  • Teams mit DSGVO-Anforderungen: Da alle Erinnerungen lokal in Qdrant gespeichert werden, verlassen keine Daten den eigenen Server.
  • Power-User des Hermes Agent: Wer täglich mit dem Hermes Agent arbeitet und wiederholtes Kontextsetzen vermeiden will, gewinnt sofort spürbar an Effizienz.

Wer dagegen nur gelegentlich eine KI-Chat-Session startet, wird die Komplexität von memory-os kaum rechtfertigen können – für diesen Anwendungsfall reichen einfachere Lösungen wie ein manuell gepflegtes Systempromt oder die Speicherfunktion kommerzieller Dienste.

Fazit

memory-os ist der bisher ausgefeilteste Open-Source-Ansatz für persistentes KI Gedächtnis. Die 7-Layer-Architektur ist gut durchdacht, die Qdrant-Integration praxistauglich. Für alle, die den Hermes Agent ernsthaft einsetzen und KI-Agent-Gedächtnis ohne Cloud-Abhängigkeit brauchen, ist memory-os ein klares Muss. Frühes Projektstadium – Breaking Changes einplanen.

Selbst gehosteten KI-Agenten mit Odysseus betreiben

Wer den Hermes Agent mit memory-os lokal betreiben möchte, braucht eine solide Infrastruktur. Der Odysseus KI Workspace bietet eine einheitliche Oberfläche für lokale Modelle (Ollama) und externe APIs – ideal als Umgebung für den Hermes Agent mit Gedächtniserweiterung.

Odysseus KI Workspace – Review & Anleitung