asiai mcp
MCP-Server (Model Context Protocol) starten, der KI-Agenten die Überwachung und das Benchmarking Ihrer Inferenzinfrastruktur ermöglicht.
Verwendung
asiai mcp # stdio-Transport (Claude Code)
asiai mcp --transport sse # SSE-Transport (Netzwerk-Agenten)
asiai mcp --transport sse --port 9000
Optionen
| Option | Beschreibung |
|---|---|
--transport |
Transportprotokoll: stdio (Standard), sse, streamable-http |
--host |
Bind-Adresse (Standard: 127.0.0.1) |
--port |
Port für SSE/HTTP-Transport (Standard: 8900) |
--register |
Opt-in-Registrierung beim asiai-Agentennetzwerk (anonym) |
Tools (11)
| Tool | Beschreibung | Nur-Lesen |
|---|---|---|
check_inference_health |
Schneller Gesundheitscheck: Engines up/down, Speicherdruck, Thermal, GPU | Ja |
get_inference_snapshot |
Vollständiger System-Snapshot mit allen Metriken | Ja |
list_models |
Alle geladenen Modelle über alle Engines auflisten | Ja |
detect_engines |
Inferenz-Engines erneut scannen | Ja |
run_benchmark |
Benchmark oder modellübergreifenden Vergleich ausführen (auf 1/min begrenzt) | Nein |
get_recommendations |
Hardwareangepasste Engine-/Modellempfehlungen | Ja |
diagnose |
Diagnosechecks ausführen (wie asiai doctor) |
Ja |
get_metrics_history |
Historische Metriken abfragen (1-168 Stunden) | Ja |
get_benchmark_history |
Vergangene Benchmark-Ergebnisse mit Filtern abfragen | Ja |
compare_engines |
Engine-Leistung für ein Modell mit Urteil vergleichen; unterstützt Multi-Modell-Vergleich aus dem Verlauf | Ja |
refresh_engines |
Engines ohne Serverneustart erneut erkennen | Ja |
Ressourcen (3)
| Ressource | URI | Beschreibung |
|---|---|---|
| Systemstatus | asiai://status |
Aktuelle Systemgesundheit (Speicher, Thermal, GPU) |
| Modelle | asiai://models |
Alle geladenen Modelle über alle Engines |
| Systeminfo | asiai://system |
Hardware-Info (Chip, RAM, Kerne, OS, Uptime) |
Claude Code Integration
Fügen Sie zu Ihrer Claude Code MCP-Konfiguration hinzu (~/.claude/claude_desktop_config.json):
{
"mcpServers": {
"asiai": {
"command": "asiai",
"args": ["mcp"]
}
}
}
Dann fragen Sie Claude: „Prüfe meine Inferenzgesundheit" oder „Vergleiche Ollama vs LM Studio für qwen3.5".
Benchmark-Karten
Das run_benchmark-Tool unterstützt Kartengenerierung über den card-Parameter. Bei card=true wird eine 1200x630 SVG-Benchmark-Karte generiert und card_path in der Antwort zurückgegeben.
{"tool": "run_benchmark", "arguments": {"model": "qwen3.5", "card": true}}
Modellübergreifender Vergleich (gegenseitig exklusiv mit model, max 8 Slots):
{"tool": "run_benchmark", "arguments": {"compare": ["qwen3.5:4b", "deepseek-r1:7b"], "card": true}}
CLI-Äquivalent für PNG + Sharing:
asiai bench --quick --card --share # Schnellbench + Karte + Teilen (~15s)
Siehe die Seite Benchmark-Karte für Details.
Agentenregistrierung
Treten Sie dem asiai-Agentennetzwerk bei für Community-Funktionen (Leaderboard, Vergleich, Perzentil-Statistiken):
asiai mcp --register # Beim ersten Start registrieren, danach Heartbeat
asiai unregister # Lokale Zugangsdaten entfernen
Die Registrierung ist optional und anonym — nur Hardware-Infos (Chip, RAM) und Engine-Namen werden gesendet. Keine IP, kein Hostname, keine persönlichen Daten werden gespeichert. Zugangsdaten werden in ~/.local/share/asiai/agent.json gespeichert (chmod 600).
Bei nachfolgenden asiai mcp --register-Aufrufen wird ein Heartbeat statt einer Neuregistrierung gesendet. Wenn die API nicht erreichbar ist, startet der MCP-Server normal ohne Registrierung.
Prüfen Sie Ihren Registrierungsstatus mit asiai version.
Netzwerk-Agenten
Für Agenten auf anderen Maschinen (z.B. Überwachung eines Headless Mac Mini):
asiai mcp --transport sse --host 0.0.0.0 --port 8900
Siehe die Anleitung zur Agentenintegration für detaillierte Setup-Anweisungen.