asiai mcp
Démarrer le serveur MCP (Model Context Protocol), permettant aux agents IA de surveiller et benchmarker votre infrastructure d'inférence.
Utilisation
asiai mcp # Transport stdio (Claude Code)
asiai mcp --transport sse # Transport SSE (agents réseau)
asiai mcp --transport sse --port 9000
Options
| Option | Description |
|---|---|
--transport |
Protocole de transport : stdio (par défaut), sse, streamable-http |
--host |
Adresse d'écoute (par défaut : 127.0.0.1) |
--port |
Port pour le transport SSE/HTTP (par défaut : 8900) |
--register |
Inscription optionnelle au réseau d'agents asiai (anonyme) |
Outils (11)
| Outil | Description | Lecture seule |
|---|---|---|
check_inference_health |
Vérification rapide de santé : moteurs up/down, pression mémoire, thermique, GPU | Oui |
get_inference_snapshot |
Snapshot complet du système avec toutes les métriques | Oui |
list_models |
Lister tous les modèles chargés sur tous les moteurs | Oui |
detect_engines |
Re-scanner les moteurs d'inférence | Oui |
run_benchmark |
Lancer un benchmark ou une comparaison inter-modèles (limité à 1/min) | Non |
get_recommendations |
Recommandations moteur/modèle adaptées au matériel | Oui |
diagnose |
Lancer les vérifications de diagnostic (comme asiai doctor) |
Oui |
get_metrics_history |
Interroger l'historique des métriques (1-168 heures) | Oui |
get_benchmark_history |
Interroger les résultats de benchmarks passés avec filtres | Oui |
compare_engines |
Comparer les performances des moteurs pour un modèle avec verdict ; supporte la comparaison multi-modèles depuis l'historique | Oui |
refresh_engines |
Re-détecter les moteurs sans redémarrer le serveur | Oui |
Ressources (3)
| Ressource | URI | Description |
|---|---|---|
| Statut système | asiai://status |
Santé actuelle du système (mémoire, thermique, GPU) |
| Modèles | asiai://models |
Tous les modèles chargés sur tous les moteurs |
| Infos système | asiai://system |
Infos matérielles (puce, RAM, cœurs, OS, uptime) |
Intégration Claude Code
Ajoutez à votre config MCP Claude Code (~/.claude/claude_desktop_config.json) :
{
"mcpServers": {
"asiai": {
"command": "asiai",
"args": ["mcp"]
}
}
}
Puis demandez à Claude : « Vérifie la santé de mon inférence » ou « Compare Ollama vs LM Studio pour qwen3.5 ».
Cartes de benchmark
L'outil run_benchmark supporte la génération de cartes via le paramètre card. Quand card=true, une carte SVG de benchmark 1200x630 est générée et card_path est retourné dans la réponse.
{"tool": "run_benchmark", "arguments": {"model": "qwen3.5", "card": true}}
Comparaison inter-modèles (mutuellement exclusif avec model, max 8 emplacements) :
{"tool": "run_benchmark", "arguments": {"compare": ["qwen3.5:4b", "deepseek-r1:7b"], "card": true}}
Équivalent CLI pour PNG + partage :
asiai bench --quick --card --share # Bench rapide + carte + partage (~15s)
Voir la page Carte de benchmark pour les détails.
Inscription d'agent
Rejoignez le réseau d'agents asiai pour accéder aux fonctionnalités communautaires (classement, comparaison, statistiques en percentiles) :
asiai mcp --register # S'inscrire au premier lancement, heartbeat aux suivants
asiai unregister # Supprimer les identifiants locaux
L'inscription est optionnelle et anonyme — seules les infos matérielles (puce, RAM) et les noms de moteurs sont envoyés. Aucune IP, nom d'hôte ou donnée personnelle n'est stockée. Les identifiants sont sauvegardés dans ~/.local/share/asiai/agent.json (chmod 600).
Lors des appels suivants à asiai mcp --register, un heartbeat est envoyé au lieu d'une ré-inscription. Si l'API est inaccessible, le serveur MCP démarre normalement sans inscription.
Vérifiez votre statut d'inscription avec asiai version.
Agents réseau
Pour les agents sur d'autres machines (ex. monitoring d'un Mac Mini headless) :
asiai mcp --transport sse --host 0.0.0.0 --port 8900
Voir le guide d'intégration agent pour des instructions détaillées.