asiai mcp

Inicia el servidor MCP (Model Context Protocol), permitiendo que los agentes de IA monitoreen y evalúen tu infraestructura de inferencia.

Uso

asiai mcp                          # transporte stdio (Claude Code)
asiai mcp --transport sse          # transporte SSE (agentes en red)
asiai mcp --transport sse --port 9000

Opciones

Opción	Descripción
`--transport`	Protocolo de transporte: `stdio` (por defecto), `sse`, `streamable-http`
`--host`	Dirección de enlace (por defecto: `127.0.0.1`)
`--port`	Puerto para transporte SSE/HTTP (por defecto: `8900`)
`--register`	Registro voluntario en la red de agentes asiai (anónimo)

Herramientas (11)

Herramienta	Descripción	Solo lectura
`check_inference_health`	Verificación rápida: motores activos/caídos, presión de memoria, térmica, GPU	Sí
`get_inference_snapshot`	Snapshot completo del sistema con todas las métricas	Sí
`list_models`	Lista todos los modelos cargados en todos los motores	Sí
`detect_engines`	Re-escanear motores de inferencia	Sí
`run_benchmark`	Ejecutar un benchmark o comparación entre modelos (limitado a 1/min)	No
`get_recommendations`	Recomendaciones de motor/modelo según tu hardware	Sí
`diagnose`	Ejecutar verificaciones de diagnóstico (como `asiai doctor`)	Sí
`get_metrics_history`	Consultar historial de métricas (1-168 horas)	Sí
`get_benchmark_history`	Consultar resultados de benchmarks anteriores con filtros	Sí
`compare_engines`	Comparar rendimiento de motores para un modelo con veredicto; soporta comparación multi-modelo desde historial	Sí
`refresh_engines`	Re-detectar motores sin reiniciar el servidor	Sí

Recursos (3)

Recurso	URI	Descripción
Estado del sistema	`asiai://status`	Estado actual del sistema (memoria, térmica, GPU)
Modelos	`asiai://models`	Todos los modelos cargados en todos los motores
Info del sistema	`asiai://system`	Info de hardware (chip, RAM, núcleos, SO, tiempo activo)

Integración con Claude Code

Añade a tu configuración MCP de Claude Code (~/.claude/claude_desktop_config.json):

{
  "mcpServers": {
    "asiai": {
      "command": "asiai",
      "args": ["mcp"]
    }
  }
}

Luego pregunta a Claude: "Verifica el estado de mi inferencia" o "Compara Ollama vs LM Studio para qwen3.5".

Tarjetas de benchmark

La herramienta run_benchmark soporta generación de tarjetas mediante el parámetro card. Cuando card=true, se genera una tarjeta SVG de 1200x630 y se devuelve card_path en la respuesta.

{"tool": "run_benchmark", "arguments": {"model": "qwen3.5", "card": true}}

Comparación entre modelos (mutuamente excluyente con model, máximo 8 slots):

{"tool": "run_benchmark", "arguments": {"compare": ["qwen3.5:4b", "deepseek-r1:7b"], "card": true}}

Equivalente en CLI para PNG + compartir:

asiai bench --quick --card --share    # Benchmark rápido + tarjeta + compartir (~15s)

Consulta la página de Tarjeta de benchmark para más detalles.

Registro de agente

Únete a la red de agentes asiai para obtener funciones comunitarias (tabla de clasificación, comparación, percentiles):

asiai mcp --register                  # Registrar en primera ejecución, heartbeat en las siguientes
asiai unregister                      # Eliminar credenciales locales

El registro es voluntario y anónimo — solo se envía información de hardware (chip, RAM) y nombres de motores. No se almacenan IP, hostname ni datos personales. Las credenciales se guardan en ~/.local/share/asiai/agent.json (chmod 600).

En llamadas posteriores a asiai mcp --register, se envía un heartbeat en lugar de volver a registrarse. Si la API no es accesible, el servidor MCP se inicia normalmente sin registro.

Verifica tu estado de registro con asiai version.

Agentes en red

Para agentes en otras máquinas (ej. monitoreando un Mac Mini sin pantalla):

asiai mcp --transport sse --host 0.0.0.0 --port 8900

Consulta la Guía de integración con agentes para instrucciones detalladas de configuración.