asiai mcp
Inicia o servidor MCP (Model Context Protocol), permitindo que agentes de IA monitorem e façam benchmark da sua infraestrutura de inferência.
Uso
asiai mcp # Transporte stdio (Claude Code)
asiai mcp --transport sse # Transporte SSE (agentes em rede)
asiai mcp --transport sse --port 9000
Opções
| Opção | Descrição |
|---|---|
--transport |
Protocolo de transporte: stdio (padrão), sse, streamable-http |
--host |
Endereço de bind (padrão: 127.0.0.1) |
--port |
Porta para transporte SSE/HTTP (padrão: 8900) |
--register |
Registro opt-in na rede de agentes asiai (anônimo) |
Ferramentas (11)
| Ferramenta | Descrição | Somente leitura |
|---|---|---|
check_inference_health |
Verificação rápida de saúde: motores up/down, pressão de memória, térmico, GPU | Sim |
get_inference_snapshot |
Snapshot completo do sistema com todas as métricas | Sim |
list_models |
Listar todos os modelos carregados em todos os motores | Sim |
detect_engines |
Re-escanear motores de inferência | Sim |
run_benchmark |
Executar benchmark ou comparação cross-model (limitado a 1/min) | Não |
get_recommendations |
Recomendações de motor/modelo baseadas em hardware | Sim |
diagnose |
Executar verificações de diagnóstico (como asiai doctor) |
Sim |
get_metrics_history |
Consultar métricas históricas (1-168 horas) | Sim |
get_benchmark_history |
Consultar resultados de benchmark anteriores com filtros | Sim |
compare_engines |
Comparar performance de motores para um modelo com veredito; suporta comparação multi-model do histórico | Sim |
refresh_engines |
Re-detectar motores sem reiniciar o servidor | Sim |
Recursos (3)
| Recurso | URI | Descrição |
|---|---|---|
| Status do Sistema | asiai://status |
Saúde atual do sistema (memória, térmico, GPU) |
| Modelos | asiai://models |
Todos os modelos carregados em todos os motores |
| Info do Sistema | asiai://system |
Informações de hardware (chip, RAM, cores, SO, uptime) |
Integração com Claude Code
Adicione à configuração MCP do seu Claude Code (~/.claude/claude_desktop_config.json):
{
"mcpServers": {
"asiai": {
"command": "asiai",
"args": ["mcp"]
}
}
}
Depois pergunte ao Claude: "Verifique minha saúde de inferência" ou "Compare Ollama vs LM Studio para qwen3.5".
Benchmark cards
A ferramenta run_benchmark suporta geração de cards via parâmetro card. Quando card=true, um benchmark card SVG de 1200x630 é gerado e card_path é retornado na resposta.
{"tool": "run_benchmark", "arguments": {"model": "qwen3.5", "card": true}}
Comparação cross-model (mutuamente exclusivo com model, máx 8 slots):
{"tool": "run_benchmark", "arguments": {"compare": ["qwen3.5:4b", "deepseek-r1:7b"], "card": true}}
Equivalente CLI para PNG + compartilhamento:
asiai bench --quick --card --share # Benchmark rápido + card + compartilhamento (~15s)
Veja a página Benchmark Card para detalhes.
Registro de agente
Junte-se à rede de agentes asiai para obter recursos da comunidade (leaderboard, comparação, estatísticas percentis):
asiai mcp --register # Registrar na primeira execução, heartbeat nas seguintes
asiai unregister # Remover credenciais locais
O registro é opt-in e anônimo — apenas informações de hardware (chip, RAM) e nomes de motores são enviados. Nenhum IP, hostname ou dado pessoal é armazenado. As credenciais são salvas em ~/.local/share/asiai/agent.json (chmod 600).
Em chamadas asiai mcp --register subsequentes, um heartbeat é enviado em vez de re-registrar. Se a API estiver inacessível, o servidor MCP inicia normalmente sem registro.
Verifique o status do seu registro com asiai version.
Agentes em rede
Para agentes em outras máquinas (ex: monitorando um Mac Mini headless):
asiai mcp --transport sse --host 0.0.0.0 --port 8900
Veja o guia de Integração com Agentes para instruções detalhadas de configuração.