A TESE
Todo commodity caro tem tres dores: disponibilidade, preco, demanda.
Voce pode atacar as tres ao mesmo tempo — e falhar nas tres. Ou pode comecar pela mais tangivel: parar o vazamento que ja existe. Capacity dedicada ociosa, inference rodando 24/7 com 3% de uso, training em on-demand que podia ser spot, fine-tuning rodando no provider mais caro sem comparar.
FairOps nao e orquestrador. Nao rebalanceamos GPU entre regioes. Nao agendamos fine-tuning jobs. FairOps e a camada de observability e waste detection que precede qualquer investimento em orquestracao. Primeira economia — vem antes.
O QUE VOCE GANHA
Observability GPU sem instalar agente, sem write access
Classificacao automatica por SKU
p4d, p5, A100, H100, V100, T4, L4, ND96_v4, A3-highgpu — mapeados automaticamente do billing. Sem configuracao.
Breakdown por workload
Training, fine-tuning, inference, notebooks, graphics — separados para voce ver onde o dinheiro esta realmente indo.
Deteccao de 7 padroes de waste AI/ML
Endpoint ocioso, training sem spot, modelo caro para tarefa simples, embeddings sem cache, throughput provisionado idle, custo acelerando, fine-tuned model abandonado.
Saving estimado em BRL
Cada oportunidade com valor em reais — conservative (under-promise). CFO entende.
PDF executivo de diagnostico
Gere em 10 minutos. Entregavel de reuniao — SKUs, waterfall, top 10 oportunidades, saving total. Leva pra reuniao e fecha.
Multi-cloud nativo
AWS, Azure, GCP desde o primeiro dia. Sem um provider de primeira classe e o resto meia-boca.
POR QUE NAO UM CLOUDZERO / DATADOG / KUBECOST
Por que FairOps, e nao um generalista global
| Dimensao | CloudZero / Datadog / Kubecost | FairOps |
|---|---|---|
| Idioma | Ingles only | PT-BR nativo |
| Faturamento | USD / cartao corporativo | BRL com nota fiscal brasileira |
| Pricing mid-market | US$ 500–5000/mes | Flat 2% · Piso R$ 500/mes |
| Regras fiscais BR (ICMS, ISS, FX) | Nenhum | Sim |
| Multi-cloud SaaS endpoints | Parcial | AWS + Azure + GCP desde dia 1 |
| Implementacao | Enterprise sales (semanas) | Self-serve (10 min) |
| Threshold calibrado | US$ 500k+/mes spend | R$ 15–60k/mes spend |
Generalistas globais sao otimos. Nao descem pro ticket mid-market BR sem destruir margem. Sobra um nicho — FairOps joga nele.
DETECTAMOS
7 padroes de waste AI/ML que o billing normal esconde
Endpoint ML ocioso
80% do custoSageMaker, Vertex, Azure OpenAI PTU, Bedrock PTU com custo estavel e variacao <10%
Training sem Spot
60% do custoJobs de training em p4d/p5/A100 on-demand com checkpointing disponivel
Modelo caro pra tarefa simples
60% do custoGPT-4/Claude Opus em classificacao — migrar pra Haiku/GPT-4o-mini
Embeddings sem cache
80% das chamadasCusto de embeddings crescendo >10% mes a mes = re-processamento
Fine-tuned model abandonado
95% do custoEndpoint com resource_id "ft-*" com custo fixo e zero trafego
Custo IA acelerando
prevencaoGasto com AI cresce >30% mes a mes — flag antes de virar runaway
GPU on-demand sem commitment
40–60%p4d/p5/A100/H100 rodando 3+ meses sem Savings Plan ou RI
COBERTURA MULTI-CLOUD
AWS, Azure, GCP — SKUs e servicos gerenciados
SKUs classificados
- · p3, p4d, p4de, p5 (V100, A100, H100)
- · g3, g4dn, g5, g5g (M60, T4, A10G)
- · inf1, inf2 (Inferentia)
- · trn1 (Trainium)
Servicos gerenciados
- ✓ Amazon SageMaker (training, inference, notebook)
- ✓ Amazon Bedrock (PTU)
- ✓ AWS Deep Learning AMIs
SKUs classificados
- · NC, NCv2, NCv3, NC_T4_v3 (K80, P100, V100, T4)
- · ND, NDv2, NDv4, NDv5 (P40, V100, A100, H100)
- · NC_A100_v4 (A100)
- · NV (graphics)
Servicos gerenciados
- ✓ Azure OpenAI (PTU + pay-as-you-go)
- ✓ Azure Machine Learning
- ✓ Azure Databricks
SKUs classificados
- · A2 family (A100 40GB, 1–16x)
- · A3 family (H100, 8–16x)
- · G2 family (L4)
- · N1 + GPU attachments
Servicos gerenciados
- ✓ Vertex AI (prediction, training)
- ✓ Cloud AI Platform
- ✓ Generative AI on Vertex
POSICIONAMENTO
Observability primeiro. Orquestracao depois — quando voce estiver pronto
HOJE · COM FAIROPS
- ✓ Visibilidade completa do gasto GPU
- ✓ Classificacao por SKU + workload
- ✓ Deteccao de waste em 24h
- ✓ Saving estimado em BRL
- ✓ PDF executivo pra reuniao
DEPOIS · ORQUESTRACAO (QUANDO FAZER SENTIDO)
- ○ Spot scheduling automatico
- ○ Cross-cloud capacity failover
- ○ Fine-tuning cost forecaster
- ○ Savings Plan auto-purchase
- ○ GPU bidding marketplace
FairOps nao faz orquestracao hoje — por design. Primeiro voce precisa saber onde esta o vazamento. Depois faz sentido orquestrar.
Quer saber quanto do seu GPU spend vira fumaca?
Conecte AWS/Azure/GCP em 10 minutos com credencial read-only. Primeiro diagnostico sai em menos de 24h. Sem cartao.