Metodologia
A metodologia, exposta do início ao fim.
Não pedimos para você confiar — pedimos para você conferir. Cada score carrega o cálculo que o gerou: as fontes, os sinais cruzados, o hash que sela o resultado. Esta página explica, passo a passo, como chegamos a um número.
O pipeline, em profundidade
Os volumes abaixo refletem a operação de hoje do sistema — crescem com novas fontes e mudam ao longo do tempo; não são um compromisso fixo.
Coleta
~95.000 documentos por dia, hoje, vindos de 63 fontes públicas globais: notícias, SAM.gov, SEC EDGAR, filas de interconexão dos operadores regionais (ISOs), RSS setorial, USPTO.
Filtro determinístico
Regras de código — não IA — leem os documentos coletados e descartam o que não é relevante, antes de qualquer custo de IA. O volume cai para cerca de 190 documentos por dia que seguem para análise.
Extração
Uma IA lê cada um dos documentos filtrados e extrai as entidades que importam: quem, o quê, onde, quanto, quando.
Correlação + Score
Lógica determinística (SQL e Python, não IA) cruza sinais independentes — licença ambiental, contrato de energia, registro federal, contratação de mão de obra. Quanto mais sinais convergem, mais alto o score da região.
Predição + Prova
O resultado é datado e selado num ledger imutável, identificado por hash. Cada predição vira, com o tempo, parte de um histórico público — inclusive quando erramos.
O score: CFI 0–100
O Compute Formation Index (CFI) dá uma nota de 0 a 100 para cada uma das 49 regiões monitoradas. A nota não conta anúncios — mede a fração comprometida da fila de interconexão que conseguimos corroborar com sinais independentes. Fila inflada por pedidos especulativos pesa contra o score, não a favor.
O número ± ao lado do score é a margem de incerteza do cálculo — também é exposta, não escondida.
sinais fortes, fila comprometida
amostra ilustrativa
"The buildout here is real."
sinais fracos, sem contraparte
amostra ilustrativa
"Anúncio sem contraparte na fila — sinais não corroboram."
Os limites — ditos com todas as letras
Parte de ganhar confiança é dizer onde o sistema ainda não chega.
Cobertura geográfica
Hoje cobrimos EUA, no nível condado/estado. Não chegamos ainda ao nó ou ao feeder — a granularidade que uma decisão operacional específica às vezes exige.
Fonte: notícia vs. filing
Cerca de 93% das fontes hoje exibidas são notícia, não documento oficial (filing). Marcamos qual é qual em cada item — nunca tratamos uma como a outra.
Descritivo, não preditivo
O score de hoje é descritivo: mede corroboração agora. Track record preditivo validado só fecha por volta de dezembro de 2026 — não vendemos acurácia que ainda não provamos.
Lacuna de cobertura ≠ fantasma
Ausência de sinal não é prova de fantasma; é lacuna de cobertura — e a gente avisa qual.
Retrato, não feed em tempo real
Os números exibidos no site, incluindo visualizações ilustrativas, refletem a última coleta verificada de fontes públicas em uma janela definida — não um feed em tempo real.
O ledger — confira você mesmo
Cada score é selado com um hash no momento em que é calculado. O selo registra a data, as fontes usadas e o cálculo que gerou o número — nada muda depois, silenciosamente. "Recompute it" leva à metodologia e às fontes daquele score específico, para qualquer pessoa conferir o caminho do número.
exemplo ilustrativo do chip — cada score real carrega seu próprio hash.
Perguntas diretas
Vocês têm track record de acerto?
Ainda não — fecha por volta de dezembro de 2026. Hoje vendemos o que é descritivo e conferível, não a predição. Não afirmamos acurácia que não provamos.
Isso é opinião ou índice?
Índice. Não damos parecer de analista — cada número é o resultado de uma regra aplicada a sinais públicos, rastreável até a fonte.
Como vocês evitam contar o mesmo projeto duas vezes?
Pedidos de interconexão às vezes duplicam o mesmo projeto sob protocolos diferentes — o que infla a fila. O sistema cruza identificadores internos da fila, datas de protocolo e metadados do pedido para sinalizar prováveis duplicatas como "SUSPEITO", com um nível de confiança explícito. Essa checagem já roda na metodologia que gera cada score; a exposição pública e navegável desses identificadores chega numa fase posterior do site.
Quer ver isso aplicado a um projeto real?
Pedir relatório de amostra →