Metodologia

A metodologia, exposta do início ao fim.

Não pedimos para você confiar — pedimos para você conferir. Cada score carrega o cálculo que o gerou: as fontes, os sinais cruzados, o hash que sela o resultado. Esta página explica, passo a passo, como chegamos a um número.

O pipeline, em profundidade

Os volumes abaixo refletem a operação de hoje do sistema — crescem com novas fontes e mudam ao longo do tempo; não são um compromisso fixo.

Coleta

~95.000 documentos por dia, hoje, vindos de 63 fontes públicas globais: notícias, SAM.gov, SEC EDGAR, filas de interconexão dos operadores regionais (ISOs), RSS setorial, USPTO.

Filtro determinístico

Regras de código — não IA — leem os documentos coletados e descartam o que não é relevante, antes de qualquer custo de IA. O volume cai para cerca de 190 documentos por dia que seguem para análise.

Extração

Uma IA lê cada um dos documentos filtrados e extrai as entidades que importam: quem, o quê, onde, quanto, quando.

Correlação + Score

Lógica determinística (SQL e Python, não IA) cruza sinais independentes — licença ambiental, contrato de energia, registro federal, contratação de mão de obra. Quanto mais sinais convergem, mais alto o score da região.

Predição + Prova

O resultado é datado e selado num ledger imutável, identificado por hash. Cada predição vira, com o tempo, parte de um histórico público — inclusive quando erramos.

O score: CFI 0–100

O Compute Formation Index (CFI) dá uma nota de 0 a 100 para cada uma das 49 regiões monitoradas. A nota não conta anúncios — mede a fração comprometida da fila de interconexão que conseguimos corroborar com sinais independentes. Fila inflada por pedidos especulativos pesa contra o score, não a favor.

O número ± ao lado do score é a margem de incerteza do cálculo — também é exposta, não escondida.

sinais fortes, fila comprometida

amostra ilustrativa

78 ±6

REAL

"The buildout here is real."

0 · fantasma45 · não sei68 · real · 100

sinais fracos, sem contraparte

amostra ilustrativa

22 ±9

FANTASMA

"Anúncio sem contraparte na fila — sinais não corroboram."

0 · fantasma45 · não sei68 · real · 100

Os limites — ditos com todas as letras

Parte de ganhar confiança é dizer onde o sistema ainda não chega.

Cobertura geográfica

Hoje cobrimos EUA, no nível condado/estado. Não chegamos ainda ao nó ou ao feeder — a granularidade que uma decisão operacional específica às vezes exige.

Fonte: notícia vs. filing

Cerca de 93% das fontes hoje exibidas são notícia, não documento oficial (filing). Marcamos qual é qual em cada item — nunca tratamos uma como a outra.

Descritivo, não preditivo

O score de hoje é descritivo: mede corroboração agora. Track record preditivo validado só fecha por volta de dezembro de 2026 — não vendemos acurácia que ainda não provamos.

Lacuna de cobertura ≠ fantasma

Ausência de sinal não é prova de fantasma; é lacuna de cobertura — e a gente avisa qual.

Retrato, não feed em tempo real

Os números exibidos no site, incluindo visualizações ilustrativas, refletem a última coleta verificada de fontes públicas em uma janela definida — não um feed em tempo real.

O ledger — confira você mesmo

Cada score é selado com um hash no momento em que é calculado. O selo registra a data, as fontes usadas e o cálculo que gerou o número — nada muda depois, silenciosamente. "Recompute it" leva à metodologia e às fontes daquele score específico, para qualquer pessoa conferir o caminho do número.

sealed·ledger #a1b2c3·recompute it ↗

exemplo ilustrativo do chip — cada score real carrega seu próprio hash.

Perguntas diretas

Vocês têm track record de acerto?

Ainda não — fecha por volta de dezembro de 2026. Hoje vendemos o que é descritivo e conferível, não a predição. Não afirmamos acurácia que não provamos.

Isso é opinião ou índice?

Índice. Não damos parecer de analista — cada número é o resultado de uma regra aplicada a sinais públicos, rastreável até a fonte.

Como vocês evitam contar o mesmo projeto duas vezes?

Pedidos de interconexão às vezes duplicam o mesmo projeto sob protocolos diferentes — o que infla a fila. O sistema cruza identificadores internos da fila, datas de protocolo e metadados do pedido para sinalizar prováveis duplicatas como "SUSPEITO", com um nível de confiança explícito. Essa checagem já roda na metodologia que gera cada score; a exposição pública e navegável desses identificadores chega numa fase posterior do site.

Quer ver isso aplicado a um projeto real?

Pedir relatório de amostra →