Metodologia Geral de Validação Completude Dados Imputados Prefeituras TCE

fraude
gastos-publicos

#1

Sabemos que os dados de gasto público de unidades gestoras municipais e estaduais geridos por Tribunais de Contas possuem sérios problemas de qualidade.

O primeiro problema são de dados sujos de toda ordem, os quais são de difícil solução e, em muitos casos, infelizmente, a solução não é escalável, pois é necessário trabalho manual de identificação do tipo de dado sujo para definição da respectiva solução.

Porém, outro problema de detecção mais fácil e passível de ser automatizado é o problema de incompletude dos dados, o qual é mais importante do que o de dados sujos na minha opinião.

Analisando os gastos de prefeituras são frequentes os casos em que número relevante de prefeituras não imputaram ao menos um contrato em um determinado ano. Estes são casos aparentemente claros de incompletude.

Porém, a provocação que faço é: para as prefeituras que imputaram alguns dados, como definir se o valor total de contratos por ela imputado corresponde ao valor total esperado de gasto?

Para responder a esta pergunta uma opção é soma o valor total de contratos celebrados por uma determinada prefeitura e dividir, por exemplo, por uma variável declarada pela prefeitura nas Contas Anuais enviada para a STN.

Ao dividir o valor total dos contratos com a despesa orçamentária por ela declarada no SICONFI identificamos grandes discrepâncias, conforme consta na tabela abaixo.

A minha provocação adicional é: (ii) quais outras formas de validar a completude dos dados de contratação, utilizando outras métricas não contábeis, como variáveis socioeconômicas, etc., e, por exemplo, técnicas como clusterização.

A minha terceira provocação é: (iii) podemos criar uma metodologia de completude de gastos municipais replicável nacionalmente?

(iv) Por fim, a última provocação: prefeituras podem estar deliberadamente sub reportando contratos?


#2

Muito interessante Rafael. Qual seria a forma mais simples de reproduzir seu resultado da comparação entre o valor total de contratos declarados por município e o valor reportado ao STN? Esses dados do Sagres serão compartilhados? De que forma?
Haveria discrepâncias legítimas entre esses dois dados: ano de exercício, fontes orçamentária independentes, critérios distintos entre o que deve ou não ser incluído em cada totalização?

Topo ajudar em criar um caderno jupyter em python como protótipo de como cruzar esses dados e assim incentivar os participantes em aprofundar essa questão. Por favor, entre em contato. Sou um dos monitores enviados pelo TCU.