// Inteligência em Custos de Infraestrutura e Transportes
Preços de insumos, custos operativos horários de equipamentos e atividades de composições do SICRO extraídos e normalizados via pipeline resiliente. Prontos para consumo ou download imediato.
O SICRO do DNIT é público, mas os dados estão fragmentados em árvores complexas de arquivos .7z e Excel por região. O PulseSICRO resolve isso compilando bases consolidadas.
Depreciação, oportunidade de capital, seguros, manutenção e custos operativos produtivos/improdutivos em formato limpo.
Coeficientes técnicos e consumos calculados proporcionalmente com base na produção declarada da equipe de cada atividade.
Utilização do py7zr no pipeline para descompactação direta no runner, garantindo automações sem gargalos locais.
Deduplicação baseada em chaves primárias compostas (ex: data, uf, desoneração e código) para garantir a integridade histórica.
O portal do DNIT apresenta quedas e rate limit constantes. O pipeline do PulseSICRO possui contingência local inteligente.
Cruzamento de dados para gerar bases equivalentes para cenários com e sem desoneração de encargos sociais sobre a mão de obra.
Pipeline estruturado em Python que descobre, baixa, descompacta com py7zr, limpa e atualiza bases consolidadas do SICRO.
O pipeline busca os arquivos comprimidos na árvore regional do portal do DNIT com base em templates parametrizados.
sicro_insumos.py · py7zr downloadVarre as planilhas extraídas de Materiais e Mão de Obra, gerando uma tabela unificada de preços medianos de insumos.
Sintético Materiais · Mão de ObraProcessa custos produtivos e improdutivos de equipamentos pesados e de transporte em uma base dedicada.
sicro_equipamentos.py · Custos OperativosLê as planilhas analíticas hierárquicas e gera a tabela de insumos por composição, dividindo quantidades pela produção horária.
sicro_composicoes.py · State MachineSalva e expõe os arquivos CSV finais prontos para uso em BI e em ferramentas de orçamentação e engenharia.
data/ CSV · pipeline_status.jsonBases de dados planas consolidadas do SICRO prontas para download.
| Dataset | Descrição | Frequência | Fonte | Download |
|---|
Estrutura das tabelas de dados planos do SICRO (UTF-8, separador vírgula).
| Campo | Tipo | Descrição |
|---|---|---|
| data_captura | datetime | Data e hora do processamento do registro |
| codigo_insumo | string | Código único alfanumérico do insumo (ex: M0004) |
| descricao_insumo | string | Descrição completa do insumo ou mão de obra |
| unidade | string | Unidade de medida de referência (kg, m³, h, t, etc.) |
| preco_mediano | float | Preço unitário ou custo mediano em reais (R$) |
| uf | string | Sigla do estado brasileiro de referência (ex: ES, SP) |
| data_referencia | string | Mês e ano da referência no formato YYYY-MM |
| desonerado | boolean | Indica se a folha de pagamento considera desoneração de encargos (True/False) |
| Campo | Tipo | Descrição |
|---|---|---|
| data_captura | datetime | Data e hora do processamento do registro |
| codigo_equipamento | string | Código único alfanumérico do equipamento (ex: E9001) |
| descricao_equipamento | string | Descrição completa do equipamento |
| valor_aquisicao | float | Preço estimado de aquisição do maquinário (R$) |
| depreciacao | float | Parcela de depreciação horária (R$/h) |
| oportunidade_capital | float | Custo de oportunidade de capital (R$/h) |
| seguros_impostos | float | Custo horário com seguros e taxas (R$/h) |
| manutencao | float | Custo horário estimado de manutenção (R$/h) |
| operacao | float | Custo horário de insumos de operação (combustível, etc.) (R$/h) |
| mao_obra_operacao | float | Custo horário da equipe dedicada de operação (R$/h) |
| custo_produtivo | float | Custo horário total operativo em regime produtivo (R$/h) |
| custo_improdutivo | float | Custo horário total em regime improdutivo (R$/h) |
| uf | string | Estado brasileiro de referência |
| data_referencia | string | Mês e ano da referência no formato YYYY-MM |
| desonerado | boolean | Se considera encargos desonerados sobre a mão de obra de operação |
| Campo | Tipo | Descrição |
|---|---|---|
| data_captura | datetime | Data e hora do processamento do registro |
| codigo_composicao | string | Código único de 8 dígitos da atividade principal (ex: 0307731) |
| descricao_composicao | string | Descrição completa do serviço/atividade |
| unidade_composicao | string | Unidade de medida da atividade (m³, m², t, dm³, etc.) |
| codigo_item | string | Código do item constituinte (insumo, equipamento ou sub-serviço) |
| descricao_item | string | Descrição do item constituinte |
| unidade_item | string | Unidade de medida do item constituinte |
| tipo_item | string | Tipo de relação: INSUMO ou COMPOSICAO |
| coeficiente | float | Consumo real do item por unidade produzida da composição |
Instale dependências e configure o pipeline de dados do SICRO.
git clone https://github.com/PulseDataLabs/PulseSICRO.git
Requer py7zr e pandas: pip install -r requirements.txt
Rode todos os scrapers ativos por fases: python run_all.py
# Clone o projeto e entre na pasta git clone https://github.com/PulseDataLabs/PulseSICRO.git cd PulseSICRO # Instale as dependências pip install -r requirements.txt # Rode o orquestrador python run_all.py