Repositório de Análises de Vitimização e Percepção de Segurança

Introdução

O presente repositório tem por finalidade centralizar, processar e analisar dados de vitimização e percepção de segurança, com foco especial em pesquisas realizadas no Brasil. O projeto foi concebido para assegurar a gestão da informação científica e a reprodutibilidade das análises, em conformidade com as melhores práticas de organização de código e dados.

Nesta plataforma, são disponibilizados desde os microdados brutos e scripts de tratamento (ETL) até as análises estatísticas e os relatórios consolidados.

Metodologia e Estrutura Técnica

Estrutura do Repositório

O projeto está organizado na seguinte estrutura de diretórios para segregar de forma clara os dados, códigos e resultados:

/analises_vitimizacao
├── dados_brutos/
│   └── "identificação_data_dataset"/
├── dados_tratados/
│   ├── csv/
│   └── excel/
├── scripts/
│   ├── tratamento/
│   └── analise/
├── analises/
│   └── relatorios/
├── documentos/
│   └── "identificação_data_dataset"/
└── metadados/
    ├── por_fonte/
    └── dicionario_unificado.csv
            

Acesso e Configuração do Ambiente

Para replicar o ambiente e executar as análises, os seguintes passos são recomendados:

  1. Clonagem do Repositório: O repositório pode ser clonado por meio do seguinte comando Git:
    git clone https://github.com/vitimizacaocrisp/Repositorio_pesquisas
  2. Acesso aos Dados Brutos: Os dados originais, devido ao seu volume, não são versionados diretamente no repositório. O download pode ser realizado a partir do seguinte link:
    Acessar Dados no Google Drive
  3. Organização dos Dados: Os arquivos baixados devem ser descompactados e alocados na pasta /dados_brutos/.
  4. Instalação de Dependências: As bibliotecas Python necessárias para a execução dos scripts estão listadas no arquivo pyproject.toml. A instalação pode ser feita com o pip, utilizando um arquivo requirements.txt.
    pip install -r requirements.txt

Fluxo de Trabalho (Workflow)

O fluxo de trabalho foi desenhado para garantir clareza e reprodutibilidade:

Estratégia de Branches

O repositório utiliza duas branches principais para diferentes finalidades de desenvolvimento:

Descrição dos Scripts de Processamento e Análise

Scripts de Tratamento

Nome do Notebook Arquivo(s) de Entrada Arquivo(s) de Saída Descrição do Processo
belo_horrizonte_2002.ipynb indices_violencia.csv
Vitimizacao_UP_27.csv
belo_horrizonte_2002.csv
belo_horrizonte_2002.xlsx

Realizada a junção de dois arquivos CSV. Foram removidas 52 colunas nulas do primeiro arquivo e 114 do segundo. Valores nulos em colunas numéricas foram imputados com 0. Ao final, os dataframes tratados foram unificados e exportados para os formatos CSV e XLSX.

escolas_2006.ipynb alunos_2006.csv
professores_2006.csv
escolas_alunos_2006.csv
escolas_alunos_2006.xlsx
escolas_professores_2006.csv
escolas_professores_2006.xlsx
Dois conjuntos de dados (alunos e professores) foram carregados e tratados separadamente. Em ambos, valores numéricos nulos foram preenchidos com 0, textos e nomes de colunas foram convertidos para minúsculas e colunas inteiramente nulas ou com um único valor irrelevante foram removidas. Os nomes das colunas foram padronizados, e os dataframes resultantes foram salvos em CSV e XLSX.
percepcao_medoMG_2008.ipynb amostra_BH.xls
amostra_MG.xls
populacao_idade_sexo.csv
percepcao_medoMG.csv
percepcao_medoMG.xlsx
Três arquivos de fontes distintas foram carregados. Em cada um, foram removidas linhas duplicadas e colunas nulas. Os valores numéricos nulos foram imputados com 0. Após o tratamento individual, os três dataframes foram consolidados em um único arquivo, exportado para CSV e XLSX.
PNAD_2009.ipynb Múltiplos arquivos .xls de diversas pastas (agressao, furto, roubo, etc.) Múltiplos arquivos .csv e .xlsx, organizados em pastas por categoria. O script processou um grande volume de arquivos .xls. Para cada arquivo, os dados foram lidos, colunas renomeadas para maior clareza, nomes de colunas e índices padronizados, e os dados convertidos para tipos numéricos. Os dataframes tratados foram exportados como arquivos individuais (CSV e XLSX) e como um único arquivo XLSX por categoria, contendo múltiplas abas.

Scripts de Análise

Nome do Notebook Arquivo(s) de Entrada Arquivo(s) de Saída Descrição do Processo
escolas_2006.ipynb escolas_alunos_2006.csv
escolas_professores_2006.csv
relatorio_final_escolas_2006.pdf

O notebook carrega os dados tratados de alunos e professores, realizando um pré-processamento para padronizar colunas demográficas (sexo, idade, raça/cor). Gera análises visuais sobre a distribuição demográfica e a satisfação com o aprendizado. Ao final, compila os gráficos e as análises em um relatório consolidado em PDF.

percepcao_social.ipynb belo_horrizonte_2002.xlsx
percepcao_medoMG.xlsx
relatorio_completo_percepcao_social.pdf Este script combina dois conjuntos de dados sobre percepção de segurança. Prepara os dados combinados, focando em colunas como sexo, faixa etária e estrato do bairro. Gera análises sobre a percepção de risco (roubo, agressão, sequestro), segmentadas por demografia. Também cria uma matriz de correlação e exporta todas as visualizações para um relatório em PDF.
PNAD_2009.ipynb Múltiplos arquivos .xls da PNAD 2009. Gerado: relatorio_pnad_2009.pdf. A presente análise examina a estabilidade das estatísticas de vitimização no Brasil, utilizando o Coeficiente de Variação (CV) para medir o grau de imprecisão e inconstância dos dados. O estudo avalia como a confiabilidade dessas estimativas varia de acordo com o perfil demográfico da vítima (sexo, raça, idade), o tipo de crime e a localidade. O notebook carrega e trata um grande volume de arquivos .xls da PNAD 2009.[INCOMPLETO]

Metadados e Documentação Técnica

Projetos de Análise e Resultados

A tabela a seguir detalha o status dos projetos de análise, indicando os concluídos (✅), os dados utilizados, os resultados gerados e as análises futuras planejadas (⬜).

.py, .ipynb
Status Categoria Análise Dados Relevantes Observações Arquivos Gerados
Status: Concluído Violência Escolar Panorama sobre o perfil e a percepção de alunos e professores em escolas de Minas Gerais (2006). alunos_2006.csv, professores_2006.csv A análise inclui distribuição demográfica, experiência docente e satisfação discente.
Status: Concluído Percepção Social Análise da percepção de risco de crimes (roubo, agressão, sequestro) em Belo Horizonte e Minas Gerais. belo_horrizonte_2002.xlsx, percepcao_medoMG.xlsx Os dados foram segmentados por sexo, tipo de bairro e faixa etária, revelando diferenças na experiência do medo.
Status: Planejado Violência Urbana Evolução dos índices de violência ao longo do tempo. indices_violencia.csv Comparar diferentes anos para identificar tendências.
Status: Planejado Violência Urbana Análise comparativa entre tipos de crimes (agressão, furto, roubo). agressao, furto, roubo Analisar proporções para compreender a natureza da criminalidade.
Status: Planejado Demografia Distribuição populacional por idade e sexo. populacao_idade_sexo.csv Possibilidade de cruzamento com dados de violência para análises aprofundadas.
Status: Planejado Homicídios Análise de homicídios tentados e consumados. Homicidios Tentado e Consumado(ENELISE) Verificar necessidade de tratamento adicional dos dados.
Status: Planejado Dados Socioeconômicos Análise de indicadores da Pesquisa Nacional por Amostra de Domicílios (PNAD). PNAD_2009 PNAD

Fontes de Dados Utilizadas

Esta seção detalha os arquivos de dados brutos utilizados, incluindo uma breve descrição do seu conteúdo principal.

Nome do Arquivo (Caminho) Planilha(s) no Arquivo Descrição
indices_violencia.csv N/A Contém índices de violência referentes ao Survey de Vitimização em Belo Horizonte (2002).
Vitimizacao_UP_27.csv N/A Contém dados de vitimização de uma unidade de pesquisa específica, como parte do Survey de Vitimização em Belo Horizonte (2002).
amostra_BH.xls Plan1, Plan2, Plan3, Plan4 Contém amostras de dados coletadas em Belo Horizonte no âmbito do "Módulo da Pesquisa de Percepção de Medo e Cultura Cidadã" (2008).
amostra_MG.xls Plan1 Contém amostras de dados para o estado de Minas Gerais, coletadas para a "Pesquisa de percepção de medo em Minas Gerais" e a "Pesquisa Policiamento comunitário: a visão dos policiais" (2008).
populacao_idade_sexo.csv N/A Contém dados demográficos da população brasileira (fonte: IBGE/PNAD), categorizados por idade e sexo.
alunos_2006.csv N/A Contém dados de alunos coletados em 2006, referentes ao projeto "Violência nas escolas públicas de Belo Horizonte e Região Metropolitana".
professores_2006.csv N/A Contém dados de professores coletados em 2006, relacionados ao mesmo projeto de violência nas escolas.
Homicidios Tentado e Consumado(ENELISE).xls Homicidios Consumado, Homicidios Tentado, etc. Inclui dados sobre homicídios tentados e consumados em diversas cidades de Minas Gerais.
Dados da PNAD 2009 Múltiplas Dados da Pesquisa Nacional por Amostra de Domicílios (2009), com 153.837 domicílios, organizados em subpastas por tipo de ocorrência (agressão, furto, roubo, etc.).

Inventário de Pesquisas Relevantes em Segurança Pública

Tabela 1: Projetos e Pesquisas Geradoras de Dados

Esta tabela lista os principais projetos e pesquisas que resultaram na coleta de dados sobre vitimização e percepção de segurança no Brasil.

Check List Duração Nome do serviço/breve descrição dos principais produtos/resultados Nome do Contratante e país do serviço
2002 Survey de Vitimização em Belo Horizonte Belo Horizonte - Minas Gerais
2005 - 2006 Pesquisa domiciliar de vitimização na cidade do Rio de Janeiro Rio de Janeiro - Rio de Janeiro
2005 Prevenção da violência nas escolas públicas de Belo Horizonte: caracterização das escolas e intervenções possíveis Contagem - Minas Gerais
2005 Pesquisa de vitimização nas cidades de Curitiba e Foz do Igraçu Curitiba e Foz do Igraçu - Paraná
2006 Violência nas escolas pública de Belo Horizonte e Região Metropolitana: caracterização do cenário, identificação de intervenções preventivas e capacitação para gestão local do problema Região Metropolitana de Belo Horizonte - Minas Gerais
2006 Survey de Vitimização na Região Metropolitana de Belo Horizonte Região Metropolitana de Belo Horizonte - Minas Gerais
2006 Diagnóstico da violência criminal no município de Itabira e construção do plano de segurança municipal com pesquisa de vitimização Itabira - Minas Gerais
2008 Diagnóstico de cultura cidadania no município de Belo Horizonte Belo Horizonte - Minas Gerais
2008 Pesquisa de percepção de medo em Minas Gerais Minas Gerais
2008 Pesquisa Policiamento comunitário: a visão dos policiais Minas Gerais
Diagnóstico da qualidade e efetividade de atendimento socioeducativo
Estudo sobre saúde dos profissionais do Sistema de defesa social
2009 Diagnóstico da violência criminal no município de Contagem e construção do Plano de segurança municipal e pesquisa de vitimização Contagem - Minas Gerais
2012 Pesquisa Nacional de Vitimização Belo Horizonte - Minas Gerais
2022 Plano de segurança e ordem pública e pesquisa de vitimização Santa Bárbara – Minas Gerais
2023 Diagnóstico de Criminalidade, Plano municipal de segurança pública do município de Contagem e pesquisa de vitimização Contagem - Minas Gerais
2023 Meta-análise de pesquisas de Vitimização em Minas Gerais e no Brasil Minas Gerais
2023 Diagnóstico da Segurança Pública em Minas Gerais: Pesquisa de Vitimização, Pesquisa de Qualidade de vida dos agentes de segurança, Mapeamento da articulação do Sistema de Justiça e dos Municípios com a segurança pública Minas Gerais

Tabela 2: Catálogo Detalhado de Pesquisas de Vitimização (Características Técnicas)

Esta tabela apresenta um panorama de diversas pesquisas de vitimização realizadas no Brasil, com detalhes sobre sua metodologia, abrangência e escopo temporal. Nota: Algumas informações podem estar incompletas.

Check List Ano Pesquisa/Instituição Responsável Abrangência Período de Referência Tamanho da Amostra
1988 PNAD Brasil 1 ano 81.628 domicílios
1992 Ilanud Município do Rio de Janeiro e Município de São Paulo 5 anos 1.000 entrevistados
1996 Ilanud Município do Rio de Janeiro e Município de São Paulo 5 anos 1.000 entrevistados
1996 Iser/PAHO Município do Rio de Janeiro 5 anos 2.469 entrevistados
1996 ISER/FGV Região Metropolitana do RJ 1 ano 1.126 entrevistados
1997 Ilanud Município do Rio de Janeiro e Município de São Paulo 5 anos 2.400 entrevistados
1997/1998 O Povo e a PM Distrito Federal Toda a vida 2000 entrevistados
1998 SEADE SP - Região Metropolitana e municípios com mais de 50.000 habitantes 1 ano 14.000 domicílios
1999 USP Região Metropolitana de SP 6 meses 1.000 entrevistados
2000 ISER Baixada Fluminense - RJ 1 ano 1.389 entrevistados
2001 CDHP - IBGE Copacabana e Leme 1 ano 450 entrevistados
2001 Universidade de Caxias do Sul Caxias do Sul (RS) Sem informação Sem informação
2001 GUTO - UNESP Município de Marília - SP Toda a vida 828 entrevistados
2002 Módulo da PESB / DATAUFF Brasil Toda a Vida 2460 entrevistados
2002 Ilanud/FIA/USP São Paulo, Rio de Janeiro, Vitória e Recife (municípios) 5 anos 2.800 entrevistados
2002 ISP / Viva Rio Município do Rio de Janeiro 1 ano 765 entrevistados
2002 CRISP Município de Belo Horizonte 1 ano e 5 anos 4.000 entrevistados
2003 Instituto Futuro Brasil Município de São Paulo 1 ano e 5 anos 5.000 domicílios
2003 GUTO - UNESP Município de Marília - SP Toda a vida Sem Informação
2003 CPP / INSPER Município de São Paulo 1 ano 5.000 entrevistados
2004 Prefeitura Alvorada (RS) 1 ano 500 domicílios
2005 IBPS - PMV Rio de Janeiro 1 mês 1.100 entrevistados por telefone
2005 CRISP/SSP-Curitiba Curitiba 1 ano e 5 anos 3560 entrevistados
2005 NEPP- PR Foz do Iguaçu 1 ano e 5 anos 700 entrevistados
2005 SENASP - SEGUP - UFPA/CCS Região Metropolitana de Belém e 8 municípios do Interior 2 anos 2848 entrevistados
2005/2006 NUPEVI / UERJ Município do Rio de Janeiro Toda vida e 1 ano 4.000 entrevistados
2006 CRISP Região Metropolitana de Belo Horizonte 1 ano e 5 anos 6.220 entrevistados
2006 SEADE /Bloco da PED Região Metropolitana de SP Sem informação 3.000 domicílios/mês
2006 Pesquisa de Vitimização nas regiões do Orçamento Participativo Regiões do Orçamento Participativo de Porto Alegre/RS 1 ano 1.404 domicílios
2007 ISP Região Metropolitana do RJ 1 ano e 5 anos 5.000 entrevistados
2007 CRISP Município de Itabira - MG 1 ano e 5 anos 401 entrevistados
2007 Prefeitura Esteio /RS 23 meses 2.682 entrevistados
2007/2008 Universidade Federal de Pelotas Município de Pelotas - RS 1 ano e 5 anos 2918 entrevistados
2008 GUTO - UNESP Município de Marília - SP Toda a vida 741 entrevistados
2008 CPP / INSPER Município de São Paulo 1 ano 2.967 entrevistados
2008 UFGO Região Metropolitana de Goiânia – GO Sem informação 3200 entrevistados
2008 Instituto Futuro Brasil Município de São Paulo 1 ano e 5 anos 3.000 domicílios
2008 Módulo da Pesquisa de Percepção de Medo e Cultura Cidadã Belo Horizonte, RMBH, Municípios polo e 16 municípios pequenos do interior de Minas Gerais Toda a vida 5.607 entrevistados
2008 NEI/UFES Grande Vitória (Serra, Cariacica, Viana, Vitória e Vila Velha) 12 meses e 05 anos 5.244 entrevistados
2009 Módulo da Pesquisa de Percepção de Medo e Cultura Cidadã Belo Horizonte, RMBH, Municípios polo e 16 municípios pequenos do interior de Minas Gerais Toda a vida 5.067 entrevistados
2009 PNAD Brasil 1 ano 153.837 domicílios
2009 Pesquisa de Vitimização de Canoas Município de Canoas/RS 12 meses 1.568 entrevistados
2010 Pesquisa de Vitimização no estado do Mato Groso FEC/DataUFF Mato Grosso 12 meses 4.000 domicílios
2010 Módulo da PCVAPSP IESP/UERJ Brasil   3.612 domicílios
2010/2012 PNV/MJ Brasil 1 ano e Toda a vida 78.008 entrevistados
2012 Pesquisa de Vitimização Santa Catarina (DATAUFF/PMSC) Santa Catarina Sem Informação 400 entrevistados
2013 CPP / INSPER Município de São Paulo 1 ano 3.000 entrevistados
2013 Representações Sociais sobre Violência e Criminalidade de Bagé Bagé/RS Sem Informação 408 entrevistados
2015 Pesquisa sobre vitimização e percepção de risco entre profissionais da segurança (FBSP) Profissionais de Segurança Pública registrados na Rede de Ensino à Distância da SENASP/MJ Toda a carreira 10.323 entrevistados
2015 (Em andamento) Observatório de Segurança Cidadã Município de Novo Hamburgo - 600 entrevistados
2015 (Em andamento) Pesquisa Distrital de Segurança (SSPPS) Distrito Federal - 19.537 domicílios