Quando trabalhamos com arquivos de dados muito grandes, se torna inviável a edição deles num programa de planilhas, como o Microsoft Excel ou as planilhas do Google Drive. Então a solução é usar um editor de código para editar os arquivos originais e gerar arquivos secundários divididos que poderão, daí, ser trabalhados no Excel sem problemas.
Neste tutorial vamos fazer isso com os microdados do Censo da Educação Superior do MEC. Primeiro vamos abrir o arquivo estados, que contém a lista de instituições por estado:
1. Utilize a tabela estados para filtrar as instituições por estado. Isso vai te dar a lista de IES no estado que você está pesquisando. No caso do Acre, são 11 universidades, faculdades.
2. Uma vez que os dados estejam filtrados por estado, copie do Excel o nome da instituição que você quer pesquisar.

3. Usando o Find no Sublime Text, procure pela instituição nos arquivos da pasta Split. Note que os dados estão organizados por ordem crescente de código de IES. Comece pelo arquivo xaa, que é o primeiro.

4. Quando o Sublime encontrar a instituição no arquivo, clique em Find All, o que vai selecionar todos os resultados.

5. Vá no menu Selection do Sublime e clique em Expand selection to line. Isso vai selecionar as linhas inteiras. Copie os dados (usando Crtl+C).

6. Cole no arquivo de destino. Salve.

7. Repita o processo para todas as instituições.

8. Copie a primeira linha do arquivo xaa.csv, que contém os nomes das colunas do arquivo de dados. Isso te poupa de ter que digitar os títulos depois. O arquivo final deverá ficar semelhante a esse:acre

9. Abra uma planilha em branco do Excel e faça a importação do arquivo csv. Pronto. Agora é só sistematizar os dados

Problemas possíveis:

  • Meu arquivo CSV não abre inteiro no Excel.

O Excel tem um limite de 250.000 linhas por planilha. Ou seja, se teu arquivo csv tem mais de 250.000 linhas, ele não vai abrir inteiro numa planilha. O que você pode fazer é dividir o arquivo em dois ou mais arquivos usando nosso tutorial. Daí a solução é realizar a sistematização em partes e depois unir tudo para conseguir os dados do estado.

  • Meu arquivo abriu estranho no Sublime.

Tem certeza que você está abrindo o arquivo csv? Se a extensão dele for xls ou xlsx não vai dar para você usar ele no Sublime.

Categories: dados

Deixe uma resposta