Formação em Análise e Visualização de Dados

Judite Cypreste e Patrícia Catandi
06
de
October
de
2023

Este é o segundo de quatro artigos que abordam a abordagem da Prefeitura do Rio de Janeiro na capacitação em upskilling e reskilling centrada em dados, apresentando as soluções implementadas até o momento, os desafios enfrentados e as propostas para o futuro.

A ementa deste curso pode ser vista neste link.

Formação em Análise e Visualização de Dados

Esta formação tem como objetivo ensinar conhecimentos em SQL, Python, análise e visualização de dados para servidores e funcionários municipais, promovendo o reskilling dos participantes. 

Além disso, visamos ampliar a integração entre as pessoas, incentivando a formação de uma comunidade de analistas e desenvolvedores dentro da prefeitura, fornecendo independência aos diversos órgãos e secretarias para a obtenção e análise de dados.

Público-alvo

O público-alvo desta formação abrange qualquer funcionário da prefeitura, tendo prioridade os servidores de carreira. Essa decisão visa assegurar que o conhecimento adquirido permaneça na prefeitura por um período mais longo. Essa prioridade é gradualmente reduzida à medida que novos ciclos de capacitação são iniciados. Não é exigido conhecimento prévio para a participação nesta formação, mas, devido à alta demanda em relação ao número de vagas disponíveis, realizamos um simples processo de seleção para verificar se os candidatos possuem o perfil analítico necessário e tempo disponível durante a semana para dedicar aos estudos.

Inscrição e seleção de participantes

A inscrição é feita por meio de um formulário online composto por três partes: identificação pessoal, um questionário sobre conhecimentos gerais e outro sobre conhecimentos específicos.

Na seção de identificação pessoal, coletamos informações de contato, o setor da prefeitura onde o candidato trabalha, se é servidor público e se sua chefia imediata está ciente de seu interesse em participar da trilha. Exigimos a ciência da chefia imediata por dois motivos: para que ela esteja ciente da necessidade de reduzir a carga de trabalho do participante, evitando desistências devido à falta de tempo, e para que ela possa direcionar projetos que exijam as novas habilidades adquiridas, consolidando o conhecimento na prefeitura.

Na seção de conhecimentos gerais, avaliamos a afinidade do candidato com trabalhar com dados e análises, suas abordagens para resolver problemas e suas motivações para fazer o curso. Também perguntamos como essa habilidade pode ser aplicada em sua área de atuação, quantas horas semanais ele tem disponíveis para estudar e quantos cursos online ele já se inscreveu e concluiu. O objetivo é identificar candidatos altamente motivados e com maior probabilidade de aplicar os conhecimentos no dia-a-dia, reduzindo a taxa de desistência ao longo da trilha.

A seção de conhecimentos específicos é destinada a avaliar a proficiência dos participantes e, em casos de empate na seleção, serve como critério de desempate. Ela inclui perguntas sobre conhecimento em tipos de gráficos, habilidades de análise em Excel, experiência em linguagens de programação e familiaridade com dashboards e plataformas utilizadas.

Todas as questões utilizadas no processo de seleção estão disponíveis neste formulário.

Formato

Esta trilha é realizada inteiramente a distância e inclui cursos assíncronos e síncronos. A parte teórica não específica sobre a prefeitura é ministrada por meio de cursos online gratuitos de forma assíncrona, enquanto os conteúdos relacionados à prefeitura são entregues por monitores de forma síncrona.

Para evitar que os alunos passem muito tempo apenas assistindo a aulas sem aplicar os conhecimentos adquiridos, dividimos os cursos em uma breve parte teórica seguida de exercícios propostos pelos monitores. Esses exercícios são projetados para relacionar o conhecimento aprendido com dados e análises usados na prefeitura, permitindo que os alunos apliquem o conhecimento imediatamente.

Os exercícios devem ser concluídos em uma semana após o término da parte teórica do módulo. No dia seguinte, um dos monitores desta trilha corrigirá os exercícios e oferecerá suporte para tirar dúvidas sobre o conteúdo ensinado.

Este processo se repete em todos os módulos, proporcionando aos alunos um ambiente de aprendizado contínuo e prático. Além disso, os exercícios servem como checkpoints para avaliar o progresso dos participantes, incentivam o comprometimento semanal e mantém o engajamento no curso.

Estruturação Teórica da Trilha

Sabemos que ao longo do curso alguns participantes podem desistir por diversos motivos. Para garantir que os desistentes tenham um conhecimento mínimo para analisar dados, iniciamos a trilha com o curso assíncrono de SQL da Khan Academy disponível no link.

A escolha de começar com SQL deve-se à sua maior facilidade de aprendizado em comparação com Python, permitindo um aumento gradual na complexidade. 

Um exemplo de cronograma de estudo pode ser visualizado na imagem a seguir, que mostra as etapas do curso de SQL.

Como podemos ver acima, o módulo de SQL foi dividido em duas partes teóricas, cada uma seguida por uma entrega obrigatória e uma sessão de dúvidas e correção, possibilitando que os alunos aprendam um tópico e o apliquem na prática. Além disso, esses exercícios desempenham outras funções importantes como a avaliação do progresso dos participantes e estímulo para que se comprometam semanalmente nos estudos, aumentando o engajamento no curso. As atividades solicitadas estão, respectivamente, em link1 e link2.

Uma vez que os participantes adquirem habilidades em SQL, ensinamos como acessar os dados do Datalake da prefeitura utilizando o BigQuery da Google Cloud Platform (GCP). Nesta etapa o aluno aprende a como realizar consultas nas bases de dados do Datalake e como realizar o download destes resultados para análises em outras plataformas.

Em seguida, concluímos esta primeira parte com o ensino do Metabase, que possibilita com que os alunos consigam construir dashboards e gráficos utilizando os dados que foram analisados no Datalake. O exercício solicitado referente a esse tópico encontra-se neste link.

Estas duas últimas aulas são oferecidas de forma síncrona, onde o monitor demonstra as ferramentas.

Na segunda parte deste curso, o aluno aprenderá os conceitos básicos da linguagem Python. Para isto, escolhemos o curso assíncrono "Fundamentos de Linguagem Python Para Análise de Dados e Data Science" da DataScienceAcademy disponível no link.

Este curso oferece mais conteúdo do que o necessário para nossa trilha introdutória de Python, portanto, selecionamos os seguintes tópicos como obrigatórios para a nossa certificação: 

Ao longo do curso, enfatizamos a importância de revisitar os tópicos não obrigatórios para obter um conhecimento mais profundo em Python.

Nesta parte os alunos também são avaliados por meio de exercícios propostos pelos monitores e podem ser acessados em lista 1, lista 2, lista 3, lista 4 e lista 5.

A etapa final da trilha envolve a apresentação de um projeto no qual os participantes aplicam os conhecimentos adquiridos para resolver um problema em sua área de atuação na Prefeitura. Essa etapa é fundamental para ajudar os participantes a identificar problemas que podem ser resolvidos com as ferramentas aprendidas e motivá-los a concluir a trilha.

Com o acompanhamento do progresso dos participantes por meio dos exercícios e da apresentação de seus projetos finais, conseguimos identificar quais alunos serão convidados a participar da trilha de Infraestrutura e Pipeline de Dados, desenvolvendo assim novas habilidades.

Este é um resumo abrangente da estrutura e do processo da trilha de Formação em Análise e Visualização de Dados da Prefeitura do Rio de Janeiro. A formação proporciona uma base sólida para os servidores municipais adquirirem habilidades essenciais em análise de dados, fortalecendo a capacidade da prefeitura de tomar decisões informadas e eficazes.