Nesta semana, o foco da atividade será a padronização de dados, a análise temporal e a interpretação de informações salariais e profissionais, aprofundando a compreensão do conjunto de dados e desenvolvendo uma análise mais estruturada e crítica.

  1. Padronização e tradução dos nomes das colunas:

    Nesta etapa, os alunos deverão traduzir os nomes das colunas do banco de dados para o português, garantindo clareza, coerência e fidelidade ao contexto da Ciência de Dados. A padronização é uma prática fundamental na preparação de dados (data cleaning), pois melhora a organização, a legibilidade e a compreensão das variáveis analisadas. Além da tradução, recomenda-se adotar um padrão consistente de nomenclatura (por exemplo, uso de letras minúsculas, separação por underscore e ausência de caracteres especiais), favorecendo a manutenção e a replicabilidade das análises.


  2. Análise temporal:

    Os alunos deverão pesquisar sobre análise de dados temporais. A análise temporal possibilita identificar tendências, sazonalidades e variações ao longo do tempo, sendo essencial para compreender a evolução de salários, cargos e demandas no mercado de trabalho em Ciência de Dados.


  3. Comparação de colunas de salário:

    Nesta etapa, os alunos devem pesquisar e explicar a diferença entre o salário na moeda original (*salary*) e o salário convertido para uma moeda padrão, geralmente em dólar americano (USD). É importante discutir o conceito de padronização monetária e sua relevância em análises comparativas internacionais, destacando como a conversão cambial permite análises mais justas entre diferentes países. Também deve-se refletir sobre possíveis impactos de taxas de câmbio, inflação e poder de compra na interpretação dos resultados.


  4. Análise das categorias profissionais:

    Os alunos deverão analisar as categorias profissionais presentes na coluna *job_category*, identificando quais áreas da Ciência de Dados apresentam maior número de registros no banco de dados. A análise deve incluir a contagem de frequência das categorias, podendo utilizar métodos como value_counts(). Além disso, é importante discutir a relevância dessas categorias no contexto do mercado atual, relacionando os resultados encontrados com tendências da área, crescimento da demanda por determinados perfis profissionais e possíveis implicações para formação e empregabilidade.


PDF da Atividade 2:

Atividade2.pdf


Códigos Markdown:

Códigos_Markdown___Extensão.pdf