MAPA - CDAS - VISUALIZAÇÃO DE DADOS - 53/2023
Considere o conjunto de dados "Automobile Data Set" disponibilizado pela UCI Machine Learning Repository. Esse dataset contém informações sobre diferentes atributos de veículos:
- symboling: avaliação de risco do veículo, representada por um número inteiro.
- normalized-losses: valor normalizado das perdas do seguro automóvel por ano.
- make: fabricante do veículo.
- fuel-type: tipo de combustível do veículo (gasolina ou diesel).
- aspiration: tipo de aspiração do motor (padrão ou turbo).
- num-of-doors: número de portas do veículo.
- body-style: estilo do corpo do veículo (sedã, hatchback, conversível etc.).
- drive-wheels: tipo de tração do veículo (4WD, fwd, rwd).
- engine-location: localização do motor (dianteiro ou traseiro).
- wheel-base: distância entre os eixos dianteiro e traseiro do veículo.
- length: comprimento do veículo.
- width: largura do veículo.
- height: altura do veículo.
- curb-weight: peso do veículo sem passageiros ou carga.
- engine-type: tipo de motor (ohc, ohcf, ohcv, rotor, etc.).
num-of-cylinders: número de cilindros do motor.
- engine-size: tamanho do motor em litros.
- fuel-system: sistema de alimentação de combustível do veículo.
- bore: diâmetro dos cilindros do motor.
- stroke: curso dos cilindros do motor.
- compression-ratio: taxa de compressão do motor.
- horsepower: potência do motor em cavalos-vapor.
- peak-rpm: RPM máximo do motor.
- city-mpg: consumo de combustível na cidade (milhas por galão).
- highway-mpg: consumo de combustível na estrada (milhas por galão).
- price: preço do veículo.
Para realizar a importação, análise e transformação dos dados, você deve utilizar as bibliotecas Pandas e Matplotlib. A seguir, estão listadas as etapas que cria uma visualização de dados com base na transformação dos dados:
1. Importação dos dados: importe o arquivo CSV que está disponível em https://archive.ics.uci.edu/ml/machine-learning-databases/autos/imports-85.data.
2. Descrição estatística: forneça informações como a contagem de registros, média, desvio padrão, valores mínimo e máximo e os quartis para cada coluna numérica.
3. Transformação dos dados: substituia os valores faltantes por 0 e converta a coluna 'price' para valores numéricos em vez de strings.
4. Visualização de dados: mostre a variação de preço (‘price’) em relação ao tamanho do motor ('engine-size') por intermédio de um gráfico de dispersão.
ORIENTAÇÕES IMPORTANTES:
1. Acesse o link com um vídeo tutorial para ajudá-lo nesse processo de criação e desenvolvimento. O acesso deverá ser realizado em: Materiais >> Material da Disciplina.
2. Disserte a respeito do tema seguindo como roteiro os tópicos elencados anteriormente.
3. A entrega deve ser feita exclusivamente por meio do template de entrega da atividade MAPA, disponível no Material da Disciplina.
4. Antes de enviar sua atividade, certifique-se de que respondeu a todas as perguntas e realize uma cuidadosa correção ortográfica.
5. Após o envio, não são permitidas alterações ou modificações. Logo, você tem apenas uma chance de enviar o arquivo corretamente. Revise bem antes de enviar!
6. Lembre-se de que evidências de cópias de materiais, incluindo de outros acadêmicos, sem as devidas referências, serão inquestionavelmente zeradas. As citações e referências, mesmo que do livro da disciplina, devem ser realizadas conforme normas da Instituição de Ensino.
7. Não são permitidas correções parciais no decorrer do módulo, ou seja, o famoso: “professor, veja se minha atividade está certa?”. Isso invalida seu processo avaliativo. Lembre-se de que a interpretação da atividade também faz parte da avaliação.
8. Procure sanar suas dúvidas junto à mediação em tempo hábil sobre o conteúdo exigido na atividade, de modo que consiga realizar sua participação.
9. Atenção ao prazo de entrega, evite o envio de atividade em cima do prazo. Você pode ter algum problema com internet, computador, software etc., e os prazos não serão flexibilizados, mesmo em caso de comprovação.
Bons estudos!
Em caso de dúvidas, encaminhe mensagem ao seu professor mediador.