Skip to content

En este repo Se encuentran diferentes tareas de un Data Science - llegando hasta el modelado de datos en Machine Learning

Notifications You must be signed in to change notification settings

JimeFioni/P_Integrador_M_Learning

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

17 Commits
 
 
 
 
 
 

Repository files navigation

P_Integrador_M_Learning 🚗

Este proyecto constará de tres fases: Análisis exploratorio de datos, Preparación de datos y Modelamiento y evaluación.

Planteamiento del Problema 🚗

Hemos sido contratados en el equipo de ciencias de datos en una consultora de renombre. Nos han asignado a un proyecto de estudio de mercado de una importante automotriz china. Nuestro cliente desea ingresar a nuestro mercado de automóviles, por lo que nos han encomendado analizar las características de los vehículos presentes en el mercado actual. Dado que tienen en su catálogo una amplia colección de modelos de todo tipo, cuyo catálogo está estratificado en gamas según el gusto de cada región, desean saber qué características presentan los vehículos de gama alta y los de gama baja en nuestro mercado, para poder abarcar todo los públicos objetivos ajustándose a toda la demanda y, en base a estos datos, poder cotizar correctamente los vehículos que ofrecerá.

Para ello, nuestro departamento de datos ha recopilado precios y características de varios de los modelos de vehículos disponibles en nuestro mercado, junto con sus precios de venta al público. Y han armado el siguiente diccionario de datos:

DiccionarioDatos

Nuestro Data Lead nos ha recomendado que analicemos detalladamente los datos, los preprocesemos debidamente y que diseñemos dos modelos predictivos, uno para el precio y otro para distinguir vehículos de gama alta y de gama baja, utilizando la mediana de los precios como punto de corte. Desean obtener los archivos con las predicciones en formato de texto plano.

Además del análisis detallado de la exploración de los datos, estas son las dos predicciones posibles que les interesaría analizar: ​

  1. Implementar un modelo de clasificación con aprendizaje supervisado que permita clasificar el precio de los vehículos en baratos y caros usando la mediana de los precios como punto de corte, utilizando los datos que se han puesto a su disposición.

​2. Implementar un modelo de regresión con aprendizaje supervisado que permita predecir el precio final de los vehículos, utilizando los datos que se han puesto a su disposición.

Dataset 🚗

El dataset se encuentra en el siguiente enlace

Preparación de datos 🚗

El notebook con el procesamiento y modelaje se encuentra aqui

Tecnologías utilizadas 🚗

pythonnumpypandasscikit

Trabajo en colaboración 🚗

Valentino Caputa - Silvina De Micco - Gonzalo Ducca - Jimena Fioni

About

En este repo Se encuentran diferentes tareas de un Data Science - llegando hasta el modelado de datos en Machine Learning

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published