Día a día se produce una cantidad increíble de datos que pueden ser usados para generar conocimiento, predecir eventos y clasificar prácticamente de todo, por lo tanto, si te interesa lo que se puede lograr con todos estos datos, pero no tienes ni ídea por donde iniciar , lo más probable es que escuches que los lenguajes más populares para aprender Machine Learning son Python y R.
Les dejo las siguientes guías prácticas a seguir para conocer cómo involucrarse en este apasionante mundo.
Clasificador de Flores de Iris – Lidgi González
Este proyecto es conocido como el “Hello World” para aprender Machine Learning. En él dispones de una dataset con datos como la longitud del sépalo y los pétalos, así como la especie a la que pertenece, con esta data de entrenamiento tendrás que clasificar las futuras flores que recibas.
Beneficios:
- Un dataset pequeño y limpio, no necesita pre-procesamiento
- Tres diferentes categorías para la Clasificación
Reconocimiento de escritura a mano – MathWorks
Un ejemplo básico, pero bastante impresionante, es el poder reconocer un número escrito a mano, para ello disponemos del popular dataset de MNIST, el cual incluye 60,000 imágenes de entrenamiento de números escritos a mano del 0 al 9.
Cuenta con:
- Un dataset grande pero sencillo de utilizar con keras
- Utiliza Redes neuronales convolucionales
Guía paso a paso : www.data-flair.training
Precios de casas – Breteuil Immobilier
Un problema de predicción clásico, es que contamos con atributos de una propiedad, por ejemplo, habitaciones, metros cuadrados, entre otros; y a partir de nuestra data de entrenamiento tenemos que generar un modelo que calcule el valor de una propiedad.
Importante:
- Se comienza por regresión lineal
- Ingeniería de datos o preprocesamiento de datos
Kaggle, Titanic, Machine Learning from Disaster – Dataquest.io
De mano de la popular página de retos de Machine Learning Kaggle, nos presenta este problema introductorio en su plataforma, con base a un dataset con datos de los pasajeros del titanic (género, clase social, edad, entre otros), debemos predecir si un pasajero sobrevivirá o no.
Útil para:
- Practicar tus habilidades con clasificadores
- Aprender a usar la plataforma de kaggle
Guía paso a paso: www.kaggle.com
Sistema de recomendación de películas – Towards Data Science
Es un sistema de recomendación, como lo están en todos lados, tiendas en líneas, servicios de streaming, redes sociales, en este ejemplo, el dataset de MovieLens, contiene películas, tags, calificaciones y usuarios, un divertido proyecto para poner a prueba tus habilidades.
Guía paso a paso: www.towardsdatascience.com
Predicción de ventas – BI Worldwide
Aquí tenemos otro reto interesante para aprender Machine learning con nuestras habilidades de predicción, tomando de base un dataset con información de las tiendas de Walmart (tamaño, fecha, temperatura), debemos predecir cuánto venderá la tienda en un día determinado.
Lo bueno:
- Nos lleva a la comparación de múltiples modelos contra la misma data
- Realizamos un análisis exploratorio de los datos
Guia paso a paso: www.medium.com
Detector de noticias falsas – Bloygo – Yoigo
En este ejemplo trabajamos nuevamente con algoritmos de clasificación, sin embargo, tendremos que realizar una transformación de nuestro dataset inicial para hacerlo manejable para nuestros modelos.
Imagina:
- Si contamos con un conjunto de artículos algunos de ellos falsos, otros verdaderos, ¿puedes entrenar un clasificador para que procese textos?
- Te ayudará a resolver este problema.
Guía paso a paso: https://data-flair.training
Análisis de sentimientos en Twitter – Universo Machine Learning
Partiendo de una base de tweets reales minados, se desea identificar cuáles son los tweets que contienen odio de los que no, este proyecto te enseña cómo pueden funcionar los algoritmos para censura de comentarios en redes sociales.
A destacar:
- Analiza y censura comentarios
Guía paso a paso: www.github.com/
Esperamos que estos proyectos te aporten experiencia práctica para aprender Machine Learning y te motiven a investigar más en esta apasionante área que demuestra resultados cada vez más asombrosos.