Ocho proyectos para aprender Machine Learning

Día a día se produce una cantidad increíble de datos que pueden ser usados para generar conocimiento, predecir eventos y clasificar prácticamente de todo, por lo tanto, si te interesa lo que se puede lograr con todos estos datos, pero no tienes ni ídea por donde iniciar , lo más probable es que escuches que los lenguajes más populares para aprender Machine Learning son Python y R.

Les dejo las siguientes guías prácticas a seguir para conocer cómo involucrarse en este apasionante mundo.

Clasificador de Flores de Iris – Lidgi González

Este proyecto es conocido como el “Hello World” para aprender Machine Learning. En él dispones de una dataset con datos como la longitud del sépalo y los pétalos, así como la especie a la que pertenece, con esta data de entrenamiento tendrás que clasificar las futuras flores que recibas.

Beneficios:

  • Un dataset pequeño y limpio, no necesita pre-procesamiento
  • Tres diferentes categorías para la Clasificación

Reconocimiento de escritura a mano – MathWorks

Un ejemplo básico, pero bastante impresionante, es el poder reconocer un número escrito a mano, para ello disponemos del popular dataset de MNIST, el cual incluye 60,000 imágenes de entrenamiento de números escritos a mano del 0 al 9.

Cuenta con:

  • Un dataset grande pero sencillo de utilizar con keras
  • Utiliza Redes neuronales convolucionales

Guía paso a paso : www.data-flair.training

Precios de casas – Breteuil Immobilier

Un problema de predicción clásico, es que contamos con atributos de una propiedad, por ejemplo, habitaciones, metros cuadrados, entre otros; y a partir de nuestra data de entrenamiento tenemos que generar un modelo que calcule el valor de una propiedad.

Importante:

  • Se comienza por regresión lineal
  • Ingeniería de datos o preprocesamiento de datos

Kaggle, Titanic, Machine Learning from Disaster – Dataquest.io

De mano de la popular página de retos de Machine Learning Kaggle, nos presenta este problema introductorio en su plataforma, con base a un dataset con datos de los pasajeros del titanic (género, clase social, edad, entre otros), debemos predecir si un pasajero sobrevivirá o no.

Útil para:

  • Practicar tus habilidades con clasificadores
  • Aprender a usar la plataforma de kaggle

Guía paso a paso: www.kaggle.com

Sistema de recomendación de películas – Towards Data Science

Es un sistema de recomendación, como lo están en todos lados, tiendas en líneas, servicios de streaming, redes sociales, en este ejemplo, el dataset de MovieLens, contiene películas, tags, calificaciones y usuarios, un divertido proyecto para poner a prueba tus habilidades.

Guía paso a paso: www.towardsdatascience.com

Predicción de ventas – BI Worldwide

Aquí tenemos otro reto interesante para aprender Machine learning con nuestras habilidades de predicción, tomando de base un dataset con información de las tiendas de Walmart (tamaño, fecha, temperatura), debemos predecir cuánto venderá la tienda en un día determinado.

Lo bueno:

  • Nos lleva a la comparación de múltiples modelos contra la misma data
  • Realizamos un análisis exploratorio de los datos

Guia paso a paso: www.medium.com

Detector de noticias falsas – Bloygo – Yoigo

En este ejemplo trabajamos nuevamente con algoritmos de clasificación, sin embargo, tendremos que realizar una transformación de nuestro dataset inicial para hacerlo manejable para nuestros modelos.

Imagina:

  • Si contamos con un conjunto de artículos algunos de ellos falsos, otros verdaderos, ¿puedes entrenar un clasificador para que procese textos?
  • Te ayudará a resolver este problema.

Guía paso a paso: https://data-flair.training

Análisis de sentimientos en Twitter – Universo Machine Learning

Partiendo de una base de tweets reales minados, se desea identificar cuáles son los tweets que contienen odio de los que no, este proyecto te enseña cómo pueden funcionar los algoritmos para censura de comentarios en redes sociales.

A destacar:

  • Analiza y censura comentarios

Guía paso a paso: www.github.com/

Esperamos que estos proyectos te aporten experiencia práctica para aprender Machine Learning y te motiven a investigar más en esta apasionante área que demuestra resultados cada vez más asombrosos.

Ernesto Mota
Nací en el d.f., sigo siendo defeño, hoy radico en la hermosa ciudad de Cuernavaca, Morelos, soy Ing. en Sistemas computacionales, con un posgrado en Tecnologías de información, Doctorando en ambientes virtuales de aprendizaje y realidad aumentada, Tecnólogo es mi categoría laboral, y mi linea de investigación es la realidad aumentada aplicada a nuevos entornos de aprendizaje.

Últimos artículos

a

Publicasciones relaciodadas