RivieraMayaPass: bot de sargazo con IA y Machine Learning que predice los próximos días
Proyectos

RivieraMayaPass: bot de sargazo con IA y Machine Learning que predice los próximos días

Publicado el 23 de junio de 2026·12 min de lectura

En Playa del Carmen hay un problema que nadie había resuelto bien: los turistas quieren saber si la playa tiene sargazo hoy. No ayer. No en general. Hoy. Buscan en Google, encuentran notas de hace tres meses, un video de TikTok sin fecha y opiniones contradictorias en TripAdvisor. Llegan a la playa y se encuentran con dos metros de alga marrón apilada. El día de playa que imaginaron no existe.

Eso es el problema que construí RivieraMayaPass para resolver. Y de paso, lo convertí en un negocio: el mismo sitio que informa sobre el sargazo vende day passes y tours de la Riviera Maya.

En este post cuento cómo funciona el bot, cómo implementé Machine Learning para predecir los próximos días, y —lo más importante para vos si tenés un negocio— cómo este mismo enfoque se puede aplicar a industrias muy distintas.

Qué es RivieraMayaPass

RivieraMayaPass es el especialista local del day pass en la Riviera Maya. Conecta viajeros con beach clubs, albercas y playas limpias en Playa del Carmen para disfrutar un día completo sin pagar la noche de hotel.

El diferencial frente a las grandes plataformas (Booking, Airbnb Experiences) es un dato que ellas no tienen y que solo puede dar alguien local: el estado del sargazo playa por playa, actualizado cada día. Ese dato es el gancho que atrae el tráfico orgánico — y cuando una playa tiene sargazo, el sitio deriva al visitante hacia tours o cenotes donde el mar no importa.

El bot de sargazo: arquitectura completa

El corazón del sitio es un sistema automático que no requiere ninguna intervención manual. Se activa todos los días a las 10:00 AM hora de Quintana Roo y produce el reporte completo:

GitHub Actions (reloj diario)
        │
        ▼
Script en Python
  ├─ Open-Meteo      → viento + temperatura (hoy y pronóstico 3 días)
  ├─ NOAA NHC        → tormentas/huracanes activos en el Caribe
  └─ Google Gemini   → busca el sargazo en internet y cruza todo
        │
        ├─► Vercel (Next.js)  → el visitante ve el reporte
        └─► Supabase          → historial diario acumulado

La pieza clave es Google Gemini con grounding: en vez de construir y mantener scrapers frágiles para cada fuente de sargazo, el modelo busca las fuentes del día en tiempo real (Red de Monitoreo del Sargazo de Quintana Roo, noticias locales, reportes de playas), las lee, las combina con el viento medido y produce un reporte estructurado con:

  • Estado por zona de Playa del Carmen (Norte, Mamitas, Centro, Playacar, Xcalacoco)
  • Estado en Holbox, Isla Mujeres, Puerto Morelos, Cancún y Tulum
  • Viento actual: dirección, velocidad y ráfagas
  • Pronóstico a 3 días con señal de si el viento empuja sargazo a la costa
  • Alertas de tormenta/huracán activas en el Caribe
  • Resumen y recomendación práctica en español e inglés
  • Nivel de confianza del reporte y fuentes consultadas

Costo operativo: prácticamente cero. GitHub Actions tiene un tier gratuito generoso, Open-Meteo y NOAA son APIs abiertas, y Gemini tiene un tier gratuito que alcanza para una llamada diaria sin problema. El sitio corre en Vercel y la base de datos en Supabase — ambos con tier gratuito para este volumen.

El salto de reglas manuales a Machine Learning

La Fase 1 usaba heurísticas simples: "si el viento viene del sureste a más de 15 km/h, probable sargazo mañana". Estas reglas acertaban en el 53% de los casos — exactamente lo mismo que adivinar al azar.

La Fase 2 cambió el enfoque. En lugar de programar reglas, le enseñamos al sistema a reconocer patrones a partir de datos históricos. Así funciona el Machine Learning: en vez de decirle qué pensar, le damos ejemplos y aprende solo.

Las 3 fuentes del modelo

El modelo combina tres tipos de datos que se cruzan por fecha y zona:

  • Semáforo verificado (la "respuesta correcta"): el estado real de cada playa, cargado a mano desde el mapa oficial de la Red de Monitoreo de Quintana Roo. Es el dato de oro: lo que realmente pasó.
  • Clima histórico (las "preguntas"): viento, ráfagas, temperatura y época del año de años atrás, descargados sin costo desde Open-Meteo.
  • Índice AFAI satelital (señal de apoyo): mide cuánto sargazo flota mar adentro frente a cada zona. Sirve para anticipar el arribo días antes de que llegue a la costa.

El algoritmo: Random Forest

El algoritmo elegido es un Random Forest (scikit-learn, Python): un conjunto de muchos árboles de decisión que votan juntos. Cada árbol analiza los datos desde un ángulo diferente; la respuesta final es la que apoya la mayoría.

La pista más fuerte que encontró el modelo: el estado de ayer. El sargazo es inercial — lo que hay hoy es el mejor predictor de mañana. Por eso el modelo no salta de "rojo" a "limpio" de un día al otro, lo cual también es lo más honesto con el visitante.

Resultado: ~80% de acierto a 3 días, entrenando y prediciendo en GitHub Actions, con el reporte publicado automáticamente en la sección "Próximos días" de rivieramayapass.com.

Por qué esto importa para cualquier negocio

El sargazo es un problema específico de Riviera Maya, pero el patrón es universal. Hay negocios en todas las industrias que tienen datos acumulados que no están usando para tomar mejores decisiones o generar valor para sus clientes.

Algunos ejemplos concretos:

  • Agropecuario: datos históricos de clima, precio de granos y cosechas → modelo que predice el mejor momento para comprar insumos o vender producción.
  • Retail o e-commerce: historial de ventas, días feriados, clima → modelo que predice qué productos van a tener alta demanda la semana próxima.
  • Turismo: datos de ocupación, eventos locales, temporada → modelo que predice los picos de demanda y ajusta precios dinámicamente.
  • Servicios profesionales: historial de clientes, estacionalidad → modelo que predice cuándo va a bajar la demanda y recomienda adelantar acciones de venta.

En todos estos casos, el primer paso es el mismo que en RivieraMayaPass: construir el historial. El bot diario que acumula datos hoy es la materia prima del modelo predictivo de mañana. No se necesita tener millones de registros para empezar — con meses de datos consistentes ya se puede entrenar un modelo útil.

El negocio detrás del dato

El estado del sargazo no es el producto — es el imán. Atrae tráfico orgánico de personas que buscan información local antes de decidir qué hacer en su día de vacaciones. Una vez que el visitante está en el sitio, tiene dos opciones según lo que encuentre:

  • Playa limpia: ve los day passes disponibles y reserva por WhatsApp.
  • Sargazo: el sitio le sugiere tours a cenotes, ruinas o Isla Mujeres donde el mar no importa — con links de afiliado a Viator.

Esta estructura convierte un problema (información mala sobre sargazo) en un embudo de conversión que funciona bien en las dos situaciones posibles.

Stack completo

  • Frontend: Next.js 15 (App Router), TypeScript, Tailwind CSS v4
  • Base de datos: Supabase (PostgreSQL)
  • Deploy: Vercel
  • Bot diario: Python + GitHub Actions (cron)
  • IA: Google Gemini con Google Search grounding
  • Clima: Open-Meteo API
  • Tormentas: NOAA National Hurricane Center
  • ML: scikit-learn (Random Forest), pandas
  • Afiliados: Viator Partner API
  • Emails: Resend
  • Analítica: Google Analytics 4 + Vercel Analytics

Lo que queda por construir

La Fase 3 del modelo agrega datos satelitales AFAI de Copernicus — manchas de sargazo flotando en el Atlántico que se pueden detectar días antes de llegar a la costa. Combinado con la visión computacional del mapa-semáforo oficial, eso permitiría pasar de "~80% de acierto a 3 días" a predicciones confiables con 5-7 días de anticipación.

En el frente comercial, el objetivo es sumar beach clubs y hoteles con acuerdo directo — que carguen sus day passes desde el panel de administración y aparezcan en la grilla del home.

Si tenés un negocio en Riviera Maya y querés aparecer en rivieramayapass.com, hay un formulario de alta para prestadores en el mismo sitio.

Y si lo que te interesa es replicar algo similar — un bot de datos, un modelo predictivo o una plataforma que combine información y conversión — hablemos.