1/9 — TÍTULO + INTRO
Este estudio hace algo súper interesante: coge planes de entrenamiento generados por IA (modelos de lenguaje grande (LLM, Large Language Model)) y los pone a examen con coaches reales y experimentados (que tengan la carrera de CCAFYD, experiencia como entrenadores...).
Comparan Google Gemini vs GPT-3.5 en dos versiones:
GPT-3.5 vía ChatGPT y GPT-3.5 vía Microsoft Copilot (mismo “modelo base”, pero distinta plataforma/capa, y eso puede cambiar lo que te devuelve).
La idea central: con prompts (instrucciones) “completos”, generar 6 planes semanales (hipertrofia + fuerza por cada IA) y que entrenadores los valoren con una rúbrica.
👉 Spoiler: la calidad global fue “moderada” y, aunque Gemini sale algo mejor en algunos puntos, casi nada llega a sobresaliente.
📎 Enlace directo al PAPER 👇