ChatGPT agregó controles deslizantes de tono, ajustar la calidez, el entusiasmo, los emojis e incluso el formato.
Se acabaron las respuestas demasiado animadas a menos que vos quieras 😅
Estos ajustes se aplican a las instrucciones personalizadas durante la generación, sin modificar el razonamiento central del modelo.
Los muñecos estos también están redoblando sus esfuerzos en transparencia, ya que un nuevo estudio demuestra que analizar el razonamiento basado en cadenas de pensamiento suele detectar intenciones desalineadas o arriesgadas mucho antes de que se materialicen.
Están impulsando la "monitorabilidad de la cadena de pensamiento" como una métrica de seguridad formal. Los modelos avanzados ya pueden ofuscar o falsear su razonamiento (turbulento 👀), lo que convierte la supervisión real en un objetivo claveee.