Presentación de OpenAI o1-preview una nueva serie de modelos de razonamiento

OpenAI o1 Una nueva serie de modelos de IA diseñados para pasar más tiempo pensando antes de responder.
 
Así ha sido anunciada por OpenAI la nueva serie de modelos.
 
OpenAI ha presentado sus dos nuevos modelos llamados o1 y o1-mini, afirmando que estos modelos pueden «razonar» tareas complejas y resolver problemas más difíciles que los modelos anteriores en ciencias, codificación y matemáticas.
 
OpenAI ha comunicado en relación con o1-mini, que la serie o1 se destaca por la generación y depuración precisa de código complejo, contando con un proceso de «razonamiento» más rápido y económico que resulta especialmente eficaz en la codificación. Informa que al ser un modelo más pequeño, o1-mini es un 80% más barato que o1-preview, es un modelo más potente y rentable para aplicaciones que requieren razonamiento y que no necesiten mayor conocimiento de internet.
 

¿Cuál es el problema que por el momento se ha detectado? 

Según todos aquellos que están haciendo sus primeras pruebas, es un poco lento. OpenAI afirma que el modelo demorará un poco más de tiempo de lo habitual antes de responder a las preguntas. 
 
Momento para reflexionar:
La primera pregunta que me hice al leer acerca del problema fue «es un poco lento». En realidad la expresión no me dice nada.
  • ¿De cuánto tiempo estamos hablando?
  • ¿Frente a qué tipo de preguntas o pedidos se tomará más o menos tiempo del que estábamos acostumbrados?
  • ¿Qué otros factores influyen en esta evaluación del tiempo que le demanda al modelo «razonar» la pregunta para luego darnos su respuesta?

¿Son modelos que suman más funcionales a las anteriores?

Por el momento, estos modelos no cuentan con las capacidades que tiene GPT-4o, como navegar por la web o cargar de archivos (pdf y/o de imágenes).
 
Momento para reflexionar:
¿Cuál habrá sido el motivo por el cual a estos nuevos modelos no les adaptaron todo lo anterior?
 

¿A partir de cuándo se puede utilizar? 

Los que tenemos ChatGPT Plus y/o Team ya podemos acceder al modelo seleccionándolo en el menú desplegable de la parte superior.
 

¿Qué otros novedades hay?

OpenAI ha informado que la primera de esta serie ha sido lanzada en ChatGPT y para la API.
 

¿Cómo funcionan estos modelos? 

OpenAI informa que han entrenado a estos modelos para que dediquen más tiempo a pensar en los problemas antes de responder. Básicamente con el entrenamiento, estos modelos aprenden a perfeccionar su proceso de pensamiento, prueban distintas estrategias y reconocen sus errores.
 

¿Han tenido en cuenta la seguridad?

OpenAI también ha tenido en cuenta este aspecto, aprovechando en estos modelos sus capacidades de razonamiento para hacer que cumplan las directrices de seguridad y alineación, considerando su contexto en lo que refiere al jailbreaking por ejemplo (cuando un usuario intenta saltear las normas de seguridad establecidas por OpenAI).
Se han ocupado de realizar pruebas y evaluaciones rigurosas utilizando su «Preparedness Framework«, su mejor equipo rojo y procesos de revisión a nivel directivo, incluido su Comité de Seguridad y Protección. En este sentido y en cuanto a su compromiso con la seguridad de la IA, han formalizado acuerdos con los Institutos de Seguridad de la IA de EE.UU. y el Reino Unido. 
 

¿Cómo usarlo? 

  • Los usuarios de ChatGPT Plus y Team podrán acceder a los modelos o1 en ChatGPT.
  • Tanto o1-preview como o1-mini se pueden seleccionar manualmente desde el selector de modelos (en el costado superior).
  • Los límites de tarifa semanal serán de 30 mensajes para o1-preview y 50 para o1-mini.
  • Están trabajando para aumentar esas tarifas y que ChatGPT pueda seleccionar automáticamente el modelo adecuado ante nuestro pedido.
  • Los desarrolladores que cumplan los requisitos para el nivel de uso 5 de la API (se abre en una ventana nueva), pueden empezar a crear prototipos con ambos modelos en la API con un límite de velocidad de 20 RPM. También OpenAI informa que están trabajando para aumentar estos límites tras realizar pruebas adicionales.
  • La API para estos modelos no incluye actualmente:
    • llamadas a funciones
    • streaming
    • soporte para mensajes de sistema y otras características. 
Hay documentación referida a la API aquí
 
OpenAI informa que están planeando ofrecer acceso a o1-mini a todos los usuarios de ChatGPT Free.
 
Estas son algunas de las últimas novedades de esta semana, seguramente seguiremos teniendo más novedades por estos días. 
 
Momento para reflexionar:
  • En lo personal estaré probando con diferentes casos de uso, incluso con un GPT que tengo creado.
  • Si estos modelos se diferencian de los anteriores en que tienen una nueva capacidad de razonar planteos más complejos relacionados con la programación o con las matemáticas, por lo tanto los escenarios deberían ir por ahí, elaborando casos de prueba que estén asociados a nuestra práctica de testing y tener como parámetro el resultado esperado.

Fuente de inspiración: OpenAI

 

 

Gus Terrera

Apasionado por el agile testing y la ia.