OpenAI y el proyecto Strawberry

Un salto hacia el razonamiento avanzado en inteligencia artificial

jul 15, 2024

OpenAI, la empresa creadora de ChatGPT, está trabajando en un nuevo enfoque para sus modelos de inteligencia artificial bajo el nombre en clave "Strawberry", según reveló Reuters el 12 de julio de 2024 (Reuters, 2024a). Este proyecto, anteriormente conocido como Q*, representa un esfuerzo significativo de la compañía para demostrar capacidades de razonamiento avanzadas en sus sistemas de IA.

Definición y expectativas de la AGI

Comencemos escribiendo sobre la Inteligencia Artificial General (AGI en inglés). La AGI representa un salto cualitativo respecto a los sistemas de IA actuales. Mientras que la IA convencional se especializa en tareas específicas, la AGI busca replicar la versatilidad cognitiva humana. Esto implica no solo la capacidad de aprender de forma autónoma, sino también de aplicar ese conocimiento en una variedad de contextos.

Sam Altman, CEO de OpenAI, ha declarado que espera que la AGI pueda alcanzarse en esta década (Bloomberg News, 2024). Esta afirmación refleja el optimismo y la ambición de la empresa en este campo, aunque también ha generado debate en la comunidad científica sobre la viabilidad y los plazos realistas para lograr este hito.

Los niveles de AGI según OpenAI

Recientemente, OpenAI ha desarrollado una escala interna para medir el progreso hacia la AGI. Esta clasificación, que consta de cinco niveles, se ha discutido en reuniones internas y se espera que se comparta más ampliamente con inversores y el público en un futuro cercano (Bloomberg News, 2024). Los niveles propuestos son:

Chatbots: IA con capacidades de lenguaje conversacional (nivel actual).
Razonadores: IA con habilidades de resolución de problemas a nivel de un humano con doctorado.
Agentes: Sistemas capaces de realizar acciones autónomas durante varios días basándose en instrucciones iniciales.
Innovadores: IA capaz de generar innovaciones no especificadas inicialmente por los usuarios.
Organizaciones: IA con capacidad para realizar el trabajo de toda una organización.

Según la propia evaluación de OpenAI, la empresa ha alcanzado el Nivel 1 y está cerca de lograr el Nivel 2 (Bloomberg News, 2024). Esta clasificación proporciona una hoja de ruta clara para el desarrollo de la AGI y permite una evaluación más precisa del progreso.

Orígenes y desarrollo del proyecto Strawberry

El proyecto Strawberry se conoce internamente en OpenAI desde hace algún tiempo. Según la información obtenida por Reuters, equipos internos de la empresa han estado trabajando en esta iniciativa, como se detalla en un documento interno reciente revisado por la agencia de noticias en mayo de 2024 (Reuters, 2024a). Aunque la fecha exacta del documento no se pudo determinar, este describe un plan sobre cómo OpenAI pretende utilizar Strawberry para realizar investigaciones avanzadas.

Es importante destacar que los detalles específicos sobre el funcionamiento de Strawberry son un secreto muy bien guardado, incluso dentro de la propia OpenAI. Esto sugiere la importancia estratégica que la empresa otorga a este desarrollo (Reuters, 2024a).

Objetivos y capacidades previstas

El documento interno revisado por Reuters describe un proyecto ambicioso que busca llevar las capacidades de la IA de OpenAI más allá de la simple generación de respuestas a consultas. Los objetivos principales de Strawberry incluyen:

Planificación autónoma: Permitir que la IA planifique con suficiente antelación para navegar por internet de forma autónoma y fiable (Reuters, 2024a).
Investigación profunda: Capacitar a los modelos para llevar a cabo lo que OpenAI denomina "investigación profunda", un concepto que implica una comprensión y análisis más profundos de la información disponible (Reuters, 2024a).
Razonamiento avanzado: Mejorar drásticamente las capacidades de razonamiento de los modelos de IA de OpenAI, un aspecto que muchos investigadores consideran clave para alcanzar niveles de inteligencia humana o sobrehumana (Tom's Guide, 2024).

Tecnología detrás de Strawberry

Aunque los detalles técnicos específicos de Strawberry son escasos, la información disponible sugiere que el proyecto implica una forma especializada de procesamiento post-entrenamiento de los modelos de IA. Este enfoque busca refinar el rendimiento de los modelos en aspectos específicos después de su entrenamiento inicial con grandes conjuntos de datos generalizados (Reuters, 2024a).

El post-entrenamiento en Strawberry podría incluir métodos como:

Ajuste fino avanzado: Una versión más sofisticada del ajuste fino tradicional utilizado en la mayoría de los modelos lingüísticos actuales (FusionChat, 2024).
Retroalimentación iterativa: Posiblemente incorporando feedback humano sobre las respuestas del modelo para mejorar su precisión y relevancia (FusionChat, 2024).
Aprendizaje por ejemplos: Introducción de ejemplos de respuestas buenas y malas para refinar el razonamiento del modelo (FusionChat, 2024).

Comparación con otros enfoques

El proyecto Strawberry tiene similitudes con el método "Self-Taught Reasoner" (STaR) desarrollado en Stanford en 2022. STaR permite a los modelos de IA alcanzar niveles de inteligencia más elevados mediante la creación iterativa de sus propios datos de entrenamiento. Según el profesor Noah Goodman de Stanford, este enfoque podría teóricamente llevar a los modelos lingüísticos a superar el nivel de inteligencia humana (Reuters, 2024a).

Desafíos y objetivos específicos

OpenAI está enfocando Strawberry en varias áreas clave, que desde Reuters (2024) lo comentan:

Tareas de largo horizonte (LHT): El proyecto busca capacitar a los modelos para realizar tareas complejas que requieren planificación a largo plazo y una serie de acciones durante períodos prolongados (AsiaFinancial, 2024).
Conjunto de datos de "investigación profunda": OpenAI está creando, entrenando y evaluando los modelos en lo que denomina un conjunto de datos de "investigación profunda", aunque los detalles específicos de este conjunto de datos no se han revelado (AsiaFinancial, 2024).
Navegación web autónoma: Un objetivo clave es permitir que los modelos realicen investigaciones navegando por la web de forma autónoma, posiblemente con la ayuda de un "agente informático" (CUA) que pueda tomar acciones basadas en sus hallazgos (Reuters, 2024a).
Aplicaciones en ingeniería de software: OpenAI planea probar las capacidades de Strawberry en tareas de ingeniería de software y aprendizaje automático (Reuters, 2024a).

Implicaciones y perspectivas futuras

El desarrollo de Strawberry representa un paso significativo en la búsqueda de OpenAI de crear sistemas de IA más avanzados y capaces. Si tiene éxito, podría marcar un hito importante en el camino hacia la Inteligencia Artificial General (AGI).

Sin embargo, como señala el profesor Goodman, este avance también plantea cuestiones éticas y filosóficas importantes: "Creo que es emocionante y aterrador a la vez... si las cosas siguen avanzando en esa dirección, tendremos que plantearnos algunas cosas serias como humanos" (Reuters, 2024a).

El proyecto Strawberry, aunque aún en fase de investigación, podría tener implicaciones significativas para el futuro de la IA y su impacto en la sociedad. A medida que OpenAI continúa desarrollando esta tecnología, será crucial mantener un equilibrio entre el avance tecnológico y las consideraciones éticas y sociales que conlleva (DigWatch, 2024).

Referencias:

AsiaFinancial. (2024, 13 de julio). OpenAI's 'Strawberry' Model Would Be Capable of 'Deep Research'. AsiaFinancial. https://www.asiafinancial.com/openais-strawberry-model-would-be-capable-of-deep-research

Bloomberg News. (2024, 11 de julio). OpenAI Sets Levels to Track Progress Toward Superintelligent AI. https://www.bloomberg.com/news/articles/2024-07-11/openai-sets-levels-to-track-progress-toward-superintelligent-ai?srnd=technology-vp

Business Today. (2024, 13 de julio). OpenAI's secret weapon: New AI reasoning technology under code name 'Strawberry'. https://www.businesstoday.in/technology/news/story/openais-secret-weapon-new-ai-reasoning-technology-under-code-name-strawberry-437071-2024-07-13

DigWatch. (2024). OpenAI's project Strawberry: Transformative AI sparks ethical debate. DigWatch. https://dig.watch/updates/openais-project-strawberry-transformative-ai-sparks-ethical-debate

FusionChat. (2024). The Mystery Behind OpenAI's 'Strawberry' Project Revealed. Recuperado de https://fusionchat.ai/news/the-mystery-behind-openais-strawberry-project-revealed

Morris, M. R., Sohl-Dickstein, J., Fiedel, N., Warkentin, T., Dafoe, A., Faust, A., Farabet, C., & Legg, S. (2024). Position: Levels of AGI for Operationalizing Progress on the Path to AGI. arXiv. https://ppl-ai-file-upload.s3.amazonaws.com/web/direct-files/5342733/e6ba8860-3b8d-4750-b67c-970f024b495c/2311.02462v4.pdf

OpenAI Community. (s.f.). OpenAI Rumors: Q* is now a reasoning engine called Project Strawberry. https://community.openai.com/t/openai-rumors-q-is-now-a-reasoning-engine-called-project-strawberry/864663

Reuters. (2024a, 12 de julio). Exclusive: OpenAI working on new reasoning technology under code name 'Strawberry'. Reuters. https://www.reuters.com/technology/artificial-intelligence/openai-working-new-reasoning-technology-under-code-name-strawberry-2024-07-12/

TheAIGrid. (2024, 13 de julio). OpenAI's NEW QStar Was Just LEAKED! (Self Improving AI) [Video]. YouTube.

Tom's Guide. (2024, 13 de julio). OpenAI's new 'Project Strawberry' could give ChatGPT more freedom to search the web and solve complex problems. Tom's Guide. https://www.tomsguide.com/ai/chatgpt/openais-new-project-strawberry-could-give-chatgpt-more-freedom-to-search-the-web-and-solve-complex-problems

Verdict. (s.f.). OpenAI developing reasoning technology. https://www.verdict.co.uk/openai-developing-reasoning-technology/

AI for all

Discusión sobre este post