Panorámica de la IA generativa: la elección entre modelos abiertos y cerrados
Junio de 2024 La inteligencia artificial generativa despertó en 2023 y se ha convertido en la tecnología con mayor potencial de crecimiento para los próximos años. Cuando hablamos de inteligencia artificial generativa lo primero que se viene a nuestra mente son los modelos grandes del lenguaje (Large Language Models, LLMs); sistemas capaces de procesar y trabajar con el lenguaje humano.Hasta el lanzamiento de GPT 3.5 los modelos grandes del lenguaje solÃan ser abiertos y compartidos con la comunidad de ingenieros y desarrolladores de sistemas inteligentes [1]. Con GPT 3.5, OpenAI provocó un gran movimiento dentro del ecosistema, iniciando a un nuevo tiempo donde la industria pivota a la creación de grandes modelos cerrados, en los que el código y las arquitecturas son confidenciales. Esto se debe fundamentalmente al potencial comercial de estos sistemas, pero al mismo tiempo para garantizar el control y la calidad en su uso.
Los modelos abiertos desafÃan la supremacÃa de OpenAI, alcanzada con su herramienta ChatGPT, y alimentan el debate sobre qué enfoque es mejor: modelos abiertos frente a modelos cerrados.Para hacernos una idea de la importancia que tienen ambas opciones, durante 2023 se lanzaron 149 modelos fundacionales - sistemas de inteligencia artificial capaces de realizar una amplia variedad de tareas - de los cuales el 65,7 por ciento eran modelos abiertos [2]. En modelos abiertos destacan empresas como Meta con sus modelos Llama, Google y su modelo abierto Gemma, Stable Diffusion en generación de imagen y la comunidad de Hugging Face, donde se comparten numerosos modelos de IA generativa. Por el contrario, OpenAI con sus modelos GPT, Dalle·3 o Sora; Google con Gemini, Imagen-3 o Veo; y Anthropic con Claude son los máximos exponentes de modelos cerrados.
Claves a la hora de decidir adoptar modelos abiertos o cerrados
Para decidir cuál de las soluciones es mejor para su adopción por parte de una empresa, es necesario evaluar varios factores entre los que se encuentran [3] [4] [5]
- Costes. En el caso de los modelos abiertos de inteligencia artificial no es necesaria una licencia y evitará la dependencia de un proveedor. Bien es cierto, que en estos casos se afrontarán costes de infraestructura, no siempre económica, para conseguir ejecutar estos modelos, y será necesario contar con un equipo de ingenieros y expertos en el uso de estos. Por el contrario, los modelos generativos cerrados sà cuentan con una licencia y el coste varÃa en función del volumen de uso que se hace del mismo, tampoco serÃa necesario contar con un panel de expertos, puesto que están diseñados para integrarse perfectamente y sin complicaciones con cualquier tipo de sistema o software, mediante APIs.
- Seguridad y privacidad de datos. Quizás uno de los puntos que más preocupaciones suscitan a las empresas. Para los modelos abiertos, este es su punto fuerte, ya que no es necesario compartir y enviar los datos de la compañÃa a un tercero para que los procese. En cambio, en los modelos cerrados tendremos que analizar la información compartida con las compañÃas y revisar sus términos de uso, prestando especial atención cuando se maneje información sensible o con derechos de propiedad intelectual.
- Evolución, actualización y capacidades. Para las inteligencias artificiales abiertas, el hecho de contar con una comunidad de expertos e investigadores con acceso a las arquitecturas y parámetros de los modelos propicia la innovación y la actualización de estos. De manera opuesta, las empresas de modelos cerrados cuentan con un importante respaldo financiero, que hace que la actualización y mejora de los modelos sea continua, permitiendo a las compañÃas confiar en una solución sólida sobre la que construir herramientas. Un ejemplo de la mejora continua de estas empresas se ha visto recientemente con la incorporación de capacidades multimodales dentro de los modelos fundacionales [6]. Aunque los modelos abiertos están en constante evolución, actualmente no son tan potentes como los cerrados, ya que, por lo general, cuentan con menos recursos [7].
- Soporte. Los modelos cerrados cuentan con el respaldo del proveedor, el cual proporciona soporte profesional, que incluye servicio al cliente y soporte técnico, siendo esto crucial para el uso empresarial de estas plataformas. Por el contrario, en los modelos abiertos el soporte viene primeramente de la comunidad colaborativa de expertos, aunque existe un vasto conocimiento en foros y publicaciones de internet, no siempre puede ser suficiente.
- Personalización Desde el punto de vista de la personalización, los modelos abiertos son particularmente flexibles, permitiendo customizarlos en tareas más especÃficas y particulares. Por el contrario, en los sistemas cerrados esta opción es mucho más limitada. En este punto está surgiendo una derivada del caso de los LLMs, donde están apareciendo modelos abiertos más pequeños llamados SLMs, Small Language Models, que demuestran capacidades más reducidas en comparación a los LLMs, pero altamente útiles. Estos modelos pueden ejecutarse localmente en máquinas sin grandes requerimientos de hardware, lo que supone una reducción en los costes necesarios para desplegar una herramienta con capacidades de lenguaje natural. Por el momento parece difÃcil que las grandes compañÃas propietarias de LLMs opten por este enfoque, modelos más pequeños y que se puedan ejecutar en local.
- Dependencia. En el caso de los modelos cerrados se reduce la autonomÃa al depender de un tercero para crear soluciones. La dependencia es a varios niveles: precios, oferta y polÃticas de servicio ofrecidos. Para los modelos abiertos la dependencia mayor es con la comunidad de expertos, la cual contribuye a la mejora y crecimiento de estos modelos, pero al mismo tiempo puede ser limitada en temas de soporte y actualización periódica.
El debate entre modelos de inteligencia artificial generativa abiertos y cerrados se encuentra en el foco de mira. La elección entre uno u otro dependerá de las necesidades y capacidades especÃficas.
El futuro estará repleto de avances y evolución en ambas variantes. Es necesario seguir reflexionando e innovando en esta materia para garantizar que la IA generativa se desarrolle de una manera beneficiosa.
Parece claro que las grandes compañÃas tecnológicas tienen un músculo financiero imbatible, y disponen de las capacidades tecnológicas para entrenar las mejores inteligencias artificiales, pero la comunidad de expertos es capaz de cosas increÃbles y los modelos abiertos seguirán destacando de uno u otro modo.
[1] Catsaros, Oktavia. Generative AI to Become a $1.3 Trillion Market by 2032, Research Finds. Bloomberg. [Online] julio 1, 2023. https://www.bloomberg.com/company/press/generative-ai-to-become-a-1-3-trillion-market-by-2032-research-finds/.
[2] Lynch, Shana. AI Index: State of AI in 13 Charts. Stanford University Human-Centered Artificial Intelligence. [Online] abril 15, 2024. https://hai.stanford.edu/news/ai-index-state-ai-13-charts.
[3] Fatima, Fiza. Open-source LLMs vs closed-source LLMs: An enterprise perspective. Data Science Dojo Blog. [Online] febrero 2024, 15. https://datasciencedojo.com/blog/open-source-llms-vs-close-source-llms/.
[4] Kacprzak, Krzysztof. Open Source vs. Closed Source in Language Models: Pros and Cons. DS Stream. [Online] enero 8, 2024. https://dsstream.com/open-source-vs-closed-source-in-language-models-pros-and-cons/.
[5] Luna, Javier Canales.Los mejores 8 LLM de código abierto para 2024 y sus usos. DataCamp Blog. [Online] febrero 2024. https://www.datacamp.com/es/blog/top-open-source-llms.
[6] OpenAI.Hello GPT-4o. OpenAI. [Online] mayo 13, 2024. https://openai.com/index/hello-gpt-4o/.
[7] SkyLab, LMSYS and UC Berkeley. LMSYS Chatbot Arena Leaderboard. LMSYS Chatbot Arena: Benchmarking LLMs in the Wild. [Online] https://chat.lmsys.org/?leaderboard.