Uso de cookies

Este sitio web solo utiliza cookies tcnicas propias obligatorias con la finalidad de hacer que su navegación sea segura.
Asimismo, utiliza cookies de terceros opcionales para hacer análisis estadístico de las visitas a la web y conocer su usabilidad.
Si desea más información o cambiar la configuración de su navegador, puede visitar nuestra Política de Cookies.
Pulse el botón "Rechazar cookies opcionales" o "Aceptar todas las cookies" para confirmar que ha leído y aceptado la información aquí presentada.

Panorámica de la IA generativa: la elección entre modelos abiertos y cerrados

Junio de 2024
La inteligencia artificial generativa despertó en 2023 y se ha convertido en la tecnología con mayor potencial de crecimiento para los próximos años. Cuando hablamos de inteligencia artificial generativa lo primero que se viene a nuestra mente son los modelos grandes del lenguaje (Large Language Models, LLMs); sistemas capaces de procesar y trabajar con el lenguaje humano.

Hasta el lanzamiento de GPT 3.5 los modelos grandes del lenguaje solían ser abiertos y compartidos con la comunidad de ingenieros y desarrolladores de sistemas inteligentes [1]. Esto se debe fundamentalmente al potencial comercial de estos sistemas, pero al mismo tiempo para garantizar el control y la calidad en su uso.

Los modelos abiertos desafían la supremacía de OpenAI, alcanzada con su herramienta ChatGPT, y alimentan el debate sobre qué enfoque es mejor: modelos abiertos frente a modelos cerrados.Para hacernos una idea de la importancia que tienen ambas opciones, durante 2023 se lanzaron 149 modelos fundacionales - sistemas de inteligencia artificial capaces de realizar una amplia variedad de tareas - de los cuales el 65,7 por ciento eran modelos abiertos [2]. En modelos abiertos destacan empresas como Meta con sus modelos Llama, Google y su modelo abierto Gemma, Stable Diffusion en generación de imagen y la comunidad de Hugging Face, donde se comparten numerosos modelos de IA generativa. Por el contrario, OpenAI con sus modelos GPT, Dalle·3 o Sora; Google con Gemini, Imagen-3 o Veo; y Anthropic con Claude son los máximos exponentes de modelos cerrados.

Distribución del número de modelos fundacionales por tipo de acceso

Claves a la hora de decidir adoptar modelos abiertos o cerrados

Para decidir cuál de las soluciones es mejor para su adopción por parte de una empresa, es necesario evaluar varios factores entre los que se encuentran [3] [4] [5]

  • Costes. En el caso de los modelos abiertos de inteligencia artificial no es necesaria una licencia y evitará la dependencia de un proveedor. Bien es cierto, que en estos casos se afrontarán costes de infraestructura, no siempre económica, para conseguir ejecutar estos modelos, y será necesario contar con un equipo de ingenieros y expertos en el uso de estos. Por el contrario, los modelos generativos cerrados sí cuentan con una licencia y el coste varía en función del volumen de uso que se hace del mismo, tampoco sería necesario contar con un panel de expertos, puesto que están diseñados para integrarse perfectamente y sin complicaciones con cualquier tipo de sistema o software, mediante APIs.
  • Seguridad y privacidad de datos. Quizás uno de los puntos que más preocupaciones suscitan a las empresas. Para los modelos abiertos, este es su punto fuerte, ya que no es necesario compartir y enviar los datos de la compañía a un tercero para que los procese. En cambio, en los modelos cerrados tendremos que analizar la información compartida con las compañías y revisar sus términos de uso, prestando especial atención cuando se maneje información sensible o con derechos de propiedad intelectual.
  • Evolución, actualización y capacidades. Para las inteligencias artificiales abiertas, el hecho de contar con una comunidad de expertos e investigadores con acceso a las arquitecturas y parámetros de los modelos propicia la innovación y la actualización de estos. De manera opuesta, las empresas de modelos cerrados cuentan con un importante respaldo financiero, que hace que la actualización y mejora de los modelos sea continua, permitiendo a las compañías confiar en una solución sólida sobre la que construir herramientas. Un ejemplo de la mejora continua de estas empresas se ha visto recientemente con la incorporación de capacidades multimodales dentro de los modelos fundacionales [6]. Aunque los modelos abiertos están en constante evolución, actualmente no son tan potentes como los cerrados, ya que, por lo general, cuentan con menos recursos [7].
  • Soporte. Los modelos cerrados cuentan con el respaldo del proveedor, el cual proporciona soporte profesional, que incluye servicio al cliente y soporte técnico, siendo esto crucial para el uso empresarial de estas plataformas. Por el contrario, en los modelos abiertos el soporte viene primeramente de la comunidad colaborativa de expertos, aunque existe un vasto conocimiento en foros y publicaciones de internet, no siempre puede ser suficiente.
  • Personalización Desde el punto de vista de la personalización, los modelos abiertos son particularmente flexibles, permitiendo customizarlos en tareas más específicas y particulares. Por el contrario, en los sistemas cerrados esta opción es mucho más limitada. En este punto está surgiendo una derivada del caso de los LLMs, donde están apareciendo modelos abiertos más pequeños llamados SLMs, Small Language Models, que demuestran capacidades más reducidas en comparación a los LLMs, pero altamente útiles. Estos modelos pueden ejecutarse localmente en máquinas sin grandes requerimientos de hardware, lo que supone una reducción en los costes necesarios para desplegar una herramienta con capacidades de lenguaje natural. Por el momento parece difícil que las grandes compañías propietarias de LLMs opten por este enfoque, modelos más pequeños y que se puedan ejecutar en local.
  • Dependencia. En el caso de los modelos cerrados se reduce la autonomía al depender de un tercero para crear soluciones. La dependencia es a varios niveles: precios, oferta y políticas de servicio ofrecidos. Para los modelos abiertos la dependencia mayor es con la comunidad de expertos, la cual contribuye a la mejora y crecimiento de estos modelos, pero al mismo tiempo puede ser limitada en temas de soporte y actualización periódica.

El debate entre modelos de inteligencia artificial generativa abiertos y cerrados se encuentra en el foco de mira. La elección entre uno u otro dependerá de las necesidades y capacidades específicas.

El futuro estará repleto de avances y evolución en ambas variantes. Es necesario seguir reflexionando e innovando en esta materia para garantizar que la IA generativa se desarrolle de una manera beneficiosa.

Parece claro que las grandes compañías tecnológicas tienen un músculo financiero imbatible, y disponen de las capacidades tecnológicas para entrenar las mejores inteligencias artificiales, pero la comunidad de expertos es capaz de cosas increíbles y los modelos abiertos seguirán destacando de uno u otro modo.


[1] Catsaros, Oktavia. Generative AI to Become a $1.3 Trillion Market by 2032, Research Finds. Bloomberg. [Online] julio 1, 2023. https://www.bloomberg.com/company/press/generative-ai-to-become-a-1-3-trillion-market-by-2032-research-finds/.
[2] Lynch, Shana. AI Index: State of AI in 13 Charts. Stanford University Human-Centered Artificial Intelligence. [Online] abril 15, 2024. https://hai.stanford.edu/news/ai-index-state-ai-13-charts.
[3] Fatima, Fiza. Open-source LLMs vs closed-source LLMs: An enterprise perspective. Data Science Dojo Blog. [Online] febrero 2024, 15. https://datasciencedojo.com/blog/open-source-llms-vs-close-source-llms/.
[4] Kacprzak, Krzysztof. Open Source vs. Closed Source in Language Models: Pros and Cons. DS Stream. [Online] enero 8, 2024. https://dsstream.com/open-source-vs-closed-source-in-language-models-pros-and-cons/.
[5] Luna, Javier Canales.Los mejores 8 LLM de código abierto para 2024 y sus usos. DataCamp Blog. [Online] febrero 2024. https://www.datacamp.com/es/blog/top-open-source-llms.
[6] OpenAI.Hello GPT-4o. OpenAI. [Online] mayo 13, 2024. https://openai.com/index/hello-gpt-4o/.
[7] SkyLab, LMSYS and UC Berkeley. LMSYS Chatbot Arena Leaderboard. LMSYS Chatbot Arena: Benchmarking LLMs in the Wild. [Online] https://chat.lmsys.org/?leaderboard.


José Manuel Rodríguez, consultor de Data Analytics de Afi
Verónica Ruiz, consultora de Data Analytics de Afi