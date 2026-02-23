La República Dominicana obtuvo el primer lugar en el benchmark cultural de Latam GPT, el primer modelo de lenguaje de gran escala desarrollado desde y para América Latina.

El país alcanzó un 16.2% en la evaluación cultural, superando a Ecuador, Colombia, México, Perú y Chile, entre los trece países participantes en la iniciativa.

Latam GPT es un modelo de código abierto con setenta mil millones de parámetros, desarrollado por el Centro Nacional de Inteligencia Artificial de Chile (CENIA) junto a más de sesenta y cinco instituciones públicas, académicas y tecnológicas de la región.

Fue entrenado sobre un corpus de aproximadamente trescientos mil millones de tokens de contenido latinoamericano, con el propósito de corregir un sesgo estructural: los modelos globales de inteligencia artificial apenas contienen entre 2% y 3% de información contextual sobre América Latina, lo que limita su precisión cultural, histórica y lingüística al responder consultas sobre la región.

El lanzamiento oficial del modelo, realizado en los estudios de TVN en Santiago de Chile con la presencia del presidente Gabriel Boric, contó con la participación del Banco de Desarrollo de América Latina y el Caribe (CAF), Amazon Web Services (AWS) y el Data Observatory, entre otros actores.

La delegación dominicana, representada por ejecutivos de Tabuga (empresa de consultoría digital y tecnología empresarial con sede en Santo Domingo) y CDN 37, estuvo presente en el evento que sus impulsores han descrito como el inicio de una vía latinoamericana para el desarrollo de la inteligencia artificial, basada en tres principios: soberanía tecnológica, colaboración regional y apertura.

El rol de la República Dominicana en la construcción del modelo

En abril de ese año, Tabuga formalizó una alianza estratégica con CENIA que la convirtió en representante oficial de los servicios de inteligencia artificial del centro chileno en la República Dominicana y el Caribe. A través de este acuerdo, la empresa asumió un rol activo en la adaptación de soluciones de IA al entorno local y en la contribución de datos para el entrenamiento del modelo.

La alianza se fortaleció en julio con la integración de CDN Canal 37 como proveedor de contenido noticioso y cultural dominicano. Esta incorporación representó un hito: fue la primera vez que una empresa privada dominicana proporcionó datos nacionales para un modelo de lenguaje masivo de alcance regional.

El resultado en el benchmark cultural responde a esta incorporación sistemática de contenidos históricos, culturales e informativos dominicanos, incluyendo referencias sobre identidad nacional, geografía, procesos históricos y manifestaciones culturales.

Entre las fuentes de referencia utilizadas para la construcción de entradas de conocimiento cultural dominicano se encuentran publicaciones editadas por el Banco Popular Dominicano, incluyendo El gran cambio: La transformación social y económica de la República Dominicana 1963-2013, de Frank Moya Pons.

Además de Taínos, arte y sociedad, de Manuel A. García Arévalo; Ecos de la Costa: Travesía por el litoral marino dominicano, de Domingo Marte; Turismo dominicano: 30 años a velocidad de crucero, de Pedro Delgado Malagón; y Patrimonio Nacional: Joyas dominicanas de la cultura y la naturaleza.

A partir de estas obras se elaboraron conjuntos de preguntas y respuestas que abarcan desde procesos históricos y socioeconómicos hasta patrimonio natural, precolombino y turístico del país.

Impacto regional y alcance del modelo

Latam GPT responde a una necesidad documentada. Según estudios de CENIA, al comparar el desempeño de modelos como GPT, Mistral, DeepSeek y Gemma en preguntas sobre entidades latinoamericanas frente a entidades de otras regiones, todos muestran un desbalance significativo: conocen sustancialmente menos sobre América Latina que sobre otras partes del mundo.

El modelo regional busca cerrar esa brecha mediante un entrenamiento concentrado en la diversidad cultural, lingüística y temática de la región, con datos balanceados por país y por ámbito (política, economía, arte, ciencias, entre otros).

El modelo se distribuirá de forma abierta junto con sus códigos de entrenamiento, los protocolos de gobernanza de datos empleados y los benchmarks de evaluación. Esta decisión de transparencia integral —que va más allá de la publicación del modelo en sí— constituye una de las características distintivas de la iniciativa frente a otros proyectos de código abierto a nivel global.

Sobre Latam GPT

Latam GPT es de código abierto coordinado por el Centro Nacional de Inteligencia Artificial de Chile (CENIA) y está disponible para desarrolladores, instituciones y emprendedores interesados en fortalecer soluciones con enfoque latinoamericano.