Conectar un modelo de lenguaje a los datos de tu empresa es la forma más rápida de pasar de "tenemos datos" a "le preguntamos al sistema en lenguaje natural y responde". El problema es que esa misma conexión, mal diseñada, puede exponer datos personales sin base de licitud, sacar información del entorno donde debe vivir y dejarte sin rastro de quién consultó qué. Con la Ley 21.719 de Protección de Datos Personales en plena exigibilidad hacia fines de 2026 y multas que pueden llegar al 2-4% de los ingresos anuales según la infracción, improvisar esta arquitectura dejó de ser una opción.
La buena noticia: cumplir no significa renunciar a la IA. Significa diseñar la conexión con los controles correctos desde el primer día. En Just Dev It conectamos agentes de IA y servidores MCP a datos empresariales con una postura técnica clara —solo lectura, datos en tu entorno, minimización y trazabilidad— pensada para soportar el escrutinio de un sector regulado. Esto es orientación técnica general, no asesoría legal: cada caso debe validarse con tu área legal o tu DPO.
El riesgo real de enchufar un LLM a tus datos
El error más común es tratar al modelo de IA como un usuario más con acceso total a la base de datos. Cuando eso ocurre, aparecen tres riesgos concretos que la Ley 21.719 castiga:
- Exposición sin base de licitud: el modelo accede a datos personales (RUT, remuneraciones, datos de clientes, antecedentes) sin que exista una finalidad lícita y declarada para ese tratamiento.
- Pérdida de trazabilidad: nadie puede reconstruir qué consultó el sistema, cuándo y para quién. Sin ese rastro es imposible demostrar el principio de responsabilidad que la ley exige.
- Sobre-exposición: se entrega al modelo mucho más de lo que necesita para responder. Si una consulta solo requiere un total agregado, no hay razón para exponer el detalle persona por persona.
La Ley 21.719 ordena estos riesgos en principios: licitud, finalidad, proporcionalidad/minimización y responsabilidad. Una IA conforme no es la que evita el riesgo apagándose, sino la que está diseñada para respetar esos principios en cada consulta.
La postura técnica: solo lectura, acotado y dentro de tu entorno
Nuestra arquitectura para una IA conforme se apoya en cinco controles que se refuerzan entre sí:
- Acceso de solo lectura y acotado: un servidor MCP (Model Context Protocol) define exactamente qué puede consultar el modelo y qué no. El modelo nunca escribe, borra ni modifica; solo lee lo que se le habilitó de forma explícita.
- Los datos permanecen en tu entorno: la capa de IA se monta sobre tu infraestructura existente. Tus datos no se copian a servidores de terceros ni salen del perímetro que tú controlas.
- Minimización: se expone solo lo necesario para responder. El servidor MCP actúa como filtro entre el modelo y tus fuentes, evitando que el detalle personal salga cuando basta con un agregado.
- Trazabilidad y auditoría: cada consulta queda registrada —qué se preguntó, qué fuente respondió, para qué usuario— de modo que cualquier acceso es reconstruible.
- Proveedores de LLM empresariales serios: trabajamos con proveedores que, en sus planes empresariales, no entrenan sus modelos con los datos del cliente.
Estos controles son la traducción técnica directa de los principios de la ley: el acceso acotado responde a la finalidad, la minimización a la proporcionalidad y la trazabilidad a la responsabilidad.
La Ley 21.719 es plenamente exigible hacia fines de 2026 y contempla multas de hasta 2-4% de los ingresos anuales según la infracción; conectar IA a tus datos sin controles aumenta la exposición.
Cómo funciona un servidor MCP gobernado
El servidor MCP es la pieza que convierte "el modelo puede leer la base de datos" en "el modelo puede consultar exactamente estas operaciones, de esta forma". En la práctica:
- Tú defines un catálogo de consultas y fuentes permitidas. Todo lo que no está en ese catálogo, no existe para el modelo.
- El acceso a los sistemas fuente —tu data warehouse en la nube, tu ERP/CRM, tus documentos— es siempre de solo lectura, con consultas SQL gobernadas por reglas de seguridad.
- Cuando el agente responde sobre documentos, cita el documento de origen; cuando consulta datos estructurados, la respuesta es trazable hasta la consulta que la generó. Nada es una caja negra.
- La capa se construye con Python y se despliega sobre tu infraestructura existente (AWS, Azure o Google Cloud), sin reemplazar lo que ya tienes.
El resultado es que un usuario pregunta en lenguaje natural —"¿cuánto facturamos en la zona sur el trimestre pasado?"— y recibe una respuesta verificable, sin escribir una sola consulta y sin que el modelo haya tenido acceso a nada fuera de su mandato.
Casos de uso donde el cumplimiento es innegociable
La diferencia entre una IA conforme y una improvisada se vuelve crítica en sectores regulados, donde el dato personal y el secreto comercial conviven en las mismas tablas:
- Un fondo de inversión o AGF que quiere consultar carteras y reporting en lenguaje natural, manteniendo cada cifra trazable a su fuente y sin que la información salga del entorno.
- Un estudio de cobranza judicial que necesita responder sobre miles de causas sin exponer datos personales de deudores más allá de lo estrictamente necesario para cada consulta.
- Una generadora hidroeléctrica o un grupo multi-sociedad que centraliza datos operacionales y financieros y quiere un copiloto interno gobernado por usuario.
Nuestro propio producto de datos inmobiliarios demuestra la arquitectura en producción: expone un servidor MCP que permite consultar 9,5 millones de propiedades en lenguaje natural, de solo lectura y con cada respuesta trazable. La misma lógica de agente gobernado se aplica a tus datos internos, y consultas que antes tomaban horas pasan a resolverse en cerca de dos minutos.
Legalidad: qué resuelve la tecnología y qué no
Es importante ser claros sobre el límite de lo que la arquitectura aporta. Los controles técnicos —solo lectura, datos en tu entorno, minimización, trazabilidad— construyen las condiciones para tratar datos personales de forma responsable y demostrable. Pero la conformidad con la Ley 21.719 no es solo técnica: incluye bases de licitud, finalidades declaradas, derechos de los titulares y la mirada de tu área legal.
Por eso insistimos: lo anterior es orientación técnica general y no constituye asesoría legal. Diseñamos la solución para que sea defendible y la validamos con tu área legal o tu DPO, que es quien determina las bases de tratamiento aplicables a tu caso. La tecnología no reemplaza esa validación; la habilita.