Just Dev It

Inicio / Blog

IA · Cumplimiento

Cómo cumplir la Ley 21.719 al conectar IA a los datos de tu empresa

Cómo conectar IA y LLM a los datos de tu empresa cumpliendo la Ley 21.719: solo lectura, datos en tu entorno, trazabilidad y minimización. Cotiza desde UF 75.

2026-06-17 6 min de lectura Just Dev It
Ilustración del artículo: IA · Cumplimiento

Conectar un modelo de lenguaje a los datos de tu empresa es la forma más rápida de pasar de "tenemos datos" a "le preguntamos al sistema en lenguaje natural y responde". El problema es que esa misma conexión, mal diseñada, puede exponer datos personales sin base de licitud, sacar información del entorno donde debe vivir y dejarte sin rastro de quién consultó qué. Con la Ley 21.719 de Protección de Datos Personales en plena exigibilidad hacia fines de 2026 y multas que pueden llegar al 2-4% de los ingresos anuales según la infracción, improvisar esta arquitectura dejó de ser una opción.

La buena noticia: cumplir no significa renunciar a la IA. Significa diseñar la conexión con los controles correctos desde el primer día. En Just Dev It conectamos agentes de IA y servidores MCP a datos empresariales con una postura técnica clara —solo lectura, datos en tu entorno, minimización y trazabilidad— pensada para soportar el escrutinio de un sector regulado. Esto es orientación técnica general, no asesoría legal: cada caso debe validarse con tu área legal o tu DPO.

El riesgo real de enchufar un LLM a tus datos

El error más común es tratar al modelo de IA como un usuario más con acceso total a la base de datos. Cuando eso ocurre, aparecen tres riesgos concretos que la Ley 21.719 castiga:

  • Exposición sin base de licitud: el modelo accede a datos personales (RUT, remuneraciones, datos de clientes, antecedentes) sin que exista una finalidad lícita y declarada para ese tratamiento.
  • Pérdida de trazabilidad: nadie puede reconstruir qué consultó el sistema, cuándo y para quién. Sin ese rastro es imposible demostrar el principio de responsabilidad que la ley exige.
  • Sobre-exposición: se entrega al modelo mucho más de lo que necesita para responder. Si una consulta solo requiere un total agregado, no hay razón para exponer el detalle persona por persona.

La Ley 21.719 ordena estos riesgos en principios: licitud, finalidad, proporcionalidad/minimización y responsabilidad. Una IA conforme no es la que evita el riesgo apagándose, sino la que está diseñada para respetar esos principios en cada consulta.

La postura técnica: solo lectura, acotado y dentro de tu entorno

Nuestra arquitectura para una IA conforme se apoya en cinco controles que se refuerzan entre sí:

  • Acceso de solo lectura y acotado: un servidor MCP (Model Context Protocol) define exactamente qué puede consultar el modelo y qué no. El modelo nunca escribe, borra ni modifica; solo lee lo que se le habilitó de forma explícita.
  • Los datos permanecen en tu entorno: la capa de IA se monta sobre tu infraestructura existente. Tus datos no se copian a servidores de terceros ni salen del perímetro que tú controlas.
  • Minimización: se expone solo lo necesario para responder. El servidor MCP actúa como filtro entre el modelo y tus fuentes, evitando que el detalle personal salga cuando basta con un agregado.
  • Trazabilidad y auditoría: cada consulta queda registrada —qué se preguntó, qué fuente respondió, para qué usuario— de modo que cualquier acceso es reconstruible.
  • Proveedores de LLM empresariales serios: trabajamos con proveedores que, en sus planes empresariales, no entrenan sus modelos con los datos del cliente.

Estos controles son la traducción técnica directa de los principios de la ley: el acceso acotado responde a la finalidad, la minimización a la proporcionalidad y la trazabilidad a la responsabilidad.

La Ley 21.719 es plenamente exigible hacia fines de 2026 y contempla multas de hasta 2-4% de los ingresos anuales según la infracción; conectar IA a tus datos sin controles aumenta la exposición.

Cómo funciona un servidor MCP gobernado

El servidor MCP es la pieza que convierte "el modelo puede leer la base de datos" en "el modelo puede consultar exactamente estas operaciones, de esta forma". En la práctica:

  • Tú defines un catálogo de consultas y fuentes permitidas. Todo lo que no está en ese catálogo, no existe para el modelo.
  • El acceso a los sistemas fuente —tu data warehouse en la nube, tu ERP/CRM, tus documentos— es siempre de solo lectura, con consultas SQL gobernadas por reglas de seguridad.
  • Cuando el agente responde sobre documentos, cita el documento de origen; cuando consulta datos estructurados, la respuesta es trazable hasta la consulta que la generó. Nada es una caja negra.
  • La capa se construye con Python y se despliega sobre tu infraestructura existente (AWS, Azure o Google Cloud), sin reemplazar lo que ya tienes.

El resultado es que un usuario pregunta en lenguaje natural —"¿cuánto facturamos en la zona sur el trimestre pasado?"— y recibe una respuesta verificable, sin escribir una sola consulta y sin que el modelo haya tenido acceso a nada fuera de su mandato.

Casos de uso donde el cumplimiento es innegociable

La diferencia entre una IA conforme y una improvisada se vuelve crítica en sectores regulados, donde el dato personal y el secreto comercial conviven en las mismas tablas:

  • Un fondo de inversión o AGF que quiere consultar carteras y reporting en lenguaje natural, manteniendo cada cifra trazable a su fuente y sin que la información salga del entorno.
  • Un estudio de cobranza judicial que necesita responder sobre miles de causas sin exponer datos personales de deudores más allá de lo estrictamente necesario para cada consulta.
  • Una generadora hidroeléctrica o un grupo multi-sociedad que centraliza datos operacionales y financieros y quiere un copiloto interno gobernado por usuario.

Nuestro propio producto de datos inmobiliarios demuestra la arquitectura en producción: expone un servidor MCP que permite consultar 9,5 millones de propiedades en lenguaje natural, de solo lectura y con cada respuesta trazable. La misma lógica de agente gobernado se aplica a tus datos internos, y consultas que antes tomaban horas pasan a resolverse en cerca de dos minutos.

Legalidad: qué resuelve la tecnología y qué no

Es importante ser claros sobre el límite de lo que la arquitectura aporta. Los controles técnicos —solo lectura, datos en tu entorno, minimización, trazabilidad— construyen las condiciones para tratar datos personales de forma responsable y demostrable. Pero la conformidad con la Ley 21.719 no es solo técnica: incluye bases de licitud, finalidades declaradas, derechos de los titulares y la mirada de tu área legal.

Por eso insistimos: lo anterior es orientación técnica general y no constituye asesoría legal. Diseñamos la solución para que sea defendible y la validamos con tu área legal o tu DPO, que es quien determina las bases de tratamiento aplicables a tu caso. La tecnología no reemplaza esa validación; la habilita.

En resumen
FAQ

Preguntas frecuentes

¿Qué exige la Ley 21.719 a las empresas?

Eleva el estándar de tratamiento de datos personales en Chile y obliga a respetar principios concretos: licitud (debe existir una base legal para tratar el dato), finalidad (se usa solo para lo declarado), proporcionalidad o minimización (solo los datos necesarios) y responsabilidad o accountability (poder demostrar cumplimiento con registros y trazabilidad). Al conectar IA a tus datos, estos principios se traducen en accesos acotados, exposición mínima y auditoría de cada consulta. Esto es orientación general; las obligaciones aplicables a tu empresa debe definirlas tu área legal o DPO.

¿Cuándo entra en vigencia y cuáles son las multas?

La ley contempla su exigibilidad plena hacia fines de 2026. Las multas pueden ser significativas y llegar al 2-4% de los ingresos anuales de la empresa según la gravedad de la infracción. El monto exacto y su aplicación a un caso concreto dependen de criterios que debe evaluar un abogado; aquí entregamos solo el orden de magnitud para dimensionar el riesgo.

¿Puedo usar Claude o ChatGPT con datos de mi empresa cumpliendo la ley?

Sí, si la conexión está bien diseñada. La clave no es qué modelo usas, sino cómo lo conectas: con acceso de solo lectura y acotado mediante un servidor MCP, manteniendo los datos en tu entorno, exponiendo lo mínimo necesario y registrando cada consulta. Además conviene usar los planes empresariales de proveedores serios, que no entrenan sus modelos con los datos del cliente. Con esos controles, modelos estándar de industria como Claude o ChatGPT pueden operar sobre tus datos de forma conforme. La validación final del cumplimiento corresponde a tu área legal.

¿El modelo de IA aprende de mis datos?

En los planes empresariales de proveedores serios de LLM, no: esos proveedores se comprometen a no entrenar sus modelos con los datos del cliente. Además, en nuestra arquitectura los datos permanecen en tu entorno y el modelo solo los lee de forma puntual para responder una consulta, sin copiarlos afuera ni incorporarlos a su entrenamiento. Es un punto que verificamos al elegir proveedor y que debe quedar reflejado en el contrato.

¿Cómo se minimizan los datos personales expuestos a la IA?

Mediante un servidor MCP que actúa como filtro entre el modelo y tus fuentes: define exactamente qué puede consultar el modelo y devuelve solo lo necesario para responder. Si una pregunta se resuelve con un total agregado, no se expone el detalle persona por persona. El acceso es de solo lectura y acotado a un catálogo de consultas autorizadas, de modo que el modelo nunca ve más datos personales de los estrictamente requeridos por la finalidad de cada consulta.

¿Qué es la trazabilidad o responsabilidad (accountability) en este contexto?

Es la capacidad de demostrar, con evidencia, qué hizo el sistema con los datos. En nuestra arquitectura cada consulta del agente queda registrada —qué se preguntó, qué fuente respondió y para qué usuario—, y cada respuesta es trazable hasta su origen: la consulta SQL o el documento citado. Eso permite reconstruir cualquier acceso y responder ante una auditoría o el ejercicio de derechos de un titular, que es justamente lo que el principio de responsabilidad de la Ley 21.719 espera de las empresas.

¿Cuánto cuesta implementar una IA conforme sobre mis datos?

Cada proyecto es desarrollo a medida y parte desde UF 75 según el alcance, las fuentes a conectar y el nivel de gobierno requerido. Te entregamos una propuesta con alcance y precio definidos, e incluimos 30 días de soporte post-entrega. Escríbenos para evaluar tu caso.

¿Tienes un caso parecido en tu empresa?

Cuéntanos qué necesitas automatizar, consolidar o consultar con IA. Te entregamos una propuesta con alcance, precio y plazo cerrados, desde UF 75 según alcance.

Cotizar proyecto Hablar por WhatsApp