Saltar a contenido

🧱 Gobierno de Datos Estructurados

Sistema de Decisión Asistida (SDA) — BKM


1. Propósito de este documento

Este documento define el marco de gobierno de los datos estructurados dentro del Sistema de Decisión Asistida (SDA) de BKM.

Su objetivo es:

  • formalizar el rol de BigQuery como fuente de verdad actual del negocio,
  • establecer qué tipos de datos estructurados existen y para qué se utilizan,
  • definir qué datos puede y no puede consumir la IA,
  • fijar límites claros antes de implementar RAG, agentes o automatizaciones,
  • y reducir riesgos de seguridad, interpretación y uso indebido.

Este documento es normativo, no técnico, y forma parte del gobierno del sistema.


2. Principio rector

BigQuery es la fuente de verdad analítica del negocio,
no un espacio libre de exploración para la IA.

Los datos estructurados existen para:

  • mejorar la calidad de las decisiones,
  • reducir riesgo en decisiones de impacto económico,
  • y alinear negocio, marketing y operaciones.

La IA consume datos gobernados;
no define qué datos son válidos ni cómo deben interpretarse.


3. Rol de BigQuery dentro del SDA

Dentro del SDA, BigQuery actúa como:

  • repositorio central de datos estructurados,
  • memoria histórica consolidada del negocio,
  • punto de alineación entre áreas,
  • base común para análisis, reporting y asistencia a decisiones.

BigQuery no es:

  • un sistema operativo en tiempo real,
  • un origen directo para automatismos sin control humano,
  • ni un entorno de experimentación sin reglas.

4. Tipología de datos estructurados

A efectos de gobierno, los datos estructurados se clasifican en tres categorías claramente diferenciadas.

4.1 Datos operativos

Definición
Datos que reflejan el estado operativo de procesos vivos del negocio.

Ejemplos - CRM en tiempo real - estados de oportunidades - datos transaccionales activos - sistemas críticos de operación

Reglas - ❌ No son consumidos directamente por IA - ❌ No participan en RAG - ✔️ Solo se replican a BigQuery con fines analíticos gobernados

Regla de oro:
La IA no debe ser el primer sistema que toca un dato operativo.


4.2 Datos analíticos (núcleo del SDA)

Definición
Datos consolidados, históricos y validados para análisis humano y soporte a decisiones.

Ejemplos - funnels consolidados - métricas agregadas de marketing - ventas históricas - costes, márgenes y ratios - KPIs definidos y aceptados por negocio

Reglas - ✔️ Base principal para decisiones - ✔️ Lectura por IA bajo reglas - ❌ No se modifican automáticamente - ❌ No contienen lógica operativa viva

Estos datos constituyen el núcleo estable del SDA.


4.3 Datos preparados para IA

Definición
Vistas o tablas derivadas explícitamente para consumo controlado por IA.

Características - nivel de agregación definido, - ausencia de datos personales innecesarios, - semántica clara y documentada, - contexto de uso explícito.

Reglas - ✔️ Única fuente directa para RAG - ✔️ Diseñados para lectura, no escritura - ❌ No se usan para operación humana directa

La IA no decide qué datos usar:
los datos se preparan para la IA.


5. Separación crítica: uso humano vs uso IA

Uso Humano IA
Datos operativos ✔️
Datos analíticos ✔️ ✔️ (con límites)
Datos preparados para IA ✔️ ✔️
Escritura en BigQuery ✔️
Modificación de métricas ✔️

La IA lee y propone.
Las personas deciden y validan.


6. Qué datos NO puede consumir la IA

Quedan explícitamente excluidos del consumo por IA:

  • datos personales sensibles (PII sin anonimizar),
  • identificadores directos innecesarios,
  • campos operativos en tiempo real,
  • notas internas no estructuradas,
  • tablas sin definición semántica clara,
  • datasets no auditados o experimentales.

Si un dato no está explícitamente gobernado, se considera no apto para IA.


7. BigQuery y el principio de “vista segura”

La IA no debe leer tablas base por defecto.

El acceso a datos estructurados por IA se realizará mediante:

  • vistas controladas,
  • tablas agregadas,
  • datasets explícitamente aprobados,
  • con significado estable y documentado.

Este principio reduce:

  • riesgo legal,
  • ruido interpretativo,
  • y dependencia excesiva del criterio técnico.

8. Relación con decisiones del SDA

Los datos estructurados solo tienen sentido en el SDA cuando:

  • están vinculados a una decisión concreta,
  • o soportan un conjunto definido de decisiones.

No se crean datasets “porque sí”.
No se habilita IA “porque hay datos”.

Decisiones → Información → Datos → IA


9. Relación con documentos posteriores

Este documento habilita y condiciona:

  • las reglas de lectura por defecto de la IA (RAG),
  • el diseño de vistas seguras en BigQuery,
  • los contratos de agentes,
  • y cualquier implementación técnica posterior.

Sin este marco:

  • el RAG sería arbitrario,
  • la IA tendría acceso excesivo,
  • y el sistema perdería control.

10. Errores críticos que se evitan con este gobierno

  • IA leyendo BigQuery “en bruto”
  • mezcla de datos operativos y analíticos
  • dashboards y RAG sobre datos inconsistentes
  • dependencia excesiva del criterio técnico
  • decisiones basadas en métricas no gobernadas

11. Idea clave final

BigQuery ya es la fuente de verdad del negocio.
El gobierno define cómo se puede usar sin romper esa verdad.

Este documento existe para asegurar que el SDA de BKM crezca en inteligencia sin perder control, seguridad ni criterio.


✅ Estado del documento

Con este documento queda cerrado el gobierno conceptual de los datos estructurados.

A partir de aquí, el siguiente paso lógico habilitado es:

👉 Reglas de lectura por defecto de la IA (RAG)
siempre apoyadas en este marco.