Descripción general del esquema
Esta sección ofrece una visión general de la estructura de esquemas de datos de DataHub, ayudándole a comprender cómo se organiza la información y cómo acceder a ella de forma efectiva. El almacén está diseñado para proporcionarle acceso completo y flexible a sus datos de la Plataforma mediante un sistema de base de datos estructurado.
Qué aprenderá:
Cómo se estructura la información en capas y esquemas
Tablas clave en cada esquema y qué contienen
Cómo se relacionan entre sí las tablas de datos
Cómo acceder a los datos usando consultas SQL
Cómo funciona la validación de datos
Mejoras futuras en la estructura de datos
Estructura de datos
DataHub utiliza una arquitectura de almacenamiento multicapa para organizar sus datos. Esta arquitectura ofrece fiabilidad, rendimiento y escalabilidad, garantizando al mismo tiempo el aislamiento adecuado de datos entre clientes.
Capas de datos
El sistema sigue un modelo de tres capas para la organización de datos:
Datos en bruto con transformación mínima
Ingesta directa desde fuentes de datos comerciales y telemáticas
Estructura de datos original con convenciones de nombre coherentes
Capa Plata
Datos ya procesados con validación y enriquecimiento
Estructuras transformadas para mejorar el análisis
Control de calidad de datos introducido y aplicación de reglas de negocio
Capa Oro
Conjuntos de datos listos para negocio optimizados para informes
Métricas preagregadas y estructuras desnormalizadas
Vistas curadas alineadas con procesos específicos de reporte de negocio
Más adelante en esta sección de la documentación encontrará esquemas de datos más detallados para cada capa.
Arquitectura de la base de datos
Cada cliente dispone de una instancia de base de datos dedicada para garantizar el aislamiento y la seguridad de los datos. Dentro de esta base de datos:
raw_business_data
Entidades de negocio y datos operativos
Tablas principales de entidades, datos operativos, datos de referencia, datos históricos, tablas de relaciones
raw_telematics_data
Seguimiento de dispositivos y datos de sensores
Datos principales de seguimiento, datos de entrada, datos de estado
repo
Gestión de activos e inventario
Definiciones de tipos de activos, campos personalizados, instancias de activos, relaciones entre activos, jerarquías de inventario, datos geoespaciales
Metadatos
Datos de referencia del sistema
tabla description_parameters
Al consultar datos, debe especificar tanto el esquema (p. ej. raw_business_data) como la tabla (p. ej. objects) nombre:
SELECT * FROM raw_business_data.objects;Metadatos del cliente y aislamiento de datos
El sistema utiliza tablas de metadatos para permitir un aislamiento de datos adecuado y soporte multiarrendatario:
Metadatos del distribuidor realiza un seguimiento de las relaciones distribuidor-cliente y de los parámetros de infraestructura
Metadatos del cliente mapea los datos comerciales y telemáticos a través de los esquemas
Mapeo cliente-dispositivo garantiza que los datos telemáticos estén correctamente asociados con el cliente adecuado
Esta capa de metadatos garantiza que:
Cada cliente solo pueda acceder a sus propios datos
Los datos telemáticos y comerciales puedan unirse correctamente
Las operaciones a nivel de sistema estén correctamente segmentadas por cliente
Última actualización
¿Te fue útil?