Descripción general del esquema

Esta sección ofrece una visión general de la estructura de esquemas de datos de DataHub, ayudándole a comprender cómo se organiza la información y cómo acceder a ella de forma efectiva. El almacén está diseñado para proporcionarle acceso completo y flexible a sus datos de la Plataforma mediante un sistema de base de datos estructurado.

Qué aprenderá:

  • Cómo se estructura la información en capas y esquemas

  • Tablas clave en cada esquema y qué contienen

  • Cómo se relacionan entre sí las tablas de datos

  • Cómo acceder a los datos usando consultas SQL

  • Cómo funciona la validación de datos

  • Mejoras futuras en la estructura de datos

Términos clave:

  • Capa: Un nivel en un data warehouse que representa una etapa del procesamiento, organización o acceso a los datos, cada uno con una función distinta.

  • Esquema: Una agrupación lógica de objetos de base de datos (tablas, vistas, etc.)

Estructura de datos

DataHub utiliza una arquitectura de almacenamiento multicapa para organizar sus datos. Esta arquitectura ofrece fiabilidad, rendimiento y escalabilidad, garantizando al mismo tiempo el aislamiento adecuado de datos entre clientes.

Capas de datos

El sistema sigue un modelo de tres capas para la organización de datos:

  • Datos en bruto con transformación mínima

  • Ingesta directa desde fuentes de datos comerciales y telemáticas

  • Estructura de datos original con convenciones de nombre coherentes

Capa Plata

  • Datos ya procesados con validación y enriquecimiento

  • Estructuras transformadas para mejorar el análisis

  • Control de calidad de datos introducido y aplicación de reglas de negocio

Capa Oro

  • Conjuntos de datos listos para negocio optimizados para informes

  • Métricas preagregadas y estructuras desnormalizadas

  • Vistas curadas alineadas con procesos específicos de reporte de negocio

Más adelante en esta sección de la documentación encontrará esquemas de datos más detallados para cada capa.

Arquitectura de la base de datos

Cada cliente dispone de una instancia de base de datos dedicada para garantizar el aislamiento y la seguridad de los datos. Dentro de esta base de datos:

Esquema
Descripción
Contenido

raw_business_data

Entidades de negocio y datos operativos

Tablas principales de entidades, datos operativos, datos de referencia, datos históricos, tablas de relaciones

raw_telematics_data

Seguimiento de dispositivos y datos de sensores

Datos principales de seguimiento, datos de entrada, datos de estado

repo

Gestión de activos e inventario

Definiciones de tipos de activos, campos personalizados, instancias de activos, relaciones entre activos, jerarquías de inventario, datos geoespaciales

Metadatos

Datos de referencia del sistema

tabla description_parameters

Al consultar datos, debe especificar tanto el esquema (p. ej. raw_business_data) como la tabla (p. ej. objects) nombre:

SELECT * FROM raw_business_data.objects;

Metadatos del cliente y aislamiento de datos

El sistema utiliza tablas de metadatos para permitir un aislamiento de datos adecuado y soporte multiarrendatario:

  • Metadatos del distribuidor realiza un seguimiento de las relaciones distribuidor-cliente y de los parámetros de infraestructura

  • Metadatos del cliente mapea los datos comerciales y telemáticos a través de los esquemas

  • Mapeo cliente-dispositivo garantiza que los datos telemáticos estén correctamente asociados con el cliente adecuado

Esta capa de metadatos garantiza que:

  • Cada cliente solo pueda acceder a sus propios datos

  • Los datos telemáticos y comerciales puedan unirse correctamente

  • Las operaciones a nivel de sistema estén correctamente segmentadas por cliente

Última actualización

¿Te fue útil?