Connexion à Apache Superset

Dans cet article, nous allons parcourir le processus de connexion d'Apache Superset à la base de données analytique. Pour rendre cela plus illustratif, nous allons également créer un tableau de bord qui se connecte à la base de données analytique et surveille l'état en temps réel des véhicules, le tout en utilisant Apache Superset.

Ce guide fait partie de la suite de documentation DataHub et couvre spécifiquement la connexion de Power BI à votre entrepôt de données. Si vous hésitez encore sur l'outil BI à utiliser, référez-vous au Sélection d'outils BI aperçu.

Fonctionnalités du tableau de bord

  • Afficher le nombre total d'objets

  • Visualiser les états de mouvement des véhicules (en mouvement/arrêté/garé)

  • Visualiser les états de connexion (actif/inactif/hors ligne)

  • Table détaillée avec l'état actuel de tous les véhicules

  • Filtrage par type de véhicule, groupe, état de mouvement et état de connexion

  • Capacités d'exportation des données et des rapports

  • Notifications et alertes personnalisables

Exigences techniques

  • Docker et Docker Compose

  • Minimum 4 Go de RAM (8 Go recommandés)

  • 20 Go d'espace disque libre

  • Linux/Windows avec WSL2/macOS

  • Python 3.8+

  • Accès Internet pour la connexion à la base de données

Installation et configuration

1. Installation avec Docker (méthode recommandée)

  1. Installez Docker et Docker Compose en suivant la documentation officielle :

  1. Téléchargez le fichier docker-compose officiel :

  1. Démarrer Superset :

  1. Créer un administrateur :

  1. Initialiser la base de données :

  1. Charger des exemples et initialiser les rôles :

2. Installation avec pip (pour le développement)

  1. Créer un environnement virtuel :

  1. Installer Superset :

  1. Initialiser la base de données :

  1. Créer un administrateur :

  1. Charger des exemples et initialiser les rôles :

  1. Démarrer Superset :

Connexion à la base de données

  1. Connectez-vous à Superset (par défaut : http://localhost:8088)

  2. Accédez à Données → Bases de données

  3. Cliquez sur "+" pour ajouter une nouvelle base de données

  4. Remplissez les paramètres de connexion :

    1. Base de données : PostgreSQL

    2. URI SQLAlchemy : postgresql://${DB_USER}:${DB_PASS}@${DB_HOST}:${DB_PORT}/${DB_NAME}

    3. Nom d'affichage : Analytics Database

    4. Extra : {"engine_params": {"connect_args": {"sslmode": "require"}}}

  5. Cliquez Tester la connexion pour vérifier la connexion

  6. Enregistrer les paramètres

Référence des paramètres de connexion

Paramètre Lakehouse
Emplacement du paramètre dans Apache Superset
Remarques

Hôte

DB_HOST dans l'URI SQLAlchemy

L'adresse du serveur de base de données fournie dans votre e‑mail de bienvenue

Port

DB_PORT dans l'URI SQLAlchemy

La valeur par défaut est 5432 pour PostgreSQL

Nom de la base de données

DB_NAME dans l'URI SQLAlchemy

Le nom de base de données qui vous est attribué

Nom d'utilisateur

DB_USER dans l'URI SQLAlchemy

Votre nom d'utilisateur de base de données

Mot de passe

DB_PASS dans l'URI SQLAlchemy

Votre mot de passe de base de données sécurisé

Mode SSL

connect_args dans les paramètres Extra

Définir sur require dans la configuration JSON Extra

Schéma

Configuration du jeu de données

Spécifiez le schéma (raw_business_data ou raw_telematics_data) dans chaque jeu de données

Importation du tableau de bord et des graphiques

  1. Cloner le bi-integratons dépôt :

  1. Dans Superset, allez à Paramètres → Importer/Exporter

  2. Importez les fichiers dans l'ordre suivant :

    1. datasets.json - jeux de données

    2. charts.json - graphiques

    3. dashboards.json - tableaux de bord

  3. Après l'importation, mettez à jour les connexions de base de données dans chaque jeu de données

Dépannage

Problèmes de connexion à la base de données

  • Erreur de connexion : Vérifiez l'exactitude des identifiants et des paramètres de connexion

  • Erreur de pare‑feu : Assurez‑vous que votre adresse IP est ajoutée à la liste blanche

  • Problèmes SSL : Vérifiez les paramètres SSL dans les paramètres de connexion

Problèmes de performance

  • Chargement lent des visualisations :

    • Optimisez les requêtes SQL

    • Réduisez le nombre d'éléments affichés simultanément

    • Utilisez la mise en cache des résultats

  • Utilisation élevée de la mémoire :

    • Augmentez les ressources du conteneur Docker

    • Optimisez les requêtes de la base de données

Autres problèmes

Voici quelques astuces qui peuvent vous aider à résoudre les problèmes courants :

  1. Vérifiez les journaux de Superset :

  1. Redémarrer les conteneurs :

  1. Vider le cache du navigateur

  2. Vérifiez la version de Superset et mettez‑la à jour si nécessaire

Étapes suivantes

Après avoir connecté Power BI avec succès à votre instance DataHub, nous vous recommandons de :

  • Explorer les schémas de données disponibles en consultant la Aperçu du schéma section pour mieux comprendre la structure des données et les relations.

  • Commencez par des requêtes simples axées sur des entités métier spécifiques avant de construire des tableaux de bord complexes - consultez nos requêtes d'exemple à titre de référence.

Assistance

Pour les questions techniques ou les demandes d'accès à la base de données de démonstration, veuillez contacter : [email protected]

Mis à jour

Ce contenu vous a-t-il été utile ?