Menghubungkan Apache Superset

Dalam artikel ini, kami akan menjelaskan proses menghubungkan Apache Superset ke database analitik. Untuk membuatnya lebih ilustratif, kami juga akan membangun sebuah dashboard yang terhubung ke database analitik dan memantau status kendaraan secara real-time, semuanya menggunakan Apache Superset.

Panduan ini adalah bagian dari rangkaian dokumentasi DataHub dan secara khusus membahas menghubungkan Power BI ke data warehouse Anda. Jika Anda masih menentukan alat BI mana yang akan digunakan, lihat Memilih alat BI ikhtisar.

Fitur dashboard

  • Tampilkan jumlah total objek

  • Visualisasikan status pergerakan kendaraan (sedang bergerak/berhenti/parkir)

  • Visualisasikan status koneksi (aktif/idle/offline)

  • Tabel terperinci dengan status saat ini dari semua kendaraan

  • Penyaringan berdasarkan tipe kendaraan, grup, status pergerakan, dan status koneksi

  • Kemampuan ekspor data dan laporan

  • Notifikasi dan peringatan yang dapat dikustomisasi

Persyaratan teknis

  • Docker dan Docker Compose

  • Minimal 4 GB RAM (direkomendasikan 8 GB)

  • 20 GB ruang disk kosong

  • Linux/Windows dengan WSL2/macOS

  • Python 3.8+

  • Akses internet untuk koneksi database

Instalasi dan penyiapan

1. Instalasi dengan Docker (metode yang direkomendasikan)

  1. Instal Docker dan Docker Compose dengan mengikuti dokumentasi resmi:

  1. Unduh berkas docker-compose resmi:

curl -fL https://raw.githubusercontent.com/apache/superset/master/docker-compose-non-dev.yml -o docker-compose.yml
  1. Mulai Superset:

docker-compose up -d
  1. Buat administrator:

docker-compose exec superset superset fab create-admin \
  --username admin \
  --firstname Superset \
  --lastname Admin \
  --email [email protected] \
  --password admin
  1. Inisialisasi database:

docker-compose exec superset superset db upgrade
  1. Muat contoh dan inisialisasi peran:

docker-compose exec superset superset init

2. Instalasi dengan pip (untuk pengembangan)

  1. Buat lingkungan virtual:

python -m venv venv
source venv/bin/activate  # untuk Linux/macOS
# atau
.\venv\Scripts\activate  # untuk Windows
  1. Instal Superset:

pip install apache-superset
  1. Inisialisasi database:

superset db upgrade
  1. Buat administrator:

export FLASK_APP=superset
superset fab create-admin
  1. Muat contoh dan inisialisasi peran:

superset init
  1. Mulai Superset:

superset run -p 8088 --with-threads --reload --debugger

Koneksi database

  1. Masuk ke Superset (default: http://localhost:8088)

  2. Arahkan ke Data → Databases

  3. Klik "+" untuk menambahkan database baru

  4. Isi parameter koneksi:

    1. Database: PostgreSQL

    2. SQLAlchemy URI: postgresql://${DB_USER}:${DB_PASS}@${DB_HOST}:${DB_PORT}/${DB_NAME}

    3. Nama Tampilan: Analytics Database

    4. Extra: {"engine_params": {"connect_args": {"sslmode": "require"}}}

  5. Klik Uji Koneksi untuk memverifikasi koneksi

  6. Simpan pengaturan

Referensi parameter koneksi

Parameter Lakehouse
Lokasi Pengaturan Apache Superset
Catatan

Host

DB_HOST dalam SQLAlchemy URI

Alamat server database yang diberikan dalam email selamat datang Anda

Port

DB_PORT dalam SQLAlchemy URI

Default adalah 5432 untuk PostgreSQL

Nama database

DB_NAME dalam SQLAlchemy URI

Nama database yang ditetapkan untuk Anda

Nama pengguna

DB_USER dalam SQLAlchemy URI

Nama pengguna database Anda

Kata sandi

DB_PASS dalam SQLAlchemy URI

Kata sandi database yang aman

Mode SSL

connect_args dalam parameter Extra

Tetapkan ke require dalam konfigurasi JSON Extra

Skema

Konfigurasi dataset

Tentukan skema (raw_business_data atau raw_telematics_data) di setiap dataset

Impor dashboard dan chart

  1. Clone bi-integratons repositori:

git clone https://github.com/SquareGPS/bi-intergrations.git
  1. Di Superset, buka Settings → Import/Export

  2. Impor berkas-berkas dalam urutan berikut:

    1. datasets.json - datasets

    2. charts.json - charts

    3. dashboards.json - dashboards

  3. Setelah mengimpor, perbarui koneksi database di setiap dataset

Pemecahan masalah

Masalah koneksi database

  • Kesalahan koneksi: Periksa kebenaran kredensial dan parameter koneksi

  • Kesalahan firewall: Pastikan alamat IP Anda ditambahkan ke daftar yang diizinkan

  • Masalah SSL: Periksa pengaturan SSL dalam parameter koneksi

Masalah kinerja

  • Pemrosesan visualisasi lambat:

    • Optimalkan kueri SQL

    • Kurangi jumlah elemen yang ditampilkan secara bersamaan

    • Gunakan caching hasil

  • Penggunaan memori tinggi:

    • Tingkatkan sumber daya kontainer Docker

    • Optimalkan kueri database

Masalah lain

Berikut beberapa trik yang dapat membantu Anda memperbaiki masalah umum:

  1. Periksa log Superset:

docker-compose logs superset
  1. Mulai ulang kontainer:

docker-compose restart
  1. Bersihkan cache browser

  2. Periksa versi Superset dan perbarui jika perlu

Langkah selanjutnya

Setelah berhasil menghubungkan Power BI ke instance DataHub Anda, kami menyarankan Anda untuk:

  • Jelajahi skema data yang tersedia dengan meninjau Ikhtisar skema bagian untuk lebih memahami struktur data dan relasinya.

  • Mulailah dengan kueri sederhana yang berfokus pada entitas bisnis tertentu sebelum membangun dashboard yang kompleks - periksa kueri contoh sebagai referensi.

Dukungan

Untuk pertanyaan teknis atau permintaan akses ke database demo, silakan hubungi: [email protected]

Last updated

Was this helpful?