Pengantar Data Modelling perlunya pengembangan search engine relasional
Pengantar Data Modelling – BI Analyst. Dunia data sangatlah kompleks. Maksud saya adalah ada alasan bagi kebanyakan kita yang masih mengandalkan tenaga ahli data yang terlatih untuk mendapatkan jawaban atas pertanyaan sederhana tentang hak bisnis. Karena itu dirasa bahwa diperlukannya pengembangan search engine relasional, yang dirancang bagi setiap pelaku bisnis untuk menjawab pertanyaan mereka sendiri tentang data mereka yang bisa dilakukan dengan menggunakan penelusuran.
Tapi itu hanyalah salah satu bagian dari teka-teki dari data modelling. Berhasil dengan proyek analisis dapat mengambil lebih dari sekedar hanya membuat data dapat diakses.
Sebagian besar organisasi menghadapi tantangan nyata yang jauh lebih besar dalam jaringan analisis mereka dengan ekstraksi data, kualitas data, data sprawl, dan kinerja dari data processing.
Terdengar menakutkan dengan data modelling?
Mungkin bagi anda yang tidak terbiasa bermain dengan data, hal ini begitu asing. Panduan ini berfungsi sebagai rangkaian pertama dari posting blog yang dirancang untuk membantu Anda menyiapkan jalur data analitik yang siap menggunakan beberapa prinsip pemodelan data fundamental. Apakah Anda sedang berjuang untuk menjaga agar model data Anda terkendali atau ingin memahami konsep pemodelan data fundamental, silahkan terus membaca panduan ini yang sengaja kita bangun dan kita sadur untuk kita semua.
Mengapa Dimensi Pemodelan Penting ?
Jadi Anda mungkin bertanya-tanya mengapa ini dilakukan saat pertama kali. Model data biasanya berjalan cukup sederhana namun seiring berkembangnya bisnis dan kebutuhan baru yang muncul, banyak hal bisa lepas kendali dengan cukup cepat.
1. Navigasi Data yang Lebih Sederhana
Orang secara alami memikirkan proses dalam hal subjek yang terlibat, dan kebanyakan pertanyaan yang mereka hadapi adalah tentang hubungan antara subjek ini. Berapa banyak vanili chai latte yang dijual kepada pelanggan berusia 18-25 pada bulan Desember 2017? Berapa 5 toko teratas di Jakarta untuk penjualan kopi es minggu lalu?
2. Kinerja Database Lebih Cepat
Pemodelan dimensi menciptakan skema database yang dioptimalkan untuk proses data yang meiliki kinerja tinggi. Ini berarti lebih sedikit union, meminimalkan redundansi data, dan operasi pada angka, bukan teks yang hampir selalu merupakan alasan dari penggunaan CPU dan memori yang lebih efisien.
3. Fleksibel Terhadap Perubahan Bisnis
Anda ingin melacak karyawan, promosi, atau pelanggan? Dalam dimensi data modelling dapat menyesuaikan dengan perubahan. Ini sesederhana menambahkan kolom baru dan membuat tabel baru.
Baca Juga : Mengetahui Apa Itu Business Intelligence
Apa itu Dimensional Data Model?
Sebelum kita mulai dengan how-to, mari kita membahas beberapa kosa kata. Ketika melakukan ke pemodelan dimensi, tabel fakta, tabel dimensi, skema bintang, dan foreign key dan primary key penting untuk dipahami.
Tabel Fakta
Menyimpan unit pengukuran bisnis yang paling dasar. Beberapa contoh dunia nyata meliputi: berapa banyak pembelian, berapa banyak terjadi panggilan telepon, dan berapa banyak pesanan.
Tabel Dimensi
Menyimpan siapa, apa, kapan dan dimana setiap proses bisnis. Rincian tentang toko dan produk semuanya akan ditemukan di tabel dimensi.
Kunci Utama
Kolom di tabel dimensi yang mengidentifikasi baris data unik. Kunci utama atau primary key direferensikan oleh kunci asing atau foreign key untuk bergabung / direlasikan dengan tabel fakta dan dimensi.
Sekarang kita memiliki nomor unik yang dapat mewakili masing-masing produk dan toko, kita dapat memasukkan nomor ini ke dalam tabel fakta kita sebagai kunci asing.
Kunci Asing / Foreign Key
Sebuah kolom yang mereferensikan tabel lain (maka itu namanya adalah asing). Ini digunakan untuk menggabungkan data dari dua tabel, biasanya tabel fakta dan dimensi.
Skema Bintang / Star Schema
Struktur database seperti bintang yang memiliki hubungan primary key – foreign key antara tabel fakta dan tabel dimensi terkait.
Baca Juga : Aplikasi Gratisan Untuk Keperluan Data Analytic
4 Langkah untuk Memulai Data Modelling
Menjelaskan pemodelan data selalu lebih mudah dengan sebuah contoh. Mari kita gunakan penjualan kedai kopi sebagai proses bisnis dan gunakan transaksi berikut sebagai contoh sederhana. Katakanlah Kim, seorang karyawan di Coffee Shop, menagih Hendra untuk 1 muffin blueberry, 1 pisang, dan satu kopi hitam kecil di Dimenso Store # 3 pada hari Kamis, 1 Desember 2016.
Data seperti ini dalam sistem transaksional hanya berisi data dengan sedikit detail informasi tentang pembelian. Cukup sederhana bukan?
Namun, anda mungkin bisa membayangkan bagaimana ini bisa cepat lepas kendali dengan adanya miliaran transaksi, jutaan pelanggan, dan ribuan toko. Permintaan data transaksional pada skala ini dapat membuat bottleneck pelaporan dengan queri besar yang memerlukan waktu berjam-jam untuk mendapatkan hasil atau akhirnya kehabisan waktu.
Sekarang setelah Anda memiliki beberapa konteks di atas, berikut adalah empat tip untuk membantu Anda memulai pemodelan data Anda:
1. Identifikasi Proses Bisnis yang Ingin Anda Lacak
Pada contoh di atas, kami tertarik untuk melacak penjualan di kedai kopi. Tapi bisa jadi apa saja yang mewakili proses bisnis yang sebenarnya seperti panggilan telepon untuk layanan pelanggan, transaksi kartu kredit, atau aktivitas situs web.
2. Pilih Granularity Data Fakta
Ini akan tergantung pada total volume data pada tingkat transaksi. Biasanya ide bagus untuk memulai dengan data terbaik dan menyimpan setiap item baris transaksi penjualan.
3. Mengeluarkan Dimensi
Identifikasi atribut yang terlibat dalam setiap transaksi dan buat tabel dimensi terpisah untuk mereka. Setiap record dalam tabel dimensi harus unik dan memiliki kunci utama numerik yang terkait dengannya. Dalam contoh ini, toko, produk, pelanggan, karyawan, dan tanggal semuanya merupakan dimensi penjualan.
4. Mengkonsolidasikan Fakta
Metrik yang tersisa seperti kuantitas dan jumlah penjualan adalah ukuran Anda dan termasuk dalam tabel fakta atau sering disebut dengan measurement. Di samping setiap ukuran, Anda harus memiliki kunci asing yang mereferensi dan berelasi ke semua dimensi yang terlibat dalam proses seperti produk, pelanggan, dan toko.
Ada tool yang bisa kita gunakan untuk menyelasikan permasalahan seputar data modelling dengan menggunakan tool yang bernama ThoughtSpot. Salah satu hal hebat tentang ThoughtSpot adalah membuat keseluruhan proses ini jauh lebih tidak menyakitkan. Search Engine Optimization ThoughtSpot secara dinamis menerjemahkan pencarian sederhana ke dalam kueri dan agregasi kompleks yang dapat memproses miliaran baris data di dalam In-Memory Cache MPP. Untuk mendapatkan daftar lengkap tentang bagaimana ThoughtSpot menyederhanakan proses pemodelan data, anda bisa mencoba untuk searching di google atau yang lebih keren dan sering di sebut dengan aktivitas “googling” .
Refference :
data dimension, data modelling, model data, model data relasional, data, jenis jenis data, macam macam data, data model, data mining