Gudang Data a.k.a Data Warehouse
pertama kali dengar, agak aneh juga sih, data kok digudangin..? di sini akan dijelaskan definisi, arsitektur dan karakteristik dari Data Warehouse.
Definisi
menurut W.H Inmon (bapaknya gudang data nih)
Data Warehouse adalah koleksi data yang mempunyai sifat berorientasi subjek, terintegrasi, time-variant, dan bersifat tetap dari koleksi data dalam mendukung proses pengambilan keputusan management.
Data Warehouse merupakan suatu database, tempat penyimpanan data, namun disini ukurannya harus besar karena datanya tetap (tidak boleh dihapus) tetapi akan bertambah terus. Data-data tersebut dapat berasal dari berbagai sumber data dan digunakan untuk membantu proses pengambilan keputusan oleh manajemen.
Arsitektur
1. Arsitektur Data Warehouse: Basic
#gambar1: Arsitektur Gudang Data : Basic
pada gambar di atas, menunjukkan arsitektur sederhana dari data warehouse. User dapat lagsung mengakses data yang diambil dari beberapa source melalui gudang data.
2. Arsitektur Data Warehouse: menggunakan Staging Area
#Gambar2: Arsitektur Data Warehouse : menggunakan staging area
Arsitektur gudang data menggunakan staging area dapat menyederhanakan proses pembuatan summary dan management warehouse secara umum. data akan dibersihkan dan diproses sebelum dimasukkan ke dalam data warehouse.
3. Arsitektur Data Warehouse: menggunakan Staging Area dan Data Marts
#Gambar3: Arsitektur Data Warehouse : menggunakan staging area dan data marts
pada #Gambar3, mengilustrasikan dimana data pembelian, penjualan, dan penyimpanan dipisahkan, sehingga akan memudahkan seorang analis dalam menganalisis data penjualan bulan tertentu atau dalam jangka waktu tertentu.
Karakteristik
Karakteristik Data Warehouse, diantaranya:
1. Berorientasi subject, artinya data warehouse didesain untuk menganalisa data berdasarkan subject-subject tertentu dalam organisasi, bukan pada proses atau fungsi aplikasi tertentu. Misalnya pada suatu perusahaan, maka akan fokus pada subject-subject tertentu, seperti karyawan, barang, atau produsen.
2. Integrated (Terintegrasi), dapat menyimpan data-data yang berasal dari sumber-sumber yang terpisah kedalam suatu format yang konsisten dan saling terintegrasi satu dengan lainnya. Dengan demikian data tidak bisa dipecah-pecah karena data yang ada merupakan suatu kesatuan yang menunjang keseluruhan konsep data warehouse itu sendiri.
3. Time Variant, Seluruh data pada data warehouse dapat dikatakan akurat atau valid pada rentang waktu tertentu. Data warehouse fokus pada perubahan-perubahan yang terjadi dalam jangka waktu tertentu, sehingga dapat menemukan suatu pola-pola yang tersembunyi dalam suatu hubungan bisnis.
4. Non-Volatile, data bersifat tetap, artinya data yang masuk tidak dapat diubah tetapi hanya bersifat read-only dan hanya dapat ditambakan.
5. Volume besar, karena data lama tetap berada dalam data warehouse dan akan terus bertambah, maka diperlukan volume yang sangat besar untuk data warehouse.
6. Not Normalized, data redundant atau duplikasi data. Karena berorientasi subjek, maka akan fokus pada subjek-subjek tertentu. Dalam histori penjualan misalnya, data penjualan bawang merah bisa menghasilkan banyak row, dari penjualan bawang merah pada mulai januari, februari, dan seterusnya.
7. Summarized, data operasioal dikumpulkan (diringkas) kemudian dimapping kedalam format untuk pengambilan keputusan.
8. Metadata, data mengenai data yang disimpan untuk user dan personil gudang data.
9. Data Sources, data berasal dari sumber internal (dalam suatu instansi) maupun eksternal (internet)
0 komentar:
Posting Komentar