Rabu, 09 November 2011

OLAP

Definisi OLAP

OLAP (Online Analytical Processing) adalah teknologi yang memproses data di dalam data warehouse dalam struktur multidimensi, menyediakan jawaban yang cepat untuk query analisis yang kompleks.

Istilah OLAP sendiri baru muncul pada tahun 1993, diperkenalkan oleh E. F. Codd yang merupakan bapak relational databases. OLAP menurut Codd didefinisikan sebagai sintesis dinamik, analisis dan konsolidasi dari data multidimensional yang sangat besar. 
OLAP didefinisikan oleh Nigel Pendse sebagai Fast Analysis of Shared Multidimensional Information, artinya :
  • FAST berarti sistem ditargetkan untuk memberikan response terhadap user dengan  secepat mungkin, sesuai dengan analisis yang dilakukan.
  • ANALYSIS,  berarti sistem dapat mengatasi berbagai logika bisnis dan analisis statistik yang relevan dengan aplikasi dan user, dan mudah
  • SHARED,  berarti sistem melaksanakan seluruh kebutuhan pengamanan data, jika dibutuhkan banyak akses penulisan terhadap data, disesuaikan dengan level dari user. Tidak semua aplikasi membutuhkan user untuk menulis data kembali. Sistem harus dapat meng-handle multiple update dalam satu waktu secara aman.
  • MULTIDIMENSIONAL,  berarti sistem harus menghasilkan conceptual view dari data secara multidimensional, meliputi full support untuk hierarki dan mutiple hierarki. Hal ini merupakan cara yang logic untuk menganalisis bisnis dan organisasi.
  • INFORMATION,  adalah semua data dan informasi yang dibutuhkan dan relevan untuk aplikasi. Kapasitas produk OLAP berbeda untuk menghandle input data tergantung beberapa pertimbangan meliputi duplikasi data, RAM yang dibutuhkan, penggunaan disk space, performance, integrasi dengan data warehouse, dan lainnya.
Kemampuan OLAP 
  • Konsolidasi atau rollup Melibatkan pengelompokkan data. Misalnya kantor-kantor cabang dapat dikelompokkan menurut kota atau bahkan provinsi. Kemudian transaksi penjualan dapat ditinjau menurut tahun, bulan, semester dan sebagainya.
  • Drill-Down adalah suatu bentuk yang merupakan kebalikan dari konsolidasi, yang memungkinkan data diringkas dijabarkan menjadi data yang lebih detail.
  • Scicing dan Dicing (atau dikenal dengan istilah pivoting) menjabarkan pada kemampua untuk melihat data dari berbagai sudaut pandang, misalnya melihat data dari dimensi a dan dimensi b saja. 

Data Cube
Adalah representasi kumpulan data dalam multidimensi. Contoh:

Gambar #1 : Data Cube


Tabel Fakta dan Tabel Dimensi
Tabel Fakta merupakan tabel utama pada cube, terdapat 2 tipe kolom, yaitu kolom nilai-nilai dan kolom yang akan menyimpan foreign key dari tabel-tabel dimensi. Tabel ini jika digambarkan berupa suatu tabel yang panjang namun sangat kecil. Sedangkan tabel dimensi adalah tabel yang berelasi dengan tabel fakta, disinilah data-data yang sebenarnya termuat.

Star Schema dan Snowflake Schema
Star Schema merupakan skema paling sederhana dan mudah dipahami. Suatu tabel fakta merupakan pusat dari skema yang dikelilingi oleh beberapa tabel dimensi sebagai cabang dari tabel fakta, sehingga jika digambarkan akan kelihatan seperti bintang (Gambar #2)

Gambar #2 : Star Schema

Snowflake Schema merupakan skema yang lebih kompleks. Terjadi jika dilakukan normalisasi untuk menghindari redudancy data. Dari Star Schema di atas, dimensi Location dan Item dapat dibuat dimensi lagi yang tidak mengarah pada tabel fakta (Gambar #3)

Gambar #3 : Snowflake Schema