Pengantar data warehouse


Menurut para ahli

Berdasarkan para ahli, Data Warehouse mempunyai macam-macam pengertian, berikut pengertian Data warehouse diambil dari beberapa Sumber:

  • Menurut Inmon (2005) di bukunya Building the Data Warehouse. Fourth Edition. Indiana : Wiley Publishing, Data warehouse adalah  suatu basis untuk proses informasi yang didefinisikan sebagai subject oriented, integrated, nonvolatile, time variant, dan a collection of data in support of management’s decision
  • Menurut Laudon (2006) di bukunya Decision Support and Business Intelligence Systems. 09. Pearson Prentice Hall. ISBN: 013_245 323 1. Data warehouse adalah database yang menyimpan data penting saat ini dan historis dari kebutuhan informasi untuk manager dalam perusahaan.
  • Data warehouse adalah data-data yang berorientasi subjek, terintegrasi, memiliki dimensi waktu, serta merupakan koleksi tetap (non-volatile), yang digunakan dalam mendukung proses pengambilan keputusan oleh para manajer di setiap jenjang (namun terutama pada jenjang manajerial yang memiliki peringkat tinggi).
  • Data warehouse adalah suatu paradigma baru dilingkungan pengambilan keputusan strategik. Data warehouse bukan suatu produk tetapi suatu lingkungan dimana user dapat menemukan informasi strategik [Poniah, 2001, h.14]. Data warehouse adalah kumpulan data-data logik yang terpisah dengan database operasional dan merupakan suatu ringkasan.
  • Data warehouse adalah data yang diperoleh dari proses dimana organisasi mengekstraksi makna dari aset infromasi yang mereka miliki. Data warehouse adalah inovasi baru dalam hal teknologi informasi. Sejak dimulai sekitar 15 tahun lalu, konsep data warehouse berkembang secara cepat sehingga saat ini konsep data warehouse ini adalah konsep yang paling banyak dibicarakan oleh para ahli di bidang tekhnologi informasi.
  • Data Warehouse adalah Pusat repositori informasi yang mampu memberikan database berorientasi subyek untuk informasi yang bersifat historis yang mendukung DSS (Decision Suport System) dan EIS (Executive Information System).

Berdasarkan beberapa pendapat, maka dapat disimpulkan bahwa data warehouse merupakan suatu metode dalam perancangan arsitektur database yang dapat mendukung pengembangan aplikasi Sistem Pendukung Keputusan dan Sistem Informasi Eksekutif. Dalam data warehouse hanya diperbolehkan melakukan dua kegiatan yaitu loading data dan access data, tidak ada kegiatan update data dalam data warehouse. Inti dari konsep data warehouse yaitu mengintegrasikan data dari berbagai sumber data yang berhubungan dengan kegiatan bisnis dan operasional perusahaan kemudian diolah melalui proses ETL (Extract, Transform, Load) kemudian disimpan dalam Data warehouse untuk keperluan analisis selanjutnya.

 

ETL (Extract, Transform, Loading)

Proses extract merupakan proses pengambilan data dari sumber data. Disebut extract, karena proses pengambilan data ini tidak mengambil keseluruhan data yang ada di database operasional, melainkan hanya data-data matang saja. Proses extract ini harus mengakomodir berbagai macam teknologi yang digunakan oleh sumber data dan diintegrasikan ke dalam database tunggal. Kemudian data-data hasil extract ini menjalani proses transformasi yang pada prinsipnya adalah mengubah kode-kode yang ada menjadi kode-kode standard, misalnya kode provinsi. Hal ini perlu dilakukan mengingat data-data yang diambil berasal dari sumber yang berbeda yang kemungkinan memiliki standarisasi yang berbeda pula. Standarisasi diperlukan untuk nantinya memudahkan pembuatan laporan. Proses load dalam ETL adalah suatu proses mengirimkan data yang telah menjalani proses transformasi ke gudang data akhir, yaitu data warehouse itu sendiri di mana aplikasi reporting dan business warehouse siap mengakses.

 

Tujuan Data Warehouse

Tujuan utama dari pembuatan data warehouse adalah untuk menyatukan data yang beragam ke dalam sebuah tempat penyimpanan dimana pengguna dapat dengan mudah menjalankan query (pencarian data), menghasilkan laporan, dan melakukan analisis. Salah satu keuntungan yang diperoleh dari keberadaan data warehouse adalah dapat meningkatkan efektifitas pembuatan keputusan (Wajarsana, 2008)

 

Karakteristik Data Warehouse

1. Berorientasi Subjek.

Data warehouse terorganisasi di seputar subjek kunci (atau entitas-entitas peringkat tinggi) dalam perusahaan, Data warehouse adalah tempat penyimpanan berdasakan subyek bukan berdasakan aplikasi. Subyek merupakan bagian dari suatu perusahaan. Contoh subyek pada perusahaan manufaktur adalah penjualan, konsumen, inventori, daln lain sebagainya.

2. Terintegrasi

Data yang tersimpan dalam data warehouse didefinisikan menggunakan konversi penamaan yang konsisten, format-format, struktur terkodekan, serta karakteristik-karakteristik yang berhubungan, Sumber data yang ada dalam data warehouse tidak hanya berasal dari database operasional (internal source) tetapi juga berasal dari data diluar sistem (external source). Data pada sumber berbeda dapat di-encode dengan cara yang berbeda. Sebagai contoh, data jenis kelamin dapat di-enkode sebagai 0 dan 1 di satu tempat dan ”m” dan ”f” di tempat lain.

3. Memiliki dimensi waktu (Time variant)

Data yang tersimpan dalam data warehouse mengandung dimensi waktu yang mungkin digunakan sebagai rekaman bisnis untuk tiap waktu tertentu, Data warehouse menyimpan sejarah (historical data). Bandingkan dengan kebutuhan sistem operasional yang hampir semuanya adalah data mutakhir! Waktu merupakan tipe atau bagian data yang sangat penting didalam data warehouse. Didalam data warehouse sering disimpan macam-macam waktu, seperti waktu suatu transaksi terjadi/dirubah/dibatalkan, kapan efektifnya, kapan masuk ke komputer, kapan masuk ke data warehouse; juga hampir selalu disimpan versinya, misalnya terjadi perubahan definisi kode pos, maka yang lama dan yang baru ada semua didalam data warehouse kita. Sekali lagi, data warehouse yang bagus adalah yang menyimpan sejarah.

4. Non-volatile

Data yang tersimpan dalam data warehouse diambil dari system operasional yang sedang berjalan, tetapi tidak dapat diperbaharui (di-update) oleh pengguna (bersifat ‘hanya-baca), Sekali masuk kedalam data warehouse, data-data, terutama data tipe transaksi, tidak akan pernah di update atau dihapus (delete) Terlihat, bahwa keempat karakteristik ini saling terkait kesemuanya harus diimplementasikan agar suatu data warehouse bisa efektif memiliki data untuk mendukung pengambilan-keputusan. Dan, implementasi keempat karakteristik ini membutuhkan struktur data dari data warehouse yang berbeda dengan database sistem operasional. Data dalam database operasional akan secara berkala atau periodik dipindahkan kedalam data warehouse sesuai dengan jadwal yang sudah ditentukan. Misal perhari, perminggu, perbulan, dan lain sebagainya. Sekali masuk ke dalam data warehouse, data adalah read-only . Pada gambar 2 dibawah ini bisa dilihat bahwa database OLTP bisa dibaca, diupdate, dan dihapus. Tetapi pada database data warehouse hanya bisa dibaca.

5. Ringkas

Jika diperlukan, data operasional dikumpulkan ke dalam ringkasan-ringkasan

6. Granularity

Pada sistem operasional data dibuat secara real-time sehingga untuk mendapatkan informasi langsung dilakukan proses query. Pada data warehouse pada menganalisis harus memperhatikan level-of-detail misalkan perhari, ringkasan perbulan, ringkasan per-tiga-bulan.

7. Tidak ternormalisasi

Data di dalam sebuah data warehouse biasanya tidak ternormalisasi dan sangat redundan. Dasar dari suatu data warehouse adalah suatu data yang besar yang mengandung informasi bisnis. Data-data yang ada di dalam data warehouse bisa berasal dari banyak sumber, misalkan dari database operasional atau transaksional dan sumber dari luar misalkan dari web, penyedia jasa informasi, dari perusahaan lain, dan lain sebagainya.

 

Kelebihan dan Kekurangan Data warehouse

1. Kelebihan Data warehouse :

  • Data terorganisir dengan baik untuk query analisis dan sebagai bahan yang baik untuk proses transaksi.
  • Perbedaan struktur data yang banyak macamnya dari sumber yang berbeda dapat di atasi
  • Memiliki aturan transformasi untuk memvalidasi dan menkonsolidasi data dari OLTP ke datawarehouse.
  • Masalah keamanan dan kinerja dapat dipecahkan tanpa perlu mengubah sistem produksi.
  • Memiliki model data yang banyak macamnya, dan tidak tergantung dari format data awal/sumbernya, sehingga memudahkan dalam menciptakan laporan.
  • Proses transformasi/ perpindahan dapat di monitoring. jika terjadi kesalahan dapat di arahkan / di luruskan.
  • Informasi yang disimpan dalam data warehouse, jadi ketika OLTP data sumber nya hilang, informasi yang diolah tetap terjaga dalam suatu datawarehouse.
  • Data warehose tidak memperlambat kerja operasional transaksi.
  • Data warehouse dapat menyediakan laporan yang bermacam-macam

2. Kekurangan Data warehouse :

  • Data warehouse bukan merupakan lingkungan yang cocok untuk data yang tidak terstruktur.
  • Data perlu di ekstrak, diubah (ETL) dan di load ke datawarehouse sehingga membutuhkan tenggang waktu untuk memindahkannya.
  • Semakin lama dipelihara, semakin besar biaya untuk merawat sebuah datawarehouse.
  • datawarehouse dapat menjadi ketinggalan dari data terbaru yang relatif cepat, karena data yang digunakan di datawarehouse tidak di update secara cepat. sehingga data yang ada tidak optimal.

 

Keuntungan Data Warehouse

Data warehouse dapat memberikan beberapa keuntungan bagi perusahaan yaitu :

1. Tingkat Pengembalian Investasi yang tinggi

Sebuah organisasi harus melibatkan sejumlah besar sumber daya untuk memastikan keberhasilan implementasi Data warehouse, dan biaya bisa mencapai puluhan ribu hingga jutaan dolar akibat berbagai solusi teknis yang tersedia. Namun, sebuah studi oleh International Data Corporation (IDC) melaporkan proyek Data warehouse yang dikirim pengembalian tiga tahun rata-rata atas investasi (ROI) sebesar 401% (IDC 1996), lebih lanjut, sebuah studi IDC nanti menjadikan analisis bisnis sebagai alat analisis yang mengakses Data warehouse menyampaikan satu tahun rata-rata ROI 431% (IDC, 2002).

2. Keuntungan Kompetitif

Pengembalian investasi yang besar bagi perusahaan yang telah berhasil menerapkan Data warehouse adalah bukti dari keunggulan kompetitif yang sangat besar yang menyertai teknologi. Keunggulan kompetitif yang diperoleh dengan memungkinkan pembuat keputusan akses ke data yang dapat mengungkapkan yang sebelumnya tidak tersedia, tidak diketahui, dan informasi belum dimanfaatkan oleh customer misalnya, tren, dan tuntutan.

3. Meningkatkan produktivitas para pembuat keputusan perusahaan

Data warehouse meningkatkan produktivitas para pengambil keputusan perusahaan dengan menciptakan sebuah database yang terintegrasi yang consistent, subject-oriented, data historical. Integrade data dari sistem yang tidak sesuai ke dalam suatu bentuk yang memberikan satu pandangan yang konsisten. Dengan mengubah data ke dalam makna informasi lengkap, Data warehouse memungkinkan para pengambil keputusan perusahaan untuk melakukan substanttion lebih, akurat, dan analisis yang konsisten.