Perusahaan sering menjaga data mereka di berbagai sistem informasi yang telah terus bekembang selama bertahun-tahun untuk melacak histori data perusahaan. Karena sistem tersebut mungkin telah diambil dari database yang berbeda atau spreadsheet, mungkin pada sistem operasi yang berbeda dan platform komputer, dan sering dikembangkan pada waktu yang berbeda oleh staf yang berbeda untuk berbagai tujuan, kualitas data mereka bervariasi secara signifikan. Sistem warisan juga sangat sulit, mahal, dan tidak efisien untuk mempertahankan. Yang paling penting, meskipun, adalah bahwa bagian kunci dari data dari seluruh sistem tidak dapat diintegrasikan ke dalam satu basis pengetahuan untuk membantu dalam membuat keputusan korporasi yang sehat.
Gambar 1-1
Dalam Gambar 1-1, metadata dan data mentah dari sistem tradisional OLTP hadir, seperti tambahan jenis data, data ringkasan. Ringkasan yang sangat berharga dalam gudang data karena mereka pra - menghitung operasi lama di muka. Misalnya, permintaan data warehouse khas adalah untuk mengambil sesuatu seperti penjualan Agustus. Ringkasan di Oracle yang disebut pandangan terwujud.
Gambar 1-2
Pada Gambar 1-1 , Anda perlu membersihkan dan memproses data operasional sebelum memasukkannya ke dalam data warehouse . Anda dapat melakukan pemrograman ini, meskipun sebagian besar data warehouse menggunakan staging area sebaliknya . Sebuah area pementasan menyederhanakan ringkasan bangunan dan manajemen gudang umum . Gambar 1-2 menggambarkan arsitektur khas.
Gambar 1-3
Meskipun
arsitektur pada Gambar 1-2 adalah sangat umum, Anda mungkin ingin menyesuaikan
arsitektur data warehouse anda untuk kelompok yang berbeda dalam organisasi.
Anda dapat melakukan ini dengan menambahkan data mart, yang merupakan sistem
yang dirancang untuk lini bisnis tertentu. Gambar 1-3 mengilustrasikan contoh
di mana pembelian, penjualan, dan persediaan dipisahkan. Dalam contoh ini,
seorang analis keuangan mungkin ingin menganalisis data historis untuk
pembelian dan penjualan.
Infrastruktur data warehouse
Infrastruktur data warehouse adalah software, hardware, pelatihan dan komponen-komponen lainnya yang memberikan dukungan yang dibutuhkan untuk mengimplementasikan data warehouse(Poe).
Salah satu instrumen yang mempengaruhi keberhasilan pengembangan data warehouse adalah pengidentifikasian arsitektur mana yang terbaik dan infrasruktur apa yang dibutuhkan. Arsitektur yang sama, mungkin memerlukan infrastruktur yang berbeda, tergantung pada lingkungan perusahaan ataupun organisasi.
Staging area itu tempat penampungan data sementara sebelum data dimasukkan ke dalam data warehouse, fungsinya buat clean, transform dan mengkombinasikan data yang diperlukan untuk data warehouse.
Karena Dalam menggunakan data warehouse ini, anda dapat mengkustomisasi arsitekturnya yang bisa anda sesuaikan dengan kebutuhan organisasi dalam artian ini adalah organisasi yang terstruktur dan mempunyai badan hukum, serta bergerak dalam dunia bisnis. Hal ini dimungkinkan dengan menambahkan data mart. Data mart merupakan subset dari data resource, biasanya berorientasi untuk suatu tujuan yang spesifik atau subjek data yang di distribusikan untuk mendukung kebutuhan bisnis. Maka jelas alas an mengapa perusahaan distributor Philips memilih Arsitektur dataware house menggunakan staging area serta datamart, karena jelas bahwa akan sangat membantu menjalankan usaha bisnis dengan baik. Sebagai contoh data purchasing, sales, dan inventory dapat di pisahkan dalam masingmasing cube. Dalam contoh ini seorang analis keuangan dapat menganalisa histori data untuk purchases dan sales.
Sebelumnya kita mesti mengetahui Fungsi serta menjelaskan bagian-bagian yang ada pada
arsitektur dataware house ini :
1. Operational System
Berfungsi mejadi wadah ataupun lapisan pertama untuk menyediakan software yang mengambil ataupun memberikan Sumber data dari data warehouse serta dapat diambil langsung dari mainframe, basis data relasional seperti Oracle, Ms SQL server dan sebagainya. Selain itu dapat melalui Operational Data Source(ODS). ODS menampung data yang diekstrak dari sistem utama atau sumber-sumber data yang ada dan kemudian data hasil ekstrasi tersebut dibersihkan.
2. Flat File
Flat File Merupakan Kumpulan data yang diakses secara periodic. CSV (Comma Separated Value) pada Microsoft Excel, sebagai Contohnya, dan merupakan sebuah flat file. Flat file tidak melakukan hubungan (relationship) dengan tabel lainnya yang mengandalkan perintah khusus untuk digunakan. Oleh karena itu penggunaan flat file banyak digunakan pada aplikasi yang membutuhkan database tunggal dan sederhana.
3. Meta Data
metadata adalah informasi yang ditanam pada sebuah file yang isinya berupa penjelasan tetang file tersebut. misal pada perusahaan lampu Philips terdapat item barang jenis tertentu, untuk mengetahui jenis item lampu tertentu maka diperlukan gambar dari item lampu tersebut untuk mendapatkan informasi mengenai spesifikasi item lampu tersebut , nah informasi inti kan adalah gambar tersebut. namun bagaimana dengan informasi yang
menjelaskan gambar tersebut (kapan produksi lampu ini dibuat, berapa harga modalnya, bagaimana bentuk lampunya, serta informasi lainnya)? informasi yang menjelaskan lampu inilah yang disebut metadata.
4. Summary Data
Summary Data merupakan Sekumpulan Ringkasan sejumlah data pada sebuah item barang, sehingga Data-data yang terkait tentang jenis/item barang itu akan teringkas melalui spefikasi tulisan maupun gambar ataupun hal-hal yang berkaitan dengan jenis/item barang tersebut untuk kemudian diproses untuk dismpan dalam data yang bernama Summary Data tersebut. Atau Lebih Disebut Data Operasioal dikumpulkan (diringkas) kemudian dimapping kedalam format untuk pengambilan keputusan
5. Raw Data
RAW Data adalah Data ‘murni’ hasil tangkapan dari sensor digital yang sama sekali belum
disentuh oleh kompresi atau pun interpolasi apapun! Jadi datanya pun ‘fresh from the oven‘,
belum ada data yang hilang karena kompresi, belum ada keputusan processing apapun yang
diambil. Apa yang dilihat/ditangkap oleh sensor digital, itulah yang ada di data RAWnya.
Sumber ::
1. http://docs.oracle.com/cd/B10501_01/server.920/a96520/concept.htm
Sumber ::
1. http://docs.oracle.com/cd/B10501_01/server.920/a96520/concept.htm
0 komentar:
Posting Komentar