Infra Struktur Data Warehouse
Data Warehousing
Gasal 2011 / 2012
Penyusun:
Dian Purnomo (09043120)
UNIVERSITAS BHAYANGKARA SURABAYA
Fakultas Teknik Informatika
2011
Infra Struktur Data Warehouse
Data Warehousing
Gasal 2011 / 2012
Kategori Infrastruktur DW
• Infrastruktur operasional
• Infrastruktur fisik
Infrastruktur Operasional
· Orang-orang
· Prosedur
· Pelatihan
· Manajemen Perangkat Lunak
Infrastruktur Fisik
· Hardware
· Sistem Operasi
· Sistem Manajemen Basis Data
· Network Software
Hardware dan Sistem Operasi
· Perangkat keras dan Sistem Operasi menyusun lingkungan untuk data warehouse
· Semua penyaringan data, transformasi, integrasi dan penjadwalan kerja yang dijalankan pada hardware yang terpilih di bawah sistem operasi pilihan
Point Penting dalam Pemilihan Hardware
· Skalabilitas
· Support
· Vendor Reference
· Keamanan
· Keandalan / Realiability
· Availability / Ketersediaan
· Preemptive Multitasking
· Gunakan pendekatan multithread
· Protection Memori
Pilihan Umum Hardware DW
· Mainframe
· Server Open System
· NT Server
Mainframe
· Hardware teruji kemampuannya
· Dirancang untuk OLTP dan bukan untuk aplikasi pendukung keputusan
· Tidak hemat biaya untuk data warehouse
Server Open System
· Server UNIX, pilihan medium untuk kebanyakan data warehouse
· Biasanya sempurna
· Sesuai untuk pengolahan paralel
NT Server
· Mendukung data warehouse ukuran menengah
· Kemampuan proses paralel yang terbatas
· Hemat biaya untuk data warehouse kecil dan ukuran menengah
Pilihan Platform
• Suatu platform komputasi adalah satuan komponen perangkat keras, sistem operasi, jaringan dan jaringan perangkat lunak
Single Platform
· Ini merupakan pilihan yang paling sederhana dan secara langsung untuk implementasi arsitektur data warehouse
· Dalam pilihan ini, semua fungsi dari back end penyaringan data hingga front end pengolahan query dilakukan pada platform tunggal
Hybrid Platform
• Pilihan platform selain single platform
Perangkat Keras Server
Symmetric Multiprocessing
• Ciri-ciri:
· Suatu arsitektur yang shared everything
· Mesin olah paralel yang paling sederhana
· Masing-masing processor memiliki akses penuh kepada memori secara bersama melalui suatu koneksi bus
· Komunikasi antara processor terjadi melalui memori umum
· Disk dapat dikontrol oleh semua processor
Cluster
· Ciri-ciri
· Masing-masing node terdiri dari satu atau lebih processor dan berhubungan dengan memori
· Memori tidak shared di antara node tapi shared hanya di dalam masing-masing node
· Komunikasi terjadi dalam kecepatan tinggi
· Masing-masing node mempunyai akses umum ke setiap disk
· Arsitektur ini adalah suatu cluster dari node
Massively Parallel Processing
• Ciri-ciri:
• Ini adalah suatu arsitektur yang shared nothing
• Arsitektur ini lebih terkait dengan mengakses disk dibanding akses memori
• Bekerja secara baik dengan suatu sistem operasi yang mendukung akses disk transparant
• Jika suatu table database ditempatkan pada disk tertentu, akses ke disk itu tergantung seluruhnya pada processor yang memiliki disk
• Internode komunikasi adalah dengan koneksi antar processor ke processor lainnya
Cache Coherent Non Uniform Memory Architecture
• Ciri-ciri:
• Ini adalah arsitektur yang paling baru; dikembangkan pada awal 1990
• NUMA arsitektur seperti suatu SMP besar mematahkan SMPs yang lebih kecil. Dimana yang lebih mudah untuk dibangun
• Perangkat keras mempertimbangkan semua unit memori sebagai suatu raksasa memori. Sistem mempunyai memori nyata tunggal menunjuk pada keseluruhan alamat memori mesin dimulai dengan 1 pada node yang pertama dan berlanjut ke node berikutnya. Masing-masing node berisi suatu direktori alamat memori di dalam node tersebut
• Di dalam arsitektur ini, jumlah waktu yang diperlukan untuk mendapatkan kembali suatu nilai memori bervariasi sebab node yang pertama mungkin memerlukan nilai yang berada di memori dari node ketiga. Hal inilah yang merupakan alasan mengapa arsitektur ini disebut arsitektur ini disebut arsitektur akses memori non uniform
Software Database
• Parallel Processing Option
• Pemilihan DBMS
• Collection Tools
Parallel Processing Options
• Interquery Parallelization
• Intraquery Parallelization
Intraquery Parallelization
• Horizontal Paralellism
• Vertical Paralellism
• Hybrid Method
Pemilihan DBMS
• Query Optimizer
• Query Management
• Load Utility
• Metadata Management
• Scalability
• Extensibility
• Portability
• Query Tool APIs
• Administration
Data Warehouse Management
• Membantu administrasi data warehouse di dalam manajemen sehari-hari
• Beberapa alat memusatkan pada proses loading dan history proses loading
• Memonitor kapasitas jaringan dan jumlah pemakai query
Middleware dan Connectivity
• Akses transparan ke source sistem di dalam lingkungan yang heterogen
• Akses transparan ke database dari jenis yang berbeda pada berbagai platform
• Alat memang mahal tetapi membuktikan mempunyai hal yang tidak ternilai untuk menyediakan interoperabilitas di antara berbagai komponen data warehouse
SEKIAN
TERIMA KASIH
TERIMA KASIH
1 komentar:
gambar nya belum di postig
di karenakan servernya masih repot
Posting Komentar