A.
Pengertian
MapReduce
MapReduce
adalah salah satu model pemrograman yang dirilis oleh perusahaan Google.Inc
ditujukan untuk memproses data berukuran raksasa secara terdistribusi dan
paralel dalam cluster jaringan yang terdiri atas ribuan komputer yang terhubung.
sebagai program yang berfungsi untuk memproses data, MapReduce dapat dibagi
dalam dua proses yaitu proses Map dan proses Reduce. Kedua proses ini didistribusikan
atau dibagikan ke setiap komputer dalam suatu jaringan cluster dan berjalan
secara paralel tanpa saling bergantung satu dengan yang lainnya.
1.
Proses Map bertugas mengumpulkan informasi dari
potongan-potongan data yang terdistribusi ke setiap komputer dalam cluster.
Hasilnya diserahkan kepada proses Reduce untuk diproses lebih lanjut.
2.
Hasil proses Reduce merupakan hasil akhir yang dikirim
ke pengguna.
3.
Untuk menggunakan MapReduce, Programmer cukup membuat
dua program yaitu program yang memuat perhitungan atau prosedur yang akan
dilakukan oleh proses Map dan Reduce. Semua proses lainnya akan dikerjakan
secara otomatis oleh MapReduce yang dijalankan diatas Google File System. Jadi
tidak perlu memikirkan bagaimana segmentasi data untuk dibagikan kepada tiap komputer,
dan memprosesnya secara paralel kemudian mengumpulkannya kembali seperti semula.
B.
Definisi
NoSQL
No SQL adalah sebuah metode cache
data dari bagian database sederhana yang berisi key dan value. Database ini
bersifat struktur storage dimana sistem databasenya yang berbeda dengan sistem
database relasional. Sistem menejemen database NoSQL berbeda dari sistem
menejemen database relasional yang klasik dalam beberapa hal. NoSQL mungkin
tidak membutuhkan skema table dan umumnya menghindari operasi join.
C. Keterkaitan
Antara MapReduce dengan NoSQL
Map
Reduce danNoSQL (Not Only SQL) adalah sebuah pemograman framework berfungsi untuk
membantu user mengembangkan sebuah data yang ukuran besar dapat terdistribusi
satu sama lain. Map-Reduce adalah salah satu konsep teknis yang sangat penting
di dalam teknologi cloud terutama karena dapat diterapkannya dalam
lingkungan distributed computing. Dengan demikian akan menjamin skalabilitas
data dari aplikasi atau software. Komponen NoSQL,
yang mencakup berbagai teknologi dan arsitektur, berusaha memecahkan masalah
dalam skalabilitas dan kinerja data yang besar. NoSQL sangat berguna ketika perusahaan
ingin mengakses dan menganalisis sejumlah data besar yang terstruktur.
Daftar Pustaka
TikaNesia - Jasa Pembuatan Website
Tidak ada komentar:
Posting Komentar