Zetlogger: Introducing Apache Hadoop: The Modern Data Operating System

Pada ulasan kedua ini saya mengambil sebuah video yang berjudul "Introducing Apache Hadoop: The Modern Data Operating System". Sebuah video yang di unggah oleh Stanford University pada tanggal 04 September 2012 lalu, dalam video yang berdurasi 1 jam 16 menit 43 detik ini akan dibahas pengenalan apa itu Apache Hadoop yang dipaparkan oleh Amr Awadallah.

Salah satu implementasi dari Big Data yang cukup terkenal adalah Hadoop atau nama resminya Apache Hadoop. Hadoop adalah teknologi yang dibuat dari sebuah artikel atau paper. Paper ini di bawakan oleh Google untuk menggambarkan Big Data yang mereka gunakan untuk menampung data mereka yang sangat besar. Jadi, Google menginspirasi lahirnya Hadoop. Bedanya Big Data Google tidak bersifat open source sementara Hadoop open source.

Pada dasarnya framework Apache Hadoop terdiri atas beberapa modul berikut:

Hadoop Common, mengandung beberapa library dan utilitas yang dibutuhkan oleh modul-modul Hadoop.
Hadoop Distributed File System (HDFS), sebuah file-system terdistribusi yang mampu menyimpan data pada PC komersil dan mampu menyediakan kemampuan agregasi data yang tinggi antar klaster.
Hadoop YARN, sebuah platform untuk mengelolah sumber daya di setiap kalster dan menggunakannya untuk penjadwalan aplikasi pengguna.
Hadoop MapReduce, implementasi algoritma MapReduce untuk pemrosessan data dalam skala yang sangat besar.

Beberapa kelebihan dari menggunakan Hadoop adalah sebagai berikut:

Scalability and availability, dengan kemampuannya untuk menyimpan dan mendistribusikan data ke banyak komputer dan bekerja secara paralel, Hadoop dapat memberikan skalabilitas yang sangat tinggi.
Cost-effectiveness, dengan desain yang fault-tolerance dan scale-out architecture, klaster Hadoop bisa dibangun dengan perangkat yang relatif murah misalnya dengan PC komersil biasa dibandingkan dengan Server yang mahal.
Flexibility and performance, kemampuan untuk mengakses dan menyimpan berbagai tipe data baik yang terstruktur maupun tidak terstruktur dan tanpa batasan harus membuat schema akan memberikan fleksibiltas dalam memproses data.

Hadoop hadir bukan untuk menggantikan RDBMS tapi untuk melengkapinya. Dengan Hadoop pengolahan data besar menjadi lebih mudah, dengan Hadoop kita tidak perlu dipusingkan bagaimana mengatur distribusi data besar, bagaimana melakukan komputasi secara terdistribusi dan paralel, bagaimana mengelolah berbagai macam tipe data, dan berbagai hal lain terkait pengolahan data besar lainnya, tapi pengguna cukup fokus pada masalah apa yang coba ingin diselesaikan dengan data besarnya.

Video tersebut sangat cocok untuk pemula untuk mengenali bidang pengolahan data besar khususnya dengan menggunakan Hadoop, video tersebut dapat memberikan gambaran apa itu Hadoop dan bagaimana kita dapat menfaatkan Hadoop untuk pengolahan data besar dengan lebih mudah. Walaupun menurut saya penyampaian materi oleh peresenternya terlalu cepat dalam berbicara sehingga cukup sulit untuk menyimak apa yang sedang beliau bicarakan, tapi dengan dengan adanya slide materi yang ditampilkan setidaknya sedikit banyak mampu membantu penonton video untuk memahami materi lebih baik lagi.

Github account : https://github.com/zetbaitsu

URL ulasan      : http://zetlogger.blogspot.co.id/2016/12/apache-hadoop-modern-data-os.html
URL video       : https://www.youtube.com/watch?v=d2xeNpfzsYI
Durasi video     : 1 jam 16 menit 43 detik
Revisi pertama : Rabu, 07 Desember 2016
Revisi terakhir : Rabu, 07 Desember 2016

Zetlogger

Rabu, 07 Desember 2016

Introducing Apache Hadoop: The Modern Data Operating System

Tidak ada komentar:

Posting Komentar