Text
Analisis kecepatan algoritma MapReduce Word Count pada Cluster Hadoop studi kasus pada Global Dataset of Events, Language and tone (GDELT)
International Data Corporation memperkirakan ukuran data semesta digital berada
pada angka 0.18 zettabytes (1 zettabytes = 1012 bytes), serta meramalkan akan
menjadi 10 kali lipatnya setiap 5 tahun. Salah satu data dengan kapasitas dan
ukuran besar yaitu data dari GDELT (Global Dataset of Event, Language and
Tone) Project dimana data tersebut menampung data dari seluruh dunia.Adanya
suatu sistem dalam pengolahan data memungkinkan pengguna untuk
mempermudah dalam mengolah suatu data, ada beberapa sistem atau framework
yang menggunakan teknik dan algoritma dalam mengolah suatu big data seperti
clustering dan klasifikasi dari suatu data set. Penelitian dengan judul “Analisis
Kecepatan Algoritma MapReduce Word Count Pada Cluster Hadoop StudiKasus
Pada Global Dataset of Events, Language and Tone (GDELT)”. Tujuan penelitian
adalah untuk menganalisis kecepatan algoritma mapreduce pada cluster Hadoop
dan mengetahui waktu yang dibutuhkan dalam mengolah data GDELT pada
Hadoop.
Penelitian ini menggunakan metode analisis kualitatif, yaitu metode yang
melakukan pendekatan pengolahan data dengan metode statistik atau matematik
yang terkumpul dari data sekunder. Adapun sumber data yang digunakan adalah
data dari buku dan jurnal ilmiah serta data dari Global Dataset of Events
Language and Tone. Data akan dianalisa dengan metode analisis kualitatif.
Landasan teori yang digunakan adalah teori Hadoop, HDFS dan MapReduce.
Berdasarkan analisa data yang telah dilakukan, diperoleh kesimpulan bahwa
algoritma Word Count yang diterapkan pada data set GDELT dapat berjalan pada
cluster Hadoop. Kecepatan algoritma Word Count pada MapReduce yang
diterapkan untuk data set GDELT pada hadoop berpengaruh apabila node yang
digunakan ditambah, dimana dalam penelitian menggunakan sebanyak 2 node
physical machine.Hadoop dapat mengolah data yang memiliki ukuran besar dan
banyak karena Hadoop mengolah data secara terdistribusi. Kecepatan Hadoop
dapat diatur dengan menambahkan node dan juga pengaturan lainnya
sepertihalnya block size.
Kata kunci: Hadoop, MapReduce, Word Count
2052191019 | TA 190220 ADA a | My Library (Tugas Akhir 2019) | Tersedia |
Tidak tersedia versi lain