Text
Analisa dan perbandingan performa RDBMS MySQL dan Hive-Hadoop
Skripsi ini membahas tentang performa dalam kecepatan antara MySQL
dan Hadoop dalam menyimpan dan mengolah big data (data besar). Adapun yang
menjadi latar belakang penulisan ini adalah teknologi yang membahas tentang big
data, banyak yang belum mempelajarinya atau mengetahui atau bahkan tidak
menggunakan. Sebelumnya sudah dikenal sebuah RDBMS MySQL dimana
sebagai tempat manajemen basis data, data yang terstruktur di proses untuk
disimpan ata dibaca oleh sistem dengan diketahui lamanya waktu eksekusi.
Sedangkan sekarang sudah banyak sekali data yang berkembang hingga sulit
untuk ditampung. Oleh karena itu kita perlu tahu dan mempelajari tentang
teknologi yang membahas big data dan bagaimana performanya. Hadoop
merupakan salah satu teknologi yang dapat membantu dalam pengolahan big data.
Dengan teknologi HDFS, data dapat dengan cepat disimpan dengan cara
didistribusikan ke beberapa file sehingga memudahkan dan mempercepat
ekseskusi.
Dengan metode eksperimen penulis akan mencoba melakukan penelitian
dengan meneliti waktu ekseskusi dalam load data dan select data. Dengan
banyaknya data yang akan digunakan tersebut bisa dilihat waktu eksekusi dalam
sistem baik di MySQL ataupun di Hadoop. Karena Hadooop merupakan sebuah
perangkat lunak untuk mendistrusikan data, maka diperlukannya sebuah
datawarehouse sebagai tempat untuk mengeksekusi yakni Hive, Hive ini
merupakan datawarehouse nomor satu yang digunakan dalam lingkungan Hadoop
dan menggunakan ekternal database sebagai metastore yakni Derby untuk
menyimpan data yang merupakan driver tertanam pada Hive.ix
Penelitian ini akan dilakukan dengan menggunakan data sebesar 1 GB
hingga 5 GB di kedua sistem, lalu akan diuji sebanyak tiga kali pada setiap data
dan jenis eksekusi yakni load dan select. Dengan mengetahui kecepatan waktu
untuk load data dan select data kita akan mengetahui bagaimana performa yang
ditunjukkan oleh keduanya. Kecepatan Hadoop lebih besar dibandingkan dengan
kecepatan MySQL, karena Hadoop merupakan file sistem yang mendistribusikan
data berupa file ke dalam blok-blok sehingga mempercepat eksekusi di dalam
Hadoop, sedangkan MySQL dieksekusi secara struktur dan dalam satu server.
Kata kunci : Hive-Hadoop, MySQL, Big Data
2032191019 | TA 190252 AZI a | My Library (Tugas Akhir 2019) | Tersedia |
Tidak tersedia versi lain