Fitur Hadoop
Fitur Hadoop
• Cocok untuk Analisis Data Besar
Karena bigdata cenderung terdistribusi dan tidak terstruktur,cluster HADOOP paling cocok untuk analisis bigdata. Karena logika pemrosesan (bukan data aktual) yang mengalir ke node komputasi,bandwidth jaringan yang dikonsumsi lebih sedikit. Konsep ini disebut sebagai konsep lokalitas data yang membantu meningkatkan efisiensi aplikasi berbasis Hadoop.• Skalabilitas
Cluster HADOOP dapat dengan mudah diskalakan sampai batas tertentu dengan menambahkan node cluster tambahan dan dengan demikian memungkinkan pertumbuhan bigdata. Selain itu,penskalaan tidak memerlukan modifikasi logika aplikasi.• Toleransi kesalahan
Ekosistem HADOOP memiliki ketentuan untuk mereplikasi data input ke node cluster lainnya. Dengan begitu,jika terjadi kegagalan node cluster,pemrosesan data masih dapat dilanjutkan dengan menggunakan data yang tersimpan di node cluster lain.Topologi Jaringan Di Hadoop
Topologi(pengaturan)jaringan,mempengaruhi kinerja cluster Hadoop ketika ukuran cluster Hadoop bertambah. Selain kinerja,seseorang juga perlu memperhatikan ketersediaan dan penanganan kegagalan. Untuk mencapai Hadoop ini,pembentukan cluster menggunakan topologi jaringan.Biasanya,bandwidth jaringan merupakan faktor penting untuk dipertimbangkan saat membentuk jaringan apa pun. Namun,karena mengukur bandwidth bisa jadi sulit,di Hadoop,jaringan direpresentasikan sebagai pohon dan jarak antara node pohon ini (jumlah hop) dianggap sebagai faktor penting dalam pembentukan cluster Hadoop. Di sini,jarak antara dua node sama dengan jumlah jarak mereka ke nenek moyang terdekat mereka.
Cluster Hadoop terdiri dari pusat data,rak,dan node yang benar-benar menjalankan pekerjaan.Di sini,pusat data terdiri dari rak dan rak terdiri dari node. Bandwidth jaringan yang tersedia untuk proses bervariasi tergantung pada lokasi proses.
Artinya,bandwidth yang tersedia menjadi lebih rendah saat kita menjauh dari :
- Proses pada node yang sama
- Node berbeda di rak yang sama
- Node di rak berbeda dari pusat data yang sama
- Node di pusat data yang berbeda
Post a Comment