Spark merupakan framework big data yang terkenal untuk pemrosesan data secara terdistribusi. Framework Spark dapat dijalankan di banyak bahasa pemrograman …

Spark merupakan framework big data yang terkenal untuk pemrosesan data secara terdistribusi. Framework Spark dapat dijalankan di banyak bahasa pemrograman …
MongoDB merupakan salah satu jenis NoSQL Database yang berbentuk dokumen. Menurut survey StackOverFlow MongoDB adalah NoSQL database paling populer. Ketika …
Kita akan belajar untuk menggunakan Hadoop Cluster di Amazon EMR untuk menganalisis log dengan Hive Sebelum lanjut pada AWS Case …
Pada artikel sebelumnya kita telah belajar menggunakan Twitter API dengan Python. Selanjutnya stream data dari Twitter API tadi akan diteruskan …
Apache Spark merupakan framework untuk processing data terdistribusi. Spark Mempunyai 4 komponen penting seperti Spark SQL, Spark Streaming, Machine learning …
Hadoop merupakan big data framework yang banyak digunakan untuk memproses data yang besar. Big Data adalah terminologi data yang mengacu …
HDFS merupakan layer terbawah dari Hadoop yang dapat menyimpan segala bentuk data. HDFS dapat menyimpan data dalam bentuk structured data, …
Sejak tahun 2008 Hadoop berkembang lebih besar tidak hanya terdiri dari HDFS dan MapReduce seperti yang telah bahas di artikel …
Hadoop merupakan framework open source untuk Big Data yang memungkinkan untuk melakukan komputasi terdistribusi Hadoop Diciptakan di Yahoo oleh Doug …
Seperti yang telah dibahas pada artikel sebelumnya bahwa teknik pengolahan Big Data adalah dengan komputasi terdistribusi Apa itu komputasi terdistribusi …
Istilah Big Data mungkin sudah banyak didengar dan dibicarakan orang. Saat ini fenomena Big Data terjadi dimana saja Misalnya di …
Pengembangan aplikasi biasanya tidak hanya sekedar membutuhkan bahasa pemrograman tetapi juga membutuhkan database untuk mengelola datanya Di beberapa materi sebelumnya …