Langsung ke konten utama

The Google File System

Rangkuman dari The Google File System

Nama : Muhammad Daffa Abiyyu Rahman

NRP : 6022211015


Google File System, disingkat GFS adalah sebuah sistem distribusi file yang dapat diskalakan (scalable) untuk aplikasi dengan data berjumlah besar. GFS di desain untuk memiliki toleransi kegagalan saat berjalan di hardware komoditas murah, dan memberikan performa tinggi untuk klien dalam jumlah besar.


Sebagian besar dari tujuan GFS merupakan tujuan yang umumnya dimiliki oleh sistem file terdistribusi lainnya, GFS memiliki desain yang didorong berdasarkan dari beban aplikasi yang dimiliki oleh Google dan juga perkembangan teknologi di Google. Perhitungan desain ini tidak hanya memperhitungkan kondisi terkini, tetapi juga kondisi yang akan dihadapi oleh sistem ini di masa depan. Perhitungan ini, beberapa di antaranya membawa asumsi-asumsi yang berlawanan dengan desain tradisional. Berikut adalah asumsi yang digunakan dalam GFS:

1. Sistem dibangun dengan hardware yang tidak terbilang mahal, dan perlu mendeteksi kegagalan, melakukan toleransi, dan memulihkan diri.

2. Mengoptimisasi file dengan ukuran besar dan tidak perlu optimasi untuk file berukuran kecil.

3. Ada dua jenis pembacaan: large stream dan random stream.

4. Penulisan data secara berurutan, atau random position dalam skala kecil.

5. Menggunakan semantic yang terdefinisi dengan baik untuk mendukung klien.

6. Mempertahankan bandwidth dibandingkan dengan latency.


GFS telah memenuhi kebutuhan yang diperlukan oleh Google terkait dengan penyimpanan data. Sebagai bukti, saat ini, GFS telah digunakan dikembangkan untuk digunakan di seluruh sistem Google untuk penyimpanan data dan juga memproses data yang digunakan oleh layanan Google. Selain itu, Google juga menggunakannya sebagai usaha riset dan pengembangan untuk himpunan data dalam skala besar. Untuk memenuhi kebutuhan tersebut, berikut beberapa hal untuk GFS:

1. Mendukung operasi file umum seperti open, close, create, delete, read, dan write, serta dua operasi khusus bernama snapshot, dan record append.

2. Menggunakan 1 master dan banyak chunkserver.

3. Metadata terdiri atas: In-memory data structure, lokasi chunk, dan log operasi.

4. Mendukung berbagai bentuk fault tolerance dan diagnosis. Beberapa yang notable adalah fault detection yang bagus dilengkapi dengan automatic recovery.

5. Memiliki kemampuan master yang kuat, termasuk garbage collection.


Sala satu klaster terbesar saat ini telah memberikan ratusan TB data di ribuan disket yang tersebar di ribuan mesin, dan digunakan secara konkuren (bersamaan) oleh ratusan klien.


Tentunya, GFS menggunakan berbagai rujukan dari model lain untuk file system seperti AFS, xFS, Swift, dan banyak lagi. Ini membuat GFS mempertimbangkan keunggulan dan kelemahan dari setiap file system dan menyesuaikan dengan keperluan Google sebagai perusahaan.

Komentar

Postingan populer dari blog ini

Kenapa Sekarang?

Years ago, I seek it. Dulu, aku berjuang untuk bisa melewati batas teman, trying to be someone that you consider as dearest. Yes, that's back then. As I said, had it been years ago, I would have straight out say YES out of sheer dumbness, or tenacity, or both. Tabun. I used to be full of desire to get you to acknowledge me, then. Sungguh lucu sekali, I would circumvent and try to just get any chance to meet with you. Aku menginginkan lebih, dulu. But no, it has always been someone else. Someone else get to be your priority, your attention. Berharap lebih adalah kesalahanku, dan aku selalu menganggapnya demikian. Why chase over the skies you cannot reach? I almost burned the entire bridge, truly. Only one more step and I know the entire relationship will turn into nothing more than smoldering ashes in the seas of lost time. You know, had you not talk to me within the short time of me settling my almost 9-years long illusion, perhaps the bridge had been burned completely, as I had wi...

Preparing Anaconda with Tensorflow [ACTUALLY WORKED FOR ME 2024]

Make sure to follow this with perfect order: 1. conda create -n tf_gpu tensorflow-gpu 2. conda activate tf_gpu 3. pip install numpy==1.23.4 [EXECUTE GPU TEST CODE] ==> CODE MUST RETURN GPU NUMBER > 0 [#CONFIRMED] 4. pip install tensorflow-gpu==2.10 [EXECUTE GPU TEST CODE] ==> CODE MUST RETURN GPU NUMBER > 0 [#CONFIRMED] 5. pip install tensorflow==2.10 [EXECUTE GPU TEST CODE] ==> CODE MUST RETURN GPU NUMBER > 0 [#CONFIRMED] (You may skip the first two test, but it helps ensure your environment is set up right)   TRIVIA: - There's no 2.11 version of Tensorflow GPU on pip as shown below: ERROR: Could not find a version that satisfies the requirement tensorflow-gpu==2.11 (from versions: 2.5.0, 2.5.1, 2.5.2, 2.5.3, 2.6.0, 2.6.1, 2.6.2, 2.6.3, 2.6.4, 2.6.5, 2.7.0rc0, 2.7.0rc1, 2.7.0, 2.7.1, 2.7.2, 2.7.3, 2.7.4, 2.8.0rc0, 2.8.0rc1, 2.8.0, 2.8.1, 2.8.2, 2.8.3, 2.8.4, 2.9.0rc0, 2.9.0rc1, 2.9.0rc2, 2.9.0, 2.9.1, 2.9.2, 2.9.3, 2.10.0rc0, 2.10.0rc1, 2.10.0rc2, 2.10.0rc3, 2.1...

Prof Ashari, Tangan Dingin Sang Rektor Visioner

Tulisan ini dipersembahkan kepada Prof  Dr Ir. Mochamad Ashari, M.Eng, IPU,  AEng. yang merupakan rektor ke-12 ITS, periode 2019-2024. Seluruh tulisan ini berupa pandangan saya pribadi, sebagai ucapan terima kasih, meski disajikan seakan penuh kritikan pada bagian awalnya. Pertama saya mengenal nama ini, saya ingat dari salah satu dosen saya sewaktu saya masih menempuh sarjana. Saya lupa persis kapan, tetapi saya diperkenalkan tentang bagaimana visionernya Prof Ashari dan sedikit cuplikan peran beliau membangun Telkom University di Bandung. Ya, sebelum beliau dinobatkan sebagai rektor, saya berpikir bahwa 'apabila beliau jadi, sepertinya akan berpotensi revolusioner, atau bakal agak ekstrem dalam kebijakan'. Bagi saya, itu cukup menarik, tetapi ada ketakutan di benak saya dengan potensi ekstrem kebijakan beliau. Kala beliau dinobatkan sebagai rektor terpilih, Prof Ashari langsung bergerak cepat yang tidak membutuhkan waktu lama untuk melihat langkah beliau. Saya masih ingat, d...