Skip to content
Home » Blog » What is ZFS filesystem

What is ZFS filesystem

  • by
ZFS Filesystem
ZFS Filesystem

ZFS (Zettabyte File System) เป็นระบบไฟล์และการจัดการข้อมูลที่พัฒนาโดย Sun Microsystems ซึ่งมีจุดเด่นในเรื่องของความเสถียรและความสามารถในการจัดการข้อมูลขนาดใหญ่ รายละเอียดเกี่ยวกับ ZFS และข้อดีของมันมีดังนี้

คุณสมบัติ ZFS

  • Copy-on-Write (COW) ทุกการเขียนข้อมูลจะไม่เขียนทับข้อมูลเก่า แต่จะเขียนข้อมูลใหม่ไปยังตำแหน่งใหม่เสมอ ทำให้มั่นใจได้ว่าข้อมูลเดิมยังคงอยู่ในกรณีที่เกิดการขัดข้องระหว่างการเขียนข้อมูล
  • Snapshots: ZFS สามารถสร้าง snapshots ซึ่งเป็นลักษณะสำเนาของระบบไฟล์ในขณะเวลาหนึ่งได้อย่างรวดเร็วและมีประสิทธิภาพ Snapshots นี้สามารถใช้เพื่อการสำรองข้อมูล หรือกู้คืนข้อมูลในกรณีที่เกิดความเสียหาย
  • Data Integrity: ZFS ใช้การตรวจสอบข้อมูลแบบ end-to-end checksum ทำให้สามารถตรวจจับและแก้ไขข้อผิดพลาดของข้อมูลได้
  • Pooled Storage: ZFS รวมการจัดการระบบไฟล์และการจัดการดิสก์เข้าด้วยกัน ทำให้สามารถเพิ่มหรือลดขนาดของ storage pool ได้ง่าย เช่นเมื่อ storage pool เต็มท่านสามารถเพิ่ม disk ใหม่เข้าไปใน pool ได้เลย โดยไม่ต้องสร้าง partition ใหม่ ทำให้ง่ายต่อการจัดการอย่างมาก
  • RAID-Z: เป็นการปรับปรุงของ RAID แบบเดิม ซึ่งออกแบบมาเพื่อลดปัญหา write hole ที่เกิดใน RAID 5 และ RAID 6 เช่น RAID-Z2, RAID-Z3 ที่รองรับความผิดพลาดของ disk 2 และ 3 ก้อนตามลำดับ
  • Compression and Deduplication: สามารถบีบอัดและลดความซ้ำซ้อนของข้อมูลในระบบไฟล์ได้อัตโนมัติ ทำให้ประหยัดพื้นที่จัดเก็บข้อมูล

ข้อดีของ ZFS

  • ความน่าเชื่อถือสูง: ด้วยการใช้ copy-on-write และ end-to-end checksum ทำให้มั่นใจได้ว่าข้อมูลจะไม่สูญหายหรือเสียหายโดยง่าย
  • การจัดการพื้นที่เก็บข้อมูลที่ยืดหยุ่น: การใช้ pooled storage ทำให้สามารถจัดการพื้นที่เก็บข้อมูลได้ง่ายและมีประสิทธิภาพ สามารถเพิ่มหรือลดขนาดของ storage pool ได้โดยไม่ต้องหยุดระบบ
  • ประสิทธิภาพในการสำรองและกู้คืนข้อมูล: Snapshots และ cloning ช่วยให้การสำรองและกู้คืนข้อมูลทำได้อย่างรวดเร็วและไม่เปลืองพื้นที่
  • การป้องกันข้อมูลสูญหาย: RAID-Z และคุณสมบัติ data integrity ช่วยป้องกันการสูญหายของข้อมูลในกรณีที่เกิดความเสียหายของดิสก์
  • ลดต้นทุนการจัดเก็บข้อมูล: การบีบอัดและ deduplication ช่วยลดพื้นที่ที่ใช้ในการจัดเก็บข้อมูล ทำให้ประหยัดต้นทุนในการจัดเก็บข้อมูล

ข้อเสียของ ZFS

  • การใช้งานทรัพยากร: ZFS ต้องการหน่วยความจำและการประมวลผลสูงเพื่อทำงานอย่างมีประสิทธิภาพ
  • ความซับซ้อนในการตั้งค่า: การตั้งค่าและการดูแลรักษา ZFS อาจมีความซับซ้อนกว่าระบบไฟล์ทั่วไป
  • ความเข้ากันได้: แม้ว่า ZFS จะสามารถใช้งานได้บนหลายแพลตฟอร์ม แต่การสนับสนุนและการบำรุงรักษาอาจไม่ครอบคลุมเท่าระบบไฟล์อื่นๆ

ZFS เป็นตัวเลือกที่ดีสำหรับองค์กรหรือผู้ใช้งานที่ต้องการระบบจัดการข้อมูลที่มีความเสถียรสูงและสามารถจัดการกับข้อมูลขนาดใหญ่ได้อย่างมีประสิทธิภาพ แต่ควรพิจารณาทรัพยากรที่ต้องใช้และความซับซ้อนในการจัดการก่อนการตัดสินใจใช้ระบบนี้ และ ถ้าจะให้ดี ผู้จัดการจะต้องมีความรู้เรื่อง file system ใน Linux มาก่อน


เมื่อเรารู้จักการทำงานของ ZFS แล้วคราวนี้เราไปดูว่า เทคโนโลยีการป้องกันข้อมูลเสียหายใน ZFS มีอะไรบ้าง
RAID ใน ZFS


RAID-Z เป็นเทคโนโลยี RAID ที่พัฒนาโดย ZFS ที่ออกแบบมาเพื่อป้องกันข้อมูลสูญหายและเพิ่มความเสถียรของระบบเก็บข้อมูล RAID-Z มีหลายระดับขึ้นอยู่กับจำนวนดิสก์ที่สามารถทนต่อการเสียหายได้ คือ RAID-Z, RAID-Z2, และ RAID-Z3 นี่คือรายละเอียดของแต่ละระดับ

RAID-Z

  • การป้องกันข้อมูลสูญหาย: RAID-Z สามารถทนต่อการเสียหายของดิสก์ได้ 1 ตัว
  • โครงสร้าง: ใช้หลักการคล้าย RAID 5 โดยมีการเขียนข้อมูลและ parity data ลงบนดิสก์ต่างๆ
  • ประสิทธิภาพ: การอ่านข้อมูลทำได้อย่างรวดเร็ว เนื่องจากสามารถอ่านจากดิสก์ได้พร้อมกัน แต่การเขียนข้อมูลอาจช้าลงเนื่องจากต้องคำนวณ parity data
  • ความจุที่ใช้งานได้: ความจุรวมของดิสก์ทั้งหมดหักลบด้วยความจุของหนึ่งดิสก์เพื่อเก็บ parity data

RAID-Z2

  • การป้องกันข้อมูลสูญหาย: RAID-Z2 สามารถทนต่อการเสียหายของดิสก์ได้ 2 ตัว
  • โครงสร้าง: ใช้หลักการคล้าย RAID 6 โดยมีการเขียนข้อมูลและ parity data สองชุดลงบนดิสก์ต่างๆ
  • ประสิทธิภาพ: ประสิทธิภาพในการอ่านข้อมูลยังคงสูง แต่การเขียนข้อมูลอาจช้ากว่า RAID-Z เนื่องจากต้องคำนวณ parity data สองชุด
  • ความจุที่ใช้งานได้: ความจุรวมของดิสก์ทั้งหมดหักลบด้วยความจุของสองดิสก์เพื่อเก็บ parity data

RAID-Z3

  • การป้องกันข้อมูลสูญหาย: RAID-Z3 สามารถทนต่อการเสียหายของดิสก์ได้ 3 ตัว
  • โครงสร้าง: ใช้หลักการคล้าย RAID 7 โดยมีการเขียนข้อมูลและ parity data สามชุดลงบนดิสก์
  • ประสิทธิภาพ: การอ่านข้อมูลยังคงทำได้อย่างรวดเร็ว แต่การเขียนข้อมูลจะช้าลงเนื่องจากต้องคำนวณ parity data สามชุด
  • ความจุที่ใช้งานได้: ความจุรวมของดิสก์ทั้งหมดหักลบด้วยความจุของสามดิสก์เพื่อเก็บ parity data

ข้อดีของ RAID-Z ทั้งสามระดับ

  • ความเสถียรและความน่าเชื่อถือ: ทั้งสามระดับมีการป้องกันข้อมูลสูญหายที่ดีเยี่ยม ด้วยการเขียน parity data ทำให้สามารถกู้คืนข้อมูลได้ในกรณีที่ดิสก์เสียหาย
  • การใช้งานง่าย: ZFS จัดการ RAID-Z แบบอัตโนมัติ ทำให้ผู้ใช้งานไม่ต้องกังวลกับการตั้งค่าและการบำรุงรักษา
  • ประสิทธิภาพ: RAID-Z มีประสิทธิภาพในการอ่านข้อมูลสูง แต่ละระดับจะเพิ่มความซับซ้อนในการเขียนข้อมูลตามจำนวน parity data ที่ต้องคำนวณ

ข้อเสียของ RAID-Z ทั้งสามระดับ

  • การใช้ทรัพยากร: การคำนวณ parity data ต้องการทรัพยากรในระบบมากขึ้น โดยเฉพาะอย่างยิ่งในระดับ RAID-Z2 และ RAID-Z3
  • ความซับซ้อนในการกู้คืน: ในกรณีที่ดิสก์หลายตัวเสียหายพร้อมกัน การกู้คืนข้อมูลอาจซับซ้อนและใช้เวลามาก
  • RAID-Z, RAID-Z2, และ RAID-Z3 เป็นเทคโนโลยีที่เหมาะสำหรับการจัดเก็บข้อมูลที่ต้องการความเสถียรและความน่าเชื่อถือสูง เช่นในองค์กรขนาดใหญ่หรือระบบที่ต้องการความปลอดภัยของข้อมูลสูง