RAID => Redundant Array of Inexpensive Disk
#Present การฝึกงาน 1st
#เทคโนโลยีเกี่ยวกับ RAID
บทความโดย
: dankejung
-
RAID ย่อมาจากคำว่า Redundant Array of (Independent) Inexpensive Disks
- เป็นวิธีการเก็บข้อมูลให้กระจายไปในดิสก์หลายๆ ตัวเพื่อช่วยให้การเพิ่มประสิทธิภาพในการอ่านและเขียนข้อมูล
- เพิ่มความน่าเชื่อถือในการเก็บข้อมูล
- จุดประสงค์เบื้องต้นของ RAID ในสมัยแรกเริ่มคือ
การรวบรวมเอาดิสก์ขนาดเล็กและราคาไม่แพงมาต่อเข้าด้วยกันเพื่อ
ให้มีขนาดและความสามารถทดแทนเหมือนดิสก์ขนาดใหญ่ที่มีราคาแพงๆ ได้ - ปัจจุบันดิสก์ขนาดใหญ่มีราคาถูกลงอย่างมากเมื่อเทียบกับเมื่อก่อน RAID จึงถูกใช้ในด้านการเพิ่มประสิทธิภาพและความน่าเชื่อถือ (reliability) ของระบบมากกว่าด้านราคา จึงทำให้คำว่า Inexpensive ถูกแทนที่ด้วยคำว่า Independent
RAID-0
- RAID 0 หรือ Block Striping คือ แทนที่ข้อมูลชุดหนึ่งจะถูกเขียนลงในฮาร์ดดิสก์เพียงตัวเดียว ก็จะถูกแบ่งกระจายออกเป็นบล๊อค แล้วก็เขียนลงไปในฮาร์ดดิสก์หลายๆตัว ประสิทธิภาพของดิสก์ดีขึ้น
- ไม่มีระบบการสำรองข้อมูล ถ้าดิสก์เสียเพียงลูกเดียว ข้อมูลก็จะหายหมด
- ระบบนี้ใช้ดิสก์ อย่างน้อย 2 ลูก
- ระบบนี้ไม่ต้องเสียพื้นที่ของฮาร์ดดิสก์ไว้จัดเก็บข้อมูลสำรอง ทำให้ใช้ความจุของฮาร์ดดิสก์ได้เต็มที่ ประสิทธิภาพสูง เพราะแบ่งกันเขียน แบ่งกันอ่าน
-
เหมาะสำหรับการใช้งานในกรณีการสูญเสียข้อมูลไม่มีผลกระทบต่อการทำงาน เช่น กรณีที่ข้อมูลด้านของวีดีโอออนไลน์ ซึ่งมักมีตัวต้นฉบับที่เก็บเอาไว้ ถ้าเกิดเสียหายก็นำต้นฉบับมาคัดลอกไว้ใหม่ หรือ Proxy Server ที่ต้องการ I/O Performance มากกว่าความวิกฤติของข้อมูล
RAID-1 หรือเรียกอีกอย่างว่า MIRRORING
- ดิสก์กระจกเงา เป็นฮาร์ดดิสก์สองชุด ที่เป็นเสมือน "เงา" ของกันและกัน
- การทำงานก็คือ เห็นเป็น Logical Drive เดียวกัน แต่ตัวไดรฟ์ที่ใช้งานคนละไดรฟ์ เวลาข้อมูลถูกเขียน ก็จะเขียนลงทั้งสองไดรฟ์เหมือนๆ กัน
- ประสิทธิภาพในการอ่านข้อมูลของ RAID-1 จะสูงเป็นสองเท่าของปกติเพราะสามารถอ่านได้จากดิสก์ชุดใดก็ได้พร้อมกัน
- การสำรองข้อมูลจะสมบูรณ์ที่สุดเพราะเก็บข้อมูลไว้ถึงสองชุด ถ้าดิสก์ชุดใดเสียก็สามารถใช้ข้อมูลจากอีกชุดได้เลยทันที จึงมีความน่าเชื่อถือสูง ถ้าตัวหนึ่งเกิดพังไป อีกตัวหนึ่งก็ยังทำงานได้เหมือนเดิม
- ข้อเสียของ Disk Mirror คือ ลดประสิทธิภาพของการเขียนลงไปมาก เพราะต้องเขียนทั้งสองตัว (เวลาอ่านเพียงตัวเดียว)
- ราคาแพงเพราะต้องซื้อมาเผื่อไว้อีกชุดหนึ่ง จะสิ้นเปลืองดิสก์ในการเก็บข้อมูลมากเพราะต้องเก็บข้อมูลเหมือนกันสองชุด จึงต้องใช้ดิสก์เก็บข้อมูลเป็นสองเท่า
- เหมาะกับงานที่ข้อมูลสำคัญมากๆ ความเหมาะสมในการใช้งาน เหมาะสมกับระบบงานที่ต้องการความมั่นคงข้อมูลสูงเช่น ระบบบัญชี การเงิน ระบบเงินเดือน ระบบประเภท Online Transaction และระบบที่มีการเข้าถึงข้อมูลแบบสุ่ม โดยที่ขนาดของข้อมูลไม่ใหญ่นัก การสำรองข้อมูลดีมาก แต่ประสิทธิภาพไม่ดีนัก ราคาก็แพงอีก
- ระบบนี้ ใช้ Disk อย่างน้อย 2 ลูก
RAID-5
- RAID 5 หรือ "Multiple Blocking with distributed parity" หมายถึงการทำบล๊อกของข้อมูลหลายๆ บล๊อกแล้วก็จัดการส่งไปเขียนลงไปหลายๆ ไดรฟ์
- มีการตัดแบ่งข้อมูลในระดับ block เช่นเดียวกับ RAID 4 แต่จะไม่ทำการแยก harddisk ตัวใดตัวหนึ่งเพื่อเก็บ parity
- ในส่วนของการสำรองข้อมูล จะทำการจัดเก็บ Parity ไปยัง harddisk ทุกตัว จะกระจาย parity โดยปะปนไปกับข้อมูลปกติ จึงช่วยลดปัญหาคอขวด ซึ่งเป็นปัญหาที่สำคัญใน RAID 3 และ RAID 4
- การสำรองข้อมูล จะเหมือนกับ RAID 3 แต่แตกต่างกันที่ จะเก็บ Parity ไว้ในหลายๆ ไดรฟ์ โดยมีข้อแม้ว่า ตัวข้อมูลเอง และตัวตรวจสอบ Parity นั้นจะต้องไม่ถูกเก็บไว้ในดิสก์ตัวเดียวกันเพราะถ้าเกิดว่าฮาร์ดดิสก์เกิดพังขึ้น ก็ยังคงใช้ Parity มาช่วยในการจัดเตรียมชุดข้อมูลขึ้นใหม่ได้
- แก้ปัญหา RAID 4 ในการ Write ข้อมูล
- ระบบนี้ ใช้ Disk อย่างน้อย 3 ลูก
- ความเหมาะสมในการใช้งาน เหมาะกับการใช้งานกับฐานข้อมูล (Database Server) ระบบอินทราเนท (Intranet Server) ซึ่งเป็นระบบที่มีการอ่านข้อมูลจากฮาร์ดดิสก์เป็นหลัก
- คุณสมบัติอีกอันหนึ่งที่น่าสนใจของ RAID 5 คือ เทคโนโลยี Hot Swap คือเราสามารถทำการเปลี่ยน harddisk ในกรณีที่เกิดปัญหาได้ในขณะที่ระบบยังทำงานอยู่ เหมาะสำหรับงาน Server ต่างๆ ที่ต้องทำงานต่อเนื่อง
- ท่านสามารถ Download เอกสารการทำ RAID 1 ในลีนุกซ์ Fedora Core3
ได้ที่นี่
http://rd.cc.psu.ac.th/component/option,com_docman/task,doc_download/gid,16/