มีการวัดความเร็วดิสก์อย่างไรและความเร็วเท่าใด สำเนา 1,500 GB ควรใช้เวลานานเท่าไหร่?


11

ความเร็วของดิสก์วัดอย่างไร? มันคือ Mbit หรือ Mbyte ต่อวินาทีที่อ่าน? ปัจจุบันนี้มีค่าเฉลี่ยเท่าไรและเร็วเพียงใดและเร็วมากในอุตสาหกรรมนี้คืออะไร

สมมติว่ามีคนบอกว่าใช้เวลานานในการทำสำเนาไฟล์ 1,500 GB (พูดไฟล์ฐานข้อมูล) ใช้เวลานานแค่ไหนในระบบมืออาชีพและวิธีคำนวณความเร็วของฮาร์ดดิสก์ลงในบัญชี ?

คำตอบ:


19

ความเร็วดิสก์มักวัดใน

  • ความเร็วรอบในการหมุนรอบต่อนาที (ต่ำสุดที่ 4200 รอบต่อนาทีจากนั้น 5400, 7200, 10k และ 15k - ไม่สามารถใช้ได้กับ SSD หรือหน่วยความจำแฟลช)
  • ความเร็วอินเตอร์เฟสเป็นวิธีที่เร็วที่สุดที่อุปกรณ์อิเล็กทรอนิกส์ดิสก์สามารถพยายามส่งข้อมูลไปยังตัวควบคุมดิสก์ (ช่วงนี้จาก 100MBps ของ ATA ผ่าน SATA 150/300/600 Mbps ของ SATA ความเร็วของไฟเบอร์แชนเนล 2/4/8/16 Gbps และแม้แต่ความเร็ว PCIe สำหรับ ที่จัดเก็บข้อมูลแบบแฟลชเช่น FusionIO)
  • เวลาที่ใช้ในการค้นหาคือเวลาที่ใช้ในการเริ่มอ่านหรือเขียนส่วนของดิสก์โดยเฉพาะ - ช่วงเวลาเหล่านี้มีตั้งแต่ 3-15ms สำหรับดิสก์ไปจนถึงส่วนเล็ก ๆ ของดิสก์ SSD / แฟลช
  • จากนั้นเราไปถึงความเร็วจริงที่คุณคาดหวังมีสี่ความเร็วที่คุณควรใส่ใจ การอ่านตามลำดับ (การอ่านบล็อกข้อมูลขนาดใหญ่มาก) การเขียนตามลำดับ (เหมือนกัน แต่การเขียน) การอ่านแบบสุ่ม (การรับข้อมูลจากทั่วดิสก์) และการเขียนแบบสุ่ม สิ่งเหล่านี้มีความหลากหลายอย่างมาก แต่สำหรับดิสก์หมุนคุณสามารถคาดหวังอะไรจาก 25MBps ถึง 150MBps ต่อเนื่องสำหรับการอ่านและเขียนตามลำดับและอะไรจาก 3MBps-to-50Mps สำหรับสุ่มอ่านและเขียน โดยทั่วไปแล้ว SSD นั้นอยู่ในช่วง 200MBps สำหรับการเรียงตามลำดับและมักจะน้อยกว่าเล็กน้อยสำหรับการใช้งานแบบสุ่ม FusionIO สามารถเข้าถึง 1GBps ได้อย่างง่ายดายสำหรับทุกคน แต่โดยทั่วไปแล้วจะมีขนาดเล็กและมีราคาแพง

อย่างที่คุณเห็นว่าไม่มีค่าเฉลี่ยจริง ๆ หากคุณต้องการคำแนะนำเกี่ยวกับสิ่งที่จะซื้อโปรดกลับมาหาเราให้มากที่สุดเท่าที่จะทำได้ - ซึ่งควรรวมถึงงบประมาณประเภทแอปพลิเคชันขนาดชุดข้อมูลฐานผู้ใช้ ฮาร์ดแวร์ / ระบบปฏิบัติการรวมถึงสิ่งอื่นใดที่คุณคิดว่ามีประโยชน์

สำหรับสำเนา 1.5TB ของคุณถ้าคุณทำเช่นนี้กับดิสก์ SATA 7200rpm ที่ต่อกับ USB 2 คุณควรได้อย่างน้อย 30MBps-40MBps หรือดังนั้น 1.5TB เต็มอาจใช้เวลามากกว่า 10 ชั่วโมง หากนี่เป็นระบบ DAS / SAN แบบมืออาชีพทั่วไปฉันคาดหวังในพื้นที่ 100MBps ซึ่งหมายความว่าใช้เวลาประมาณ 3 ชั่วโมง

หวังว่าสิ่งนี้จะช่วยได้แหมเพียงชี้แจง MB = เมกะไบต์ Mb เป็นเมกะบิต


8

มีตัวแปรมากมายที่เกี่ยวข้องกับการคำนวณประเภทนี้ ระบบดิสก์ในโลกแห่งความเป็นจริงมีการพึ่งพาระหว่างกันมากมาย ภายในคอมพิวเตอร์เครื่องเดียว:

  • ความเร็วที่แท้จริงของไดร์ฟนั้น (โดยทั่วไปคือ RPMs, 5200, 7200, 10K, 15K)
  • ระบบไฟล์ที่ใช้งานอยู่
  • มีการใช้ระบบ RAID หรือไม่
    • ถ้าเป็นเช่นนั้นประสิทธิภาพของการ์ด RAID
    • ประเภทของ RAID
  • ระบบปฏิบัติการที่ใช้งานอยู่
  • การอ่านและเขียนมีลักษณะการทำงานที่แตกต่างกันอย่างสิ้นเชิง
  • อัตราส่วนการอ่าน / เขียนสำหรับการดำเนินการ
  • สำหรับการดำเนินการต่อเนื่องปัจจัยการกระจายตัวของการจัดเก็บ

อย่างที่คุณเห็นความเร็วของดิสก์นั้นเป็นเพียงหนึ่งในหลาย ๆ ปัจจัย มันเป็นปัจจัยใหญ่ แต่ก็ยังเป็นหนึ่งในหลาย ๆ หากสำเนา 1.5TB นั้นอยู่ในดิสก์เดียวกันดิสก์นั้นจะมีประสิทธิภาพ 95% ในการอ่าน / เขียนแบบสุ่ม 100% ซึ่งโดยทั่วไปแล้วจะเปลี่ยนเป็นเมตริกประสิทธิภาพที่แย่ที่สุด หากการคัดลอกมาจากดิสก์หนึ่งไปยังอีกดิสก์หนึ่งและข้อมูลนั้นเรียงลำดับได้ 100% และดิสก์เป้าหมายนั้นว่างเปล่าทั้งหมดสิ่งนี้จะเปลี่ยนประสิทธิภาพการทำงานที่เร็วที่สุดที่เป็นไปได้ด้วยระบบย่อยดิสก์นี้ การแสดงในโลกแห่งความเป็นจริงจะอยู่ระหว่างสุดขั้วทั้งสองนี้

หากคุณกำลังคัดลอกระหว่างเซิร์ฟเวอร์สองเครื่องจะมีปัจจัยที่เกี่ยวข้องมากกว่า

ฉันมีอาร์เรย์หน่วยเก็บข้อมูลในที่ทำงานซึ่งสามารถทำให้แชนเนล SAS ของ 3Gb (gigaBIT) แชนเนลได้อย่างสมบูรณ์เมื่อทำการดำเนินการตามลำดับเป็นส่วนใหญ่ ถ้าฉันมี 6Gb SAS มันอาจจะเข้าใกล้ความอิ่มตัวของมันด้วย สำหรับการสุ่ม I / O ระบบนี้จะทำงานแตกต่างกันมากโดยขึ้นอยู่กับว่าระบบปฏิบัติการคืออะไร (OpenSolaris เป็นต้นว่ามี I / O แบบสุ่มที่แย่ที่สุดและ Linux XFS ที่ดีที่สุดโดยใช้ปัจจัย 3)

มีตัวแปรมากเกินไปที่จะตอบคำถามนี้อย่างชัดเจน


3

การคัดลอกข้อมูลขนาด 1.5TB ใช้เวลานานเท่าใดขึ้นอยู่กับประเภทของข้อมูล หากคุณมีไฟล์ 1,500GB 1GB เพียงไม่กี่ชั่วโมงมันอาจจะใช้เวลาเพียงไม่กี่ชั่วโมง แต่ถ้าคุณมีไฟล์ 1 พันล้านไฟล์ครึ่งกิโลไบต์อาจใช้เวลาหลายวัน

นี่เป็นเพราะทั้งสองรายละเอียดการแข่งขันบนแผ่นดิสก์: ปริมาณงานและเวลาเข้าถึงโดยเฉลี่ย ดิสก์แบบดั้งเดิมที่มีปริมาณงาน 100MB / วินาทีและเวลาในการเข้าถึง 10ms เป็นเรื่องปกติ หากคุณสามารถสตรีมข้อมูลตามลำดับคุณสามารถรับ 100MB / วินาที อย่างไรก็ตามหากคุณต้องการข้ามไปยังสถานที่อื่นจะใช้เวลา 10ms หากคุณสตรีมมิ่งคุณสามารถเขียนข้อมูล 1MB ในเวลาที่ใช้ในการข้ามไปยังตำแหน่งอื่น

การสร้างไฟล์สามารถทำได้หลายครั้งดังนั้นการสร้างไฟล์ขนาด 1KB สามารถ "เสียค่าใช้จ่าย" ได้มากเท่ากับการสตรีมข้อมูลหลาย MB

ดังนั้นในบางกรณีการทำสำเนาดิสก์แบบดิบของอุปกรณ์บล็อกนั้นดีกว่าการคัดลอกที่ระบบไฟล์ผ่านทาง rsync หากคุณมีไฟล์จำนวนมากในระบบไฟล์กล่าวคือเต็ม 50% หรือมากกว่านั้นคุณมักจะทำได้ดีกว่าเพียงแค่คัดลอกอุปกรณ์บล็อกแบบเต็มผ่าน "dd" เท่าที่ใช้เวลา แน่นอนคุณไม่สามารถทำได้ในขณะที่ติดตั้งระบบไฟล์ดังนั้นจึงมีข้อเสียเช่นกัน

SSD สามารถช่วยลดปัญหานี้ได้เนื่องจากเวลาในการเข้าถึงเร็วกว่า 100 เท่า แต่ไดรฟ์ MLC SSD มีปัญหาการเข้าถึงที่ซับซ้อนขึ้นอยู่กับความพร้อมของกลุ่มของบล็อกที่ถูกลบไว้ล่วงหน้า SLC SSD สามารถช่วยสิ่งนี้ได้

ตัวควบคุม RAID ที่มีแคชในตัวสามารถช่วยค้นหาได้เช่นเดียวกับโมดูลเคอร์เนล flashcache ที่ให้คุณแคชอุปกรณ์บล็อกผ่าน SSD

ระบบ RAID สามารถอนุญาตให้มีการค้นหาแบบขนานหลายครั้งช่วยลดเวลาในการเข้าถึงโดยเฉลี่ยได้อย่างมีประสิทธิภาพรวมถึงการทำขนานเพื่อเพิ่มปริมาณงาน แต่ประสิทธิภาพโดยรวมของคุณมักขึ้นอยู่กับจำนวนไฟล์ที่เกี่ยวข้อง

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.