ในขณะนี้ฉันกำลังใช้งาน rsync จำนวน 2.2 ล้านไฟล์รวม 250GB และใช้เวลาแค่ 700,000 ไฟล์ใน 6 ชั่วโมง
ไม่มีใครรู้ rsync เช่นเครื่องมือที่สามารถทำได้ด้วยหลายกระทู้เพื่อให้มันเร็วขึ้น?
ในขณะนี้ฉันกำลังใช้งาน rsync จำนวน 2.2 ล้านไฟล์รวม 250GB และใช้เวลาแค่ 700,000 ไฟล์ใน 6 ชั่วโมง
ไม่มีใครรู้ rsync เช่นเครื่องมือที่สามารถทำได้ด้วยหลายกระทู้เพื่อให้มันเร็วขึ้น?
คำตอบ:
ฉันสงสัยว่าซีพียูเป็นปัจจัย จำกัด ที่นี่ คุณอาจถูก จำกัด ทั้งแบนด์วิดท์เครือข่ายสำหรับการถ่ายโอนและดิสก์ IO เวลาแฝงโดยเฉพาะอย่างยิ่งสำหรับการโทรสถิติเหล่านั้นทั้งหมด
คุณสามารถแบ่งลำดับชั้นของระบบไฟล์ออกเป็นชิ้นเล็ก ๆ เพื่อประมวลผลแบบขนานได้หรือไม่?
ไฟล์ต้นฉบับคืออะไรและมีการเขียนหรือแก้ไขอะไร เป็นไปได้ไหมที่จะส่งการเปลี่ยนแปลงเมื่อเกิดขึ้นในระดับแอปพลิเคชัน
หากระบบย่อยดิสก์ของเซิร์ฟเวอร์ที่รับเป็นอาร์เรย์ที่มีหลายดิสก์การใช้กระบวนการ rsync หลายรายการสามารถปรับปรุงประสิทธิภาพได้ ฉันใช้กระบวนการ rsync 3 กระบวนการเพื่อคัดลอกไฟล์ไปยังเซิร์ฟเวอร์ NFS (RAID6 ที่มี 6 ดิสก์ต่อกลุ่มการโจมตี) เพื่อทำให้ Gigabit Ethernet อิ่มตัว
ผู้ชายคนนี้รายงานเกี่ยวกับชุดสายหลามพื้นฐานที่วางไข่หลายกระบวนการ rsync http://www.reliam.com/company/featured_geek
ฉันได้อ่านคำถามมากมายเช่นนี้ ฉันคิดว่าคำตอบที่แท้จริงคือการคัดลอก / ย้ายด้วยตนเอง IOps จะเป็นปัญหาที่นี่ หากมันทำให้คุณรู้สึกดีขึ้นฉันกำลังอยู่ระหว่างการเคลื่อนย้ายไฟล์ประมาณ 200 ล้านไฟล์ซึ่งกินเนื้อที่ดิสก์มากกว่า 100TB
คุณอาจลองตรวจสอบ cp โคลนแบบมัลติเธรดสำหรับ linux (โอเพ่นซอร์ส): http://static.usenix.org/event/lisa10/tech/slides/kolano.pdf