Nvidia K20X vs GeForce Titan สำหรับการเร่งความเร็ว GPGPU


10

ฉันพยายามเข้าใจความแตกต่างระหว่างการ์ดกราฟิกทั้งสองสำหรับการคำนวณเชิงวิชาการโดยเฉพาะสำหรับส่วนประกอบ DGEMM

หากเราดูสถิติดิบทั้งคู่มีชิป GK110 เหมือนกันมีสถิติเทียบเคียงในแทบทุกหมวดหมู่และฉันเชื่อว่ามีสถาปัตยกรรมแกนหลักเดียวกัน ก่อนที่จะมีส่วนลดใด ๆ K20X นั้นมีราคาของไททันประมาณ 4 เท่า จากมุมมองของประสิทธิภาพดูเหมือนว่าเหมาะสมที่จะใช้ไททันกับ K20X

ฉันมีช่วงเวลาที่ยากลำบากในการทำความเข้าใจความแตกต่างที่นี่ใครสามารถส่องสว่างสถานการณ์ได้หรือไม่

ตามที่ทราบมาฉันกำลังมองหาซื้อการ์ดเหล่านี้เพื่อใช้กับแร็คเซิร์ฟเวอร์และทำการเอียงอย่างเต็มรูปแบบโดยพื้นฐานจนกว่าจะตาย แต่ฉันไม่ได้ดูประสิทธิภาพของการใช้ GPU หลายตัวสำหรับงานเดียวที่จะยิ่งสำคัญ

คำตอบ:


13

มีความแตกต่างบางประการ แต่ไม่จำเป็นต้องอยู่ในฮาร์ดแวร์หรือรายละเอียด โปรดทราบว่านี่คือข้อมูลทั้งหมดที่ฉันได้รับจากฟอรั่มหรือข่าวประชาสัมพันธ์ดังนั้นให้นำทุกอย่างไปด้วยเม็ดเกลือ

ประการแรกคือ "ความยืดหยุ่นและความน่าเชื่อถือ" ( แหล่งที่มา ) K20 ได้รับการออกแบบให้นั่งในระบบคลัสเตอร์และทำงานได้อย่างเต็มประสิทธิภาพตลอด 24/7 Titan ได้รับการออกแบบมาสำหรับการเล่นเกมมากขึ้นดังนั้นมันจะทำงานในรอบการทำงานนี้ แต่อาจประสบปัญหาระยะยาวหากใช้วิธีนี้

ไดรเวอร์ต่างกัน แต่ฉันก็ไม่แน่ใจในความแตกต่างที่สำคัญ ความแตกต่างในการมุ่งเน้นการออกแบบการ์ดน่าจะนำไปสู่ประสิทธิภาพที่ค่อนข้างเล็กสำหรับการ์ดเทสลาที่อยู่ด้านหน้านี้

"ฟีเจอร์ที่ไม่เหมือนใครของ Tesla ได้แก่ :

  • NVIDIA GPUDirect RDMA สำหรับประสิทธิภาพ InfiniBand
  • Hyper-Q สำหรับ MPI (Hyper-Q สำหรับ CUDA Streams รองรับบน GeForce GTX TITAN)
  • การป้องกัน ECC สำหรับการลงทะเบียนและความทรงจำทั้งภายในและภายนอก
  • เครื่องมือที่รองรับสำหรับ GPU และการจัดการคลัสเตอร์เช่น Bright Computing, Ganglia "( แหล่งที่มา )

สิ่งนี้ชี้ให้เห็นถึงความจริงที่ว่าข้อแตกต่างหลักคือความสามารถในการปรับขนาดได้ หากคุณต้องการรันเดสก์ท็อปในสำนักงานของคุณมันคงเป็นการยากที่จะเถียงกับ Titan เหนือ K20 สำหรับความแตกต่างของราคา หากคุณต้องการประสิทธิภาพที่เพิ่มขึ้นของ K20 หลายตัวค้นหาศูนย์ HPC ด้วยตัวคุณเองและซื้อเวลากับเซิร์ฟเวอร์ของพวกเขา

แก้ไข:

หลังจากดู ECC อีกเล็กน้อยฉันกำลังอัปเดตคำตอบนี้เพื่อชี้ให้เห็นถึงความหมายของการมีไว้ใน K20 ไม่ใช่บนไททัน ข้อมูลต่อไปนี้คือการแปลความหมายของข้อมูลที่พบที่นี่

ECC กำลังตรวจสอบข้อผิดพลาดบน DRAM และลงทะเบียน GPU ข้อผิดพลาดที่อ่อนนุ่มคือเมื่อบิตถูกโอน / จัดเก็บอย่างไม่ถูกต้อง ยิ่งวงจรเข้าใกล้เร็วขึ้นเท่าไหร่ก็จะยิ่งมีโอกาสเกิดข้อผิดพลาดที่สูงขึ้นเท่านั้น หากคุณกำลังแก้ปัญหาชุดของคู่ ODE หรือการแก้ระบบเชิงเส้นจำนวนหนึ่งที่ถูกปิดโดยหนึ่งบิตสามารถเปลี่ยนผลลัพธ์อย่างมีนัยสำคัญในลักษณะที่ไม่สามารถทำซ้ำได้ RAM และแคชมาตรฐานส่วนใหญ่ใน CPU จะตรวจสอบข้อผิดพลาดสำหรับข้อผิดพลาดเหล่านี้โดยใช้ ECC

ในทางกลับกัน GPU โดยทั่วไปไม่มี ECC แม้ว่าหน่วยความจำบัสจะเร็วกว่าซีพียูมาก นี่เป็นเพราะถ้าพิกเซลบนหน้าจอดับไปหนึ่งเฟรมคุณภาพของโปรแกรมจะไม่ลดลง ข้อผิดพลาดเหล่านี้ยังไม่ได้นำเสนอ ดังนั้นชิปอสังหาริมทรัพย์ (และค่าใช้จ่าย) จำนวนมากสามารถบันทึกได้โดยการข้ามคุณสมบัตินี้ ความซับซ้อนพิเศษนี้น่าจะเป็นสาเหตุส่วนใหญ่ของค่าใช้จ่ายเพิ่มเติมของสาย Tesla


3
คำตอบที่ดี +1! เป็นการยากที่จะเชื่อว่าคุณลักษณะเหล่านั้นมีราคาแพง ฉันคิดว่าบรรทัด "พัฒนาด้วย GeForce ปรับใช้กับ Tesla" จากเว็บไซต์ Nvidia ที่เชื่อมโยงสรุปประเด็นสำคัญ ดูเหมือนว่าทางออกที่ดีที่สุดในตอนนี้คือการซื้อ GeForces หลาย ๆ ตัวและเรียกใช้ยาก ๆ จนกว่าพวกเขาจะยอมแพ้ควันสีฟ้าเพื่อพูด
Ophion

3
อย่างไรก็ตามเรื่องนี้ไม่ได้หยุดพวกเขาจากการใช้งานที่ Oakridge OLCF ของเครย์ XK7ชื่อ "ไททัน" ใช้ Tesla K20 GPUs ไม่ GTX Titan NVidia กล่าวว่า GTX Titan มี "เทคโนโลยีของ" OLCF Titan ซึ่งเป็นคำศัพท์เดียวกับที่ใช้เมื่อกล่าวว่ารถยนต์ประหยัดมี "เทคโนโลยีของ" รถสูตร 1 (ประสิทธิภาพ GTX Titan สวยดี แต่มันไม่ได้มี ECC และไม่ได้นำมาใช้ในการติดตั้งใด ๆ ที่สำคัญที่ฉันรู้.)
เจดบราวน์

1
ความผิดพลาดของฉันฉันตีความบทความผิด ๆ ฉันจะอัปเดตคำตอบเพื่อไม่ให้เข้าใจผิด
Godric Seer

2

ในความคิดของฉันความแตกต่างน่าจะเป็นการแบ่งส่วนตลาดมากที่สุด หากคุณเป็นนักวิทยาศาสตร์ NVidia ต้องการให้คุณกลัวว่าเอกสารของคุณจะถูกปฏิเสธเพราะคุณใช้ GPGPU โดยไม่มีข้อผิดพลาดในการแก้ไข RAM เหมือนกับ K20X ในทำนองเดียวกันถ้าคุณเป็น บริษัท คุณอาจต้องจ่าย 4x หากหมายความว่าคุณมีโอกาสน้อยที่ถูกฟ้องร้องด้วยความสงสัยว่าการคำนวณของคุณไม่ได้รับการแก้ไขผิดพลาดมากที่สุด นักเล่นเกมหรืองานอดิเรก GPGPU'ers แต่ละคนถูกขายไททันเพราะพวกเขามีเงินน้อยกว่า


2
ฉันใช้การคำนวณด้วย ECC เท่านั้นคุณมีบทความที่ดีที่แสดงให้เห็นถึงความล้มเหลวของระบบที่ไม่ใช่ของ ECC และจุดพักเชิงตรรกะที่เป็นประโยชน์หรือไม่?
Ophion


สำหรับผู้ที่ต้องการบทสรุปผู้บริหารของลิงค์ที่ยอดเยี่ยมมากโดย BenC: ข้อผิดพลาดที่อ่อนนุ่มที่ ECC จะแก้ไขนั้นหายากเหลือเกินและกระดาษก็ไปไกลถึงการแนะนำให้ปิด ECC บน Tesla เพื่อเพิ่มความเร็ว Caveat: นี่ไม่ใช่การทดสอบจริงกับ GPU ผู้บริโภค
ต์ที่อยู่นอกสถานที่

0

ขึ้นอยู่กับแอพพลิเคชั่นที่คุณใช้งานจริง ๆ GPUGRID.net ทำงานบนเครื่องที่ไม่มี ECC และทุกอย่างใช้ได้ ผลลัพธ์ที่ได้ก็ดีเหมือนกันบนแพลตฟอร์มอื่น ๆ Acellera ยังจำหน่ายฮาร์ดแวร์ด้วยการ์ด GeForce และในบางกรณีเท่านั้นที่ GPUs ล้มเหลว GeForce คือทุกสิ่งที่คุณต้องการ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.