คำถามติดแท็ก hpc

คอมพิวเตอร์ประสิทธิภาพสูงโดยทั่วไปจะใช้อาร์เรย์ของคอมพิวเตอร์ขนาดใหญ่ที่เชื่อมต่อในคลัสเตอร์หรือกริด

4
การทำโปรไฟล์รหัส CFD ด้วย Callgrind
ฉันใช้ Valgrind + Callgrind เพื่อทำหน้าที่แก้ปัญหาที่ฉันเขียน ในฐานะที่เป็นคู่มือผู้ใช้ Valgrind ฉันได้รวบรวมรหัสของฉันพร้อมตัวเลือกการดีบักสำหรับคอมไพเลอร์: "หากไม่มีข้อมูลการดีบักเครื่องมือ Valgrind ที่ดีที่สุดจะสามารถทำได้คือเดาว่าฟังก์ชันใดที่เป็นส่วนหนึ่งของรหัสซึ่งทำให้ทั้งข้อความแสดงข้อผิดพลาดและผลลัพธ์การทำโปรไฟล์เกือบไร้ประโยชน์ด้วย -g คุณจะได้รับข้อความที่ชี้ไปยัง บรรทัดซอร์สโค้ดที่เกี่ยวข้อง " คู่มือ Valgrind เมื่อคอมไพล์ด้วยตัวเลือกการดีบักรหัสจะทำงานช้าลงมาก รหัส CFD ช้ามาก ๆ แม้ในกรณีเล็ก ๆ เมื่อคอมไพล์ด้วยแฟล็กการดีบัก Valgrind ทำให้ช้าลง 40x (ดูคู่มือ1 ) คุณใช้เครื่องมือใดในการทำโปรไฟล์โค้ด (การทำโปรไฟล์ไม่ใช่การทำเกณฑ์เปรียบเทียบ)? คุณให้โค้ดทำงานนานแค่ไหน (สถิติ: กี่ขั้นตอน) เคสมีขนาดใหญ่เท่าใด (ถ้าเคสพอดีกับแคชตัวแก้คำสั่งจะมีขนาดเร็วขึ้น แต่แล้วฉันจะพลาดกระบวนการที่เกี่ยวข้องกับหน่วยความจำ)
16 hpc 

5
ซอฟต์แวร์ทางวิทยาศาสตร์ควรได้รับการปรับให้เหมาะสมเท่าใด
สำหรับแอปพลิเคชันที่ต้องการทรัพยากรการคำนวณที่สำคัญประสิทธิภาพสูงอาจเป็นปัจจัยที่สำคัญเมื่อพูดถึงการให้ผลลัพธ์ทางวิทยาศาสตร์หรือการบรรลุ "การเจาะผ่าน" ในเวลาที่เหมาะสม นักพัฒนาซอฟต์แวร์ควรลงทุนเวลาและความพยายามในการปรับแต่งแอปพลิเคชั่นให้เหมาะสมเท่าไร? เกณฑ์หลักที่ใช้มีอะไรบ้าง?
13 software  hpc 

1
แบบจำลองทางสถิติสำหรับหน่วยความจำ / การคำนวณโลคัลเวลาแฝงของเครือข่ายและแบนด์วิดท์ตัวสั่นใน HPC
การคำนวณแบบขนานมีการจำลองแบบบ่อยครั้งโดยใช้อัตราการคำนวณในท้องถิ่นที่กำหนดไว้ค่าใช้จ่ายในการตอบสนองและแบนด์วิดท์เครือข่าย ในความเป็นจริงเหล่านี้เป็นตัวแปรเชิงพื้นที่และไม่กำหนดขึ้น การศึกษาเช่นสกินเนอร์และเครเมอร์ (2005)สังเกตการกระจายแบบหลายโมดัล แต่การวิเคราะห์ประสิทธิภาพดูเหมือนว่าจะใช้การแจกแจงแบบกำหนดเวลาหรือแบบเกาส์นเสมอ (ไม่ใช่แค่ไม่ถูกต้องเท่านั้น มีการพัฒนาแบบจำลองทางสถิติที่มีความเที่ยงตรงสูงขึ้นหรือไม่ บัญชีใดที่มีความสัมพันธ์ข้ามกันในการคำนวณ / หน่วยความจำเวลาแฝงและความแปรปรวนของแบนด์วิดท์หรือไม่

2
ไลบรารีแบบขนานหน่วยความจำที่แบ่งใช้ตามภารกิจใน Scientific Computing
ในช่วงไม่กี่ปีที่ผ่านมาห้องสมุด / โครงการซอฟต์แวร์หลายแห่งปรากฏว่ามีรูปแบบหรือรูปแบบอื่น ๆ ของการใช้งานร่วมกันของหน่วยความจำที่ใช้ข้อมูลร่วมกันแบบขนาน แนวคิดหลักคือแทนที่จะเขียนโค้ดแบบเธรดอย่างชัดเจนโปรแกรมเมอร์ใช้อัลกอริธึมของพวกเขาเป็นงานที่ต้องพึ่งพาระหว่างกันซึ่งจะถูกกำหนดเวลาแบบไดนามิกโดยมิดเดิลแวร์จุดประสงค์ทั่วไปบนเครื่องหน่วยความจำที่ใช้ร่วมกัน ตัวอย่างของห้องสมุดดังกล่าวคือ: QUARK : เริ่มแรกออกแบบมาสำหรับไลบรารีพีชคณิตเชิงเส้นแบบขนานของMAGMAดูเหมือนว่าจะถูกใช้สำหรับวิธีการ Multipole แบบขนานแบบขนานเช่นกัน Cilkเดิมโครงการ MIT-based สนับสนุนในขณะนี้โดย Intel นำมาใช้เป็นภาษา / นามสกุลคอมไพเลอร์ที่ C ใช้ในCilkchessซอฟต์แวร์คอมพิวเตอร์หมากรุกและทดลองใน FFTW SMP superscalar : พัฒนาที่ Barcelona Supercomputing Center ซึ่งคล้ายกับ Cilk ในหลาย ๆ ด้านตาม#pragmaส่วนขยาย StarPU : "codelets" ซึ่งคล้ายกับห้องสมุดซึ่งสามารถรวบรวมและกำหนดเวลาสำหรับสถาปัตยกรรมที่แตกต่างกันหลายแห่งรวมถึง GPU งาน OpenMP: ตั้งแต่เวอร์ชัน 3.0, OpenMP แนะนำ "งาน" ที่สามารถกำหนดเวลาแบบอะซิงโครนัส (ดูส่วนที่ 2.7 ของข้อกำหนด) …

2
ค่าใช้จ่ายในการสื่อสารในซูเปอร์คอมพิวเตอร์
ฉันกำลังมองหาแหล่งอ้างอิงที่น่าเชื่อถือระบุว่าซูเปอร์คอมพิวเตอร์ใช้ทรัพยากรในการประสานงานกับงานที่เกี่ยวข้องกับงานจริงมากเพียงใด ทรัพยากรอาจเป็นพลังการประมวลผลที่ใช้ได้ แต่แม้แต่ Watts ก็ดูเหมือนหน่วยที่ใช้ได้ ฉันเชื่อว่าหนึ่งในอาจารย์หรือหนังสือของฉันเคยกล่าวไว้ว่าในระบบคู่ขนานขนาดใหญ่พลังการประมวลผลที่มีอยู่มากถึงครึ่งหนึ่งใช้ในการประสานงานและการส่งข้อความ น่าเสียดายที่ฉันไม่สามารถหาข้อมูลอ้างอิงนี้หรือเนื้อหาอื่น ๆ เกี่ยวกับสัดส่วนนี้ ฉันรู้ว่าสิ่งนี้จะแตกต่างกันมากขึ้นอยู่กับสถาปัตยกรรมซูเปอร์คอมพิวเตอร์และการนำไปใช้งานที่ทันสมัยอาจมีประสิทธิภาพมากขึ้นในเรื่องนี้ดังนั้นภาพรวมของการวัดนี้ในสถาปัตยกรรมหรือวิวัฒนาการหลาย ๆ อย่าง (ก่อนและหลังฮาร์ดแวร์ส่งข้อความเฉพาะ)
10 hpc  mpi 

4
ตัวแก้ปัญหาที่แข็งแกร่งและวนซ้ำสำหรับปัญหาเชิงเส้นยืดสามมิติขนาดใหญ่คืออะไร
ฉันกำลังดำดิ่งสู่โลกอันน่าทึ่งของการวิเคราะห์องค์ประกอบ จำกัด และต้องการที่จะแก้ปัญหาเครื่องจักรกลเทอร์โมขนาดใหญ่ (เฉพาะกลไกทางความร้อน , ไม่มีข้อเสนอแนะ)→→\rightarrow สำหรับปัญหาทางกลฉันได้เข้าใจจากคำตอบของเจฟฟ์แล้วว่าฉันจะต้องใช้ตัวแก้ซ้ำเนื่องจากขนาดตาข่ายของฉัน ฉันอ่านเพิ่มเติมในคำตอบของ Mattว่าการเลือกอัลกอริทึมการวนซ้ำที่ถูกต้องเป็นงานที่น่ากังวล ฉันถามที่นี่หากมีประสบการณ์เกี่ยวกับปัญหาการยืดตัวเชิงเส้นแบบสามมิติขนาดใหญ่ที่จะช่วยให้ฉัน จำกัด การค้นหาเพื่อประสิทธิภาพที่ดีที่สุดหรือไม่ ในกรณีของฉันมันเป็นโครงสร้างที่มีฟิล์มบาง ๆ มีลวดลายและวัสดุที่วางผิดปกติ (ทั้ง high-CTE และ low-CTE) ไม่มีการเสียรูปขนาดใหญ่ในการวิเคราะห์เชิงกลทางความร้อน ฉันสามารถใช้ HPC ในมหาวิทยาลัยของฉัน [1.314 โหนดพร้อมโปรเซสเซอร์ AMD Opteron 2 ตัว (แต่ละ 2.2 GHz / 8 คอร์)] ฉันคิดว่าPETScอาจมีบางสิ่งที่น่าสนใจโดยเฉพาะอย่างยิ่งอัลกอริทึมที่ใช้ในการแยกโดเมน (FETI, multigrid) แต่ฉันรู้สึกสับสนกับตัวเลือกและไม่มีประสบการณ์ ฉันชอบวลีที่ว่า"สิ่งมีชีวิตที่มีความรู้ทางเรขาคณิต"แต่ไม่แน่ใจว่าสิ่งนี้จะช่วยฉันได้หรือไม่ ฉันยังไม่ได้พบสิ่งที่เพ่งความสนใจไปที่กลศาสตร์ต่อเนื่องเชิงเส้น Strong Scaling (Amdahl) มีความสำคัญมากในใบสมัครของฉันเพราะพันธมิตรอุตสาหกรรมของฉันไม่สามารถรอผลการจำลองเป็นเวลานาน ฉันไม่เพียง แต่ชื่นชมคำตอบเท่านั้น แต่ยังมีคำแนะนำสำหรับการอ่านเพิ่มเติมในความคิดเห็น
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.