4
การทำโปรไฟล์รหัส CFD ด้วย Callgrind
ฉันใช้ Valgrind + Callgrind เพื่อทำหน้าที่แก้ปัญหาที่ฉันเขียน ในฐานะที่เป็นคู่มือผู้ใช้ Valgrind ฉันได้รวบรวมรหัสของฉันพร้อมตัวเลือกการดีบักสำหรับคอมไพเลอร์: "หากไม่มีข้อมูลการดีบักเครื่องมือ Valgrind ที่ดีที่สุดจะสามารถทำได้คือเดาว่าฟังก์ชันใดที่เป็นส่วนหนึ่งของรหัสซึ่งทำให้ทั้งข้อความแสดงข้อผิดพลาดและผลลัพธ์การทำโปรไฟล์เกือบไร้ประโยชน์ด้วย -g คุณจะได้รับข้อความที่ชี้ไปยัง บรรทัดซอร์สโค้ดที่เกี่ยวข้อง " คู่มือ Valgrind เมื่อคอมไพล์ด้วยตัวเลือกการดีบักรหัสจะทำงานช้าลงมาก รหัส CFD ช้ามาก ๆ แม้ในกรณีเล็ก ๆ เมื่อคอมไพล์ด้วยแฟล็กการดีบัก Valgrind ทำให้ช้าลง 40x (ดูคู่มือ1 ) คุณใช้เครื่องมือใดในการทำโปรไฟล์โค้ด (การทำโปรไฟล์ไม่ใช่การทำเกณฑ์เปรียบเทียบ)? คุณให้โค้ดทำงานนานแค่ไหน (สถิติ: กี่ขั้นตอน) เคสมีขนาดใหญ่เท่าใด (ถ้าเคสพอดีกับแคชตัวแก้คำสั่งจะมีขนาดเร็วขึ้น แต่แล้วฉันจะพลาดกระบวนการที่เกี่ยวข้องกับหน่วยความจำ)
16
hpc