คำถามติดแท็ก cuda

1
CUDA เทียบกับ OpenCL ปลายปี 2556
CUDA และ OpenCL เปรียบเทียบกันอย่างไรเมื่อปลายปี 2013 จากมุมมองของโปรแกรมเมอร์ กลุ่มของฉันคิดว่าจะพยายามใช้ประโยชน์จากการคำนวณด้วย GPU เราจะ จำกัด ตัวเองอย่างมากด้วยการเลือกฮาร์ดแวร์ที่รองรับ OpenCL แต่ไม่ใช่ CUDA หรือไม่ หากต้องการระบุให้ชัดเจนยิ่งขึ้นสมมติฐานต่อไปนี้ถูกต้องหรือไม่ ทุกสิ่งที่เป็นไปได้ใน CUDA ก็เป็นไปได้เช่นกันใน OpenCL ตราบใดที่เราไม่ได้ใช้ห้องสมุดงานที่กำหนดก็ไม่ง่ายอย่างที่คิด (หรือยากกว่า) ที่จะทำในสิ่งใดสิ่งหนึ่ง ข้อได้เปรียบหลักของ CUDA คือความพร้อมใช้งานของไลบรารี ทั้งสองมีการสนับสนุนที่ดีสำหรับแพลตฟอร์มหลักทั้งสาม (Win / OSX / Linux)
34 hpc  gpu  cuda  opencl 

3
การแก้ปัญหาการเพิ่มประสิทธิภาพที่ไม่เชิงเส้นแบบไม่มีข้อ จำกัด บน GPU
ฉันกำลังพยายามแก้ปัญหาการเพิ่มประสิทธิภาพแบบไม่เชิงเส้นที่ไม่มีข้อ จำกัด บน GPU (CUDA) ฟังก์ชันวัตถุประสงค์เป็นฟังก์ชันที่ไม่เชิงเส้นอย่างราบรื่นและการไล่ระดับสีนั้นค่อนข้างถูกในการคำนวณเชิงวิเคราะห์ดังนั้นฉันไม่จำเป็นต้องกังวลกับการประมาณเชิงตัวเลข ฉันต้องการที่จะแก้ปัญหานี้โดยส่วนใหญ่ fp32 maths ops (ด้วยเหตุผลต่าง ๆ ) ดังนั้นวิธีการเพิ่มประสิทธิภาพแบบไม่เชิงเส้นที่มีประสิทธิภาพมากขึ้นเมื่อเทียบกับข้อผิดพลาดในการปัดเศษขึ้นในขณะที่มีประสิทธิภาพที่ดี? (เช่นคอนจูเกตการไล่ระดับสี / เสมือนนิวตัน / ภูมิภาคที่เชื่อถือได้) มีใครเคยลองใช้ BFGS บน GPU ด้วยผลลัพธ์ที่ดีหรือไม่? BTW, Hessian ถ้าจำเป็นมีขนาดค่อนข้างเล็กในกรณีของฉัน (โดยทั่วไป <64x64) แต่ฉันต้องแก้ปัญหาการเพิ่มประสิทธิภาพขนาดเล็กหลายพันรายการพร้อมกันนี้

1
cuda และวิธีการเชิงตัวเลขที่มีการลดทอนเวลาโดยนัย
ฉันกำลังมองหาที่จะพอร์ตรหัสบางอย่างที่แก้ไขชุดของสมการเชิงอนุพันธ์บางส่วน (PDE) โดยวิธีปริมาณ จำกัด ในรูปแบบ IMPLICIT (สำหรับการแยกส่วนเวลา) ด้วยเหตุนี้จึงมีระบบสมการสามมิติในทิศทาง x, y, z ซึ่งจัดการโดยโครงการ ADI / TDMA ฉันไม่สามารถหาอะไรเกี่ยวกับการแก้ปัญหาโดยนัยของ PDEs ด้วย CUDA สามารถใช้ ADI / TDMA ใน CUDA ได้หรือไม่? มีตัวอย่างเช่นสมการการกระจายความร้อนแบบ 2D ที่มีอยู่ที่ไหนสักแห่ง? ทั้งหมดที่ฉันสามารถหาได้คือโค้ดตัวอย่าง CUDA สำหรับสมการการกระจายความร้อนแบบ 2D ในความแตกต่างอัน จำกัด แต่ในรูปแบบ EXPLICIT (University of Cambridge) คำใบ้ / การอ้างอิงใด ๆ จะได้รับการชื่นชมอย่างมาก

3
แรงขับสำหรับการเขียนโปรแกรม GPU
ฉันมากใหม่ในการเขียนโปรแกรม GPGPU ดังนั้นโปรดยกโทษให้ฉันถ้าคำถามไม่เหมาะสมโดยเฉพาะอย่างยิ่ง จากสิ่งที่ฉันเข้าใจการเขียนโปรแกรม GPU เป็นงานวิศวกรรมที่ซับซ้อนมากเมื่อเทียบกับการเขียนโปรแกรม CPU ปกติ สิ่งหนึ่งที่จะต้องระมัดระวังอย่างมากเกี่ยวกับปัญหาความแตกต่างการปูกระเบื้องการจัดสรรหน่วยความจำที่ตรึงไว้และการคำนวณอุปกรณ์สื่อสาร / อุปกรณ์โฮสต์ซ้อนทับกัน หลังจากทำวิจัยเล็กน้อยฉันพบห้องสมุดแรงผลักดันซึ่งดูเหมือนว่าพยายามเลียนแบบ C ++ STL มันค่อนข้างดี อย่างไรก็ตามจากประสบการณ์ที่ จำกัด มากของฉันและการได้เห็นการจัดการไมโครที่จำเป็นทั้งหมดเพื่อให้ได้ประสิทธิภาพที่ดีฉันค่อนข้างสงสัยเกี่ยวกับประสิทธิภาพ แรงขับสามารถจัดการกับส่วนการเขียนโปรแกรมที่ซับซ้อนทั้งหมดได้อย่างมีประสิทธิภาพภายในหรือไม่? ห้องสมุดที่รู้จักกันดีบางแห่งเช่น PETSc ดูเหมือนจะใช้แพ็คเกจนี้ซึ่งทำให้ฉันเชื่อว่ามันควรจะเป็นอย่างใด ฉันสงสัยว่าคนที่มีประสบการณ์เกี่ยวกับ CUDA และแรงผลักดันอาจพูดคำหนึ่งหรือสองเกี่ยวกับประสิทธิภาพของแพ็คเกจเมื่อเทียบกับการเขียนโปรแกรม CUDA ระดับต่ำ ฉันสามารถใช้แรงขับได้เมื่อใดและฉันควรเปลี่ยนกลับเป็น CUDA เมื่อใด
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.