วิทยาศาสตร์การคำนวณ parallel-computing

2

การเลือกตัวแก้เชิงเส้นสำหรับการคำนวณ GPGPU (OpenCL)

ฉันได้พัฒนาวิธีการทำงานของวิธีไฟไนต์เอลิเมนต์เพื่อแก้ปัญหาการถ่ายเทความร้อนโดยใช้ GPU และ OpenCL โดยใช้วิธีการไล่ระดับสีคอนจูเกต ข้อเสียเปรียบหลักของวิธีนี้คือความต้องการหน่วยความจำสูง ยิ่งไปกว่านั้นในกรณีที่การ์ดหน่วยความจำมักจะมีข้อ จำกัด มาก ฉันเห็นสองตัวเลือก: สร้างโดเมนย่อยและแลกเปลี่ยนส่วนต่าง ๆ ของเมชด้วยหน่วยความจำโฮสต์ ใช้วิธีการแบบหลายหน้า ฉันต้องคำนึงถึงสถาปัตยกรรมที่เฉพาะเจาะจง การแลกเปลี่ยนอาจมีราคาแพงมาก วิธีการ CG เป็นที่นิยมในบริบทของการคำนวณ GPGPU แต่ฉันไม่พบการเปรียบเทียบระหว่าง CG และวิธีการแบบหลายหน้า (ในกรณีของ GPGPU) วิธีการแบบหลายหน้าสามารถทำได้เร็วกว่า CG ไหม นี่เป็นคำถามทั่วไปที่จริงแล้วมันยังขึ้นอยู่กับการใช้งาน

10 parallel-computing opencl linear-solver

1

วิธีการรวบรวมและแก้ปัญหาระบบเมทริกซ์ในแบบคู่ขนานจากค่าที่สร้างขึ้นในโปรเซสเซอร์ที่แตกต่างกันอย่างไร

ฉันกำลังแก้ปัญหา Multiscale ใช้วิวิธ Multiscale วิธี (HMM) โดยพื้นฐานแล้วกระบวนการเฉพาะของฉันใช้กระบวนการวนซ้ำต่อไปนี้: แก้ปัญหาระบบเมทริกซ์ในพื้นที่จำนวนมาก คำนวณมูลค่าที่น่าสนใจจากโซลูชันของระบบภายใน ประกอบระบบเมทริกซ์ระดับโลกจาก "ค่าสนใจ" ในพื้นที่ แก้ปัญหาระบบเมทริกซ์ทั่วโลก ใช้วิธีการแก้ปัญหาของระบบเมทริกซ์ทั่วโลกเพื่อสร้างระบบเมทริกซ์ท้องถิ่นใหม่ ทำซ้ำจนกว่าจะถึงเกณฑ์การลู่เข้า เนื่องจากมีหลายท้องถิ่น (อิสระ) ระบบเชิงเส้นของสมการและหลายระบบสามารถใส่ลงในหน่วยความจำแรมท้องถิ่นผมคิดว่ามันเป็นที่ดีที่สุดในการโหลดหลายระบบ "ท้องถิ่น" ในแต่ละหน่วยประมวลผลและการแก้ปัญหาในแต่ละระบบตามลำดับ ( ดูคำถามที่โพสต์นี้ ) คำถามของฉันเกี่ยวกับกลยุทธ์ที่ดีที่สุดในการรวบรวมและแก้ไขระบบเมทริกซ์ทั่วโลก ในกรณีเฉพาะของฉันระบบโกลบอลเมทริกซ์นั้นมีขนาดเล็กพอที่จะพอดีกับหน่วยความจำ RAM ของโปรเซสเซอร์ นอกจากนี้เมทริกซ์ท้องถิ่นและทั่วโลกจะไม่เปลี่ยนขนาดระหว่างการวนซ้ำ ดังนั้นฉันคาดว่าหนึ่งในสามกลยุทธ์ที่เป็นไปได้: รวบรวม "คุณค่าที่น่าสนใจ" ลงในโปรเซสเซอร์เดียวและรวบรวม / แก้ปัญหาระบบเมทริกซ์ทั่วโลกตามลำดับในโปรเซสเซอร์เดียว คัดลอกค่าที่น่าสนใจไปยังโปรเซสเซอร์ทุกตัวและประกอบ / แก้ปัญหาระบบเมทริกซ์ทั่วโลกที่เหมือนกันตามลำดับในทุกโปรเซสเซอร์ สมมติว่าแต่ละโปรเซสเซอร์มี "คุณค่าของความสนใจ" ที่จำเป็นในการสร้างบล็อกที่ต่อเนื่องกันของเมทริกซ์ระดับโลกจากนั้นเราสามารถรวบรวมพาร์ติชันของเมทริกซ์ระดับโลกในพื้นที่จากนั้นก็แก้ปัญหาพวกมันพร้อมกัน ฉันเห็นข้อดี / ข้อเสียของแต่ละวิธี ในวิธีที่ 1 ไม่จำเป็นต้องมีการสื่อสารในขั้นตอนการแก้ไข แต่การสื่อสารไปยังและจากตัวประมวลผลหลักอาจกลายเป็นคอขวด (โดยเฉพาะอย่างยิ่งในระดับ) วิธีที่ 2 …

10 parallel-computing mapping-strategy

5

Galerkin ไม่ต่อเนื่องใด ๆ ที่ขนานกันได้จริง ๆ กับ Galerkin ต่อเนื่องหรือไม่

ฉันได้ยินมาเสมอว่าการขนานที่ง่ายเป็นหนึ่งในข้อดีของวิธีการของ DG แต่ฉันไม่เห็นเลยว่าทำไมเหตุผลเหล่านั้นถึงไม่สามารถใช้กับ Galerkin ต่อเนื่องได้

9 finite-element parallel-computing discontinuous-galerkin

1

มีรายการจดหมายที่ดีสำหรับ 'วิทยาศาสตร์การคำนวณ' ไหม?

ฉันสงสัยว่ามีรายชื่อผู้รับจดหมายหรือgoogle กลุ่มที่ดีมากสำหรับการคำนวณทางวิทยาศาสตร์ที่เราสามารถพูดคุยคำถามแทนการถามและตอบคำถามเท่านั้น ในความเป็นจริงฉันสนใจการคำนวณแบบขนานและการแก้ปัญหาเชิงตัวเลขของ PDE มากกว่า แต่ฉันไม่รู้ว่าคนในพื้นที่นี้กำลังทำอะไรและอย่างไร ฉันสามารถอ่านเอกสารเพื่อเข้าใจแผนที่ถนนของพื้นที่นี้เท่านั้น โปรดให้ข้อมูลฉันด้วย ขอบคุณ

9 parallel-computing reference-request

2

การคำนวณแบบขนานของเมทริกซ์ความแปรปรวนร่วมขนาดใหญ่

เราจำเป็นต้องคำนวณเมทริกซ์ความแปรปรวนร่วมที่มีขนาดตั้งแต่ 10,000 × 10,00010000×1000010000\times10000 ถึง 100000 × 100000100000×100000100000\times100000. เราสามารถเข้าถึง GPU และกลุ่มเราสงสัยว่าอะไรคือวิธีการขนานที่ดีที่สุดในการเร่งการคำนวณเหล่านี้

9 matrix parallel-computing gpu

4

ตัวแก้ปัญหาที่แข็งแกร่งและวนซ้ำสำหรับปัญหาเชิงเส้นยืดสามมิติขนาดใหญ่คืออะไร

ฉันกำลังดำดิ่งสู่โลกอันน่าทึ่งของการวิเคราะห์องค์ประกอบ จำกัด และต้องการที่จะแก้ปัญหาเครื่องจักรกลเทอร์โมขนาดใหญ่ (เฉพาะกลไกทางความร้อน , ไม่มีข้อเสนอแนะ)→→\rightarrow สำหรับปัญหาทางกลฉันได้เข้าใจจากคำตอบของเจฟฟ์แล้วว่าฉันจะต้องใช้ตัวแก้ซ้ำเนื่องจากขนาดตาข่ายของฉัน ฉันอ่านเพิ่มเติมในคำตอบของ Mattว่าการเลือกอัลกอริทึมการวนซ้ำที่ถูกต้องเป็นงานที่น่ากังวล ฉันถามที่นี่หากมีประสบการณ์เกี่ยวกับปัญหาการยืดตัวเชิงเส้นแบบสามมิติขนาดใหญ่ที่จะช่วยให้ฉัน จำกัด การค้นหาเพื่อประสิทธิภาพที่ดีที่สุดหรือไม่ ในกรณีของฉันมันเป็นโครงสร้างที่มีฟิล์มบาง ๆ มีลวดลายและวัสดุที่วางผิดปกติ (ทั้ง high-CTE และ low-CTE) ไม่มีการเสียรูปขนาดใหญ่ในการวิเคราะห์เชิงกลทางความร้อน ฉันสามารถใช้ HPC ในมหาวิทยาลัยของฉัน [1.314 โหนดพร้อมโปรเซสเซอร์ AMD Opteron 2 ตัว (แต่ละ 2.2 GHz / 8 คอร์)] ฉันคิดว่าPETScอาจมีบางสิ่งที่น่าสนใจโดยเฉพาะอย่างยิ่งอัลกอริทึมที่ใช้ในการแยกโดเมน (FETI, multigrid) แต่ฉันรู้สึกสับสนกับตัวเลือกและไม่มีประสบการณ์ ฉันชอบวลีที่ว่า"สิ่งมีชีวิตที่มีความรู้ทางเรขาคณิต"แต่ไม่แน่ใจว่าสิ่งนี้จะช่วยฉันได้หรือไม่ ฉันยังไม่ได้พบสิ่งที่เพ่งความสนใจไปที่กลศาสตร์ต่อเนื่องเชิงเส้น Strong Scaling (Amdahl) มีความสำคัญมากในใบสมัครของฉันเพราะพันธมิตรอุตสาหกรรมของฉันไม่สามารถรอผลการจำลองเป็นเวลานาน ฉันไม่เพียง แต่ชื่นชมคำตอบเท่านั้น แต่ยังมีคำแนะนำสำหรับการอ่านเพิ่มเติมในความคิดเห็น

9 pde parallel-computing petsc hpc iterative-method

คำถามติดแท็ก parallel-computing