คำถามติดแท็ก parallel-computing

การศึกษาการแก้ปัญหาการคำนวณโดยใช้ประโยชน์จากการใช้โปรเซสเซอร์หลายตัวพร้อมกัน

4
โครงการภาษาวิทยาศาสตร์คอมพิวเตอร์“ Julia” มีความเป็นผู้ใหญ่เพียงใด
ฉันกำลังพิจารณาการเรียนรู้ภาษาใหม่เพื่อใช้สำหรับโครงการสร้างแบบจำลองเชิงตัวเลข / จำลองเป็นการแทนที่ (บางส่วน) สำหรับ C ++ และ Python ที่ฉันใช้อยู่ในปัจจุบัน ฉันเจอจูเลียซึ่งฟังดูสมบูรณ์แบบ ถ้ามันทำทุกอย่างที่อ้างฉันสามารถใช้มันเพื่อแทนที่ทั้ง C ++ และ Python ในทุกโปรเจคของฉันเพราะมันสามารถเข้าถึงโค้ดไลบรารี่การคำนวณทางวิทยาศาสตร์ระดับสูง (รวมถึง PyPlot) ได้ ฉันจะได้รับประโยชน์จากสิ่งต่าง ๆ เช่น coroutines ที่เหมาะสมซึ่งไม่มีในภาษาอื่น อย่างไรก็ตามมันเป็นโครงการที่ค่อนข้างใหม่ในปัจจุบันที่เวอร์ชัน 0.x และฉันพบคำเตือนต่าง ๆ (โพสต์ตามวันที่ต่าง ๆ ในอดีต) ว่ายังไม่พร้อมสำหรับการใช้งานแบบวันต่อวัน ดังนั้นฉันต้องการข้อมูลบางอย่างเกี่ยวกับสถานะของโครงการในขณะนี้ (กุมภาพันธ์ 2014 หรือเมื่อใดก็ตามที่มีการโพสต์คำตอบ) เพื่อช่วยฉันประเมินว่าส่วนตัวฉันควรพิจารณาลงทุนเวลาเพื่อเรียนรู้ภาษาในขั้นตอนนี้หรือไม่ ฉันอยากจะขอบคุณคำตอบที่มุ่งเน้นไปที่ข้อเท็จจริงที่เกี่ยวข้องเฉพาะเกี่ยวกับโครงการจูเลีย ; ฉันไม่ค่อยสนใจความเห็นจากประสบการณ์กับโครงการอื่น โดยเฉพาะอย่างยิ่งความคิดเห็นโดย Geoff Oxberry แสดงให้เห็นว่า Julia API ยังคงอยู่ในสถานะฟลักซ์ทำให้ต้องมีการอัพเดทโค้ดเมื่อมีการเปลี่ยนแปลง ฉันต้องการทราบถึงขอบเขตของกรณีนี้ว่าพื้นที่ใดของ API …

3
สถานะของศิลปะในวิธีการ ODE แบบขนานคืออะไร
ฉันกำลังค้นหาวิธีการแบบขนานสำหรับการรวม ODE มีวรรณกรรมทั้งเก่าและใหม่มากมายที่อธิบายถึงแนวทางที่หลากหลาย แต่ฉันไม่พบบทความสำรวจหรือภาพรวมล่าสุดที่อธิบายหัวข้อโดยทั่วไป มีหนังสือของ Burrage [1] แต่เกือบ 20 ปีแล้วดังนั้นจึงไม่ครอบคลุมความคิดที่ทันสมัยกว่าเช่นอัลกอริทึมการเปรียบเทียบ [1] K. Burrage, วิธีขนานและลำดับสำหรับสมการเชิงอนุพันธ์สามัญ, Clarendon Press, Oxford, 1995

7
Parallelizing for-loop ใน Python
มีเครื่องมือใดใน Python ที่เหมือนกับ parlab ของ Matlab หรือไม่? ฉันพบกระทู้นี้แต่อายุสี่ขวบ ฉันคิดว่าบางทีคนที่นี่อาจมีประสบการณ์มากกว่านี้ นี่คือตัวอย่างของประเภทของสิ่งที่ฉันต้องการขนาน: X = np.random.normal(size=(10, 3)) F = np.zeros((10, )) for i in range(10): F[i] = my_function(X[i,:]) ที่my_functionจะใช้เวลาndarrayที่มีขนาด(1,3)และผลตอบแทนเกลา อย่างน้อยที่สุดฉันต้องการใช้หลายคอร์พร้อมกัน --- เหมือน parfor กล่าวอีกนัยหนึ่งคือสมมติว่าระบบหน่วยความจำที่ใช้ร่วมกันมี 8 ถึง 16 คอร์

2
ห้องสมุดคณิตศาสตร์สำหรับ OpenCL?
ฉันกำลังมองหาข้อมูลจากใครก็ตามที่พยายามใช้ OpenCL ในรหัสทางวิทยาศาสตร์ มีใครลองเวียนนาCLบ้างไหม? ถ้าเป็นเช่นนั้นจะเปรียบเทียบกับcusp ได้อย่างไร OCLToolsเกี่ยวกับอะไร มันขึ้นอยู่กับสัญญาหรือไม่? ถ้าเป็นเช่นนั้นจะเป็นไปได้ไหมที่จะเริ่มเขียนเมล็ดทางคณิตศาสตร์ใน OpenCL?

5
มีปัญหา / อัลกอริทึมที่มีชื่อเสียงในการคำนวณทางวิทยาศาสตร์ที่ไม่สามารถเร่งความเร็วด้วยการขนาน
มีปัญหา / อัลกอริทึมที่มีชื่อเสียงในการคำนวณทางวิทยาศาสตร์ที่ไม่สามารถเร่งความเร็วด้วยการขนาน ดูเหมือนว่าฉันในขณะที่อ่านหนังสือเกี่ยวกับ CUDA ว่าสิ่งส่วนใหญ่สามารถ

6
ปัญหา n-body ความโน้มถ่วงสามารถแก้ไขในแบบคู่ขนานได้อย่างไร?
ปัญหา n-body ความโน้มถ่วงสามารถแก้ไขเป็นตัวเลขแบบขนานได้อย่างไร? การแลกเปลี่ยนความซับซ้อนที่มีความแม่นยำเป็นไปได้หรือไม่? ความแม่นยำมีอิทธิพลต่อคุณภาพของรุ่นอย่างไร

8
ซอฟต์แวร์อะไรดีที่ใช้สำหรับการดีบักแบบขนาน?
ฉันไม่ได้ใช้งานรหัสขนานใด ๆ ในตอนนี้ แต่ฉันคาดว่าจะเรียกใช้รหัสขนานในอนาคตโดยใช้ลูกผสมของ OpenMP และ MPI เครื่องมือแก้จุดบกพร่องเป็นเครื่องมือที่มีค่าสำหรับฉันเมื่อใช้งานโครงการแบบอนุกรม ใครสามารถแนะนำ debugger แบบขนาน (หรือ debuggers หลายรายการ) เพื่อใช้สำหรับการดีบักซอฟต์แวร์แบบขนานได้หรือไม่ ซอฟต์แวร์ฟรีน่าจะดีกว่า แต่อย่าลังเลที่จะพูดถึงซอฟต์แวร์เชิงพาณิชย์ที่มีประสิทธิภาพ

3
ตัวเลือก Parallel I / O โดยเฉพาะ HDF5 แบบขนาน
ฉันมีแอปพลิเคชันที่สามารถทำให้ขนานกันเล็กน้อย แต่ประสิทธิภาพของมันคือขอบเขต I / O ขนาดใหญ่ แอปพลิเคชันอ่านอาร์เรย์อินพุตเดียวที่เก็บอยู่ในไฟล์ที่โดยทั่วไปมีขนาด 2-5 GB (แต่ฉันคาดว่าจำนวนนี้จะเพิ่มขึ้นในอนาคต) การคำนวณทั่วไปใช้การดำเนินการเดียวกันกับแต่ละแถวหรือคอลัมน์ของอาร์เรย์นั้น สำหรับการทำงานหนักของ CPU ฉันได้รับการปรับขนาดที่ดีมากถึงโปรเซสเซอร์ 100 ตัว แต่สำหรับการดำเนินการที่ช้าลง I / O และการสื่อสารที่เกี่ยวข้อง (การเข้าถึง NFS) นั้นครองและฉันไม่สามารถใช้ตัวประมวลผลได้อย่างมีประสิทธิภาพ ตัวเลือกใดที่มีประสิทธิภาพและพกพา (มีประสิทธิภาพในการพกพา) สำหรับสถานการณ์เช่นนี้? Parallel HDF5 ดูเหมือนว่าจะมีแนวโน้ม ไม่มีใครมีประสบการณ์ชีวิตจริงกับมันหรือไม่? MPI-I / O จะเป็นสิ่งที่ควรพิจารณาหรือไม่ มันสามารถทำงานได้อย่างมีประสิทธิภาพกับรูปแบบไฟล์ที่กำหนดหรือฉันต้องปรับทุกอย่าง?

4
มีห้องสมุดเอนกประสงค์สำหรับการปรับตารางตาข่ายแบบปรับโครงสร้างหรือไม่?
ต้องการปรับปรุงโพสต์นี้หรือไม่? ให้คำตอบโดยละเอียดสำหรับคำถามนี้รวมถึงการอ้างอิงและคำอธิบายว่าทำไมคำตอบของคุณถึงถูกต้อง คำตอบที่ไม่มีรายละเอียดเพียงพออาจแก้ไขหรือลบออกได้ Adaptive mesh refinement (AMR) เป็นเทคนิคที่ใช้กันทั่วไปในการจัดการกับปัญหาของสเกลอวกาศที่หลากหลายในการแก้ปัญหาเชิงตัวเลขของ PDE มีไลบรารีวัตถุประสงค์ทั่วไปสำหรับ AMR บนกริดที่มีโครงสร้างอย่างไร เป็นการดีที่ฉันต้องการบางสิ่งบางอย่างในจิตวิญญาณของ PETSc ที่ห้องสมุดจัดการเพียงตาข่ายแบบปรับตัวและฉันให้ฟิสิกส์และการแยกส่วน (ความแตกต่าง / ปริมาณ / องค์ประกอบ) ห้องสมุดที่เหมาะจะเป็น แบบแยกส่วน : ไม่บอกว่าฉันจะเขียนรหัสหรือโครงสร้างข้อมูลของฉันมากเกินไป ทั่วไป : ไม่สนใจว่าฉันใช้การแยกประเภทแบบใด มีประสิทธิภาพ : ไม่เสียค่าใช้จ่ายมากเกินไป ขนานและปรับขนาดได้สูง ไลบรารีที่เหมาะสมกับชุดย่อยของเกณฑ์เหล่านี้จะยังคงเป็นที่สนใจ ภาคผนวก : ฉันรู้ว่าแพ็คเกจ AMR ที่กว้างขวางของDonna Calhounแต่ฉันไม่รู้ว่าอันไหน (ถ้ามี) ที่ตรงกับเกณฑ์ด้านบน ดังนั้นฉันจึงสนใจที่จะได้ยินจากผู้ที่มีประสบการณ์จริงกับแพ็คเกจเพิ่มเติมหนึ่งหรือ (ยังดีกว่า) แพ็คเกจเกี่ยวกับวิธีที่พวกเขาวัดค่าในเงื่อนไขเหล่านั้น

3
พล็อตการปรับขนาด / การบันทึกแบบขนานของล็อก - ล็อก
งานของฉันจำนวนมากหมุนรอบการทำให้อัลกอริธึมขยายขนาดได้ดีขึ้นและหนึ่งในวิธีที่ต้องการในการแสดงการปรับสเกลแบบขนานและ / หรือประสิทธิภาพแบบขนานคือการพล็อตประสิทธิภาพของอัลกอริทึม / รหัสบนจำนวนแกนเช่น โดยที่ -axis แสดงถึงจำนวนแกนและy -axis ตัวชี้วัดบางตัวเช่นงานที่ทำต่อหน่วยเวลา เส้นโค้งที่แตกต่างกันแสดงประสิทธิภาพแบบขนานที่ 20%, 40%, 60%, 80% และ 100% ที่ 64 แกนตามลำดับxxxYYy แต่น่าเสียดายที่แม้ว่าในสิ่งพิมพ์หลายผลเหล่านี้มีพล็อตที่มีการเข้าสู่ระบบเข้าสู่ระบบการปรับเช่นผลลัพธ์ในนี้หรือนี้กระดาษ ปัญหาของแผนการบันทึกการใช้งานเหล่านี้คือมันยากที่จะประเมินค่า / ประสิทธิภาพขนานจริงอย่างไม่น่าเชื่อ ซึ่งเป็นพล็อตเดียวกับด้านบน แต่ยังมีการปรับขนาดบันทึกการทำงาน โปรดทราบว่าขณะนี้ไม่มีความแตกต่างอย่างมากระหว่างผลลัพธ์ที่มีประสิทธิภาพแบบขนาน 60%, 80% หรือ 100% ผมเคยเขียนบิตอย่างกว้างขวางมากขึ้นเกี่ยวกับเรื่องนี้ที่นี่ ดังนั้นนี่คือคำถามของฉัน: มีเหตุผลอะไรบ้างที่แสดงผลลัพธ์ในการปรับขนาดบันทึกการทำงาน ฉันใช้มาตราส่วนแบบเส้นตรงเพื่อแสดงผลลัพธ์ของตัวเองเป็นประจำและใช้ค้อนทุบโดยผู้ตัดสินบอกว่าผลการวัด / ประสิทธิภาพแบบขนานของตัวเองไม่ได้ดูดีเท่าผลการบันทึก (log-log) ของผู้อื่น แต่สำหรับชีวิตของฉันฉัน ไม่เห็นว่าทำไมฉันจึงควรเปลี่ยนรูปแบบการพล็อต

5
วิธีการระบุที่ไม่ใช่ความสัมพันธ์เชิงตัวเลขสำหรับการลดแบบขนานได้อย่างไร
การลดลงแบบขนานถือว่าการดำเนินการที่สอดคล้องกันนั้นเชื่อมโยงกัน สมมติฐานนี้ถูกละเมิดเนื่องจากการเพิ่มจำนวนจุดลอยตัว คุณอาจถามว่าทำไมฉันถึงสนใจเรื่องนี้ มันทำให้ได้ผลลัพธ์ที่ทำซ้ำได้น้อยลง และจะแย่ลงเมื่อใช้การอบแบบจำลองเพื่อเพิ่มประสิทธิภาพ (หรือพารามิเตอร์ที่เหมาะสม) ให้กับรูทีนย่อยที่ให้ผลลัพธ์ที่ไม่สามารถทำซ้ำได้ วิธีทั่วไปในการจัดการกับปัญหานี้มีอะไรบ้าง สิ่งที่สามารถพูดเกี่ยวกับกลยุทธ์ต่อไปนี้? ไม่สนใจเกี่ยวกับความไม่สามารถทำซ้ำได้ อย่าใช้การลดแบบขนานพร้อมกับจำนวนจุดลอยตัวและการเพิ่ม สร้างแพคเกจงานที่มีขนาดที่เหมาะสมในวิธีที่ทำซ้ำได้และทำการลดขั้นสุดท้ายด้วยมือ ใช้ความแม่นยำที่สูงขึ้นสำหรับการเติม (แต่ไม่ใช่คอมไพเลอร์ทั้งหมดที่เสนอประเภทจุดลอยตัวที่มีความแม่นยำสูงกว่า)

5
CFD โอเพ่นซอร์สคุณภาพดีใช้งานง่ายแก้ปัญหาได้หรือไม่?
วิทยานิพนธ์ของฉันคือการพัฒนาวิธีการเชิงตัวเลขสำหรับการลดรูปแบบในการเผาไหม้ ฉันใช้วิธีการของฉันอย่างหมดจดในส่วนทางเคมีของการจำลองการเผาไหม้และฉันมีกรณีศึกษามากมายสำหรับการจำลอง 0-D (ไม่มีการไหล) สิ่งที่ฉันต้องการคือการเรียกใช้แบบจำลองที่มีการไหลในพวกเขาโดยเฉพาะอย่างยิ่งแบบจำลอง 2 มิติหรือ 3 มิติ การจำลองเหล่านี้จะต้องเป็นแบบขนานเนื่องจากความต้องการการคำนวณสูง ฉันต้องการสิ่งที่สามารถเชื่อมต่อกับนักแก้ปัญหาทางเคมีเช่น Chemkin หรือ Cantera ซึ่งฉันมีซอร์สโค้ด (Chemkin อยู่ใน Fortran 77 และ Cantera อยู่ใน C ++) ในกรณีที่เหมาะสมที่สุดฉันสามารถระบุรูปแบบการไหลโดยใช้ความรู้พื้นฐานเกี่ยวกับกลศาสตร์ของไหลที่ฉันมีจากโปรแกรมการเรียนจบของฉันและแพ็คเกจ CFD บางอย่างเพิ่มเคมีและเรียกใช้ ถ้าฉันต้องการฉันสามารถตั้งค่าสมการที่ควบคุมการเคลื่อนที่ของไหลและเคมีสำหรับกรณีศึกษาอย่างง่ายจากการตั้งค่าการทดลองที่ใช้โดยผู้ทำงานร่วมกันในอดีต แต่ฉันชอบไม่หมุนรหัส CFD ของตัวเองเว้นแต่ว่า แพคเกจหรือแพคเกจที่ทำให้มันง่ายมากที่จะทำ ฉันยินดีที่จะใช้เวลา 2-3 สัปดาห์กับมัน ฉันไม่ทราบว่าข้อกำหนดนี้เป็นไปตามกฎของ PETSc หรือ Trilinos หรือไม่ ถ้าฉันต้องใช้เวลานานกว่านี้ฉันก็ควรจะยกเลิกมันไปจนกระทั่งภายหลังเพราะฉันมีผู้ทำงานร่วมกันจัดหารหัส CFD สำหรับกรณีศึกษาด้วยเช่นกัน ใครบ้างมีประสบการณ์ใช้แพ็คเกจ CFD หรือเขียนรหัส CFD และถ้าเป็นเช่นนั้นคุณสามารถแนะนำหนึ่งหรือไม่ สิ่งหนึ่งที่ฉันรู้ว่าฉันต้องการใช้คือการแยก Strang …

5
อัลกอริธึมการปรับให้เหมาะสมแบบขนานสำหรับปัญหากับฟังก์ชันวัตถุประสงค์ราคาแพงมาก
ฉันเพิ่มประสิทธิภาพการทำงานของตัวแปร 10-20 ข่าวดีก็คือการประเมินแต่ละฟังก์ชั่นมีราคาแพงประมาณ 30 นาทีของการคำนวณแบบอนุกรม ข่าวดีก็คือฉันมีกลุ่มที่มีโหนดการคำนวณไม่กี่โหลในการกำจัดของฉัน ดังนั้นคำถาม: มีอัลกอริธึมการปรับให้เหมาะสมที่จะให้ฉันใช้พลังงานการคำนวณทั้งหมดได้อย่างมีประสิทธิภาพหรือไม่? อีกด้านหนึ่งของสเปกตรัมจะเป็นการค้นหาที่ละเอียดถี่ถ้วน: แบ่งพื้นที่การค้นหาทั้งหมดออกเป็นกริดที่ละเอียดและคำนวณฟังก์ชันที่จุดกริดแต่ละจุดอย่างอิสระ นี่เป็นการคำนวณคู่ขนานอย่างแน่นอน แต่อัลกอริทึมนั้นไม่มีประสิทธิภาพอย่างน่ากลัว อีกด้านหนึ่งของสเปกตรัมจะเป็นอัลกอริธึมกึ่งนิวตัน: ปรับปรุงการประมาณค่าพารามิเตอร์ถัดไปอย่างชาญฉลาดโดยอิงตามประวัติก่อนหน้านี้ นี่เป็นอัลกอริทึมที่มีประสิทธิภาพ แต่ฉันไม่ทราบวิธีที่จะทำให้มันขนานกัน: แนวคิดของ "การประมาณค่าพารามิเตอร์ตามประวัติก่อนหน้า" ฟังดูเหมือนการคำนวณแบบอนุกรม อัลกอริธึมกำลังสองดูเหมือนจะอยู่ตรงกลาง: เราสามารถสร้าง "ตัวแทนจำลอง" เริ่มต้นด้วยการคำนวณค่าจำนวนมากในแบบคู่ขนาน แต่ฉันไม่รู้ว่าการวนซ้ำที่เหลืออยู่นั้นสามารถขนานกันได้หรือไม่ คำแนะนำใด ๆ เกี่ยวกับวิธีเพิ่มประสิทธิภาพการไล่ระดับสีแบบใดที่ทำงานได้ดีในคลัสเตอร์ นอกจากนี้ยังมีการใช้อัลกอริธึมการปรับให้เหมาะสมแบบขนานในปัจจุบันหรือไม่

3
อะไรคือข้อดีและข้อเสียของการสลายตัวของอนุภาคและอัลกอริธึมการสลายตัวแบบขนานของโดเมนคืออะไร?
ฉันใช้การจำลองแบบโมเลกุล (MD) โดยใช้ซอฟต์แวร์หลายชุดเช่น Gromacs และ DL_POLY ขณะนี้Gromacสนับสนุนการสลายตัวของอนุภาคและอัลกอริธึมการสลายตัวของโดเมน ตามค่าเริ่มต้นการจำลอง Gromacs ใช้การสลายตัวของโดเมนแม้ว่าจะเป็นเวลาหลายปีจนกระทั่งเมื่อเร็ว ๆ นี้การสลายตัวของอนุภาคเป็นวิธีการเดียวที่นำมาใช้ใน Gromacs ในหนึ่งในเอกสาร Gromacs (DOI 10.1002 / jcc.20291) ผู้เขียนให้เหตุผลในการเลือกการสลายตัวของอนุภาคเริ่มต้น: "การตัดสินใจออกแบบช่วงแรกคือทางเลือกในการทำงานกับการสลายตัวของอนุภาคมากกว่าการสลายตัวของโดเมนเพื่อแจกจ่ายงานผ่านโปรเซสเซอร์ในกรณีหลังโดเมนเชิงพื้นที่ได้รับมอบหมายให้โปรเซสเซอร์ซึ่งช่วยให้สามารถค้นหาเพื่อนบ้านเชิงพื้นที่ได้อย่างรวดเร็วโดยการสื่อสารในท้องถิ่นเท่านั้น ไปยังอนุภาคที่เคลื่อนที่ผ่านขอบเขตเชิงพื้นที่มีความสำคัญการสลายตัวของโดเมนเป็นตัวเลือกที่ดีกว่าเมื่อขนาดของระบบเชิงเส้นมีขนาดใหญ่กว่าช่วงของการปฏิสัมพันธ์ซึ่งไม่ค่อยเกิดขึ้นในกรณีของการเคลื่อนที่ของโมเลกุลด้วยการสลายตัวของอนุภาคแต่ละตัวประมวลผล สำหรับเศษส่วนที่กำหนดของอนุภาคโดยใช้รายการเพื่อนบ้านที่คำนวณล่วงหน้าอย่างเท่าเทียมกันกระจายไปทั่วโปรเซสเซอร์FฉันเจFผมJF_{ij}เกิดขึ้นจากการทำงานร่วมกันระหว่างอนุภาค และซึ่งจำเป็นสำหรับการปรับปรุงความเร็วของทั้งอนุภาคและ ผมผมiJJjผมผมiJJjถูกคำนวณเพียงครั้งเดียวและสื่อสารกับโปรเซสเซอร์อื่น ๆ โปรเซสเซอร์ทุกตัวจะเก็บชุดพิกัดที่สมบูรณ์ของระบบไว้ในหน่วยความจำภายในของมันแทนที่จะ จำกัด ที่เก็บข้อมูลให้ตรงกับความต้องการ สิ่งนี้ง่ายกว่าและประหยัดค่าใช้จ่ายในการสื่อสารในขณะที่การอ้างสิทธิ์หน่วยความจำมักไม่ได้เป็นปัจจัย จำกัด แม้แต่กับอนุภาคหลายล้านตัว ในทางกลับกันเพื่อนบ้านซึ่งสามารถบรรจุอนุภาคได้มากถึง 1,000 เท่าของจำนวนนั้นจะถูกกระจายไปทั่วโปรเซสเซอร์ การสื่อสารนั้น จำกัด การส่งพิกัดและแรงหนึ่งครั้งต่อรอบวงแหวนโปรเซสเซอร์ ตัวเลือกเหล่านี้ได้รับการพิสูจน์แล้วว่ามีความแข็งแกร่งเมื่อเวลาผ่านไปและสามารถใช้กับกลุ่มโปรเซสเซอร์ที่ทันสมัยได้อย่างง่ายดาย " พวกเขาหมายถึงอะไรโดย "ขนาดของระบบเชิงเส้น" ในประโยค "การสลายตัวของโดเมนเป็นตัวเลือกที่ดีกว่าเฉพาะเมื่อขนาดของระบบเชิงเส้นมีขนาดใหญ่เกินขอบเขตของการปฏิสัมพันธ์ซึ่งไม่ค่อยเกิดขึ้นในโมเลกุล" จากย่อหน้าข้างต้นฉันได้รับแนวคิดว่าการสลายตัวของอนุภาคมีข้อดีที่ไม่ต้องจัดการกับอนุภาคที่เคลื่อนที่ข้ามขอบเขตของโดเมน แต่คุณต้องมีหน่วยความจำเพียงพอสำหรับโปรเซสเซอร์แต่ละตัวเพื่อจัดเก็บการกำหนดค่าระบบทั้งหมด ดังนั้นการสลายตัวของอนุภาคจึงดูดีมากในขณะที่การสลายตัวของโดเมนดูไม่ดีนัก ฉันแน่ใจว่านี่เป็นคำถามที่ซับซ้อนมาก (และอาจเป็นเรื่องของหนังสือหลายเล่ม) แต่โดยทั่วไปแล้วหากการสลายตัวของอนุภาคดูดีมากทำไมทุกคนต้องใช้การย่อยสลายโดเมน …

3
ทำไมการคูณการคูณเมทริกซ์ - เวกเตอร์ของฉันไม่
ขออภัยสำหรับโพสต์ที่ยาวนาน แต่ฉันต้องการรวมทุกอย่างที่ฉันคิดว่ามีความเกี่ยวข้องในครั้งแรก สิ่งที่ฉันต้องการ ฉันกำลังใช้ Krylov Subspace Method แบบขนานสำหรับเมทริกซ์หนาแน่น GMRES ส่วนใหญ่, QMR และ CG ฉันรู้ (หลังจากทำโปรไฟล์) ว่ารูทีน DGEMV ของฉันน่าสงสาร ดังนั้นฉันจึงตัดสินใจที่จะมีสมาธิกับมันโดยแยกมันออกมา ฉันได้ลองใช้งานด้วยเครื่อง 12 คอร์ แต่ผลลัพธ์ด้านล่างนี้สำหรับแล็ปท็อป Intel i3 แบบ 4 คอร์ แนวโน้มไม่แตกต่างกันมากนัก ฉันKMP_AFFINITY=VERBOSEส่งออกสามารถใช้ได้ที่นี่ ฉันเขียนรหัสเล็ก ๆ : size_N = 15000 A = randomly_generated_dense_matrix(size_N,size_N); %Condition Number is not bad b = randomly_generated_dense_vector(size_N); for it=1:n_times %n_times …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.