ใน GPU จริงแทนที่จะมีหลายแกนพยายามอ่าน / เขียนพื้นที่เดียวกันของบัฟเฟอร์ความลึกและพยายามซิงโครไนซ์ระหว่างกันบัฟเฟอร์ความลึกจะแบ่งออกเป็นไทล์ (เช่น 16 × 16 หรือ 32 × 32) และแต่ละอัน ไทล์ถูกกำหนดให้กับแกนเดียว แกนนั้นรับผิดชอบการแรสเตอร์ทั้งหมดในไทล์นั้น: สามเหลี่ยมใด ๆ ที่แตะไทล์นั้นจะถูกแรสเตอร์ (ภายในไทล์นั้น) โดยแกนที่เป็นเจ้าของ จากนั้นจะไม่มีการรบกวนระหว่างคอร์และไม่จำเป็นต้องให้ซิงโครไนซ์เมื่อเข้าถึงส่วนเฟรมเวิร์กของพวกเขา
นี่หมายความว่ารูปสามเหลี่ยมที่สัมผัสหลายแผ่นจะต้องมีการแรสเตอร์ด้วยหลายแกน ดังนั้นจึงมีขั้นตอนการกระจายงานระหว่างการประมวลผลทางเรขาคณิต (การดำเนินการเกี่ยวกับจุดยอดและรูปสามเหลี่ยม) และการประมวลผลพิกเซล
ในเวทีเรขาคณิตแต่ละแกนอาจประมวลผลการป้อนข้อมูลแบบดั้งเดิม จากนั้นสำหรับแต่ละดั้งเดิมมันสามารถกำหนดได้อย่างรวดเร็วว่าไพ่ใดที่สัมผัสดั้งเดิม (ซึ่งเรียกว่า "หยาบแรสเตอร์เซชั่น") และเพิ่มดั้งเดิมลงในคิวสำหรับแต่ละคอร์ที่เป็นเจ้าของหนึ่งในกระเบื้องที่ได้รับผลกระทบ
จากนั้นในระยะพิกเซลแต่ละแกนสามารถอ่านรายการดั้งเดิมในคิวคำนวณพิกเซลครอบคลุมสำหรับกระเบื้องที่เป็นเจ้าของหลักและดำเนินการทดสอบเชิงลึกพิกเซลแรเงาและปรับปรุง framebuffer โดยไม่จำเป็นต้องประสานงานเพิ่มเติม กับแกนอื่น ๆ