หนึ่งเขียนรหัสที่ใช้แคช CPU ที่ดีที่สุดเพื่อปรับปรุงประสิทธิภาพได้อย่างไร
สิ่งนี้อาจฟังดูเป็นคำถามส่วนตัว แต่สิ่งที่ฉันกำลังมองหาเป็นกรณีเฉพาะซึ่งคุณอาจได้พบที่เกี่ยวข้องกับเรื่องนี้ วิธีการสร้างโค้ด, การแคชที่มีประสิทธิภาพ / การแคช (การแคชที่มากขึ้น, การทำแคชให้น้อยที่สุด) จากมุมมองทั้งแคชข้อมูลและแคชโปรแกรม (แคชคำสั่ง) คือสิ่งใดในรหัสที่เกี่ยวข้องกับโครงสร้างข้อมูลและการสร้างรหัสเราควรดูแลเพื่อให้แคชมีประสิทธิภาพ มีโครงสร้างข้อมูลใดที่หนึ่งต้องใช้ / หลีกเลี่ยงหรือมีวิธีการเข้าถึงสมาชิกของโครงสร้างนั้น ฯลฯ ... เพื่อให้แคชรหัสมีประสิทธิภาพ มีโปรแกรมใด ๆ ที่สร้าง (ถ้า, สำหรับ, สวิตช์, หยุดพัก, goto, ... ), code-flow (สำหรับภายในถ้า, ถ้าภายใน, สำหรับ, ฯลฯ ... ) หนึ่งควรปฏิบัติตาม / หลีกเลี่ยงในเรื่องนี้หรือไม่? ฉันรอคอยที่จะได้รับประสบการณ์ของแต่ละบุคคลที่เกี่ยวข้องกับการสร้างรหัสประสิทธิภาพแคชโดยทั่วไป มันสามารถเป็นภาษาการเขียนโปรแกรมใด ๆ (C, C ++, Assembly, ... ), เป้าหมายฮาร์ดแวร์ใด ๆ (ARM, Intel, …