คำสั่งแรกไม่จำเป็นต้อง "ดำเนินการตามลำดับ" แม้ใน ISA ที่ไม่ใช่ VLIW การดำเนินการจะต้องปรากฏตามลำดับเท่านั้น การดำเนินการตามลำดับ superscalar สามารถดำเนินการมากกว่าหนึ่งคำสั่งพร้อมกัน ในการทำเช่นนี้ได้อย่างมีประสิทธิภาพฮาร์ดแวร์สำหรับการถอดรหัสคำสั่งจะต้องเพิ่มขึ้น (กว้างขึ้น) ต้องเพิ่มฮาร์ดแวร์เพื่อให้แน่ใจว่าข้อมูลที่เป็นอิสระของคำแนะนำในการดำเนินการแบบขนานทรัพยากรการดำเนินการจะต้องเพิ่มขึ้นและจำนวนพอร์ตไฟล์ลงทะเบียน ทั้งหมดนี้เป็นการเพิ่มทรานซิสเตอร์
การใช้งานที่ไม่เป็นไปตามคำสั่งซึ่งช่วยให้สามารถดำเนินการคำสั่งในภายหลังก่อนหน้าได้ตราบใดที่ไม่มีการพึ่งพาข้อมูลใช้ฮาร์ดแวร์เพิ่มเติมเพื่อจัดการกำหนดเวลาของคำแนะนำทันทีที่ข้อมูลพร้อมใช้งานและเพิ่มการลงทะเบียนเปลี่ยนชื่อและฮาร์ดแวร์สำหรับการทำแผนที่ จัดสรรและปล่อยให้เป็นอิสระ (มีทรานซิสเตอร์มากขึ้น) เพื่อหลีกเลี่ยงอันตรายจากการเขียนหลังจากอ่านและการเขียนหลังจากเขียน การดำเนินการที่ไม่เป็นไปตามคำสั่งอนุญาตให้ตัวประมวลผลหลีกเลี่ยงการหยุดทำงาน
การเรียงลำดับการโหลดและการจัดเก็บในตัวประมวลผลที่ไม่เป็นไปตามข้อกำหนดต้องทำให้มั่นใจได้ว่าการจัดเก็บก่อนหน้านี้ในลำดับโปรแกรมจะส่งต่อผลลัพธ์ไปยังการโหลดที่อยู่เดียวกันในภายหลัง สิ่งนี้แสดงถึงตรรกะการเปรียบเทียบที่อยู่เช่นเดียวกับที่เก็บข้อมูลสำหรับที่อยู่ (และขนาด) ของร้านค้า (และที่เก็บข้อมูล) จนกว่าร้านค้าจะถูกส่งไปยังหน่วยความจำ (แคช) (สำหรับ ISA ที่มีโมเดลความสอดคล้องของหน่วยความจำที่น้อยกว่านั้นมีความจำเป็นที่จะต้องตรวจสอบว่าโหลดได้รับคำสั่งอย่างถูกต้องเกี่ยวกับร้านค้าจากโปรเซสเซอร์อื่น - ทรานซิสเตอร์เพิ่มขึ้น)
การวางท่อเพิ่มการควบคุมเพิ่มเติมและค่าใช้จ่ายในการบัฟเฟอร์และป้องกันการใช้ซ้ำของตรรกะสำหรับส่วนต่าง ๆ ของการจัดการคำสั่ง แต่อนุญาตให้ส่วนต่าง ๆ ของการจัดการคำสั่งซ้อนทับในเวลาสำหรับคำแนะนำที่แตกต่างกัน
การดำเนินการวางท่อและ superscalar เพิ่มผลกระทบของอันตรายจากการควบคุม (เช่นกิ่งที่มีเงื่อนไขและการกระโดด) Pipelining (และการดำเนินการที่ไม่เป็นไปตามลำดับ) สามารถชะลอความพร้อมใช้งานของเป้าหมายของการกระโดดที่ไม่มีเงื่อนไขได้ดังนั้นการเพิ่มฮาร์ดแวร์เพื่อคาดการณ์เป้าหมาย (และทิศทางสำหรับสาขาที่มีเงื่อนไข) ช่วยให้สามารถดึงคำสั่งเพื่อดำเนินการต่อได้โดยไม่ต้องรอ โปรเซสเซอร์เพื่อทำให้ข้อมูลที่จำเป็นพร้อมใช้งาน ตัวทำนายที่แม่นยำมากขึ้นมักจะต้องการทรานซิสเตอร์มากกว่า
สำหรับตัวประมวลผลที่ไม่เป็นไปตามที่ต้องการสามารถอนุญาตให้โหลดจากหน่วยความจำเพื่อดำเนินการก่อนที่อยู่ของร้านค้าก่อนหน้านี้ทั้งหมดได้รับการคำนวณดังนั้นจึงจำเป็นต้องใช้ฮาร์ดแวร์บางตัวในการเก็งกำไรเช่นอาจมีตัวพยากรณ์
แคชสามารถลดเวลาแฝงและเพิ่มแบนด์วิดท์ของการเข้าถึงหน่วยความจำ แต่เพิ่มทรานซิสเตอร์เพื่อเก็บข้อมูลและจัดเก็บแท็ก (และเปรียบเทียบแท็กกับที่อยู่ที่ร้องขอ) จำเป็นต้องมีฮาร์ดแวร์เพิ่มเติมเพื่อใช้นโยบายการเปลี่ยนทดแทน การดึงข้อมูลฮาร์ดแวร์ล่วงหน้าจะเพิ่มทรานซิสเตอร์มากขึ้น
การใช้งานฟังก์ชั่นในฮาร์ดแวร์มากกว่าซอฟต์แวร์สามารถเพิ่มประสิทธิภาพ (ในขณะที่ต้องการทรานซิสเตอร์เพิ่มเติม) เช่นการจัดการ TLB การดำเนินการที่ซับซ้อนเช่นการคูณหรือการดำเนินการจุดลอยการดำเนินงานเฉพาะเช่นศูนย์นำหน้าการนับ (การเพิ่มคำสั่งยังช่วยเพิ่มความซับซ้อนของการถอดรหัสคำสั่งและโดยทั่วไปแล้วความซับซ้อนของการดำเนินการเช่น - เพื่อควบคุมว่าส่วนใดของฮาร์ดแวร์การเรียกใช้จะใช้)
การดำเนินการ SIMD / เวกเตอร์เพิ่มจำนวนของงานที่ทำตามคำสั่ง แต่ต้องการพื้นที่จัดเก็บข้อมูลเพิ่มเติม (ลงทะเบียนที่กว้างขึ้น) และโดยทั่วไปจะใช้ทรัพยากรการดำเนินการเพิ่มเติม
(มัลติเธรดแบบเก็งกำไรยังสามารถอนุญาตให้ตัวประมวลผลหลายตัวดำเนินการโปรแกรมเธรดเดี่ยวได้เร็วขึ้นการเพิ่มตัวประมวลผลเข้ากับชิปจะเพิ่มจำนวนทรานซิสเตอร์อย่างเห็นได้ชัด)
การมีทรานซิสเตอร์เพิ่มมากขึ้นสามารถทำให้สถาปนิกคอมพิวเตอร์สามารถจัดเตรียมซอฟต์แวร์ที่ลงทะเบียนไว้กับ ISA ได้ซึ่งอาจลดความถี่ของการเข้าถึงหน่วยความจำซึ่งมีแนวโน้มที่จะช้ากว่าการลงทะเบียนการเข้าถึงและเกี่ยวข้องกับการอ้อมในระดับหนึ่ง ตัวชี้) ซึ่งเพิ่มเวลาแฝง
การรวมเข้าด้วยกัน - ซึ่งเพิ่มจำนวนทรานซิสเตอร์บนชิป แต่ไม่ได้อยู่ในระบบ - ลดความหน่วงในการสื่อสารและเพิ่มแบนด์วิดท์เห็นได้ชัดว่าช่วยเพิ่มประสิทธิภาพ (นอกจากนี้ยังมีการลดการใช้พลังงานซึ่งอาจแปลเป็นประสิทธิภาพที่เพิ่มขึ้น)
แม้ในระดับของการดำเนินการคำสั่งการเพิ่มทรานซิสเตอร์สามารถเพิ่มประสิทธิภาพได้ ยกตัวอย่างเช่นตัวเลือกแบบพกพาแอดเดอร์เพิ่มบิตด้านบนสองเท่าในแบบคู่ขนานกับสมมติฐานที่แตกต่างกันของการดำเนินการจากบิตที่ต่ำกว่าการเลือกผลรวมที่ถูกต้องของบิตบนเมื่อดำเนินการจากบิตที่ต่ำกว่าที่มีอยู่ ระลอกคลื่นบวก adder แต่ลดความล่าช้าในการผลิตผลรวมเต็ม ในทำนองเดียวกันตัวคูณที่มีแถวเดียวของตัวช่วยเพิ่มการพกพาใช้ทรานซิสเตอร์น้อยลง (แต่ช้ากว่า) ตัวคูณต้นไม้ Dadda (หรือ Wallace) และไม่สามารถไปป์ไลน์ได้ (ดังนั้นจะต้องทำซ้ำเพื่อให้อีกทวีคูณ ทวีคูณกำลังดำเนินการ)
ข้างต้นอาจจะเหนื่อย แต่ก็ไม่ครบถ้วน!