Haswell ของ Intel (หรืออย่างน้อยผลิตภัณฑ์เหล่านั้นที่รวม Iris Pro 5200 GPU) และ POWER7 และ POWER8 ของ IBM ทั้งหมดรวม DRAM ในตัว "eDRAM"
ปัญหาสำคัญอย่างหนึ่งที่ทำให้ eDRAM ไม่เป็นที่รู้จักกันทั่วไปจนกระทั่งเมื่อเร็ว ๆ นี้คือกระบวนการผลิต DRAM นั้นไม่เข้ากันกับกระบวนการทางตรรกะโดยเนื้อแท้ดังนั้นจึงต้องรวมขั้นตอนเพิ่มเติม (ซึ่งจะเป็นการเพิ่มต้นทุนและลดผลตอบแทน) เมื่อต้องการ eDRAM ดังนั้นจะต้องมีเหตุผลที่น่าสนใจสำหรับการรวมเข้าด้วยกันเพื่อชดเชยข้อเสียทางเศรษฐกิจนี้ อีกทางหนึ่งสามารถวาง DRAM ลงบนแม่พิมพ์แยกต่างหากที่ผลิตขึ้นโดยอิสระ แต่รวมเข้ากับชุดเดียวกับ CPU สิ่งนี้ให้ประโยชน์ส่วนใหญ่ของท้องที่โดยไม่มีปัญหาในการผลิตทั้งสองในลักษณะที่ผสมผสานอย่างแท้จริง
ปัญหาอีกประการหนึ่งคือ DRAM ไม่เหมือน SRAM เพราะมันไม่ได้จัดเก็บเนื้อหาไว้อย่างไม่มีกำหนดในขณะที่มีการใช้พลังงานและการอ่านมันก็จะทำลายข้อมูลที่เก็บไว้ซึ่งจะต้องถูกเขียนลงในภายหลัง ดังนั้นจึงต้องมีการรีเฟรชเป็นระยะและหลังจากอ่านทุกครั้ง และเนื่องจากเซลล์ DRAM ขึ้นอยู่กับตัวเก็บประจุการชาร์จหรือการคายประจุอย่างเพียงพอที่การรั่วไหลจะไม่ทำให้ค่าของมันเสียหายก่อนที่การฟื้นฟูครั้งต่อไปจะใช้เวลาค่อนข้าง จำกัด เวลาชาร์จนี้ไม่จำเป็นต้องใช้กับ SRAM ซึ่งเป็นเพียงสลัก ดังนั้นมันสามารถโอเวอร์คล็อกที่อัตราเดียวกันกับ CPU ในขณะที่ DRAM ถูก จำกัด ที่ประมาณ 1 GHz ในขณะที่ยังคงใช้พลังงานที่เหมาะสม สิ่งนี้ทำให้ DRAM มีเวลาแฝงที่สูงกว่า SRAM ซึ่งไม่คุ้มค่าที่จะใช้สำหรับทุกคน แต่เป็นแคชที่ใหญ่ที่สุดซึ่งอัตราการพลาดจะลดลง
ยิ่งไปกว่านั้นในเรื่องเวลาแฝงที่เกี่ยวข้องส่วนใหญ่ของความยากลำบากคือสัญญาณระยะทางกายภาพจะต้องเดินทาง แสงเดินทางได้เพียง 10 ซม. ในช่วงเวลาของ CPU 3 GHz แน่นอนว่าสัญญาณไม่เดินทางเป็นเส้นตรงข้ามความตายและไม่มีการแพร่กระจายในทุกสิ่งที่ใกล้เคียงกับความเร็วของแสงเนื่องจากความต้องการบัฟเฟอร์และพัดลมออกซึ่งทำให้เกิดความล่าช้าในการแพร่กระจาย ดังนั้นระยะทางสูงสุดที่หน่วยความจำจะอยู่ห่างจากซีพียูเพื่อรักษารอบเวลา 1 รอบของเวลาแฝงคือไม่กี่เซนติเมตรที่มากที่สุดซึ่งจะ จำกัด จำนวนหน่วยความจำที่สามารถรองรับได้ในพื้นที่ที่มีอยู่ โปรเซสเซอร์ Nehalem ของ Intel ลดความจุแคช L2 กับ Penryn บางส่วนเพื่อปรับปรุงเวลาแฝงซึ่งนำไปสู่ประสิทธิภาพที่สูงขึ้น * หากเราไม่สนใจเรื่องเวลาแฝงมากนัก
ควรสังเกตว่าอัตราการเข้าชมแคชนั้นสูงมากสำหรับปริมาณงานส่วนใหญ่: สูงกว่า 90% ในเกือบทุกกรณีและไม่ผิดปกติแม้จะสูงกว่า 99% ดังนั้นข้อได้เปรียบของการรวมความทรงจำที่ใหญ่กว่าจึง จำกัด ให้ลดผลกระทบของการพลาดเพียงไม่กี่เปอร์เซ็นต์ โปรเซสเซอร์ที่มีไว้สำหรับตลาดเซิร์ฟเวอร์องค์กร (เช่น POWER) มักจะมีแคชจำนวนมหาศาลและสามารถทำกำไรได้รวม eDRAM เพราะมีประโยชน์ในการรองรับชุดการทำงานขนาดใหญ่ของปริมาณงานขององค์กรจำนวนมาก แฮสมีเพื่อรองรับ GPU เนื่องจากพื้นผิวมีขนาดใหญ่และไม่สามารถรองรับแคชได้ กรณีเหล่านี้เป็นกรณีการใช้งานสำหรับ eDRAM วันนี้ไม่ใช่เดสก์ท็อปทั่วไปหรือปริมาณงาน HPC ซึ่งให้บริการเป็นอย่างดีจากลำดับชั้นแคชทั่วไป
ในการแก้ไขปัญหาที่เกิดขึ้นในความคิดเห็น:
แคช eDRAM เหล่านี้ไม่สามารถใช้แทนหน่วยความจำหลักได้เนื่องจากถูกออกแบบให้เป็นแคช L4 ของเหยื่อ ซึ่งหมายความว่าพวกเขามีความผันผวนและสามารถระบุเนื้อหาได้อย่างมีประสิทธิภาพดังนั้นข้อมูลที่เก็บไว้ในนั้นจะไม่ถือว่าเป็นการอยู่ในสถานที่เฉพาะและอาจถูกทิ้งเมื่อใดก็ได้ คุณสมบัติเหล่านี้ยากที่จะปรับให้ตรงกับความต้องการของ RAM ที่จะแมปโดยตรงและขัดขืน แต่การเปลี่ยนมันจะทำให้แคชไร้ประโยชน์ตามวัตถุประสงค์ที่ต้องการ แน่นอนว่ามันเป็นไปได้ที่จะฝังความทรงจำของการออกแบบแบบเดิม ๆ มากขึ้นเช่นเดียวกับที่ทำในไมโครคอนโทรลเลอร์ แต่สิ่งนี้ไม่สามารถใช้ได้สำหรับระบบที่มีความทรงจำขนาดใหญ่เนื่องจากความหน่วงแฝงต่ำนั้นไม่เป็นประโยชน์ในหน่วยความจำหลัก หรือการเพิ่มแคชเป็นข้อเสนอที่คุ้มค่ากว่า
สำหรับความเป็นไปได้ของแคชที่มีขนาดใหญ่มากที่มีความจุตามลำดับกิกะไบต์จำเป็นต้องใช้แคชในขนาดที่ใหญ่ที่สุดของชุดการทำงานสำหรับแอปพลิเคชันเท่านั้น แอปพลิเคชัน HPC อาจจัดการกับชุดข้อมูลเทราไบต์ แต่มีตำแหน่งทางโลกและอวกาศที่ดีดังนั้นชุดการทำงานของพวกเขาจึงไม่ใหญ่มาก แอปพลิเคชันที่มีชุดการทำงานขนาดใหญ่เช่นฐานข้อมูลและซอฟต์แวร์ ERP แต่มีเพียงตลาดที่ จำกัด สำหรับโปรเซสเซอร์ที่ปรับให้เหมาะกับภาระงานประเภทนี้ ยกเว้นว่าซอฟต์แวร์ต้องการใช้งานอย่างแท้จริงการเพิ่มแคชมากขึ้นจะให้ผลตอบแทนลดลงอย่างรวดเร็ว เมื่อเร็ว ๆ นี้เราได้เห็นโปรเซสเซอร์ได้รับคำแนะนำในการดึงข้อมูลล่วงหน้าดังนั้นแคชจึงสามารถใช้งานได้อย่างมีประสิทธิภาพมากขึ้น: เราสามารถใช้คำแนะนำเหล่านี้เพื่อหลีกเลี่ยงการพลาดเนื่องจากความไม่แน่นอนของรูปแบบการเข้าถึงหน่วยความจำมากกว่าขนาดที่แน่นอนของชุดการทำงาน
* การปรับปรุงเวลาแฝงไม่ได้เกิดจากขนาดฟิสิคัลของแคชที่เล็กลงเท่านั้น แต่ยังเป็นเพราะค่าความสัมพันธ์ลดลง มีการเปลี่ยนแปลงอย่างมีนัยสำคัญกับลำดับชั้นของแคชทั้งหมดใน Nehalem ด้วยเหตุผลที่แตกต่างกันหลายประการไม่ใช่ทั้งหมดที่มุ่งเน้นไปที่การปรับปรุงประสิทธิภาพ ดังนั้นในขณะที่พอเพียงนี้เป็นตัวอย่างมันไม่ได้เป็นบัญชีที่สมบูรณ์