ฟังก์ชั่นของคำสั่ง push / pop ที่ใช้กับ register ใน x86 assembly คืออะไร?

Question 1

เมื่ออ่านเกี่ยวกับแอสเซมเบลอร์ฉันมักจะเจอคนเขียนว่าพวกเขาดันรีจิสเตอร์ของโปรเซสเซอร์และเปิดขึ้นมาอีกครั้งในภายหลังเพื่อกู้คืนสถานะก่อนหน้า

คุณจะกดลงทะเบียนได้อย่างไร? มันดันอยู่ตรงไหน? เหตุใดจึงจำเป็น
สิ่งนี้ทำให้คำสั่งโปรเซสเซอร์ตัวเดียวเดือดหรือซับซ้อนกว่านี้หรือไม่?

Question 2

การผลักค่า (ไม่จำเป็นต้องเก็บไว้ในรีจิสเตอร์) หมายถึงการเขียนลงในสแต็ก

poppingหมายถึงการกู้คืนสิ่งที่อยู่ด้านบนของสแต็กลงในรีจิสเตอร์ นี่คือคำแนะนำพื้นฐาน:

push 0xdeadbeef      ; push a value to the stack
pop eax              ; eax is now 0xdeadbeef

; swap contents of registers
push eax
mov eax, ebx
pop ebx

Question 3

นี่คือวิธีที่คุณกดลงทะเบียน ฉันคิดว่าเรากำลังพูดถึง x86

push ebx
push eax

มันถูกผลักลงบนกอง ค่าของESPรีจิสเตอร์จะลดลงตามขนาดของค่าที่ผลักเมื่อสแต็กเติบโตลงในระบบ x86

จำเป็นต้องรักษาค่า การใช้งานทั่วไปคือ

push eax           ;   preserve the value of eax
call some_method   ;   some method is called which will put return value in eax
mov  edx, eax      ;    move the return value to edx
pop  eax           ;    restore original eax

A pushคือคำสั่งเดียวใน x86 ซึ่งทำสองสิ่งภายใน

ลดการESPลงทะเบียนตามขนาดของค่าที่ผลัก
จัดเก็บค่าพุชตามที่อยู่ปัจจุบันของการESPลงทะเบียน

Question 4

มันดันอยู่ตรงไหน?

esp - 4. อย่างแม่นยำมากขึ้น:

esp ถูกลบด้วย 4
ค่าจะถูกส่งไปที่ esp

pop ย้อนกลับสิ่งนี้

System V ABI บอกให้ Linux rspชี้ไปยังตำแหน่งสแต็กที่เหมาะสมเมื่อโปรแกรมเริ่มทำงาน: สถานะการลงทะเบียนเริ่มต้นคืออะไรเมื่อเปิดโปรแกรม (asm, linux) ซึ่งเป็นสิ่งที่คุณควรใช้เป็นประจำ

คุณจะกดลงทะเบียนได้อย่างไร?

ตัวอย่าง GNU GAS ขั้นต่ำ:

.data
    /* .long takes 4 bytes each. */
    val1:
        /* Store bytes 0x 01 00 00 00 here. */
        .long 1
    val2:
        /* 0x 02 00 00 00 */
        .long 2
.text
    /* Make esp point to the address of val2.
     * Unusual, but totally possible. */
    mov $val2, %esp

    /* eax = 3 */
    mov $3, %ea 

    push %eax
    /*
    Outcome:
    - esp == val1
    - val1 == 3
    esp was changed to point to val1,
    and then val1 was modified.
    */

    pop %ebx
    /*
    Outcome:
    - esp == &val2
    - ebx == 3
    Inverses push: ebx gets the value of val1 (first)
    and then esp is increased back to point to val2.
    */

ข้างต้นใน GitHub พร้อมการยืนยันที่รันได้

เหตุใดจึงจำเป็น

มันเป็นความจริงว่าคำแนะนำเหล่านั้นสามารถดำเนินการได้อย่างง่ายดายผ่านทางmov, และaddsub

เหตุผลเหล่านี้มีอยู่นั่นคือชุดคำสั่งเหล่านั้นเกิดขึ้นบ่อยมากจน Intel ตัดสินใจจัดเตรียมคำแนะนำเหล่านี้ให้กับเรา

สาเหตุที่ชุดค่าผสมเหล่านี้เกิดขึ้นบ่อยมากก็คือทำให้ง่ายต่อการบันทึกและกู้คืนค่าของรีจิสเตอร์ไปยังหน่วยความจำชั่วคราวดังนั้นจึงไม่ถูกเขียนทับ

เพื่อทำความเข้าใจปัญหาให้ลองรวบรวมรหัส C ด้วยตนเอง

ปัญหาสำคัญคือการตัดสินใจว่าจะจัดเก็บตัวแปรแต่ละตัวไว้ที่ใด

ตามหลักการแล้วตัวแปรทั้งหมดจะพอดีกับรีจิสเตอร์ซึ่งเป็นหน่วยความจำที่เร็วที่สุดในการเข้าถึง (ปัจจุบันเร็วกว่า RAM ประมาณ100เท่า)

แต่แน่นอนว่าเราสามารถมีตัวแปรได้มากกว่ารีจิสเตอร์โดยเฉพาะสำหรับอาร์กิวเมนต์ของฟังก์ชันที่ซ้อนกันดังนั้นทางออกเดียวคือการเขียนลงในหน่วยความจำ

เราสามารถเขียนไปยังที่อยู่หน่วยความจำใด ๆ ก็ได้ แต่เนื่องจากตัวแปรภายในและอาร์กิวเมนต์ของการเรียกใช้ฟังก์ชันและการส่งคืนนั้นพอดีกับรูปแบบสแต็กที่ดีซึ่งป้องกันการแตกกระจายของหน่วยความจำนั่นจึงเป็นวิธีที่ดีที่สุดในการจัดการกับมัน เปรียบเทียบกับความบ้าคลั่งของการเขียนตัวจัดสรรฮีป

จากนั้นเราให้คอมไพเลอร์ปรับแต่งการจัดสรรรีจิสเตอร์ให้เหมาะสมที่สุดเนื่องจาก NP นั้นสมบูรณ์และเป็นส่วนที่ยากที่สุดในการเขียนคอมไพเลอร์ ปัญหานี้จะเรียกว่าการจัดสรรลงทะเบียนและมันก็เป็นไป isomorphic กราฟสี

เมื่อจัดสรรคอมไพเลอร์จะถูกบังคับให้สิ่งที่เก็บไว้ในหน่วยความจำแทนเพียงลงทะเบียนที่เป็นที่รู้จักกันการรั่วไหล

สิ่งนี้ทำให้คำสั่งโปรเซสเซอร์ตัวเดียวเดือดหรือซับซ้อนกว่านี้หรือไม่?

สิ่งที่เรารู้แน่นอนก็คือ Intel จัดทำเอกสาร a pushและpopคำสั่งดังนั้นจึงเป็นคำสั่งเดียวในแง่นั้น

ภายในสามารถขยายเป็นไมโครโค้ดได้หลายตัวตัวหนึ่งต้องปรับเปลี่ยนespและอีกอันใช้ทำหน่วยความจำ IO และใช้เวลาหลายรอบ

แต่ก็เป็นไปได้เช่นกันว่า single pushจะเร็วกว่าคำสั่งอื่น ๆ ที่ใช้ร่วมกันเนื่องจากมีความเฉพาะเจาะจงมากกว่า

สิ่งนี้ส่วนใหญ่เป็นเอกสารที่ไม่มี (der):

Peter Cordes กล่าวว่าเทคนิคที่อธิบายไว้ในhttp://agner.org/optimize/microarchitecture.pdfแนะนำpushและpopดำเนินการเพียงครั้งเดียว
Johanกล่าวว่าเนื่องจาก Pentium M Intel ใช้ "stack engine" ซึ่งเก็บค่า esp + regsize ไว้ล่วงหน้าและ esp-regsize ทำให้สามารถ push และ pop เพื่อดำเนินการใน uop เดียวได้ ยังกล่าวถึงที่: https://en.wikipedia.org/wiki/Stack_register
ไมโครโค้ดของ Intel คืออะไร
/security/29730/processor-microcode-manipulation-to-change-opcodes
จำเป็นต้องใช้รอบ CPU กี่รอบสำหรับแต่ละคำสั่งในการประกอบ?

Question 5

การผลักดันและการลงทะเบียน popping อยู่เบื้องหลังเทียบเท่ากับสิ่งนี้:

push reg   <= same as =>      sub  $8,%rsp        # subtract 8 from rsp
                              mov  reg,(%rsp)     # store, using rsp as the address

pop  reg    <= same as=>      mov  (%rsp),reg     # load, using rsp as the address
                              add  $8,%rsp        # add 8 to the rsp

โปรดทราบว่านี่คือไวยากรณ์ x86-64 At & t

ใช้เป็นคู่ช่วยให้คุณสามารถบันทึกรีจิสเตอร์บนสแต็กและเรียกคืนได้ในภายหลัง มีประโยชน์อื่น ๆ ด้วย

Question 6

ซีพียูเกือบทั้งหมดใช้ stack กองโปรแกรมเป็นเทคนิคLIFOพร้อมฮาร์ดแวร์ที่รองรับการจัดการ

กองซ้อนคือจำนวนหน่วยความจำโปรแกรม (RAM) โดยปกติจะจัดสรรไว้ที่ด้านบนของฮีปหน่วยความจำ CPU และขยาย (ที่คำสั่ง PUSH ตัวชี้สแต็กจะลดลง) ในทิศทางตรงกันข้าม คำมาตรฐานสำหรับการแทรกเข้าไปในสแต็คเป็นPUSHและลบออกจากสแต็คเป็นPOP

สแต็คถูกจัดการผ่านสแต็กที่ต้องการลงทะเบียน CPU หรือที่เรียกว่าตัวชี้สแต็กดังนั้นเมื่อ CPU ดำเนินการPOPหรือPUSHตัวชี้สแต็กจะโหลด / จัดเก็บรีจิสเตอร์หรือค่าคงที่ลงในหน่วยความจำสแต็กและตัวชี้สแต็กจะลด x หรือเพิ่มขึ้นโดยอัตโนมัติตามจำนวนคำที่พุช หรือปรากฏใน (จาก) สแต็ก

ผ่านคำแนะนำแอสเซมเบลอร์เราสามารถจัดเก็บลงในกองซ้อน:

CPU ลงทะเบียนและค่าคงที่
ส่งคืนที่อยู่สำหรับฟังก์ชันหรือขั้นตอน
ฟังก์ชัน / โพรซีเดอร์เข้า / ออกตัวแปร
ฟังก์ชัน / โพรซีเดอร์ตัวแปรท้องถิ่น