จำลอง CPU Intel 8086


157

หมายเหตุ:คำตอบสองสามข้อได้มาถึงแล้ว ลองพิจารณาคำตอบที่ใหม่กว่าด้วย


8086เป็นครั้งแรกของอินเทลไมโครโปรเซสเซอร์ x86 งานของคุณคือการเขียนโปรแกรมจำลองมัน เนื่องจากนี่เป็นขั้นสูงฉันต้องการ จำกัด ให้ litte:

  • เฉพาะ opcodes ต่อไปนี้เท่านั้นที่จะต้องถูกนำไปใช้:
    • mov, กด, ป๊อป, xchg
    • เพิ่ม, adc, ย่อย, sbb, cmp, และ, หรือ, xor
    • inc
    • โทร, ret, jmp
    • jb, jz, jbe, js, jnb, jnz, jnbe, jns
    • stc, clc
    • hlt, nop
  • ด้วยเหตุนี้คุณจะต้องคำนวณธงพกศูนย์และเครื่องหมาย
  • อย่าใช้กลุ่ม cs = ds = ss = 0สมมติ
  • ไม่มีคำนำหน้า
  • ไม่มีอินเตอร์รัปต์หรือพอร์ต IO
  • ไม่มีฟังก์ชั่นสตริง
  • ไม่มี opcodes สองไบต์ (0F .. )
  • ไม่มีเลขทศนิยม
  • (ชัด) ไม่มีสิ่ง 32 บิต, sse, mmx, ... สิ่งที่ยังไม่ได้ถูกคิดค้นในปี 1979
  • คุณไม่จำเป็นต้องนับรอบหรือทำเวลาใด ๆ

เริ่มต้นด้วยและip = 0sp = 100h


อินพุต:อีมูเลเตอร์ของคุณควรใช้โปรแกรมไบนารีในรูปแบบใด ๆ ที่คุณชอบเช่นอินพุต (อ่านจากไฟล์อาร์เรย์ที่กำหนดไว้ล่วงหน้า ... ) และโหลดลงในหน่วยความจำที่อยู่ 0

เอาต์พุต: RAM วิดีโอเริ่มต้นที่แอดเดรส 8000h ทุก ๆ ไบต์คือหนึ่งตัวอักษร (ASCII-) จำลองหน้าจอ 80x25 เพื่อคอนโซล ปฏิบัติต่อศูนย์ไบต์เช่นช่องว่าง

ตัวอย่าง:

08000   2E 2E 2E 2E 2E 2E 2E 2E 2E 00 00 00 00 00 00 00   ................
08010   00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00   ................
08020   00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00   ................
08030   00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00   ................
08040   00 00 00 00 00 00 00 00 00 00 00 00 00 00 00 00   ................
08050   48 65 6C 6C 6F 2C 20 77 6F 72 6C 64 21 00 00 00   Hello,.world!...

หมายเหตุ: โหมดนี้คล้ายกับโหมดวิดีโอจริงมากซึ่งปกติจะอยู่ที่ 0xB8000 และมีไบต์ต่ออักขระหนึ่งตัวสำหรับสี

เกณฑ์การชนะ:

  • ต้องดำเนินการตามคำแนะนำทั้งหมด
  • ฉันทำโปรแกรมทดสอบที่ไม่ใส่หมายเหตุ( ลิงก์ , ที่มา nasm ) ที่ควรทำงานอย่างถูกต้อง มันออกมา

    .........                                                                       
    Hello, world!                                                                   
    0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ 
    
    
    ################################################################################
    ##                                                                            ##
    ##  0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987                          ##
    ##                                                                            ##
    ##  0 1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 289 324 361 400     ##
    ##                                                                            ##
    ##  2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97    ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ##                                                                            ##
    ################################################################################
    
  • ฉันไม่แน่ใจว่าควรเป็น codegolf หรือไม่ มันเป็นงานที่หนักดังนั้นการส่งใด ๆ ก็จะชนะ upvotes ได้มากมาย โปรดแสดงความคิดเห็น.

นี่คือลิงค์ที่จะช่วยคุณในงานนี้:

นี่เป็นรายการแรกของฉันในแพลตฟอร์มนี้ หากมีข้อผิดพลาดใด ๆ โปรดชี้ให้พวกเขา; หากฉันพลาดรายละเอียดเพียงแค่ถาม


5
ขั้นสูงเกินไปสำหรับฉัน แต่ฉันกระตือรือร้นที่จะเห็นคำตอบของคำถามนี้เนื่องจากเป็นประเภทที่ฉันสนใจมากที่สุด! ฉันอาจจะใช้เวลาแตกที่ได้ในภายหลังหากฉันรู้สึกย่ำแย่โดยเฉพาะอย่างยิ่ง ...
คริสบราวน์

3
@ChrisBrowne โชคดีเป็นร้าย ตอนนี้ฉันเปลี่ยน 8086 เป็น 80386 และเรียนรู้มากมายจากโครงการนี้
คัดลอก

2
+1 + รายการโปรด ... ฉันไม่สามารถแสดงความรู้สึกที่ฉันได้รับเมื่อฉันเห็นคำถามนี้
ixtmixilix

2
@copy ไม่มีคำว่าสายเกินไปที่จะแข่งขันกอล์ฟสำหรับทุกคู่ภาษา / เจ้าบ้าน
Yauhen Yakimovich

2
@ MartinBüttnerแน่นอนว่าคำถามนั้นเก่ากว่าแท็กนั้นและโดยทั่วไปเป็นการประกวดความนิยมอยู่แล้ว
คัดลอก

คำตอบ:


84

รู้สึกอิสระที่จะแยกและเล่นกอล์ฟได้ที่: https://github.com/julienaubert/py8086

ผลลัพธ์ ฉันรวมดีบักเกอร์แบบโต้ตอบด้วย

CF:0 ZF:0 SF:0 IP:0x0000
AX:0x0000  CX:0x0000  DX:0x0000  BX:0x0000  SP:0x0100  BP:0x0000  SI:0x0000  DI:0x0000
AL:  0x00  CL:  0x00  DL:  0x00  BL:  0x00  AH:  0x00  CH:  0x00  DH:  0x00  BH:  0x00
stack: 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 ...
cmp SP, 0x100
[Enter]:step [R]:run [B 0xadr]:add break [M 0xadr]:see RAM [Q]:quit

B 0x10
M 0x1
M 0x1: 0xfc 0x00 0x01 0x74 0x01 0xf4 0xbc 0x00 0x10 0xb0 0x2e 0xbb ...
R

CF:0 ZF:0 SF:1 IP:0x0010
AX:0x002e  CX:0x0000  DX:0x0000  BX:0xffff  SP:0x1000  BP:0x0000  SI:0x0000  DI:0x0000
AL:  0x2e  CL:  0x00  DL:  0x00  BL:  0xff  AH:  0x00  CH:  0x00  DH:  0x00  BH:  0x00
stack: 0x00 0x00 0x00 0x00 0x00 0x00 0x00 0x00 ...
cmp BX, 0xffff
[Enter]:step [R]:run [B 0xadr]:add break [M 0xadr]:see RAM [Q]:quit

มีสามไฟล์: emu8086.py (จำเป็น) console.py (เป็นทางเลือกสำหรับเอาต์พุตที่แสดง), disasm.py (เป็นทางเลือกเพื่อรับรายการ asm ใน codegolf)

วิธีรันด้วยจอแสดงผล (note ใช้ curses):

python emu8086.py 

วิธีเรียกใช้ด้วยดีบักเกอร์แบบโต้ตอบ:

python emu8086.py a b

วิธีเรียกใช้ด้วย "debugger" แบบไม่โต้ตอบ:

python emu8086.py a

โปรแกรม " codegolf " ควรอยู่ในไดเรกทอรีเดียวกัน

emu8086.py

console.py

disasm.py

บน GitHub


9
นั่นเป็นหนึ่งนรกของโพสต์กอล์ฟรหัสแรก +1 +1 +1 +1 +1 +1 +1 +1 +1 +1 ...
Dillon Cower

@DC ขอบคุณ :) เป็นความท้าทายที่สนุก!
ja

1
ยังไม่อยากจะเชื่อว่ามีคนทำสิ่งนี้จริง ๆ :-) ยอดเยี่ยมมาก!
คัดลอก

1
น่าทึ่ง! ขอแสดงความยินดี! ในท้ายที่สุดมีกี่บรรทัด?
จะ Lp

59

Haskell, 256 234 196 บรรทัด

ฉันมีความคืบหน้าในการทำงานมาระยะหนึ่งแล้วฉันตั้งใจจะขัดมันอีกเล็กน้อยก่อนที่จะเผยแพร่ แต่ตอนนี้ความสนุกเริ่มต้นขึ้นอย่างเป็นทางการแล้วไม่มีจุดไหนที่จะซ่อนมันไว้ได้อีกต่อไป ฉันสังเกตว่าในขณะที่แยกมันออกมามันมีความยาว 256 บรรทัดดังนั้นฉันคิดว่ามันอยู่ที่จุด "โดดเด่น" ของการมีอยู่

มีอะไรใน:แทบจะไม่เพียงพอของคำสั่ง 8086 ที่ตั้งค่าให้เรียกใช้ไบนารีตัวอย่างไร้ที่ติ สนับสนุนการแก้ไขรหัสด้วยตนเอง (prefetch: ศูนย์ไบต์)
แดกดันซ้ำครั้งแรกที่เพียงพอของรหัสได้อีกต่อไปและได้รับการสนับสนุนน้อยกว่าช่วง opcode การปรับโครงสร้างอีกครั้งเป็นประโยชน์ทั้งความยาวโค้ดและการครอบคลุม opcode

มีอะไรออกมา:ชัดเซกเมนต์ส่วนนำหน้าและหลายไบต์ opcodes ขัดจังหวะพอร์ต I / O การดำเนินงานของสตริงและ FP ตอนแรกฉันทำตามPUSH SPพฤติกรรมดั้งเดิมแต่ต้องลดลงหลังจากทำซ้ำสองสามครั้ง

ผลธง Carry อาจจะสับสนมากขึ้นในไม่กี่กรณี/ADCSBB

อย่างไรก็ตามนี่คือรหัส:

------------------------------------------------------------
-- Imports

-- They're the only lines I allow to go over 80 characters.
-- For the simple reason the code would work just as well without the
-- actual symbol list, but I like to keep it up to date to better
-- grasp my dependency graph.

import           Control.Monad.Reader      (ReaderT,runReaderT,ask,lift,forever,forM,when,void)
import           Control.Monad.ST          (ST,runST)
import           Control.Monad.Trans.Maybe (MaybeT,runMaybeT)
import           Data.Array.ST             (STUArray,readArray,writeArray,newArray,newListArray)
import           Data.Bits                 (FiniteBits,(.&.),(.|.),xor,shiftL,shiftR,testBit,finiteBitSize)
import           Data.Bool                 (bool)
import qualified Data.ByteString as B      (unpack,getContents)
import           Data.Char                 (chr,isPrint) -- for screen dump
import           Data.Int                  (Int8)
import           Data.STRef                (STRef,newSTRef,readSTRef,writeSTRef,modifySTRef)
import           Data.Word                 (Word8,Word16)

------------------------------------------------------------
-- Bytes and Words
-- Bytes are 8 bits.  Words are 16 bits.  Addressing is little-endian.

-- Phantom types.  Essentially (only?) used for the ALU
byte = undefined :: Word8
word = undefined :: Word16

-- Byte to word conversion
byteToWordSE = (fromIntegral :: Int8 -> Word16) .
               (fromIntegral :: Word8 -> Int8)

-- Two-bytes to word conversion
concatBytes :: Word8 -> Word8 -> Word16
concatBytes l h = fromIntegral l .|. (fromIntegral h `shiftL` 8)

-- Word to two bytes conversion
wordToByteL,wordToByteH :: Word16 -> Word8
wordToByteL = fromIntegral
wordToByteH = fromIntegral . (`shiftR` 8)

-- A Place is an lvalue byte or word.  In absence of I/O ports, this
-- means RAM or register file.  This type synonym is not strictly
-- needed, but without it it's unclear I could keep the alu function
-- type signature under twice 80 characters, so why not keep this.
type Place s = (STUArray s Word16 Word8,Word16)

-- Read and write, byte or word, from RAM or register file

class (Ord a,FiniteBits a,Num a) => Width a where
  readW  :: Place s ->      MonadCPU s a
  writeW :: Place s -> a -> MonadCPU s ()

instance Width Word8 where
  readW  =  liftST    . uncurry readArray
  writeW = (liftST .) . uncurry writeArray

instance Width Word16 where
  readW (p,a) = concatBytes <$> readW (p,a) <*> readW (p,a+1)
  writeW (p,a) val = do
    writeW (p,a)   $ wordToByteL val
    writeW (p,a+1) $ wordToByteH val

------------------------------------------------------------
-- CPU object

-- The actual CPU state.  Yeah, I obviously don't have all flags in! :-D
data CPU s = CPU { ram  :: STUArray s Word16 Word8
                 , regs :: STUArray s Word16 Word8
                 , cf :: STRef s Bool
                 , zf :: STRef s Bool
                 , sf :: STRef s Bool }

newCPU rawRam = do ramRef <- newListArray (0,0xFFFF) rawRam
                   regFile <- newArray (0,17) 0
                   cf <- newSTRef False
                   zf <- newSTRef False
                   sf <- newSTRef False
                   return $ CPU ramRef regFile cf zf sf

-- Register addresses within the register file.  Note odd placement
-- for BX and related.  Also note the 16-bit registers have a wider
-- pitch.  IP was shoehorned in recently, it doesn't really need an
-- address here, but it made other code shorter, so that's that.

-- In the 8-bit subfile, only regAl is used in the code (and it's 0,
-- so consider that a line I could totally have skipped)
[regAl,regAh,regCl,regCh,regDl,regDh,regBl,regBh] = [0..7]

-- In the 16-bit file, they're almost if not all referenced.  8086
-- sure is clunky.
[regAx,regCx,regDx,regBx,regSp,regBp,regSi,regDi,regIp] = [0,2..16]

-- These functions look like I got part of the Lens intuition
-- independently, come to look at it after the fact.  Cool :-)
readCpu  ext   = liftST .      readSTRef    . ext =<< ask
writeCpu ext f = liftST . flip writeSTRef f . ext =<< ask

-- It looks like the only operations IP can receive are relative moves
-- (incrIP function below) and a single absolute set: RET.  I deduce
-- only short jumps, not even near, were in the spec.
incrIP i = do old <- readReg regIp
              writeReg regIp (old + i)
              return old

-- Read next instruction.  Directly from RAM, so no pipeline prefetch.
readInstr8 = incrIP 1 >>= readRam
readInstr16 = concatBytes <$> readInstr8 <*> readInstr8

-- RAM/register file R/W specializers
readReg  reg      = ask >>= \p -> readW  (regs p,reg)
readRam  addr     = ask >>= \p -> readW  (ram p ,addr)
writeReg reg val  = ask >>= \p -> writeW (regs p,reg)  val
writeRam addr val = ask >>= \p -> writeW (ram p ,addr) val

-- I'm not quite sure what those do anymore, or why they're separate.
decodeReg8  n = fromIntegral $ (n `shiftL` 1) .|. (n `shiftR` 2)
decodeReg16 n = fromIntegral $  n `shiftL` 1
readDecodedReg8 = readReg . decodeReg8
readDecodedReg16 = readReg . decodeReg16

-- The monad type synonym make type signatures easier :-(
type MonadCPU s = MaybeT (ReaderT (CPU s) (ST s))

-- Specialized liftST, because the one from Hackage loses the
-- parameter, and I need it to be able to qualify Place.
liftST :: ST s a -> MonadCPU s a
liftST = lift . lift

------------------------------------------------------------
-- Instructions

-- This is arguably the core secret of the 8086 architecture.
-- See statement links for actual explanations.
readModRM = do
  modRM <- readInstr8
  let mod   =  modRM           `shiftR` 6
      opReg = (modRM .&. 0x38) `shiftR` 3
      rm    =  modRM .&. 0x07
  cpu <- ask
  operand <- case mod of
               0 -> do
                 addr <- case rm of
                           1 -> (+) <$> readReg regBx <*> readReg regDi
                           2 -> (+) <$> readReg regBp <*> readReg regSi
                           6 -> readInstr16
                           7 -> readReg regBx
                 return (ram cpu,addr)
               2 -> do
                 addr <- case rm of
                           5 -> (+) <$> readReg regDi <*> readInstr16
                           7 -> (+) <$> readReg regBx <*> readInstr16
                 return (ram cpu,addr)
               3 -> return (regs cpu,2*fromIntegral rm)
  return (operand,opReg,opReg)

-- Stack operations.  PUSH by value (does NOT reproduce PUSH SP behavior)
push16 val = do
  sp <- subtract 2 <$> readReg regSp
  writeReg regSp sp
  writeRam sp (val :: Word16)
pop16 = do
  sp <- readReg regSp
  val <- readRam sp
  writeReg regSp (sp+2)
  return (val :: Word16)

-- So, yeah, JMP seems to be relative (short) only.  Well, if that's enough…
jump cond = when cond . void . incrIP . byteToWordSE =<< readInstr8

-- The ALU.  The most complicated type signature in this file.  An
-- initial argument as a phantom type I tried to get rid of and
-- failed.
alu :: Width w => w -> MonadCPU s w -> MonadCPU s w -> Place s
    -> (w -> w -> MonadCPU s (Bool,Maybe Bool,w)) -> MonadCPU s ()
alu _ a b r op = do
  (rw,c,v) <- a >>= (b >>=) . op
  when rw $ writeW r v
  maybe (return ()) (writeCpu cf) c
  writeCpu zf (v == 0)
  writeCpu sf (testBit v (finiteBitSize v - 1))
decodeALU 0 = \a b -> return (True, Just (a >= negate b),       a   +   b)
decodeALU 1 = \a b -> return (True, Just False,                 a  .|.  b)
decodeALU 2 = \a b -> bool 0 1 <$> readCpu cf >>= \c ->
                      return (True, Just (a >= negate (b + c)), a + b + c)
decodeALU 3 = \a b -> bool 0 1 <$> readCpu cf >>= \c ->
                      return (True, Just (a < b + c),           a - b - c)
decodeALU 4 = \a b -> return (True, Just False,                 a  .&.  b)
decodeALU 5 = \a b -> return (True, Just (a <= b),              a   -   b)
decodeALU 6 = \a b -> return (True, Just False,                 a `xor` b)
decodeALU 7 = \a b -> return (False,Just (a <= b),              a   -   b)
opIncDec :: Width w => w -> w -> MonadCPU s (Bool,Maybe Bool,w)
opIncDec    = \a b -> return (True, Nothing,                    a   +   b)

-- Main iteration: process one instuction
-- That's the rest of the meat, but that part's expected.
processInstr = do
  opcode <- readInstr8
  regs <- regs <$> ask
  let zReg = (regs,decodeReg16 (opcode .&. 0x07))
  if opcode < 0x40 then -- no segment or BCD
    let aluOp = (opcode .&. 0x38) `shiftR` 3 in case opcode .&. 0x07 of
    0 -> do
      (operand,reg,_) <- readModRM
      alu byte (readW operand) (readDecodedReg8 reg) operand (decodeALU aluOp)
    1 -> do
      (operand,reg,_) <- readModRM
      alu word (readW operand) (readDecodedReg16 reg) operand (decodeALU aluOp)
    4 -> alu byte (readReg regAl) readInstr8 (regs,regAl) (decodeALU aluOp)
  else case opcode .&. 0xF8 of -- 16-bit (mostly) reg ops
    0x40 -> alu word (readW zReg) (return   1 ) zReg opIncDec -- 16b INC
    0x48 -> alu word (readW zReg) (return (-1)) zReg opIncDec -- 16b DEC
    0x50 -> readW zReg >>= push16                       -- 16b PUSH reg
    0x58 -> pop16 >>= writeW zReg                       -- 16b POP reg
    0x90 -> do v1 <- readW zReg                         -- 16b XCHG (or NOP)
               v2 <- readReg regAx
               writeW zReg (v2 :: Word16)
               writeReg regAx (v1 :: Word16)
    0xB0 -> readInstr8  >>= writeW zReg -- (BUG!)       -- 8b MOV reg,imm
    0xB8 -> readInstr16 >>= writeW zReg                 -- 16b MOV reg,imm
    _ -> case bool opcode 0x82 (opcode == 0x80) of
      0x72 -> jump       =<< readCpu cf                 -- JB/JNAE/JC
      0x74 -> jump       =<< readCpu zf                 -- JE/JZ
      0x75 -> jump . not =<< readCpu zf                 -- JNE/JNZ
      0x76 -> jump       =<< (||) <$> readCpu cf <*> readCpu zf -- JBE
      0x77 -> jump . not =<< (||) <$> readCpu cf <*> readCpu zf -- JA
      0x79 -> jump . not =<< readCpu sf                 -- JNS
      0x81 -> do                                        -- 16b arith to imm
        (operand,_,op) <- readModRM
        alu word (readW operand) readInstr16 operand (decodeALU op)
      0x82 -> do                                        -- 8b arith to imm
        (operand,_,op) <- readModRM
        alu byte (readW operand) readInstr8 operand (decodeALU op)
      0x83 -> do                                        -- 16b arith to 8s imm
        (operand,_,op) <- readModRM
        alu word (readW operand) (byteToWordSE <$> readInstr8) operand
            (decodeALU op)
      0x86 -> do                                        -- 8b XCHG reg,RM
        (operand,reg,_) <- readModRM
        v1 <- readDecodedReg8 reg
        v2 <- readW operand
        writeReg (decodeReg8 reg) (v2 :: Word8)
        writeW operand v1
      0x88 -> do                                        -- 8b MOV RM,reg
        (operand,reg,_) <- readModRM
        readDecodedReg8 reg >>= writeW operand
      0x89 -> do                                        -- 16b MOV RM,reg
        (operand,reg,_) <- readModRM
        readDecodedReg16 reg >>= writeW operand
      0x8A -> do                                        -- 8b MOV reg,RM
        (operand,reg,_) <- readModRM
        val <- readW operand
        writeReg (decodeReg8 reg) (val :: Word8)
      0x8B -> do                                        -- 16b MOV reg,RM
        (operand,reg,_) <- readModRM
        val <- readW operand
        writeReg (decodeReg16 reg) (val :: Word16)
      0xC3 -> pop16 >>= writeReg regIp                  -- RET
      0xC7 -> do (operand,_,_) <- readModRM             -- 16b MOV RM,imm
                 readInstr16 >>= writeW operand
      0xE8 -> readInstr16 >>= incrIP >>= push16         -- CALL relative
      0xEB -> jump True                                 -- JMP short
      0xF4 -> fail "Halting and Catching Fire"          -- HLT
      0xF9 -> writeCpu cf True                          -- STC
      0xFE -> do                                        -- 8-bit INC/DEC RM
        (operand,_,op) <- readModRM
        alu byte (readW operand) (return $ 1-2*op) operand
            (\a b -> return (True,Nothing,a+b)) -- kinda duplicate :(

------------------------------------------------------------

main = do
  rawRam <- (++ repeat 0) . B.unpack <$> B.getContents
  putStr $ unlines $ runST $ do
    cpu <- newCPU rawRam
    flip runReaderT cpu $ runMaybeT $ do
      writeReg regSp (0x100 :: Word16)
      forever processInstr

    -- Next three lines is the screen dump extraction.
    forM [0..25] $ \i -> forM [0..79] $ \j -> do
      c <- chr . fromIntegral <$> readArray (ram cpu) (0x8000 + 80*i + j)
      return $ bool ' ' c (isPrint c)

เอาต์พุตสำหรับไบนารีตัวอย่างที่ให้มานั้นตรงกับข้อกำหนดอย่างสมบูรณ์ ลองใช้การขอร้องเช่น:

runhaskell 8086.hs <8086.bin

การดำเนินการที่ไม่ได้ดำเนินการส่วนใหญ่จะทำให้เกิดความล้มเหลวในการจับคู่รูปแบบ

ฉันยังคงตั้งใจที่จะคำนึงถึงอีกเล็กน้อยและใช้การแสดงผลสดจริงด้วยคำสาป

อัปเดต 1: นำไปลงที่ 234 บรรทัด จัดระเบียบโค้ดได้ดีขึ้นโดยฟังก์ชันการทำงานปรับตำแหน่งสิ่งที่อาจเป็นไปได้พยายามติดกับคอลัมน์ 80 คอลัมน์ และทำการคืนค่า ALU หลายครั้ง

อัปเดต 2: เป็นเวลาห้าปีแล้วที่ฉันคิดว่ามีการอัปเดตเพื่อให้สามารถรวบรวม GHC ล่าสุดได้อย่างไม่มีที่ติ ระหว่างทาง:

  • กำจัด liftM, liftM2 และเช่นนั้น ฉันรักการมี<$>และ<*>ในโหมโรง
  • Data.Bool และ Data.ByteString ช่วยประหยัดและทำความสะอาด
  • IP register เคยเป็นแบบพิเศษ (unaddressable) ตอนนี้มันอยู่ในไฟล์ register มันไม่ได้ทำให้รู้สึก 8086 มาก แต่เฮ้ฉันเป็นนักกอล์ฟ
  • เป็นรหัส ST บริสุทธิ์ทั้งหมดในขณะนี้ จากมุมมองของนักกอล์ฟสิ่งนี้แย่มากเพราะมันจำเป็นต้องมีลายเซ็นประเภทมาก ในทางกลับกันฉันมีความรู้สึกผิดชอบชั่วดีและฉันเสียไปดังนั้นตอนนี้คุณก็จะได้รหัสที่สะอาดและยาว
  • ดังนั้นตอนนี้นี่คือการติดตามคอมไพล์
  • เพิ่มความคิดเห็นที่รุนแรงมากขึ้น ผลที่ตามมาคือวิธีที่ฉันนับจำนวนบรรทัดมีการเปลี่ยนแปลง: ฉันปล่อยบรรทัดว่างเปล่าและความคิดเห็นบริสุทธิ์ ฉันขอรับประกันทุกบรรทัด แต่การนำเข้ามีความยาวน้อยกว่า 80 ตัวอักษร ฉันไม่ได้ทิ้งลายเซ็นประเภทเนื่องจากสิ่งที่ฉันทิ้งไว้เป็นสิ่งจำเป็นจริง ๆ เพื่อให้มันคอมไพล์อย่างถูกต้อง (ขอบคุณมาก ST สะอาดมาก)

ดังที่ความคิดเห็นของรหัสบอกว่า 5 บรรทัด (การนำเข้า Data.Char การแมปการลงทะเบียน 8 บิตและการถ่ายโอนข้อมูลหน้าจอ) นั้นไม่เพียงพอดังนั้นคุณจึงยินดีลดราคาถ้าคุณรู้สึกว่า :-)


3
ทำได้ดีนี่. มันสั้นมากโดยเฉพาะเมื่อเทียบกับโซลูชันของฉันและอีกอัน รหัสของคุณก็ดูดีเช่นกันแม้ว่าฉันจะต้องเรียนรู้ Haskell ก่อน
คัดลอก

3
เยี่ยมมาก! สั้นมาก ฉันควรเรียนรู้ฮาเซล
ja

อะไรนะ.|.? / 10char
Soham Chowdhury

@octatoan การดำเนินการที่รู้จักกันใน x86 opcodes เป็น OR
JB

46

C - 7143 บรรทัด (CPU เอง 3162 เส้น)

แก้ไข: บิลด์ Windows ตอนนี้มีเมนูแบบเลื่อนลงเพื่อเปลี่ยนดิสก์เสมือน

ฉันเขียนตัวจำลอง PC 80186 / V20 เต็มรูปแบบ (ด้วย CGA / MCGA / VGA, Sound Blaster, adlib, เมาส์ ฯลฯ ) มันไม่ใช่เรื่องง่ายที่จะเลียนแบบ 8086 ด้วยวิธีการใด ๆ ต้องใช้เวลาหลายเดือนกว่าจะได้รับความแม่นยำเต็มที่ นี่คือโมดูล CPU เฉพาะจากโปรแกรมจำลองของฉัน

http://sourceforge.net/p/fake86/code/ci/master/tree/src/fake86/cpu.c

ฉันจะเป็นคนแรกที่ยอมรับว่าฉันใช้ตัวแปรระดับโลกมากเกินไปในตัวจำลองนี้ ฉันเริ่มเขียนสิ่งนี้เมื่อฉันยังใหม่กับ C และมันก็แสดงให้เห็น ฉันต้องล้างมันสักวันหนึ่ง ไฟล์ต้นฉบับส่วนใหญ่ที่อยู่ในนั้นดูไม่น่าเกลียดนัก

คุณสามารถดูรหัสทั้งหมด (และภาพหน้าจอบางส่วนอยู่ด้านล่าง) ผ่านทางที่นี่: http://sourceforge.net/p/fake86

ฉันมีความสุขมากที่ได้ช่วยเหลือใครก็ตามที่ต้องการเขียนของตัวเองเพราะมันสนุกมากและคุณเรียนรู้มากมายเกี่ยวกับซีพียู! ข้อสงวนสิทธิ์: ฉันไม่ได้เพิ่มการจำลอง 8080 ของ V20 เนื่องจากแทบจะไม่เคยใช้ในโปรแกรมพีซี ดูเหมือนว่าจะทำงานมากมายเพื่อผลประโยชน์

สตรีทไฟท์เตอร์ 2!


3
เยี่ยมมาก! เกมรันด้วยความเร็วสูงสุดจริงหรือไม่?
คัดลอก

1
ขอบคุณ ใช่มันวิ่งเร็วกว่า 8088 หลายเท่าในระบบที่ทันสมัยมันสามารถทำความเร็ว 486 เหมือนได้ บนโปรเซสเซอร์ที่ดีจริง ๆ มันเหมือนกับ Pentium ต่ำ น่าเสียดายที่การจำลอง CPU ไม่สามารถทำแบบมัลติเธรดได้จริงๆ ฉันทำทุกการแสดงผลวิดีโอในหัวข้อของตัวเองว่า ฉันใช้มันกับ 400 MHz PowePC G3 ตัวเก่าของฉันซึ่งมันลดลงเหลือ 8088 ความเร็วที่แท้จริง
Mike C

1
น่ากลัว! ฉันต้องการใช้รหัส op และการแบ่งเซ็กเมนต์เพิ่มเติม อย่างไรก็ตามไม่พบโปรแกรมทดสอบมากมายที่จะทำงาน คุณดาวน์โหลดรอมเก่าหรือไม่?
เดฟ C

1
เดฟไม่จริงมีการขาดการทดสอบอย่างจริงจังจำนวน 8086 ออกมาอย่างน่าประหลาดใจเมื่อคุณพบเช่นกัน วิธีที่ฉันดำเนินการคือเริ่มต้นด้วยการทำให้ XT BIOS ROM ทำงานได้อย่างถูกต้อง หากใช้งานได้ดีการแบ่งส่วนของคุณน่าจะดี หลังจากนั้นมันเพิ่งทำการดีบั๊กจนกระทั่ง DOS เริ่มทำงาน ... จากนั้นเข้าสู่แอพและเกม! :)
Mike C

1
@MikeC ฉันต้องการความช่วยเหลือหรือพอยน์เตอร์เริ่มต้น! (Pun ตั้งใจ: P) ฉันเป็นนักพัฒนา Desktop และ Web App มาหลายปีแล้วและช้าฉันก็ถึงจุดที่ฉันมีซอร์สโค้ด linux โดยทั่วไปฉันเข้าใจว่าชิ้นส่วนต่างๆของฟังก์ชั่นระบบปฏิบัติการและฉันสามารถเล่นกับโครงการของเล่นขนาดเล็กได้อย่างไร แต่การโต้ตอบกับฮาร์ดแวร์โดยตรงเพียงแค่หลบหลีกฉัน!
gideon

41

Postscript (130 200 367 517 531 222 246 บรรทัด)

ยังคงอยู่ระหว่างดำเนินการ แต่ผมอยากจะแสดงรหัสบางอย่างในความพยายามที่จะส่งเสริมให้ผู้อื่นแสดงโค้ดบางส่วน

ชุดรีจิสเตอร์ถูกแสดงเป็นหนึ่งสตริงดังนั้นการลงทะเบียนไบต์และขนาดต่าง ๆ สามารถซ้อนทับกันตามธรรมชาติโดยอ้างอิงถึงสตริงย่อย สตริงย่อยถูกใช้เป็นพอยน์เตอร์ตลอดเพื่อให้รีจิสเตอร์และตำแหน่งหน่วยความจำ (ซับสตริงของสตริงหน่วยความจำ) สามารถได้รับการปฏิบัติอย่างสม่ำเสมอในฟังก์ชั่นของผู้ปฏิบัติงาน

จากนั้นมีคำจำนวนหนึ่งที่จะรับและจัดเก็บข้อมูล (ไบต์หรือคำ) จาก "ตัวชี้" จากหน่วยความจำจาก mem [(IP)] (IP ที่เพิ่มขึ้น) จากนั้นมีฟังก์ชั่นบางอย่างในการเรียกข้อมูลไบต์ MOD-REG-R / M และตั้งค่าตัวแปร REG และ R / M และ MOD และถอดรหัสพวกเขาโดยใช้ตาราง จากนั้นผู้ปฏิบัติงานจะทำหน้าที่ป้อนรหัสไปยัง opcode fetchb load execดังนั้นห่วงการดำเนินการเป็นเพียง

ฉันเพิ่งใช้งาน opcodes เพียงไม่กี่ชิ้น แต่ gทำให้การถอดรหัสตัวถูกดำเนินการรู้สึกเหมือนเป็นเหตุการณ์สำคัญที่ฉันต้องการแชร์

แก้ไข:เพิ่มคำเพื่อเพิ่มตัวเลขติดลบ opcodes เพิ่มเติม แก้ไขข้อผิดพลาดในการลงทะเบียน ความคิดเห็น ยังคงทำงานกับธงและการกรอกตัวดำเนินการ เอาท์พุทนำเสนอตัวเลือกบางอย่าง: ข้อความที่ส่งออกไปยัง stdout เมื่อสิ้นสุดการส่งออกอย่างต่อเนื่องโดยใช้รหัส vt100, การส่งออกไปที่หน้าต่างภาพโดยใช้แบบอักษร CP437

แก้ไข:เสร็จสิ้นการเขียนเริ่มการดีบัก มันได้รับสี่จุดแรกของการส่งออก! จากนั้นพกพาไปผิดพลาด ง่วงนอน

แก้ไข:ฉันคิดว่าฉันมีการจัดเรียงธงดำเนินการ บางส่วนของเรื่องที่เกิดขึ้นในcomp.lang.postscript ฉันได้เพิ่มเครื่องมือแก้ไขข้อบกพร่องบางส่วนและผลลัพธ์ไปที่หน้าต่างกราฟิก (โดยใช้แบบอักษรCode-Page 437 Type-3 ที่ฉันเขียนไว้ก่อนหน้านี้) ดังนั้นเอาต์พุตข้อความอาจเต็มไปด้วยร่องรอยและการทิ้ง มันเขียนว่า "Hello World!" แล้วมีคาเร็ตที่น่าสงสัย จากนั้นก็พูดไม่ออกทั้งหมด :( เราจะไปถึงที่นั่นขอบคุณสำหรับกำลังใจทั้งหมด!

แก้ไข:รันการทดสอบให้เสร็จสมบูรณ์ ข้อบกพร่องเล็กน้อยสุดท้ายคือ: XCHG ทำ 2 {read store} ทำซ้ำซึ่งแน่นอนว่าเป็นการคัดลอกมากกว่าการแลกเปลี่ยนและไม่ตั้งค่าสถานะ (FE) INC พยายามรับคำจากตัวชี้ไบต์

แก้ไข:เขียนซ้ำทั้งหมดตั้งแต่ต้นโดยใช้ตารางรัดกุมจากคู่มือ ( เปลี่ยนหน้าใหม่! ) ฉันเริ่มคิดว่าการแยกตัวประกอบการจัดเก็บจาก opcodes นั้นเป็นความคิดที่ไม่ดี แต่มันช่วยให้ optab นั้นสวย ไม่มีภาพหน้าจอในเวลานี้ ฉันเพิ่มตัวนับคำแนะนำและ mod-trigger เพื่อถ่ายโอนข้อมูลหน่วยความจำวิดีโอดังนั้นมันจึงแทรกสอดข้อมูล debug ได้อย่างง่ายดาย

แก้ไข:รันโปรแกรมทดสอบอีกครั้ง! ข้อบกพร่องบางประการสุดท้ายสำหรับการเขียนใหม่ที่สั้นกว่านั้นถูกละเลยการลงนามขยายไบต์ทันทีใน opcodes 83 (กลุ่ม "ทันที") และ EB (JMP สั้น) การเพิ่ม 24 บรรทัดครอบคลุมถึงขั้นตอนการดีบักเพิ่มเติมที่จำเป็นในการติดตามบั๊กสุดท้ายเหล่านั้น

%!
%a8086.ps Draught2:BREVITY
[/NULL<0000>/nul 0
/mem 16#ffff string %16-bit memory
/CF 0 /OF 0 /AF 0 /ZF 0 /SF 0
/regs 20 string >>begin %register byte storage
0{AL AH CL CH DL DH BL BH}{regs 2 index 1 getinterval def 1 add}forall pop
0{AX CX DX BX SP BP SI DI IP FL}{regs 2 index 2 getinterval def 2 add}forall pop

%getting and fetching
[/*b{0 get} %get byte from pointer
/*w{dup *b exch 1 get bbw} %get word from pointer
/*{{*b *w}W get exec} %get data(W) from pointer
/bbw{8 bitshift add} %lo-byte hi-byte -> word
/shiftmask{2 copy neg bitshift 3 1 roll 1 exch bitshift 1 sub and}
/fetchb{IP *w mem exch get bytedump   IP dup *w 1 add storew} % byte(IP++)
/fetchw{fetchb fetchb bbw} % word(IP),IP+=2

%storing and accessing
/storeb{16#ff and 0 exch put} % ptr val8 -> -
/storew{2 copy storeb -8 bitshift 16#ff and 1 exch put} % ptr val16 -> -
/stor{{storeb storew}W get exec} % ptr val(W) -> -
/memptr{16#ffff and mem exch {1 2}W get getinterval} % addr -> ptr(W)

%decoding the mod-reg-reg/mem byte
/mrm{fetchb 3 shiftmask /RM exch def 3 shiftmask /REG exch def /MOD exch def}
/REGTAB[[AL CL DL BL AH CH DH BH][AX CX DX BX SP BP SI DI]]
/decreg{REGTAB W get REG get} % REGTAB[W][REG]
%2 indexes,   with immed byte,   with immed word
/2*w{exch *w exch *w add}/fba{fetchb add}/fwa{fetchw add}
/RMTAB[[{BX SI 2*w}{BX DI 2*w}{BP SI 2*w}{BP DI 2*w}
    {SI *w}{DI *w}{fetchw}{BX *w}]
[{BX SI 2*w fba}{BX DI 2*w fba}{BP SI 2*w fba}{BP DI 2*w fba}
    {SI *w fba}{DI *w fba}{BP *w fba}{BX *w fba}]
[{BX SI 2*w fwa}{BX DI 2*w fwa}{BP SI 2*w fwa}{BP DI 2*w fwa}
    {SI *w fwa}{DI *w fwa}{BP *w fwa}{BX *w fwa}]]
/decrm{MOD 3 eq{REGTAB W get RM get} %MOD=3:register mode
    {RMTAB MOD get RM get exec memptr}ifelse} % RMTAB[MOD][RM] -> addr -> ptr

%setting and storing flags
/flagw{OF 11 bitshift SF 7 bitshift or ZF 6 bitshift or AF 4 bitshift CF or}
/wflag{dup 1 and /CF exch def dup -4 bitshift 1 and /AF exch def
    dup -6 bitshift 1 and /ZF exch def dup -7 bitshift 1 and /SF exch def
    dup -11 bitshift 1 and /OF exch def}
/nz1{0 ne{1}{0}ifelse}
/logflags{/CF 0 def /OF 0 def /AF 0 def %clear mathflags
    dup {16#80 16#8000}W get and nz1 /SF exch def
    dup {16#ff 16#ffff}W get and 0 eq{1}{0}ifelse /ZF exch def}
/mathflags{{z y x}{exch def}forall
    /CF z {16#ff00 16#ffff0000}W get and nz1 def
    /OF z x xor z y xor and {16#80 16#8000}W get and nz1 def
    /AF x y xor z xor 16#10 and nz1 def
    z} %leave the result on stack

%opcodes (each followed by 'stor')  %% { OPTAB fetchb get exec stor } loop
/ADD{2 copy add logflags mathflags}
/OR{or logflags}
/ADC{CF add ADD}
/SBB{D 1 xor {exch}repeat CF add 2 copy sub logflags mathflags}
/AND{and logflags}
/SUB{D 1 xor {exch}repeat 2 copy sub logflags mathflags}
/XOR{xor logflags}
/CMP{3 2 roll pop NULL 3 1 roll SUB} %dummy stor target
/INC{t CF exch dup * 1 ADD 3 2 roll /CF exch def}
/DEC{t CF exch dup * 1 SUB 3 2 roll /CF exch def}
/PUSH{SP dup *w 2 sub storew   *w SP *w memptr exch}
/POP{SP *w memptr *w   SP dup *w 2 add storew}

/jrel{w {CBW IP *w add IP exch}{NULL exch}ifelse}
/JO{fetchb OF 1 eq jrel }
/JNO{fetchb OF 0 eq jrel }
/JB{fetchb CF 1 eq jrel }
/JNB{fetchb CF 0 eq jrel }
/JZ{fetchb ZF 1 eq jrel }
/JNZ{fetchb ZF 0 eq jrel }
/JBE{fetchb CF ZF or 1 eq jrel }
/JNBE{fetchb CF ZF or 0 eq jrel }
/JS{fetchb SF 1 eq jrel }
/JNS{fetchb SF 0 eq jrel }
/JL{fetchb SF OF xor 1 eq jrel }
/JNL{fetchb SF OF xor 0 eq jrel }
/JLE{fetchb SF OF xor ZF or 1 eq jrel }
/JNLE{fetchb SF OF xor ZF or 0 eq jrel }

/bw{dup 16#80 and 0 ne{16#ff xor 1 add 16#ffff xor 1 add}if}
/IMMTAB{ADD OR ADC SBB AND SUB XOR CMP }cvlit
/immed{ W 2 eq{ /W 1 def
            mrm decrm dup * fetchb bw
    }{ mrm decrm dup * {fetchb fetchw}W get exec }ifelse
    exch IMMTAB REG get dup == exec }

%/TEST{ }
/XCHG{3 2 roll pop 2 copy exch * 4 2 roll * stor }
/AXCH{w dup AX XCHG }
/NOP{ NULL nul }
/pMOV{D{exch}repeat pop }
/mMOV{ 3 1 roll pop pop }
/MOV{ }
/LEA{w mrm decreg RMTAB MOD get RM get exec }

/CBW{dup 16#80 and 0 ne {16#ff xor 1 add 16#ffff xor 1 add } if }
/CWD{dup 16#8000 and 0 ne {16#ffff xor 1 add neg } if }
/CALL{w xp /xp{}def fetchw IP PUSH storew IP dup *w 3 2 roll add dsp /dsp{}def }
%/WAIT{ }
/PUSHF{NULL dup flagw storew 2 copy PUSH }
/POPF{NULL dup POP *w wflag }
%/SAHF{ }
%/LAHF{ }

%/MOVS{ }
%/CMPS{ }
%/STOS{ }
%/LODS{ }
%/SCAS{ }
/RET{w IP POP storew SP dup * 3 2 roll add }
%/LES{ }
%/LDS{ }

/JMP{IP dup fetchw exch *w add}
/sJMP{IP dup fetchb bw exch *w add}

/HLT{exit}
/CMC{/CF CF 1 xor def NULL nul}
/CLC{/CF 0 def NULL nul}
/STC{/CF 1 def NULL nul}

/NOT{not logflags }
/NEG{neg logflags }
/GRP1TAB{TEST --- NOT NEG MUL IMUL DIV IDIV } cvlit
/Grp1{mrm decrm dup * GRP1TAB REG get
dup ==
exec }
/GRP2TAB{INC DEC {id CALL}{l id CALL}{id JMP}{l id JMP} PUSH --- } cvlit
/Grp2{mrm decrm GRP2TAB REG get
dup ==
exec }

%optab shortcuts
/2*{exch * exch *}
/rm{mrm decreg decrm D index 3 1 roll 2*} % fetch,decode mrm -> dest *reg *r-m
/rmp{mrm decreg decrm D index 3 1 roll} % fetch,decode mrm -> dest reg r-m
/ia{ {{AL dup *b fetchb}{AX dup *w fetchw}}W get exec } %immed to accumulator
/is{/W 2 def}
/b{/W 0 def} %select byte operation
/w{/W 1 def} %select word operation
/t{/D 1 def} %dest = reg
/f{/D 0 def} %dest = r/m
/xp{} /dsp{}
%/far{ /xp { <0000> PUSH storew } /dsp { fetchw pop } def }
/i{ {fetchb fetchw}W get exec }

/OPTAB{
{b f rm ADD}{w f rm ADD}{b t rm ADD}{w t rm ADD}{b ia ADD}{w ia ADD}{ES PUSH}{ES POP} %00-07
 {b f rm OR}{w f rm OR}{b t rm OR}{w t rm OR}{b ia OR}{w ia OR}{CS PUSH}{}            %08-0F
{b f rm ADC}{w f rm ADC}{b t rm ADC}{w t rm ADC}{b ia ADC}{w ia ADC}{SS PUSH}{SS POP} %10-17
 {b f rm SBB}{w f rm SBB}{b t rm SBB}{w t rm SBB}{b ia SBB}{w ia SBB}{DS PUSH}{DS POP}%18-1F
{b f rm AND}{w f rm AND}{b t rm AND}{w t rm AND}{b ia AND}{w ia AND}{ES SEG}{DAA}     %20-27
 {b f rm SUB}{w f rm SUB}{b t rm SUB}{w t rm SUB}{b ia SUB}{w ia SUB}{CS SEG}{DAS}    %28-2F
{b f rm XOR}{w f rm XOR}{b t rm XOR}{w t rm XOR}{b ia XOR}{w ia XOR}{SS SEG}{AAA}     %30-37
 {b f rm CMP}{w f rm CMP}{b t rm CMP}{w t rm CMP}{b ia CMP}{w ia CMP}{DS SEG}{AAS}    %38-3F
{w AX INC}{w CX INC}{w DX INC}{w BX INC}{w SP INC}{w BP INC}{w SI INC}{w DI INC}      %40-47
 {w AX DEC}{w CX DEC}{w DX DEC}{w BX DEC}{w SP DEC}{w BP DEC}{w SI DEC}{w DI DEC}     %48-4F
{AX PUSH}{CX PUSH}{DX PUSH}{BX PUSH}{SP PUSH}{BP PUSH}{SI PUSH}{DI PUSH}              %50-57
 {AX POP}{CX POP}{DX POP}{BX POP}{SP POP}{BP POP}{SI POP}{DI POP}                     %58-5F
{}{}{}{}{}{}{}{}  {}{}{}{}{}{}{}{}                                                    %60-6F
{JO}{JNO}{JB}{JNB}{JZ}{JNZ}{JBE}{JNBE} {JS}{JNS}{JP}{JNP}{JL}{JNL}{JLE}{JNLE}         %70-7F

{b f immed}{w f immed}{b f immed}{is f immed}{b TEST}{w TEST}{b rmp XCHG}{w rmp XCHG}   %80-87
 {b f rm pMOV}{w f rm pMOV}{b t rm pMOV}{w t rm pMOV}                                 %88-8B
   {sr f rm pMOV}{LEA}{sr t rm pMOV}{w mrm decrm POP}                                 %8C-8F
{NOP}{CX AXCH}{DX AXCH}{BX AXCHG}{SP AXCH}{BP AXCH}{SI AXCH}{DI AXCH}             %90-97
 {CBW}{CWD}{far CALL}{WAIT}{PUSHF}{POPF}{SAHF}{LAHF}                                  %98-9F
{b AL m MOV}{w AX m MOV}{b m AL MOV}{b AX m MOV}{MOVS}{MOVS}{CMPS}{CMPS}              %A0-A7
 {b i a TEST}{w i a TEST}{STOS}{STOS}{LODS}{LODS}{SCAS}{SCAS}                         %A8-AF
{b AL i MOV}{b CL i MOV}{b DL i MOV}{b BL i MOV}                                      %B0-B3
 {b AH i MOV}{b CH i MOV}{b DH i MOV}{b BH i MOV}                                     %B4-B7
 {w AX i MOV}{w CX i MOV}{w DX i MOV}{w BX i MOV}                                     %B8-BB
 {w SP i MOV}{w BP i MOV}{w SI i MOV}{w DI i MOV}                                     %BC-BF
{}{}{fetchw RET}{0 RET}{LES}{LDS}{b f rm i mMOV}{w f rm i mMOV}                       %C0-B7
 {}{}{fetchw RET}{0 RET}{3 INT}{fetchb INT}{INTO}{IRET}                               %C8-CF
{b Shift}{w Shift}{b v Shift}{w v Shift}{AAM}{AAD}{}{XLAT}                            %D0-D7
 {0 ESC}{1 ESC}{2 ESC}{3 ESC}{4 ESC}{5 ESC}{6 ESC}{7 ESC}                             %D8-DF
{LOOPNZ}{LOOPZ}{LOOP}{JCXZ}{b IN}{w IN}{b OUT}{w OUT}                                 %E0-E7
 {CALL}{JMP}{far JMP}{sJMP}{v b IN}{v w IN}{v b OUT}{v w OUT}                         %E8-EF
{LOCK}{}{REP}{z REP}{HLT}{CMC}{b Grp1}{w Grp}                                         %F0-F7
 {CLC}{STC}{CLI}{STI}{CLD}{STD}{b Grp2}{w Grp2}                                       %F8-FF
}cvlit

/break{ /hook /pause load def }
/c{ /hook {} def }
/doprompt{
    (\nbreak>)print
    flush(%lineedit)(r)file
    cvx {exec}stopped pop }
/pause{ doprompt }
/hook{}

/stdout(%stdout)(w)file
/bytedump{ <00> dup 0 3 index put stdout exch writehexstring ( )print }
/regdump{ REGTAB 1 get{ stdout exch writehexstring ( )print }forall
    stdout IP writehexstring ( )print
    {(NC )(CA )}CF get print
    {(NO )(OV )}OF get print
    {(NS )(SN )}SF get print
    {(NZ )(ZR )}ZF get print
    stdout 16#1d3 w memptr writehexstring
    (\n)print
}
/mainloop{{
    %regdump
    OPTAB fetchb get
    dup ==
    exec
    %pstack flush
    %hook
    stor
    /ic ic 1 add def ictime
}loop}

/printvideo{
    0 1 28 {
        80 mul 16#8000 add mem exch 80 getinterval {
            dup 0 eq { pop 32 } if
                    dup 32 lt 1 index 126 gt or { pop 46 } if
            stdout exch write
        } forall (\n)print
    } for
    (\n)print
}
/ic 0
/ictime{ic 10 mod 0 eq {onq} if}
/timeq 10
/onq{ %printvideo
}
>>begin
currentdict{dup type/arraytype eq 1 index xcheck and
    {bind def}{pop pop}ifelse}forall

SP 16#100 storew
(codegolf.8086)(r)file mem readstring pop
pop[

mainloop
printvideo

%eof

และเอาท์พุท (พร้อมท้ายของการแก้จุดบกพร่องเอาท์พุทย่อ)

75 {JNZ}
19 43 {w BX INC}
83 {is f immed}
fb 64 CMP
76 {JBE}
da f4 {HLT}
.........
Hello, world!
0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~


################################################################################
##                                                                            ##
##  0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987                          ##
##                                                                            ##
##  0 1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 289 324 361 400     ##
##                                                                            ##
##  2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97    ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
################################################################################





GS<1>

5
ฉันสงสัย ... ฮอตคีย์เพื่อปิดแอปพลิเคชัน alt-F4 เพราะ F4h เป็น opcode 8086 HLT หรือไม่
luser droog

5
ฉันแค่อยากจะบอกคุณว่าคุณยอดเยี่ยมมากสำหรับการนำไปใช้ใน Postscript
cemper93

1
รหัสที่เป็นระยะสั้น มันสมควรได้รับการโหวตมากขึ้น มีของฉันสำหรับการเริ่มต้น
JB

2
เดี๋ยวก่อน ... postscript เป็นภาษาการเขียนโปรแกรมหรือไม่! ;)
n611x007

32

จาวาสคริ

ฉันกำลังเขียนอีมูเลเตอร์ 486 ตัวในจาวาสคริปต์ที่ได้รับแรงบันดาลใจจาก jslinux ถ้าฉันรู้ว่ามันจะทำงานได้มากแค่ไหนฉันคงไม่เริ่มเลย แต่ตอนนี้ฉันอยากจะทำให้มันเสร็จ

จากนั้นฉันเจอความท้าทายของคุณและมีความสุขมากที่มีโปรแกรม 8086 ทดสอบ

http://i.stack.imgur.com/54a6S.png

คุณสามารถ "เห็น" มันทำงานอยู่ที่นี่: http://codinguncut.com/jsmachine/

ฉันมีปัญหาหนึ่งเมื่อพิมพ์บัฟเฟอร์กราฟิก ที่ควรมีช่องว่างหน่วยความจำมีองค์ประกอบ "00" การตีความ "0x00" เป็นช่องว่างหรือฉันมีข้อบกพร่องในโปรแกรมจำลองการทำงานหรือไม่

ไชโย

โยฮันเน


น่าสนใจจริง ๆ ฉันรู้ชื่อของคุณจาก Screencasts ของคุณซึ่งฉันดูหลังจากการตอบสนองของ Haskell ในการท้าทายนี้ (และฉันก็เริ่มจำลอง x86 ใน Javascript) ใช่ศูนย์ไบต์ควรปรากฏเป็นช่องว่าง ฉันได้เพิ่มภาพหน้าจอในโพสต์ของคุณแล้ว +1 ต่อไป :-)
คัดลอก

@ Johannes ฉันได้ดูรหัส mycpu-min.js อย่างรวดเร็ว จากสิ่งที่ฉันสามารถบอกคุณได้ใช้เพียงไม่กี่ความคิดจาก cpux86.js (จาก jslinux ของ FB) ยินดีด้วย! เป็นงานที่ดี มีโอกาสที่จะเห็น mycpu.js ที่ไม่ได้รวบรวมที่ไหนสักแห่ง? หวังว่าจะได้ที่github.com/codinguncut
เหยาเหมินยากิโมวิช

@YauhenYakimovich ไม่ฉันยังไม่ได้ใช้รหัส jslinux ใด ๆ ฉันใช้งานไปแล้วจนถึง 286 คำแนะนำทั้งหมดลบเพจจิ้งและการแบ่งกลุ่ม (mmu) แผนของฉันคือการปล่อยรหัสภายใต้ GPL แต่ฉันต้องการนำความคิดไปใช้ในเชิงพาณิชย์สำหรับการใช้งานเช่น Freedos หรือ Reactos ดังนั้นฉันจึงยังไม่แน่ใจเกี่ยวกับสิทธิ์ใช้งาน ความจริงก็คือมันจะใช้เวลานานสำหรับฉันที่จะใช้หน่วยความจำเต็มรูปแบบ และจากนั้นเป็นเวลานานกว่าที่มันจะวิ่งด้วยความเร็ว ฉันจะแชร์ที่ github.com/codinguncut อย่างแน่นอน ขอบคุณสำหรับคำติชมของคุณ Johannes
fluquid

1
ลิงก์เสียสำหรับฉัน (IE บน Windows 8)
Conor O'Brien

สิ่งนี้มาช้ามาก อักขระศูนย์คือช่องว่างอื่นใน RAM วิดีโอ
โจชัว

30

C ++

ฉันต้องการส่งรายการของเราสำหรับการท้าทายรหัสนี้ มันถูกเขียนใน c ++ และรันโปรแกรมทดสอบอย่างสมบูรณ์ เราได้ดำเนินการ 90% ของรหัส One Byte Op และการแบ่งส่วนพื้นฐาน (บางส่วนถูกปิดใช้งานเนื่องจากไม่สามารถใช้งานได้กับโปรแกรมทดสอบ)

โปรแกรมเขียนถึง: http://davecarruth.com/index.php/2012/04/15/creating-an-8086-emulator

คุณสามารถค้นหารหัสในไฟล์ซิปที่ส่วนท้ายของโพสต์บล็อก

โปรแกรมทดสอบภาพหน้าจอ: ป้อนคำอธิบายรูปภาพที่นี่

การดำเนินการนี้ใช้เวลาสักครู่ ... หากคุณมีคำถามหรือความคิดเห็นใด ๆ โปรดส่งข้อความถึงฉัน มันเป็นแบบฝึกหัดที่ยอดเยี่ยมในการเขียนโปรแกรมพันธมิตร


3
เป็นเรื่องที่ดีเสมอเมื่อผู้คนสนุกกับความท้าทายนี้ :) บันทึกย่อสองสามรายการโปรแกรมทดสอบของฉันควรใช้งานได้ (และผ่านการทดสอบ) โดยไม่มีการแบ่งเซ็กเมนต์ทั้งหมด ดูรหัสของคุณฉันสังเกตว่าret immคำสั่งนั้นผิด (ดูที่นี่ ) และคุณพลาด0xffกลุ่ม ฉันชอบข้อความแสดงข้อผิดพลาดของคุณว่า: โยน "ค่าในทันทีไม่สามารถเก็บค่าได้, ชะลอ";
คัดลอก

เรามีสองประเด็นหลักเกี่ยวกับโปรแกรมทดสอบ: 1) การแบ่งกลุ่ม - เมื่อมีการโทรเราผลัก CS ในกองซ้อน ... หนึ่งในฟังก์ชั่นในโปรแกรมทดสอบไม่ชอบสิ่งนี้ 2) โปรแกรมทดสอบคาดว่าหน่วยความจำของเราจะเริ่มต้นเป็นศูนย์ อย่างไรก็ตามพวกเราสนุกมากขอบคุณมากสำหรับการโพสต์!
Dave C

คุณอาจทำผิดพลาดที่นั่น: ใกล้การกระโดด ( 0xE8 ) อย่าผลักดันการcsลงทะเบียน
คัดลอก

นั่นจะเป็นปัญหาจับได้ดี! ดูเหมือนว่าคุณจะมีประสบการณ์มากกับรุ่น 8086 คุณได้ตั้งโปรแกรมไว้หรือไม่?
เดฟ C

1
จริงๆแล้วฉันกำลังทำงานเกี่ยวกับโครงการตัวเลียนแบบ x86 ด้วยตัวเอง มันทำงานได้ดีมากและตอนนี้ฉันทำงานบนการรองรับ 32 บิตเต็มแล้ว ไม่ได้โพสต์ที่นี่เพราะอาจไม่ยุติธรรมกับผู้โพสต์คนอื่น (และซอร์สโค้ดสับสนเล็กน้อย)
คัดลอก

28

C

ความท้าทายที่ยิ่งใหญ่และเป็นครั้งแรกของฉัน ฉันสร้างบัญชีเพียงเพราะความท้าทายทำให้ฉันทึ่งมาก ข้อเสียคือฉันไม่สามารถหยุดคิดเกี่ยวกับความท้าทายเมื่อฉันมีจริงจ่ายเงินทำงานเขียนโปรแกรมที่จะทำ

ฉันรู้สึกว่าถูกบังคับให้ทำงานการจำลอง 8086 เสร็จสมบูรณ์ แต่นั่นเป็นความท้าทายอีกอย่างหนึ่ง ;-)

รหัสถูกเขียนใน ANSI-C ดังนั้นเพียงแค่รวบรวม / เชื่อมโยงไฟล์. c เข้าด้วยกันผ่านใน codegolf binary และไป

ซิปแหล่งที่มา

ป้อนคำอธิบายรูปภาพที่นี่


เป็นงานที่ดี RichTX!
Dave C

ขอบคุณเดฟ คุณก็ด้วย. ฉันไม่เข้าใจความคาดหวังของการทำโค้ดให้เล็กที่สุดเท่าที่จะเป็นไปได้เมื่อเริ่มต้น แต่มันก็ยังเป็นสิ่งที่ท้าทาย
RichTX

+1 ฉันดูรหัสของคุณเพื่อดูว่าการตั้งค่าสถานะการพกพานั้นทำงานอย่างไร
luser droog

ลิงค์ไม่ทำงานสำหรับฉัน
Tyilo

25

C ++ 1,064 บรรทัด

โครงการที่ยอดเยี่ยม ฉันใช้Intellivision emulator เป็นเวลาหลายปีที่ผ่านมาดังนั้นมันจึงเป็นเรื่องที่ดีมากที่จะได้เกร็งกล้ามเนื้อการกัดของฉันอีกครั้ง

หลังจากทำงานประมาณหนึ่งสัปดาห์ฉันคงไม่ตื่นเต้นไปกว่านี้เมื่อมันเกิดขึ้น:

.........
╤╤╤╤╤╤╤╤╤╤╤╤╤╤
? 0123456789:; @ ABCDEFGHIJKLMNOPQRSTUVWXYZ [\] ^ _ `ABCDEFGHIJKLMNOPQRSTUVWXYZ {|} ~


################################################## ##############################
################################################## ######################
    0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0 0

    0 1 4 9 ♠ a ♣ b ♠ cd ♦ f ☺h `§☺b, ♦ d E f` ♠ i ↓♣ b 8 ♠ e Y h ↑♦ b = ☺f '

    2 3 4 5 6 7 8 9 a ☺a☻a♥ a ♦ a ♣ a ♠ a aa ab ☺b☻b♥ b ♦ b b b ♠ b ♠ b bb b
 c ☺c☻c♥ c ♦ c ♣ c ♠ c cc cd ☺d♥d♥ d ♦ d ♣ d ♠ d dd d dee ☻e♥ e ♦ e ♦ e
 ee ef ☺f☻f♥ f ♦ f ♣ f ♠ f ff fg ☺g☻g♥ g ♥ g ♦ g ♣ g ♠ gggh ☺h☻h♥
h ♦ h ♣ h ♠ h hh สวัสดี☺i☻i♥ฉัน♦ฉัน♣ฉัน♠ฉัน ii ฉัน ii ฉัน `

การดีบั๊กเล็กน้อยในภายหลังและ ... SHAZAM! ป้อนคำอธิบายรูปภาพที่นี่

นอกจากนี้ฉันได้สร้างโปรแกรมทดสอบต้นฉบับขึ้นมาใหม่โดยไม่มีส่วนขยาย 80386 เนื่องจากฉันต้องการสร้างโปรแกรมจำลองของฉันที่แท้จริงสำหรับ 8086 และไม่เหลวไหลในคำแนะนำพิเศษใด ๆ เชื่อมโยงโดยตรงกับรหัสที่นี่: ไฟล์ซิป

ตกลงฉันสนุกกับมันมากเกินไป ฉันจัดการหน่วยความจำและการจัดการหน้าจอและตอนนี้หน้าจอจะอัปเดตเมื่อบัฟเฟอร์หน้าจอถูกเขียนไป ฉันทำวิดีโอ :)

http://www.youtube.com/watch?v=qnAssaTpmnA

อัปเดต: มีการส่งกลุ่มแรกผ่านไปมีการใช้งานคำแนะนำน้อยมาก แต่ฉันทดสอบด้วยการย้าย CS / DS และ SS ไปรอบ ๆ และทุกอย่างยังทำงานได้ดี

นอกจากนี้ยังเพิ่มการจัดการขัดจังหวะขั้นพื้นฐาน พื้นฐานมาก แต่ฉันใช้ int 21 ชม. เพื่อพิมพ์สตริง เพิ่มสองสามบรรทัดในแหล่งทดสอบและอัปโหลดเช่นกัน

start:
    sti
    mov ah, 9
    mov dx, joetext
    int 21h
...

joetext:
    db 'This was printed by int 21h$', 0

ป้อนคำอธิบายรูปภาพที่นี่

หากใครมีรหัสการประกอบที่ค่อนข้างง่ายที่จะทดสอบเซกเมนต์ออกฉันชอบที่จะเล่นกับมัน

ฉันพยายามที่จะคิดออกว่าฉันต้องการที่จะใช้ การจำลอง CPU แบบเต็ม? โหมด VGA? ตอนนี้ฉันกำลังเขียน DOSBox

12/6: ลองดูโหมด VGA!

ป้อนคำอธิบายรูปภาพที่นี่


โอกาสใดที่คุณสามารถโพสต์รหัสของคุณบนเว็บไซต์ฟรีที่ไม่ต้องลงทะเบียน? ขอบคุณ
เดฟ C

ฉันไม่ทราบว่าจำเป็นต้องมีการลงทะเบียน ขอโทษสำหรับเรื่องนั้น! ฉันจะพยายามทำมันเมื่อฉันกลับถึงบ้านคืนนี้
JoeFish

@DaveC ตรวจสอบการแก้ไขล่าสุด
JoeFish

ฉันสงสัยว่ามีพอร์ตอูฐก่อนหน้านี้หรือไม่ ที่จะทดสอบกลุ่ม
luser droog

ที่น่ากลัว! +1 อีกครั้ง ครับมีเป็นพอร์ต 8086 อูฐมาbradrodriguez.com/papers/index.html
luser droog

25

C ++ - 4455 บรรทัด

และไม่ฉันไม่เพียงทำตามข้อกำหนดของคำถาม ฉันทำทั้ง 8086 ซึ่งรวมถึง opcodes ที่รู้จักมาก่อน 16 รายการ ลงทะเบียนใหม่ช่วยในการหา opcodes เหล่านั้นออกมา

https://github.com/Alegend45/IBM5150


ไฟล์ 4455-line อยู่ที่ไหน? โอ้ฉันพบแล้ว #include "cpu.h"ยากที่จะเห็น
luser droog

2
(w) คำสั่งสวิตช์ศักดิ์สิทธิ์!
luser droog

ใช่มันกำลังจะแย่ลงเช่นกันเนื่องจากฉันกำลังจะรวมการสนับสนุน NEC V20 ด้วย
Darius Goad

ฉันดูบล็อกของการลงทะเบียนใหม่ ไม่พบอะไรเกี่ยวกับรหัสพิเศษเหล่านี้ ออนไลน์หรือเปล่า
luser droog

1
เขาไม่ได้อัปเดตบล็อกของเขาในขณะที่ แม้ว่าเขาจะอยู่ที่ # ibm5150 บน EFNET ดังนั้นคุณสามารถถามเขาที่นั่นได้
Darius Goad

20

Javascript - 4,404 บรรทัด

ฉันสะดุดกับโพสต์นี้เมื่อค้นคว้าข้อมูลเพื่อจำลองของฉันเอง โพสต์ Codegolf นี้เป็นประโยชน์อย่างยิ่งสำหรับฉัน ตัวอย่างโปรแกรมและแอสเซมบลีที่เกี่ยวข้องทำให้สามารถดีบักและดูว่าเกิดอะไรขึ้นได้อย่างง่ายดาย

ขอขอบคุณ!!!

และนี่คืออีมูเลเตอร์ Javascript 8086 เวอร์ชันแรกของฉัน

เสร็จสิ้นการวิ่ง

คุณสมบัติ:

  • opcodes ที่จำเป็นทั้งหมดสำหรับความท้าทายนี้รวมถึงบริการพิเศษบางอย่างที่คล้ายคลึงกันมากพอที่จะเขียนโค้ดได้ง่าย
  • โหมดข้อความที่ใช้งานได้บางส่วน (80x25) วิดีโอ (ยังไม่มีการขัดจังหวะ)
  • ฟังก์ชั่นสแต็ค
  • หน่วยความจำพื้นฐาน (ไม่แบ่งกลุ่ม)
  • การดีบักที่ดีพอสมควร (ต้องมีสิ่งนี้)
  • การตั้งค่าแบบอักษรของรหัสหน้า 437 โหลดแบบไดนามิกจากการแสดงบิตแมป

การสาธิต

ฉันมีการสาธิตออนไลน์อย่าลังเลที่จะเล่นกับมันและแจ้งให้เราทราบหากคุณพบข้อบกพร่อง :)

http://js86emu.chadrempp.com/

เพื่อเรียกใช้โปรแกรม codegolf

1) คลิกที่ปุ่มการตั้งค่า

ป้อนคำอธิบายรูปภาพที่นี่

2) จากนั้นคลิกโหลด (คุณสามารถเล่นกับตัวเลือกการดีบักที่นี่เช่นการก้าวผ่านโปรแกรม) โปรแกรม codegolf เป็นโปรแกรมเดียวที่มีอยู่ในขณะนี้ฉันกำลังทำงานเพื่อรับออนไลน์มากขึ้น

ป้อนคำอธิบายรูปภาพที่นี่

แหล่ง

แหล่งที่มาเต็มรูปแบบที่นี่ https://github.com/crempp/js86emu

ฉันพยายามวางความกล้าหาญของการเลียนแบบ 8086 ที่นี่ (ตามที่แนะนำโดยลูกบิดประตู) แต่มันเกินขีด จำกัด อักขระ ("ร่างกาย จำกัด เพียง 30,000 ตัวอักษร; คุณป้อน 158,272")

นี่คือลิงค์ด่วนของรหัสที่ฉันจะวางที่นี่ - https://github.com/crempp/js86emu/blob/39dbcb7106a0aaf59e003cd003f722acb4b6923d87/src/js/emu/cpus/8086.js

*Edit - updated for new demo and repo location


ว้าววิเศษจริงๆ! อย่างไรก็ตามจะเป็นการดีถ้ารหัสอยู่ในโพสต์ของคุณเองเนื่องจากเราต้องการให้โพสต์ของเรามีอยู่ในตัวเอง
Doorknob

@ Doorknob ฉันไม่แน่ใจว่าฉันเข้าใจ คุณต้องการให้ฉันโพสต์ 4,400 บรรทัดของรหัสแบบอินไลน์ในการโพสต์?
crempp

อืมม ... ผมไม่ทราบว่ามันเป็นที่ยาว มีความยาวไม่เกินจำนวนอักขระสูงสุดหรือไม่ ถ้าเป็นเช่นนั้นใช่มันจะดีถ้าโพสต์ของคุณอยู่ในตัวเอง ขอบคุณ! :-)
Doorknob

13

ชวา

ฉันต้องการท้าทายนี้มานานและในที่สุดฉันก็ใช้เวลาทำเช่นนั้น มันเป็นประสบการณ์ที่วิเศษมากและฉันก็ภูมิใจที่ได้ประกาศว่าฉันได้ทำมันจนสำเร็จแล้ว

ทดสอบผลลัพธ์ของโปรแกรม

แหล่ง

รหัสที่มาสามารถใช้ได้บน GitHub ที่NeatMonster / Intel8086 ฉันได้พยายามเอกสารทุกอย่างสวยมากด้วยความช่วยเหลือของฮอลลีManual 8086 ผู้ใช้ของครอบครัว

ฉันตั้งใจที่จะติดตั้ง opcodes และฟีเจอร์ที่หายไปทั้งหมดดังนั้นคุณอาจต้องการตรวจสอบการเปิดตัว 1.0สำหรับรุ่นที่มีเฉพาะรุ่นที่จำเป็นสำหรับความท้าทายนี้

ขอบคุณมากที่ @copy!


13

Common Lisp - 580 loc (442 w / o บรรทัดว่างและข้อคิดเห็น)

ฉันใช้ความท้าทายนี้เป็นข้ออ้างในการเรียนรู้ Common LISP นี่คือผลลัพธ์:

;;; Program settings

(defparameter *disasm* nil "Whether to disassemble")

(defmacro disasm-instr (on-disasm &body body)
  `(if *disasm*
       ,on-disasm
       (progn ,@body)))

;;; State variables

(defparameter *ram* (make-array (* 64 1024) :initial-element 0 :element-type '(unsigned-byte 8)) "Primary segment")
(defparameter *stack* (make-array (* 64 1024) :initial-element 0 :element-type '(unsigned-byte 8)) "Stack segment")
(defparameter *flags* '(:cf 0 :sf 0 :zf 0) "Flags")
(defparameter *registers* '(:ax 0 :bx 0 :cx 0 :dx 0 :bp 0 :sp #x100 :si 0 :di 0) "Registers")
(defparameter *ip* 0 "Instruction pointer")
(defparameter *has-carried* nil "Whether the last wraparound changed the value")
(defparameter *advance* 0 "Bytes to advance IP by after an operation")

;;; Constants

(defconstant +byte-register-to-word+ '(:al (:ax nil) :ah (:ax t) :bl (:bx nil) :bh (:bx t) :cl (:cx nil) :ch (:cx t) :dl (:dx nil) :dh (:dx t)) "Mapping from byte registers to word registers")
(defconstant +bits-to-register+ '(:ax :cx :dx :bx :sp :bp :si :di) "Mapping from index to word register")
(defconstant +bits-to-byte-register+ '(:al :cl :dl :bl :ah :ch :dh :bh) "Mapping from index to byte register")

;;; Constant mappings

(defun bits->word-reg (bits)
  (elt +bits-to-register+ bits))

(defun bits->byte-reg (bits)
  (elt +bits-to-byte-register+ bits))

(defun address-for-r/m (mod-bits r/m-bits)
  (disasm-instr
      (if (and (= mod-bits #b00) (= r/m-bits #b110))
      (list :disp (peek-at-word))
      (case r/m-bits
        (#b000 (list :base :bx :index :si))
        (#b001 (list :base :bx :index :di))
        (#b010 (list :base :bp :index :si))
        (#b011 (list :base :bp :index :di))
        (#b100 (list :index :si))
        (#b101 (list :index :di))
        (#b110 (list :base :bp))
        (#b111 (list :base :bx))))
    (if (and (= mod-bits #b00) (= r/m-bits #b110))
    (peek-at-word)
    (case r/m-bits
      (#b000 (+ (register :bx) (register :si)))
      (#b001 (+ (register :bx) (register :di)))
      (#b010 (+ (register :bp) (register :si)))
      (#b011 (+ (register :bp) (register :di)))
      (#b100 (register :si))
      (#b101 (register :di))
      (#b110 (register :bp))
      (#b111 (register :bx))))))

;;; Convenience functions

(defun reverse-little-endian (low high)
  "Reverse a little-endian number."
  (+ low (ash high 8)))

(defun negative-p (value is-word)
  (or (if is-word (>= value #x8000) (>= value #x80)) (< value 0)))

(defun twos-complement (value is-word)
  (if (negative-p value is-word)
      (- (1+ (logxor value (if is-word #xffff #xff))))
      value))

(defun wrap-carry (value is-word)
  "Wrap around an carried value."
  (let ((carry (if is-word (>= value #x10000) (>= value #x100))))
    (setf *has-carried* carry)
    (if carry
    (if is-word (mod value #x10000) (mod value #x100))
    value)))

;;; setf-able locations

(defun register (reg)
  (disasm-instr reg
    (getf *registers* reg)))

(defun set-reg (reg value)
  (setf (getf *registers* reg) (wrap-carry value t)))

(defsetf register set-reg)

(defun byte-register (reg)
  (disasm-instr reg
    (let* ((register-to-word (getf +byte-register-to-word+ reg)) (word (first register-to-word)))
      (if (second register-to-word)
      (ash (register word) -8)
      (logand (register word) #x00ff)))))

(defun set-byte-reg (reg value)
  (let* ((register-to-word (getf +byte-register-to-word+ reg)) (word (first register-to-word)) (wrapped-value (wrap-carry value nil)))
    (if (second register-to-word)
    (setf (register word) (+ (ash wrapped-value 8) (logand (register word) #x00ff)))
    (setf (register word) (+ wrapped-value (logand (register word) #xff00))))))

(defsetf byte-register set-byte-reg)

(defun flag (name)
  (getf *flags* name))

(defun set-flag (name value)
  (setf (getf *flags* name) value))

(defsetf flag set-flag)

(defun flag-p (name)
  (= (flag name) 1))

(defun set-flag-p (name is-set)
  (setf (flag name) (if is-set 1 0)))

(defsetf flag-p set-flag-p)

(defun byte-in-ram (location segment)
  "Read a byte from a RAM segment."
  (elt segment location))

(defsetf byte-in-ram (location segment) (value)
  "Write a byte to a RAM segment."
  `(setf (elt ,segment ,location) ,value))

(defun word-in-ram (location segment)
  "Read a word from a RAM segment."
  (reverse-little-endian (elt segment location) (elt segment (1+ location))))

(defsetf word-in-ram (location segment) (value)
  "Write a word to a RAM segment."
  `(progn
     (setf (elt ,segment ,location) (logand ,value #x00ff))
     (setf (elt ,segment (1+ ,location)) (ash (logand ,value #xff00) -8))))

(defun indirect-address (mod-bits r/m-bits is-word)
  "Read from an indirect address."
  (disasm-instr
      (if (= mod-bits #b11) (register (if is-word (bits->word-reg r/m-bits) (bits->byte-reg r/m-bits)))
      (let ((base-index (address-for-r/m mod-bits r/m-bits)))
        (unless (getf base-index :disp)
          (setf (getf base-index :disp)
            (case mod-bits
              (#b00 0)
              (#b01 (next-instruction))
              (#b10 (next-word)))))
        base-index))
    (let ((address-base (address-for-r/m mod-bits r/m-bits)))
      (case mod-bits
    (#b00 (if is-word (word-in-ram address-base *ram*) (byte-in-ram address-base *ram*)))
    (#b01 (if is-word (word-in-ram (+ address-base (peek-at-instruction)) *ram*) (byte-in-ram (+ address-base (peek-at-instruction)) *ram*)))
    (#b10 (if is-word (word-in-ram (+ address-base (peek-at-word)) *ram*) (byte-in-ram (+ address-base (peek-at-word)) *ram*)))
    (#b11 (if is-word (register (bits->word-reg r/m-bits)) (byte-register (bits->byte-reg r/m-bits))))))))

(defsetf indirect-address (mod-bits r/m-bits is-word) (value)
  "Write to an indirect address."
  `(let ((address-base (address-for-r/m ,mod-bits ,r/m-bits)))
    (case ,mod-bits
      (#b00 (if ,is-word (setf (word-in-ram address-base *ram*) ,value) (setf (byte-in-ram address-base *ram*) ,value)))
      (#b01 (if ,is-word (setf (word-in-ram (+ address-base (peek-at-instruction)) *ram*) ,value) (setf (byte-in-ram (+ address-base (peek-at-instruction)) *ram*) ,value)))
      (#b10 (if ,is-word (setf (word-in-ram (+ address-base (peek-at-word)) *ram*) ,value) (setf (byte-in-ram (+ address-base (peek-at-word)) *ram*) ,value)))
      (#b11 (if ,is-word (setf (register (bits->word-reg ,r/m-bits)) ,value) (setf (byte-register (bits->byte-reg ,r/m-bits)) ,value))))))

;;; Instruction loader

(defun load-instructions-into-ram (instrs)
  (setf *ip* 0)
  (setf (subseq *ram* 0 #x7fff) instrs)
  (length instrs))

(defun next-instruction ()
  (incf *ip*)
  (elt *ram* (1- *ip*)))

(defun next-word ()
  (reverse-little-endian (next-instruction) (next-instruction)))

(defun peek-at-instruction (&optional (forward 0))
  (incf *advance*)
  (elt *ram* (+ *ip* forward)))

(defun peek-at-word ()
  (reverse-little-endian (peek-at-instruction) (peek-at-instruction 1)))

(defun advance-ip ()
  (incf *ip* *advance*)
  (setf *advance* 0))

(defun advance-ip-ahead-of-indirect-address (mod-bits r/m-bits)
  (cond
    ((or (and (= mod-bits #b00) (= r/m-bits #b110)) (= mod-bits #b10)) 2)
    ((= mod-bits #b01) 1)
    (t 0)))

(defun next-instruction-ahead-of-indirect-address (mod-bits r/m-bits)
  (let ((*ip* *ip*))
    (incf *ip* (advance-ip-ahead-of-indirect-address mod-bits r/m-bits))
    (incf *advance*)
    (next-instruction)))

(defun next-word-ahead-of-indirect-address (mod-bits r/m-bits)
  (let ((*ip* *ip*))
    (incf *ip* (advance-ip-ahead-of-indirect-address mod-bits r/m-bits))
    (incf *advance* 2)
    (next-word)))

;;; Memory access

(defun read-word-from-ram (loc &optional (segment *ram*))
  (word-in-ram loc segment))

(defun write-word-to-ram (loc word &optional (segment *ram*))
  (setf (word-in-ram loc segment) word))

(defun push-to-stack (value)
  (decf (register :sp) 2)
  (write-word-to-ram (register :sp) value *stack*))

(defun pop-from-stack ()
  (incf (register :sp) 2)
  (read-word-from-ram (- (register :sp) 2) *stack*))

;;; Flag effects

(defun set-cf-on-add (value)
  (setf (flag-p :cf) *has-carried*)
  value)

(defun set-cf-on-sub (value1 value2)
  (setf (flag-p :cf) (> value2 value1))
  (- value1 value2))

(defun set-sf-on-op (value is-word)
  (setf (flag-p :sf) (negative-p value is-word))
  value)

(defun set-zf-on-op (value)
  (setf (flag-p :zf) (= value 0))
  value)

;;; Operations

;; Context wrappers

(defun with-one-byte-opcode-register (opcode fn)
  (let ((reg (bits->word-reg (mod opcode #x08))))
    (funcall fn reg)))

(defmacro with-mod-r/m-byte (&body body)
  `(let* ((mod-r/m (next-instruction)) (r/m-bits (logand mod-r/m #b00000111)) (mod-bits (ash (logand mod-r/m #b11000000) -6)) (reg-bits (ash (logand mod-r/m #b00111000) -3)))
     ,@body))

(defmacro with-in-place-mod (dest mod-bits r/m-bits &body body)
  `(progn
     ,@body
     (when (equal (car ',dest) 'indirect-address)
       (decf *advance* (advance-ip-ahead-of-indirect-address ,mod-bits ,r/m-bits)))))

;; Templates

(defmacro mov (src dest)
  `(disasm-instr (list "mov" :src ,src :dest ,dest)
     (setf ,dest ,src)))

(defmacro xchg (op1 op2)
  `(disasm-instr (list "xchg" :op1 ,op1 :op2 ,op2)
     (rotatef ,op1 ,op2)))

(defmacro inc (op1 is-word)
  `(disasm-instr (list "inc" :op1 ,op1)
     (set-sf-on-op (set-zf-on-op (incf ,op1)) ,is-word)))

(defmacro dec (op1 is-word)
  `(disasm-instr (list "dec" :op1 ,op1)
     (set-sf-on-op (set-zf-on-op (decf ,op1)) ,is-word)))

;; Group handling

(defmacro parse-group-byte-pair (opcode operation mod-bits r/m-bits)
  `(,operation ,mod-bits ,r/m-bits (oddp ,opcode)))

(defmacro parse-group-opcode (&body body)
  `(with-mod-r/m-byte
     (case reg-bits
       ,@body)))

;; One-byte opcodes on registers

(defun clear-carry-flag ()
  (disasm-instr '("clc")
    (setf (flag-p :cf) nil)))

(defun set-carry-flag ()
  (disasm-instr '("stc")
    (setf (flag-p :cf) t)))

(defun push-register (reg)
  (disasm-instr (list "push" :src reg)
    (push-to-stack (register reg))))

(defun pop-to-register (reg)
  (disasm-instr (list "pop" :dest reg)
    (setf (register reg) (pop-from-stack))))

(defun inc-register (reg)
  (inc (register reg) t))

(defun dec-register (reg)
  (dec (register reg) t))

(defun xchg-register (reg)
  (disasm-instr (if (eql reg :ax) '("nop") (list "xchg" :op1 :ax :op2 reg))
    (xchg (register :ax) (register reg))))

(defun mov-byte-to-register (opcode)
  (let ((reg (bits->byte-reg (mod opcode #x08))))
    (mov (next-instruction) (byte-register reg))))

(defun mov-word-to-register (reg)
  (mov (next-word) (register reg)))

;; Flow control

(defun jmp-short ()
  (disasm-instr (list "jmp" :op1 (twos-complement (next-instruction) nil))
    (incf *ip* (twos-complement (next-instruction) nil))))

(defmacro jmp-short-conditionally (opcode condition mnemonic)
  `(let ((disp (next-instruction)))
     (if (evenp ,opcode)
       (disasm-instr (list (concatenate 'string "j" ,mnemonic) :op1 (twos-complement disp nil))
     (when ,condition
       (incf *ip* (twos-complement disp nil))))
       (disasm-instr (list (concatenate 'string "jn" ,mnemonic) :op1 (twos-complement disp nil))
     (unless ,condition
       (incf *ip* (twos-complement disp nil)))))))

(defun call-near ()
  (disasm-instr (list "call" :op1 (twos-complement (next-word) t))
    (push-to-stack (+ *ip* 2))
    (incf *ip* (twos-complement (next-word) t))))

(defun ret-from-call ()
  (disasm-instr '("ret")
    (setf *ip* (pop-from-stack))))

;; ALU

(defmacro parse-alu-opcode (opcode operation)
  `(let ((mod-8 (mod ,opcode 8)))
     (case mod-8
       (0
    (with-mod-r/m-byte
      (,operation (byte-register (bits->byte-reg reg-bits)) (indirect-address mod-bits r/m-bits nil) nil mod-bits r/m-bits)))
       (1
    (with-mod-r/m-byte
      (,operation (register (bits->word-reg reg-bits)) (indirect-address mod-bits r/m-bits t) t mod-bits r/m-bits)))
       (2
    (with-mod-r/m-byte
      (,operation (indirect-address mod-bits r/m-bits nil) (byte-register (bits->byte-reg reg-bits)) nil)))
       (3
    (with-mod-r/m-byte
      (,operation (indirect-address mod-bits r/m-bits t) (register (bits->word-reg reg-bits)) t)))
       (4
    (,operation (next-instruction) (byte-register :al) nil))
       (5
    (,operation (next-word) (register :ax) t)))))

(defmacro add-without-carry (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "add" :src ,src :dest ,dest)
     (with-in-place-mod ,dest ,mod-bits ,r/m-bits
       (set-zf-on-op (set-sf-on-op (set-cf-on-add (incf ,dest ,src)) ,is-word)))))

(defmacro add-with-carry (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "adc" :src ,src :dest ,dest)
     (with-in-place-mod ,dest ,mod-bits ,r/m-bits
       (set-zf-on-op (set-sf-on-op (set-cf-on-add (incf ,dest (+ ,src (flag :cf)))) ,is-word)))))

(defmacro sub-without-borrow (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "sub" :src ,src :dest ,dest)
     (with-in-place-mod ,dest ,mod-bits ,r/m-bits
       (let ((src-value ,src))
     (set-zf-on-op (set-sf-on-op (set-cf-on-sub (+ (decf ,dest src-value) src-value) src-value) ,is-word))))))

(defmacro sub-with-borrow (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "sbb" :src ,src :dest ,dest)
     (with-in-place-mod ,dest ,mod-bits ,r/m-bits
       (let ((src-plus-cf (+ ,src (flag :cf))))
     (set-zf-on-op (set-sf-on-op (set-cf-on-sub (+ (decf ,dest src-plus-cf) src-plus-cf) src-plus-cf) ,is-word))))))

(defmacro cmp-operation (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "cmp" :src ,src :dest ,dest)
     (set-zf-on-op (set-sf-on-op (set-cf-on-sub ,dest ,src) ,is-word))))

(defmacro and-operation (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "and" :src ,src :dest ,dest)
     (with-in-place-mod ,dest ,mod-bits ,r/m-bits
       (set-zf-on-op (set-sf-on-op (setf ,dest (logand ,src ,dest)) ,is-word))
       (setf (flag-p :cf) nil))))

(defmacro or-operation (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "or" :src ,src :dest ,dest)
     (with-in-place-mod ,dest ,mod-bits ,r/m-bits
       (set-zf-on-op (set-sf-on-op (setf ,dest (logior ,src ,dest)) ,is-word))
       (setf (flag-p :cf) nil))))

(defmacro xor-operation (src dest is-word &optional mod-bits r/m-bits)
  `(disasm-instr (list "xor" :src ,src :dest ,dest)
     (with-in-place-mod ,dest ,mod-bits ,r/m-bits
       (set-zf-on-op (set-sf-on-op (setf ,dest (logxor ,src ,dest)) ,is-word))
       (setf (flag-p :cf) nil))))

(defmacro parse-group1-byte (opcode operation mod-bits r/m-bits)
  `(case (mod ,opcode 4)
    (0 (,operation (next-instruction-ahead-of-indirect-address ,mod-bits ,r/m-bits) (indirect-address ,mod-bits ,r/m-bits nil) nil mod-bits r/m-bits))
    (1 (,operation (next-word-ahead-of-indirect-address ,mod-bits ,r/m-bits) (indirect-address ,mod-bits ,r/m-bits t) t mod-bits r/m-bits))
    (3 (,operation (twos-complement (next-instruction-ahead-of-indirect-address ,mod-bits ,r/m-bits) nil) (indirect-address ,mod-bits ,r/m-bits t) t mod-bits r/m-bits))))

(defmacro parse-group1-opcode (opcode)
  `(parse-group-opcode
     (0 (parse-group1-byte ,opcode add-without-carry mod-bits r/m-bits))
     (1 (parse-group1-byte ,opcode or-operation mod-bits r/m-bits))
     (2 (parse-group1-byte ,opcode add-with-carry mod-bits r/m-bits))
     (3 (parse-group1-byte ,opcode sub-with-borrow mod-bits r/m-bits))
     (4 (parse-group1-byte ,opcode and-operation mod-bits r/m-bits))
     (5 (parse-group1-byte ,opcode sub-without-borrow mod-bits r/m-bits))
     (6 (parse-group1-byte ,opcode xor-operation mod-bits r/m-bits))
     (7 (parse-group1-byte ,opcode cmp-operation mod-bits r/m-bits))))

;; Memory and register mov/xchg

(defun xchg-memory-register (opcode)
  (let ((is-word (oddp opcode)))
    (with-mod-r/m-byte
      (if is-word
      (xchg (register (bits->word-reg reg-bits)) (indirect-address mod-bits r/m-bits is-word))
      (xchg (byte-register (bits->byte-reg reg-bits)) (indirect-address mod-bits r/m-bits is-word))))))

(defmacro mov-immediate-to-memory (mod-bits r/m-bits is-word)
  `(if ,is-word
       (mov (next-word-ahead-of-indirect-address ,mod-bits ,r/m-bits) (indirect-address ,mod-bits ,r/m-bits t))
       (mov (next-instruction-ahead-of-indirect-address ,mod-bits ,r/m-bits) (indirect-address ,mod-bits ,r/m-bits nil))))

(defmacro parse-group11-opcode (opcode)
  `(parse-group-opcode
     (0 (parse-group-byte-pair ,opcode mov-immediate-to-memory mod-bits r/m-bits))))

(defmacro parse-mov-opcode (opcode)
  `(let ((mod-4 (mod ,opcode 4)))
     (with-mod-r/m-byte
       (case mod-4
     (0
      (mov (byte-register (bits->byte-reg reg-bits)) (indirect-address mod-bits r/m-bits nil)))
     (1
      (mov (register (bits->word-reg reg-bits)) (indirect-address mod-bits r/m-bits t)))
     (2
      (mov (indirect-address mod-bits r/m-bits nil) (byte-register (bits->byte-reg reg-bits))))
     (3
      (mov (indirect-address mod-bits r/m-bits t) (register (bits->word-reg reg-bits))))))))

;; Group 4/5 (inc/dec on EAs)

(defmacro inc-indirect (mod-bits r/m-bits is-word)
  `(inc (indirect-address ,mod-bits ,r/m-bits ,is-word) ,is-word))

(defmacro dec-indirect (mod-bits r/m-bits is-word)
  `(dec (indirect-address ,mod-bits ,r/m-bits ,is-word) ,is-word))

(defmacro parse-group4/5-opcode (opcode)
  `(parse-group-opcode
     (0 (parse-group-byte-pair ,opcode inc-indirect mod-bits r/m-bits))
     (1 (parse-group-byte-pair ,opcode dec-indirect mod-bits r/m-bits))))

;;; Opcode parsing

(defun in-paired-byte-block-p (opcode block)
  (= (truncate (/ opcode 2)) (/ block 2)))

(defun in-4-byte-block-p (opcode block)
  (= (truncate (/ opcode 4)) (/ block 4)))

(defun in-8-byte-block-p (opcode block)
  (= (truncate (/ opcode 8)) (/ block 8)))

(defun in-6-byte-block-p (opcode block)
  (and (= (truncate (/ opcode 8)) (/ block 8)) (< (mod opcode 8) 6)))

(defun parse-opcode (opcode)
  "Parse an opcode."
  (cond
    ((not opcode) (return-from parse-opcode nil))
    ((= opcode #xf4) (return-from parse-opcode '("hlt")))
    ((in-8-byte-block-p opcode #x40) (with-one-byte-opcode-register opcode #'inc-register))
    ((in-8-byte-block-p opcode #x48) (with-one-byte-opcode-register opcode #'dec-register))
    ((in-8-byte-block-p opcode #x50) (with-one-byte-opcode-register opcode #'push-register))
    ((in-8-byte-block-p opcode #x58) (with-one-byte-opcode-register opcode #'pop-to-register))
    ((in-8-byte-block-p opcode #x90) (with-one-byte-opcode-register opcode #'xchg-register))
    ((in-8-byte-block-p opcode #xb0) (mov-byte-to-register opcode))
    ((in-8-byte-block-p opcode #xb8) (with-one-byte-opcode-register opcode #'mov-word-to-register))
    ((= opcode #xf8) (clear-carry-flag))
    ((= opcode #xf9) (set-carry-flag))
    ((= opcode #xeb) (jmp-short))
    ((in-paired-byte-block-p opcode #x72) (jmp-short-conditionally opcode (flag-p :cf) "b"))
    ((in-paired-byte-block-p opcode #x74) (jmp-short-conditionally opcode (flag-p :zf) "z"))
    ((in-paired-byte-block-p opcode #x76) (jmp-short-conditionally opcode (or (flag-p :cf) (flag-p :zf)) "be"))
    ((in-paired-byte-block-p opcode #x78) (jmp-short-conditionally opcode (flag-p :sf) "s"))
    ((= opcode #xe8) (call-near))
    ((= opcode #xc3) (ret-from-call))
    ((in-6-byte-block-p opcode #x00) (parse-alu-opcode opcode add-without-carry))
    ((in-6-byte-block-p opcode #x08) (parse-alu-opcode opcode or-operation))
    ((in-6-byte-block-p opcode #x10) (parse-alu-opcode opcode add-with-carry))
    ((in-6-byte-block-p opcode #x18) (parse-alu-opcode opcode sub-with-borrow))
    ((in-6-byte-block-p opcode #x20) (parse-alu-opcode opcode and-operation))
    ((in-6-byte-block-p opcode #x28) (parse-alu-opcode opcode sub-without-borrow))
    ((in-6-byte-block-p opcode #x30) (parse-alu-opcode opcode xor-operation))
    ((in-6-byte-block-p opcode #x38) (parse-alu-opcode opcode cmp-operation))
    ((in-4-byte-block-p opcode #x80) (parse-group1-opcode opcode))
    ((in-4-byte-block-p opcode #x88) (parse-mov-opcode opcode))
    ((in-paired-byte-block-p opcode #x86) (xchg-memory-register opcode))
    ((in-paired-byte-block-p opcode #xc6) (parse-group11-opcode opcode))
    ((in-paired-byte-block-p opcode #xfe) (parse-group4/5-opcode opcode))))

;;; Main functions

(defun execute-instructions ()
  "Loop through loaded instructions."
  (loop
     for ret = (parse-opcode (next-instruction))
     until (equal ret '("hlt"))
     do (advance-ip)
     finally (return t)))

(defun disasm-instructions (instr-length)
  "Disassemble code."
  (loop
     for ret = (parse-opcode (next-instruction))
     collecting ret into disasm
     until (= *ip* instr-length)
     do (advance-ip)
     finally (return disasm)))

(defun loop-instructions (instr-length)
  (if *disasm*
      (disasm-instructions instr-length)
      (execute-instructions)))

(defun load-instructions-from-file (file)
  (with-open-file (in file :element-type '(unsigned-byte 8))
    (let ((instrs (make-array (file-length in) :element-type '(unsigned-byte 8) :initial-element 0 :adjustable t)))
      (read-sequence instrs in)
      instrs)))

(defun load-instructions (&key (file nil))
  (if file
      (load-instructions-from-file file)
      #()))

(defun print-video-ram (&key (width 80) (height 25) (stream t) (newline nil))
  (dotimes (line height)
    (dotimes (column width)
      (let ((char-at-cell (byte-in-ram (+ #x8000 (* line 80) column) *ram*)))
    (if (zerop char-at-cell)
        (format stream "~a" #\Space)
        (format stream "~a" (code-char char-at-cell)))))
    (if newline (format stream "~%"))))

(defun disasm (&key (file nil))
  (setf *disasm* t)
  (loop-instructions (load-instructions-into-ram (load-instructions :file file))))

(defun main (&key (file nil) (display nil) (stream t) (newline nil))
  (setf *disasm* nil)
  (loop-instructions (load-instructions-into-ram (load-instructions :file file)))
  (when display
    (print-video-ram :stream stream :newline newline)))

นี่คือผลลัพธ์ใน Emacs:

หน้าต่าง Emacs ที่มีสองบานหน้าต่างส่วนหนึ่งของแหล่งเสียงกระเพื่อมด้านซ้ายและเอาต์พุต REPL พร้อมเนื้อหาที่ต้องการทางด้านขวา

ฉันต้องการเน้นคุณสมบัติหลักสามอย่าง รหัสนี้จะทำให้การใช้งานหนักของแมโครเมื่อใช้คำแนะนำเช่นmov, xchgและการดำเนินงาน artithmetic แต่ละคำสั่งรวมถึงการdisasm-instrเรียกแมโคร สิ่งนี้ใช้การถอดแยกชิ้นส่วนพร้อมกับรหัสจริงโดยใช้ if บนชุดตัวแปรส่วนกลางที่รันไทม์ ฉันภูมิใจอย่างยิ่งกับวิธีการไม่เชื่อเรื่องปลายทางที่ใช้สำหรับการเขียนค่าลงทะเบียนและที่อยู่ทางอ้อม มาโครที่ใช้คำสั่งไม่สนใจปลายทางเนื่องจากแบบฟอร์มที่ต่อกันเพื่อความเป็นไปได้ทั้งสองจะทำงานกับsetfแมโคร Lisp ทั่วไป

รหัสสามารถพบได้ที่repo GitHub ของฉัน มองหาสาขา "codegolf" ตามที่ฉันได้เริ่มใช้คุณสมบัติอื่น ๆ ของ 8086 ในต้นแบบ ฉันได้ติดตั้งธงล้นและพาริตี้ไปแล้วพร้อมกับลงทะเบียน FLAGS

มีสามการดำเนินการในเรื่องนี้ไม่ได้อยู่ใน 8086, 0x82และ0x83รุ่นของผู้ประกอบการตรรกะ นี่มันสายเกินไปและมันค่อนข้างยุ่งที่จะลบการดำเนินการเหล่านั้น

ฉันอยากจะขอบคุณ @ja สำหรับเวอร์ชั่น Python ของเขาซึ่งเป็นแรงบันดาลใจให้ฉันในการลงทุนครั้งนี้


3
คำตอบแรกที่เหลือเชื่อ! ยินดีต้อนรับสู่เว็บไซต์ :)
DJMcMayhem

1
ตัวเลือกภาษาที่เจ๋งมาก!
คัดลอก

12

C - 319 348 บรรทัด

นี่เป็นการแปลโดยตรงของโปรแกรม Postscript ของฉันเป็น C มากขึ้นหรือน้อยลงแน่นอนว่าการใช้สแต็กจะถูกแทนที่ด้วยตัวแปรที่ชัดเจน เขตข้อมูลของคำสั่งแบ่งออกเป็นตัวแปรo- คำสั่ง opcode ไบต์d- ฟิลด์ทิศทางw- ฟิลด์ความกว้าง ถ้ามันเป็น "mod-reg-R / m" การเรียนการสอนที่MR-RMstruct rm rไบต์อ่านใน การถอดรหัสฟิลด์ reg และ r / m ดำเนินการในสองขั้นตอน: การคำนวณตัวชี้ไปยังข้อมูลและโหลดข้อมูลการใช้ตัวแปรเดียวกันซ้ำ ดังนั้นสำหรับสิ่งที่ชอบADD AX,BXก่อนอื่น x คือตัวชี้ไปที่ขวานและ y คือตัวชี้ไปที่ bx จากนั้น x คือเนื้อหา (ขวาน) และ y คือเนื้อหา (bx) จำเป็นต้องใช้การคัดเลือกจำนวนมากเพื่อนำตัวแปรกลับมาใช้ใหม่สำหรับประเภทต่างๆเช่นนี้

ไบต์ opcode ถูกถอดรหัสด้วยพอยน์เตอร์ของฟังก์ชัน แต่ละฟังก์ชั่นประกอบด้วยการใช้มาโครสำหรับชิ้นส่วนที่ใช้งานได้อีกครั้ง DWแมโครอยู่ในฟังก์ชั่น opcode และถอดรหัสdและwตัวแปรจากoไบต์ opcode RMPแมโครดำเนินการขั้นตอนแรกของการถอดรหัส "MR-RM" ไบต์และLDXYดำเนินการขั้นตอนที่สอง Opcodes ที่เก็บผลลัพธ์ใช้pตัวแปรเพื่อเก็บตัวชี้ไปยังตำแหน่งผลลัพธ์และzตัวแปรเพื่อเก็บค่าผลลัพธ์ แฟล็กจะถูกคำนวณหลังจากคำนวณzค่าแล้ว INCและDECการดำเนินงานบันทึกธงดำเนินการก่อนที่จะใช้ทั่วไปMATHFLAGSฟังก์ชั่น (เป็นส่วนหนึ่งของADDหรือSUB submacro) และกู้คืนมันในภายหลังเพื่อรักษา Carry

แก้ไข: แก้ไขข้อบกพร่อง!
แก้ไข: ขยายและแสดงความคิดเห็น เมื่อtrace==0ตอนนี้มันส่งออกคำสั่ง ANSI ย้ายไป -0,0 เมื่อทิ้งวิดีโอ ดังนั้นจึงควรจำลองการแสดงผลจริง ลบBIGENDIANสิ่งที่ไม่ได้ผลออกแล้ว มันอาศัยอยู่ในบางแห่งตามลำดับไบต์เล็ก ๆ แต่ฉันวางแผนที่จะแก้ไขในการแก้ไขครั้งต่อไป โดยพื้นฐานแล้วการเข้าถึงตัวชี้ทั้งหมดจะต้องผ่านget_และput_ฟังก์ชั่นที่ชัดเจน (de) เขียนไบต์ตามลำดับ LE

#include<ctype.h>
#include<stdint.h>
#include<stdio.h>
#include<stdlib.h>
#include<string.h>
#include<sys/stat.h>
#include<unistd.h>
#define P printf
#define R return
#define T typedef
T intptr_t I; T uintptr_t U;
T short S; T unsigned short US;
T signed char C; T unsigned char UC; T void V;  // to make everything shorter
U o,w,d,f; // opcode, width, direction, extra temp variable (was initially for a flag, hence 'f')
U x,y,z;   // left operand, right operand, result
void *p;   // location to receive result
UC halt,debug=0,trace=0,reg[28],null[2],mem[0xffff]={ // operating flags, register memory, RAM
    1, (3<<6),        // ADD ax,ax
    1, (3<<6)+(4<<3), // ADD ax,sp
    3, (3<<6)+(4<<3), // ADD sp,ax
    0xf4 //HLT
};

// register declaration and initialization
#define H(_)_(al)_(ah)_(cl)_(ch)_(dl)_(dh)_(bl)_(bh)
#define X(_)_(ax)     _(cx)     _(dx)     _(bx)     _(sp)_(bp)_(si)_(di)_(ip)_(fl)
#define SS(_)_(cs)_(ds)_(ss)_(es)
#define HD(_)UC*_;      // half-word regs declared as unsigned char *
#define XD(_)US*_;      // full-word regs declared as unsigned short *
#define HR(_)_=(UC*)(reg+i++);      // init and increment by one
#define XR(_)_=(US*)(reg+i);i+=2;   // init and increment by two
H(HD)X(XD)SS(XD)V init(){I i=0;H(HR)i=0;X(XR)SS(XR)}    // declare and initialize register pointers
enum { CF=1<<0, PF=1<<2, AF=1<<4, ZF=1<<6, SF=1<<7, OF=1<<11 };

#define HP(_)P(#_ ":%02x ",*_);     // dump a half-word reg as zero-padded hex
#define XP(_)P(#_ ":%04x ",*_);     // dump a full-word reg as zero-padded hex
V dump(){ //H(HP)P("\n");
    P("\n"); X(XP)
    if(trace)P("%s %s %s %s ",*fl&CF?"CA":"NC",*fl&OF?"OV":"NO",*fl&SF?"SN":"NS",*fl&ZF?"ZR":"NZ");
    P("\n");  // ^^^ crack flag bits into strings ^^^
}

// get and put into memory in a strictly little-endian format
I get_(void*p,U w){R w? *(UC*)p + (((UC*)p)[1]<<8) :*(UC*)p;}
V put_(void*p,U x,U w){ if(w){ *(UC*)p=x; ((UC*)p)[1]=x>>8; }else *(UC*)p=x; }
// get byte or word through ip, incrementing ip
UC fetchb(){ U x = get_(mem+(*ip)++,0); if(trace)P("%02x(%03o) ",x,x); R x; }
US fetchw(){I w=fetchb();R w|(fetchb()<<8);}

T struct rm{U mod,reg,r_m;}rm;      // the three fields of the mod-reg-r/m byte
rm mrm(U m){ R(rm){ (m>>6)&3, (m>>3)&7, m&7 }; }    // crack the mrm byte into fields
U decreg(U reg,U w){    // decode the reg field, yielding a uintptr_t to the register (byte or word)
    if (w)R (U)((US*[]){ax,cx,dx,bx,sp,bp,si,di}[reg]);
    else R (U)((UC*[]){al,cl,dl,bl,ah,ch,dh,bh}[reg]); }
U rs(US*x,US*y){ R get_(x,1)+get_(y,1); }  // fetch and sum two full-words
U decrm(rm r,U w){      // decode the r/m byte, yielding uintptr_t
    U x=(U[]){rs(bx,si),rs(bx,di),rs(bp,si),rs(bp,di),get_(si,1),get_(di,1),get_(bp,1),get_(bx,1)}[r.r_m];
    switch(r.mod){ case 0: if (r.r_m==6) R (U)(mem+fetchw()); break;
                   case 1: x+=fetchb(); break;
                   case 2: x+=fetchw(); break;
                   case 3: R decreg(r.r_m,w); }
    R (U)(mem+x); }

// opcode helpers
    // set d and w from o
#define DW  if(trace){ P("%s:\n",__func__); } \
            d=!!(o&2); \
            w=o&1;
    // fetch mrm byte and decode, setting x and y as pointers to args and p ptr to dest
#define RMP rm r=mrm(fetchb());\
            x=decreg(r.reg,w); \
            y=decrm(r,w); \
            if(trace>1){ P("x:%d\n",x); P("y:%d\n",y); } \
            p=d?(void*)x:(void*)y;

    // fetch x and y values from x and y pointers
#define LDXY \
            x=get_((void*)x,w); \
            y=get_((void*)y,w); \
            if(trace){ P("x:%d\n",x); P("y:%d\n",y); }

    // normal mrm decode and load
#define RM  RMP LDXY

    // immediate to accumulator
#define IA x=(U)(p=w?(UC*)ax:al); \
           x=get_((void*)x,w); \
           y=w?fetchw():fetchb();

    // flags set by logical operators
#define LOGFLAGS  *fl=0; \
                  *fl |= ( (z&(w?0x8000:0x80))           ?SF:0) \
                       | ( (z&(w?0xffff:0xff))==0        ?ZF:0) ;

    // additional flags set by math operators
#define MATHFLAGS *fl |= ( (z&(w?0xffff0000:0xff00))     ?CF:0) \
                       | ( ((z^x)&(z^y)&(w?0x8000:0x80)) ?OF:0) \
                       | ( ((x^y^z)&0x10)                ?AF:0) ;

    // store result to p ptr
#define RESULT \
        if(trace)P(w?"->%04x ":"->%02x ",z); \
        put_(p,z,w);

// operators, composed with helpers in the opcode table below
    // most of these macros will "enter" with x and y already loaded with operands
#define PUSH(x) put_(mem+(*sp-=2),*(x),1)
#define POP(x) *(x)=get_(mem+(*sp+=2)-2,1)
#define ADD z=x+y; LOGFLAGS MATHFLAGS RESULT
#define ADC x+=(*fl&CF); ADD
#define SUB z=d?x-y:y-x; LOGFLAGS MATHFLAGS RESULT
#define SBB d?y+=*fl&CF:(x+=*fl&CF); SUB
#define CMP p=null; SUB
#define AND z=x&y; LOGFLAGS RESULT
#define  OR z=x|y; LOGFLAGS RESULT
#define XOR z=x^y; LOGFLAGS RESULT
#define INC(r) w=1; d=1; p=(V*)r; x=(S)*r; y=1; f=*fl&CF; ADD *fl=(*fl&~CF)|f;
#define DEC(r) w=1; d=1; p=(V*)r; x=(S)*r; y=1; f=*fl&CF; SUB *fl=(*fl&~CF)|f;
#define F(f) !!(*fl&f)
#define J(c) U cf=F(CF),of=F(OF),sf=F(SF),zf=F(ZF); y=(S)(C)fetchb(); \
                  if(trace)P("<%d> ", c); \
                  if(c)*ip+=(S)y;
#define JN(c) J(!(c))
#define IMM(a,b) rm r=mrm(fetchb()); \
            p=(void*)(y=decrm(r,w)); \
            a \
            x=w?fetchw():fetchb(); \
            b \
            d=0; \
            y=get_((void*)y,w); \
            if(trace){ P("x:%d\n",x); P("y:%d\n",y); } \
            if(trace){ P("%s ", (C*[]){"ADD","OR","ADC","SBB","AND","SUB","XOR","CMP"}[r.reg]); } \
            switch(r.reg){case 0:ADD break; \
                          case 1:OR break; \
                          case 2:ADC break; \
                          case 3:SBB break; \
                          case 4:AND break; \
                          case 5:SUB break; \
                          case 6:XOR break; \
                          case 7:CMP break; }
#define IMMIS IMM(w=0;,w=1;x=(S)(C)x;)
#define TEST z=x&y; LOGFLAGS MATHFLAGS
#define XCHG f=x;z=y; LDXY if(w){*(US*)f=y;*(US*)z=x;}else{*(UC*)f=y;*(UC*)z=x;}
#define MOV z=d?y:x; RESULT
#define MOVSEG
#define LEA RMP z=((UC*)y)-mem; RESULT
#define NOP
#define AXCH(r) x=(U)ax; y=(U)(r); w=1; XCHG
#define CBW *ax=(S)(C)*al;
#define CWD z=(I)(S)*ax; *dx=z>>16;
#define CALL x=w?fetchw():(S)(C)fetchb(); PUSH(ip); (*ip)+=(S)x;
#define WAIT
#define PUSHF PUSH(fl)
#define POPF POP(fl)
#define SAHF x=*fl; y=*ah; x=(x&~0xff)|y; *fl=x;
#define LAHF *ah=(UC)*fl;
#define mMOV if(d){ x=get_(mem+fetchw(),w); if(w)*ax=x; else*al=x; } \
             else { put_(mem+fetchw(),w?*ax:*al,w); }
#define MOVS
#define CMPS
#define STOS
#define LODS
#define SCAS
#define iMOVb(r) (*r)=fetchb();
#define iMOVw(r) (*r)=fetchw();
#define RET(v) POP(ip); if(v)*sp+=v*2;
#define LES
#define LDS
#define iMOVm if(w){iMOVw((US*)y)}else{iMOVb((UC*)y)}
#define fRET(v) POP(cs); RET(v)
#define INT(v)
#define INT0
#define IRET
#define Shift rm r=mrm(fetchb());
#define AAM
#define AAD
#define XLAT
#define ESC(v)
#define LOOPNZ
#define LOOPZ
#define LOOP
#define JCXZ
#define IN
#define OUT
#define INv
#define OUTv
#define JMP x=fetchw(); *ip+=(S)x;
#define sJMP x=(S)(C)fetchb(); *ip+=(S)x;
#define FARJMP
#define LOCK
#define REP
#define REPZ
#define HLT halt=1
#define CMC *fl=(*fl&~CF)|((*fl&CF)^1);
#define NOT
#define NEG
#define MUL
#define IMUL
#define DIV
#define IDIV
#define Grp1 rm r=mrm(fetchb()); \
             y=decrm(r,w); \
             if(trace)P("%s ", (C*[]){}[r.reg]); \
             switch(r.reg){case 0: TEST; break; \
                           case 2: NOT; break; \
                           case 3: NEG; break; \
                           case 4: MUL; break; \
                           case 5: IMUL; break; \
                           case 6: DIV; break; \
                           case 7: IDIV; break; }
#define Grp2 rm r=mrm(fetchb()); \
             y=decrm(r,w); \
             if(trace)P("%s ", (C*[]){"INC","DEC","CALL","CALL","JMP","JMP","PUSH"}[r.reg]); \
             switch(r.reg){case 0: INC((S*)y); break; \
                           case 1: DEC((S*)y); break; \
                           case 2: CALL; break; \
                           case 3: CALL; break; \
                           case 4: *ip+=(S)y; break; \
                           case 5: JMP; break; \
                           case 6: PUSH((S*)y); break; }
#define CLC *fl=*fl&~CF;
#define STC *fl=*fl|CF;
#define CLI
#define STI
#define CLD
#define STD

// opcode table
// An x-macro table of pairs (a, b) where a becomes the name of a void function(void) which
// implements the opcode, and b comprises the body of the function (via further macro expansion)
#define OP(_)\
/*dw:bf                 wf                     bt                    wt   */ \
_(addbf, RM ADD)      _(addwf, RM ADD)       _(addbt,  RM ADD)     _(addwt, RM ADD)     /*00-03*/\
_(addbi, IA ADD)      _(addwi, IA ADD)       _(pushes, PUSH(es))   _(popes, POP(es))    /*04-07*/\
_(orbf,  RM OR)       _(orwf,  RM OR)        _(orbt,   RM OR)      _(orwt,  RM OR)      /*08-0b*/\
_(orbi,  IA OR)       _(orwi,  IA OR)        _(pushcs, PUSH(cs))   _(nop0,       )      /*0c-0f*/\
_(adcbf, RM ADC)      _(adcwf, RM ADC)       _(adcbt,  RM ADC)     _(adcwt, RM ADC)     /*10-13*/\
_(adcbi, IA ADC)      _(adcwi, IA ADC)       _(pushss, PUSH(ss))   _(popss, POP(ss))    /*14-17*/\
_(sbbbf, RM SBB)      _(sbbwf, RM SBB)       _(sbbbt,  RM SBB)     _(sbbwt, RM SBB)     /*18-1b*/\
_(sbbbi, IA SBB)      _(sbbwi, IA SBB)       _(pushds, PUSH(ds))   _(popds, POP(ds))    /*1c-1f*/\
_(andbf, RM AND)      _(andwf, RM AND)       _(andbt, RM AND)      _(andwt, RM AND)     /*20-23*/\
_(andbi, IA AND)      _(andwi, IA AND)       _(esseg, )            _(daa, )             /*24-27*/\
_(subbf, RM SUB)      _(subwf, RM SUB)       _(subbt, RM SUB)      _(subwt, RM SUB)     /*28-2b*/\
_(subbi, IA SUB)      _(subwi, IA SUB)       _(csseg, )            _(das, )             /*2c-2f*/\
_(xorbf, RM XOR)      _(xorwf, RM XOR)       _(xorbt, RM XOR)      _(xorwt, RM XOR)     /*30-33*/\
_(xorbi, IA XOR)      _(xorwi, IA XOR)       _(ssseg, )            _(aaa, )             /*34-37*/\
_(cmpbf, RM CMP)      _(cmpwf, RM CMP)       _(cmpbt, RM CMP)      _(cmpwt, RM CMP)     /*38-3b*/\
_(cmpbi, IA CMP)      _(cmpwi, IA CMP)       _(dsseg, )            _(aas, )             /*3c-3f*/\
_(incax, INC(ax))     _(inccx, INC(cx))      _(incdx, INC(dx))     _(incbx, INC(bx))    /*40-43*/\
_(incsp, INC(sp))     _(incbp, INC(bp))      _(incsi, INC(si))     _(incdi, INC(di))    /*44-47*/\
_(decax, DEC(ax))     _(deccx, DEC(cx))      _(decdx, DEC(dx))     _(decbx, DEC(bx))    /*48-4b*/\
_(decsp, DEC(sp))     _(decbp, DEC(bp))      _(decsi, DEC(si))     _(decdi, DEC(di))    /*4c-4f*/\
_(pushax, PUSH(ax))   _(pushcx, PUSH(cx))    _(pushdx, PUSH(dx))   _(pushbx, PUSH(bx))  /*50-53*/\
_(pushsp, PUSH(sp))   _(pushbp, PUSH(bp))    _(pushsi, PUSH(si))   _(pushdi, PUSH(di))  /*54-57*/\
_(popax, POP(ax))     _(popcx, POP(cx))      _(popdx, POP(dx))     _(popbx, POP(bx))    /*58-5b*/\
_(popsp, POP(sp))     _(popbp, POP(bp))      _(popsi, POP(si))     _(popdi, POP(di))    /*5c-5f*/\
_(nop1, ) _(nop2, )   _(nop3, ) _(nop4, )    _(nop5, ) _(nop6, )   _(nop7, ) _(nop8, )  /*60-67*/\
_(nop9, ) _(nopA, )   _(nopB, ) _(nopC, )    _(nopD, ) _(nopE, )   _(nopF, ) _(nopG, )  /*68-6f*/\
_(jo, J(of))          _(jno, JN(of))         _(jb, J(cf))          _(jnb, JN(cf))       /*70-73*/\
_(jz, J(zf))          _(jnz, JN(zf))         _(jbe, J(cf|zf))      _(jnbe, JN(cf|zf))   /*74-77*/\
_(js, J(sf))          _(jns, JN(sf))         _(jp, )               _(jnp, )             /*78-7b*/\
_(jl, J(sf^of))       _(jnl_, JN(sf^of))     _(jle, J((sf^of)|zf)) _(jnle,JN((sf^of)|zf))/*7c-7f*/\
_(immb, IMM(,))       _(immw, IMM(,))        _(immb1, IMM(,))      _(immis, IMMIS)      /*80-83*/\
_(testb, RM TEST)     _(testw, RM TEST)      _(xchgb, RMP XCHG)    _(xchgw, RMP XCHG)   /*84-87*/\
_(movbf, RM MOV)      _(movwf, RM MOV)       _(movbt, RM MOV)      _(movwt, RM MOV)     /*88-8b*/\
_(movsegf, RM MOVSEG) _(lea, LEA)            _(movsegt, RM MOVSEG) _(poprm,RM POP((US*)p))/*8c-8f*/\
_(nopH, )             _(xchgac, AXCH(cx))    _(xchgad, AXCH(dx))   _(xchgab, AXCH(bx))  /*90-93*/\
_(xchgasp, AXCH(sp))  _(xchabp, AXCH(bp))    _(xchgasi, AXCH(si))  _(xchadi, AXCH(di))  /*94-97*/\
_(cbw, CBW)           _(cwd, CWD)            _(farcall, )          _(wait, WAIT)        /*98-9b*/\
_(pushf, PUSHF)       _(popf, POPF)          _(sahf, SAHF)         _(lahf, LAHF)        /*9c-9f*/\
_(movalb, mMOV)       _(movaxw, mMOV)        _(movbal, mMOV)       _(movwax, mMOV)      /*a0-a3*/\
_(movsb, MOVS)        _(movsw, MOVS)         _(cmpsb, CMPS)        _(cmpsw, CMPS)       /*a4-a7*/\
_(testaib, IA TEST)   _(testaiw, IA TEST)    _(stosb, STOS)        _(stosw, STOS)       /*a8-ab*/\
_(lodsb, LODS)        _(lodsw, LODS)         _(scasb, SCAS)        _(scasw, SCAS)       /*ac-af*/\
_(movali, iMOVb(al))  _(movcli, iMOVb(cl))   _(movdli, iMOVb(dl))  _(movbli, iMOVb(bl)) /*b0-b3*/\
_(movahi, iMOVb(ah))  _(movchi, iMOVb(ch))   _(movdhi, iMOVb(dh))  _(movbhi, iMOVb(bh)) /*b4-b7*/\
_(movaxi, iMOVw(ax))  _(movcxi, iMOVw(cx))   _(movdxi, iMOVw(dx))  _(movbxi, iMOVw(bx)) /*b8-bb*/\
_(movspi, iMOVw(sp))  _(movbpi, iMOVw(bp))   _(movsii, iMOVw(si))  _(movdii, iMOVw(di)) /*bc-bf*/\
_(nopI, )             _(nopJ, )              _(reti, RET(fetchw())) _(retz, RET(0))     /*c0-c3*/\
_(les, LES)           _(lds, LDS)            _(movimb, RMP iMOVm)  _(movimw, RMP iMOVm) /*c4-c7*/\
_(nopK, )             _(nopL, )              _(freti, fRET(fetchw())) _(fretz, fRET(0)) /*c8-cb*/\
_(int3, INT(3))       _(inti, INT(fetchb())) _(int0, INT(0))       _(iret, IRET)        /*cc-cf*/\
_(shiftb, Shift)      _(shiftw, Shift)       _(shiftbv, Shift)     _(shiftwv, Shift)    /*d0-d3*/\
_(aam, AAM)           _(aad, AAD)            _(nopM, )             _(xlat, XLAT)        /*d4-d7*/\
_(esc0, ESC(0))       _(esc1, ESC(1))        _(esc2, ESC(2))       _(esc3, ESC(3))      /*d8-db*/\
_(esc4, ESC(4))       _(esc5, ESC(5))        _(esc6, ESC(6))       _(esc7, ESC(7))      /*dc-df*/\
_(loopnz, LOOPNZ)     _(loopz, LOOPZ)        _(loop, LOOP)         _(jcxz, JCXZ)        /*e0-e3*/\
_(inb, IN)            _(inw, IN)             _(outb, OUT)          _(outw, OUT)         /*e4-e7*/\
_(call, w=1; CALL)    _(jmp, JMP)            _(farjmp, FARJMP)     _(sjmp, sJMP)        /*e8-eb*/\
_(invb, INv)          _(invw, INv)           _(outvb, OUTv)        _(outvw, OUTv)       /*ec-ef*/\
_(lock, LOCK)         _(nopN, )              _(rep, REP)           _(repz, REPZ)        /*f0-f3*/\
_(hlt, HLT)           _(cmc, CMC)            _(grp1b, Grp1)        _(grp1w, Grp1)       /*f4-f7*/\
_(clc, CLC)           _(stc, STC)            _(cli, CLI)           _(sti, STI)          /*f8-fb*/\
_(cld, CLD)           _(std, STD)            _(grp2b, Grp2)        _(grp2w, Grp2)       /*fc-ff*/
#define OPF(a,b)void a(){DW b;}     // generate opcode function
#define OPN(a,b)a,                  // extract name
OP(OPF)void(*tab[])()={OP(OPN)};    // generate functions, declare and populate fp table with names

V clean(C*s){I i;       // replace unprintable characters in 80-byte buffer with spaces
    for(i=0;i<80;i++)
        if(!isprint(s[i]))
            s[i]=' ';
}
V video(){I i;          // dump the (cleaned) video memory to the console
    C buf[81]="";
    if(!trace)P("\e[0;0;f");
    for(i=0;i<28;i++)
        memcpy(buf, mem+0x8000+i*80, 80),
        clean(buf),
        P("\n%s",buf);
    P("\n");
}

static I ct;        // timer memory for period video dump
V run(){while(!halt){if(trace)dump();
    if(!ct--){ct=10; video();}
    tab[o=fetchb()]();}}
V dbg(){
    while(!halt){
        C c;
        if(!ct--){ct=10; video();}
        if(trace)dump();
        //scanf("%c", &c);
        fgetc(stdin);
        //switch(c){
        //case '\n':
        //case 's':
            tab[o=fetchb()]();
            //break;
        //}
    }
}

I load(C*f){struct stat s; FILE*fp;     // load a file into memory at address zero
    R (fp=fopen(f,"rb"))
        && fstat(fileno(fp),&s) || fread(mem,s.st_size,1,fp); }

I main(I c,C**v){
    init();
    if(c>1){            // if there's an argument
        load(v[1]);     //     load named file
    }
    *sp=0x100;          // initialize stack pointer
    if(debug) dbg();    // if debugging, debug
    else run();         // otherwise, just run
    video();            // dump final video
    R 0;}               // remember what R means? cf. line 9

การใช้มาโครสำหรับขั้นตอนของการดำเนินการต่างๆทำให้การจับคู่ความหมายใกล้เคียงกับวิธีที่รหัสโพสต์สคริปต์ทำงานตามลำดับอย่างหมดจด ตัวอย่างเช่น opcodes สี่ตัวแรก 0x00-0x03 เป็นคำสั่ง ADD ทั้งหมดที่มีทิศทางที่แตกต่างกัน (REG -> REG / MOD, REG <- REG / MOD) และขนาดไบต์ / คำดังนั้นจึงมีขนาดเท่ากันในตารางฟังก์ชัน .

_(addbf, RM ADD)      _(addwf, RM ADD)       _(addbt,  RM ADD)     _(addwt, RM ADD)

ตารางฟังก์ชันสร้างอินสแตนซ์ของแมโครนี้:

OP(OPF)

ซึ่งใช้กับOPF()การแสดง opcode แต่ละครั้ง OPF()หมายถึง:

#define OPF(a,b)void a(){DW b;}     // generate opcode function

ดังนั้นสี่ตัวแรกจะขยาย (หนึ่งครั้ง) เป็น:

void addbf(){ DW RM ADD ; }
void addwf(){ DW RM ADD ; }
void addbt(){ DW RM ADD ; }
void addwt(){ DW RM ADD ; }

ฟังก์ชั่นเหล่านี้แยกแยะความแตกต่างด้วยผลลัพธ์ของDWแมโครซึ่งกำหนดทิศทางและไบต์ / คำบิตตรงจาก opcode ไบต์ การขยายเนื้อหาของหนึ่งในฟังก์ชันเหล่านี้ (หนึ่งครั้ง) จะสร้าง:

if(trace){ P("%s:\n",__func__); }  // DW: set d and w from o
d=!!(o&2);
w=o&1;
RMP LDXY  // RM: normal mrm decode and load
z=x+y; LOGFLAGS MATHFLAGS RESULT  // ADD
;

ตำแหน่งที่ลูปหลักได้ตั้งค่าoตัวแปรไว้แล้ว:

while(!halt){tab[o=fetchb()]();}}

การขยายอีกครั้งจะให้ "เนื้อ" ทั้งหมดของรหัส:

// DW: set d and w from o
if(trace){ P("%s:\n",__func__); }
d=!!(o&2);
w=o&1;

// RMP: fetch mrm byte and decode, setting x and y as pointers to args and p ptr to dest
rm r=mrm(fetchb());
x=decreg(r.reg,w);
y=decrm(r,w);
if(trace>1){ P("x:%d\n",x); P("y:%d\n",y); }
p=d?(void*)x:(void*)y;

// LDXY: fetch x and y values from x and y pointers
x=get_((void*)x,w);
y=get_((void*)y,w);
if(trace){ P("x:%d\n",x); P("y:%d\n",y); }

z=x+y;   // ADD
// LOGFLAGS: flags set by logical operators
*fl=0;
*fl |= ( (z&(w?0x8000:0x80))           ?SF:0)
     | ( (z&(w?0xffff:0xff))==0        ?ZF:0) ;

// MATHFLAGS: additional flags set by math operators
*fl |= ( (z&(w?0xffff0000:0xff00))     ?CF:0)
     | ( ((z^x)&(z^y)&(w?0x8000:0x80)) ?OF:0)
     | ( ((x^y^z)&0x10)                ?AF:0) ;

// RESULT: store result to p ptr
if(trace)P(w?"->%04x ":"->%02x ",z);
put_(p,z,w);
;

และฟังก์ชั่นที่ประมวลผลล่วงหน้าอย่างสมบูรณ์ผ่านผ่านindent:

void
addbf ()
{
  if (trace)
    {
      printf ("%s:\n", __func__);
    }
  d = ! !(o & 2);
  w = o & 1;
  rm r = mrm (fetchb ());
  x = decreg (r.reg, w);
  y = decrm (r, w);
  if (trace > 1)
    {
      printf ("x:%d\n", x);
      printf ("y:%d\n", y);
    }
  p = d ? (void *) x : (void *) y;
  x = get_ ((void *) x, w);
  y = get_ ((void *) y, w);
  if (trace)
    {
      printf ("x:%d\n", x);
      printf ("y:%d\n", y);
    }
  z = x + y;
  *fl = 0;
  *fl |=
    ((z & (w ? 0x8000 : 0x80)) ? SF : 0) | ((z & (w ? 0xffff : 0xff)) ==
                        0 ? ZF : 0);
  *fl |=
    ((z & (w ? 0xffff0000 : 0xff00)) ? CF : 0) |
    (((z ^ x) & (z ^ y) & (w ? 0x8000 : 0x80)) ? OF : 0) |
    (((x ^ y ^ z) & 0x10) ? AF : 0);
  if (trace)
    printf (w ? "->%04x " : "->%02x ", z);
  put_ (p, z, w);;
}

ไม่ใช่สไตล์ C ที่ยิ่งใหญ่ที่สุดสำหรับการใช้ในชีวิตประจำวัน แต่การใช้มาโครในลักษณะนี้ค่อนข้างสมบูรณ์แบบสำหรับการนำไปใช้งานที่นี่สั้นและตรงมาก

เอาต์พุตโปรแกรมการทดสอบโดยมีหางของเอาต์พุตการติดตาม:

43(103) incbx:
->0065 
ax:0020 cx:0015 dx:0190 bx:0065 sp:1000 bp:0000 si:0000 di:00c2 ip:013e fl:0000 NC NO NS NZ 
83(203) immis:
fb(373) 64(144) x:100
y:101
CMP ->0001 
ax:0020 cx:0015 dx:0190 bx:0065 sp:1000 bp:0000 si:0000 di:00c2 ip:0141 fl:0000 NC NO NS NZ 
76(166) jbe:
da(332) <0> 
ax:0020 cx:0015 dx:0190 bx:0065 sp:1000 bp:0000 si:0000 di:00c2 ip:0143 fl:0000 NC NO NS NZ 
f4(364) hlt:

.........                                                                       
Hello, world!                                                                   
0123456789:;<=>?@ABCDEFGHIJKLMNOPQRSTUVWXYZ[\]^_`abcdefghijklmnopqrstuvwxyz{|}~ 


################################################################################
##                                                                            ##
##  0 1 1 2 3 5 8 13 21 34 55 89 144 233 377 610 987                          ##
##                                                                            ##
##  0 1 4 9 16 25 36 49 64 81 100 121 144 169 196 225 256 289 324 361 400     ##
##                                                                            ##
##  2 3 5 7 11 13 17 19 23 29 31 37 41 43 47 53 59 61 67 71 73 79 83 89 97    ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
##                                                                            ##
################################################################################

ฉันแชร์รุ่นก่อนหน้านี้ในcomp.lang.cแต่พวกเขาไม่สนใจมาก


เวอร์ชันที่ขยายมาโคร ห่อแล้ว (มันไม่ได้ช่วย :)
luser droog

indented 5810 บรรทัด
luser droog
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.