การบีบอัดเขาวงกต ASCII

ท้าทาย

ออกแบบอัลกอริทึมการบีบอัดแบบพิเศษสำหรับการบีบอัดเขาวงกต ASCII คุณจะต้องสร้างทั้งอัลกอริทึมการบีบอัดและอัลกอริธึมการบีบอัด คะแนนของคุณจะขึ้นอยู่กับขนาดของเขาวงกตที่บีบอัดของคุณ

เขาวงกต

เขาวงกตเหล่านี้จะทำส่วนใหญ่ของตัวละคร(ชั้น) +, -, |และ#(ผนัง) และอีกหนึ่งแต่ละ^(เริ่มต้น) และ$(จบ) พวกเขาอาจมีตัวอักษร ASCII ซึ่งนับเป็นกระเบื้องปูพื้น สำหรับจุดประสงค์ของการท้าทายนี้เขาวงกตไม่จำเป็นต้องแก้ปัญหาและความหมายที่แท้จริงของเนื้อหาเขาวงกตนั้นไม่เกี่ยวข้อง

+ จะใช้สำหรับเซลล์ผนังที่มีเซลล์ผนังติดกันอย่างน้อยหนึ่งเซลล์ในแนวนอนและอย่างน้อยหนึ่งเซลล์ติดผนังแนวตั้ง
| จะใช้สำหรับเซลล์ผนังที่มีเซลล์ผนังติดกันอย่างน้อยหนึ่งเซลล์ในแนวตั้ง แต่ไม่มีเซลล์ผนังติดในแนวนอน
- จะใช้สำหรับเซลล์ผนังที่มีเซลล์ผนังติดกันอย่างน้อยหนึ่งเซลล์ในแนวนอน แต่จะไม่มีเซลล์ผนังติดกันในแนวตั้ง
# จะถูกใช้สำหรับเซลล์ผนังที่ไม่ได้อยู่ติดกันกับเซลล์ผนังอื่น ๆ

เขาวงกตทั้งหมดเป็นรูปสี่เหลี่ยมผืนผ้า แต่ไม่จำเป็นต้องมีการจัดแนวตาราง / กำแพงตามปกติ

บีบอัด

เขาวงกต 1

+----+----
|  o |    |
| -- | o--+
|    | |  $
 --^-+-+---

เขาวงกต 2

+-----+---+
|  a  |   |
^ +-+-+ # |
| | |  B  |
| | | --+ |
|   c   | $
+-------+--

เขาวงกต 3

----------+-+-+-----+-+
^         | | |     | |
+-- --+R #  | |p| | | |
|     | |       | |   |
+---+ +-+-+-- +-+ | | |
|  m| | | |   |   | | |
| +-+ | | | | | --+ | |
| | |    h  | |   | | |
| | | | | |  #  --+-+ |
|     | | | | |  S|   $
+-----+-+-+-+-+---+----

เขาวงกต 4

+-----+---+-+---+-------^-----+
|     |x  | |   |     tsrq    |
+-+-- +-- | +--  #  --+---- --+
| |   |           |   |       |
| | | | | +-+-+---+ | +-- | +-+
| | | u | | | |     | |   | | |
| +-+ | | | | +---- +-+---+ | |
| |   | |   |    y  |       w |
| | --+ | --+ +-- | +---- | | |
|     | |   | |   | |     | | |
+-- --+ +-+ | | | | +-- | +-+-+
|     | | |   | | | |   |     |
$ | --+-+ | --+-+ | +-+-+-- --+
| |   |      z|   |   |    v  |
+-+---+-------+---+---+-------+

เขาวงกต 5

++ -----------+
++-       Beep|
$  ----+---+--+
+-+boop|   |  |
| +--- | | | ++
|      | |  +++
+------+-+--+ ^

เขาวงกต 6

+-$---------------+-+--
|                 | |j 
| |l ---- # ---+ |  |  
| | |       m  | +--+ |
| | | +-+---- #       |
| | | | |      +----+ |
|o| | | | +----+    | |
|       | |    | -- | |
| | | | | | -+ |    | |
| | | | |  | | +--- | |
| | | | +- | | |   | ++
+-+ |n| |  | ++ +--+ | 
    | |   -+- | |  | +-
+---+ +---    |  | |  ^
|    |     --+ --+ | | 
| -- | |  k  |     | ++
|    | |      +--- | ++
|    |      | |    |  |
+-- -+----  | +----+--+

เขาวงกต 7

+---+-+-------------+-+^+-----+-------+---+-+---+-+---+-+---+
|   |c|             | | |  c  |       |   | |   | |   |c|   |
+-- | | +-- +-- # | | | +-- --+ +---- +-- | +-+ | | +-+ | --+
|       |   |     | |           |         |   | |c| |       |
| | +-- | +-+-- +-+ +-- # +- # -+-- +-- | | --+ | | | | --+C|
|c| |   | | c   |         |         |c  |             |   | |
+-+-+---+-+-----+---------+---------+---+-------------+---+$|

เขาวงกต 8

------+-+-+---+-+---+-----------+---+-----+---------------+-+
^     | | |   | |   |           |   |     |      r        | |
+-- | | | t | | +-- +----- # ---+-- +-- --+-- ----+-+ --+ | |
|   |   | | |   |   |         r |   |             | |   |   |
| | | | | +-+ --+ --+-- --------+-- | ----+ --+ | | | --+ | |
| |r| |            rotation               |   | |   |   | | $
+-+-+-+-----------------------------------+---+-+---+---+-+--

เขาวงกต 9

|$|^--+-+---+-----+-+---+-+-+---+---+-+---+-----+
| |   | |   |     | |   | | | f |   | |   |     |
| +-+ | | # +-+ --+ +-+ | | | # | +-+ +-- | ----+
|   |       | |    f| |           | | |   |   f |
| |F+-+ | | | | +---+ | | | ----+-+ | | --+ --+-+
| |   | | |     |     | | |   f |   |         | |
| | | | +-+-+---+-- | | | +-+-+-+ +-+ +--- # -+ |
| | | |     |   |   |   | | | |   | | |         |
+-+-+ | +---+ --+ | +---+-+ | | --+ f | | | | --+
|     | |         |                 | | | | |   |
| --+f| | | +-- --+--f--+ --+ | ----+ | +-+ +---+
|   |     | |     |     |   | |           |     |
+---+-----+-+-----+-----+---+-+-----------+-----+

เขาวงกต 10

+-----+-+-----------+
|  q  | |         q |
|Q+-+ | +-+-+-+---- |
$ | |     | | |  q  |
+-+ | | | | | +-- +-+
| |   | |     |   | |
| +-- +-+ |q| +-+ | |
|    q|   | |   |   |
| | | +-- | +-+ | --+
| | | |   | | |     |
+-+-+-+ +-+-+ +-- | |
|       |         | |
+--- # -+ | | +-- | |
|  q      | | |   | ^
+-+ +-- | | +-+ | +-+
| | |   | |q|   |   |
| +-+-+ | +-+-- | | |
|     | | |     | | |
| | | +-+-+-- +-+ +-+
| | |         | q   |
+-+-+---------+-----+

กฎข้อสมมติฐานการให้คะแนน

ช่องโหว่มาตรฐานถูกแบน
- เขียนโปรแกรมทั่วไปไม่ใช่โปรแกรมที่ใช้ได้กับกรณีทดสอบสิบกรณีเท่านั้น มันจะต้องสามารถจัดการเขาวงกตใด ๆ
คุณอาจคิดว่าจะมีทางเข้าหนึ่งทางและทางออกเดียว ทางเข้าและทางออกจะอยู่ที่ชายแดนของเขาวงกตเสมอ
คุณอาจสมมติว่าอินพุตทั้งหมดใช้กำแพงที่เป็นไปตามกฎที่ระบุด้านบน อัลกอริทึมการบีบอัดของคุณไม่จำเป็นต้องทำงานกับเขาวงกตที่มีกำแพงที่ละเมิดกฎเหล่านั้น
เขาวงกตที่ป้อนเข้าอาจจะหรือไม่สามารถแก้ไขได้
คุณอาจสันนิษฐานว่าเขาวงกตนั้นจะมีขนาดไม่เกิน 100 ตัวอักษรในทิศทางใดทิศทางหนึ่ง
คุณอาจสันนิษฐานว่าตัวอักษรจะไม่ปรากฏขึ้นที่ขอบของเขาวงกต (เนื่องจากเป็นกรณีของตัวอย่างที่มีให้)
คะแนนของคุณคือขนาดรวมเป็นไบต์ (octets) ของเขาวงกตที่บีบอัดทั้งหมด
- คุณสามารถใช้เลขฐานสิบหก, base64, ไบนารี่หรือรูปแบบที่คล้ายกันเพื่อเป็นตัวแทนของเขาวงกตที่ถูกบีบอัดหากคุณพบว่าสะดวกกว่า คุณควรนับผลลัพธ์เป็น octet ทั้งหมดปัดเศษขึ้นสำหรับเขาวงกตแต่ละอัน (เช่น 4 เบส 64 หลักคือ 3 ไบต์, 2 ฐานสิบหกหลักคือ 1 ไบต์, 8 หลักฐานแปดคือ 1 ไบต์, ฯลฯ ... )
- คะแนนต่ำสุดชนะ!

— Beefster
แหล่งที่มา

เขาวงกตมีขนาด จำกัด หรือไม่?

— ศูนย์รวมแห่งความไม่รู้

@EmbodimentofIgnorance 100x100

— Beefster

@ อันที่จริงแล้วนั่นเป็นปัญหาการคัดลอก แต่ฉันคิดว่า SE การจัดรูปแบบจะตัดช่องว่างที่ท้ายบรรทัดอย่างไรก็ตาม ใช่มันควรจะเป็นเบาะอวกาศ

— Beefster

@ChasBrown ซึ่งนับว่าเป็นช่องโหว่มาตรฐานซึ่งหมายความว่ามันถูกแบนตามค่าเริ่มต้น

— Beefster

@ schnaader ที่ดูเหมือนว่าสมเหตุสมผลให้กรณีทดสอบตัวอย่าง

— Beefster

คำตอบ:

JavaScript (Node.js)คะแนน = 586 541 503 492 479 ไบต์

ผนังจะถูกจัดเก็บเป็นกระแส H บิตmanเข้ารหัสของบิตที่อธิบายว่าฟังก์ชั่นการคาดการณ์จะกลับมาเดาที่ถูกต้องหรือไม่

อักขระพิเศษถูกเก็บเป็น $(d, c)$ ที่ไหน $d$ คือระยะห่างจากอักขระพิเศษก่อนหน้าและ $c$ คือรหัส ASCII

ลองออนไลน์!

ร่วมกัน

const HUFFMAN = [
  '00',       // 0000
  '010',      // 0001
  '1001',     // 0010
  '11100',    // 0011
  '011',      // 0100
  '101',      // 0101
  '11110',    // 0110
  '100010',   // 0111
  '110',      // 1000
  '11101',    // 1001
  '1111100',  // 1010
  '1111101',  // 1011
  '10000',    // 1100
  '1111110',  // 1101
  '100011',   // 1110
  '1111111'   // 1111
];

let bin = (n, w) => n.toString(2).padStart(w, '0');

let wallShape = (row, x, y) => {
  let vWall = (row[y - 1] || [])[x] | (row[y + 1] || [])[x],
      hWall = row[y][x - 1] | row[y][x + 1];

  return ' -|+'[row[y][x] ? vWall * 2 | hWall : 0];
}

let predictWall = (row, x, y, w, h) => {
  let prvRow = row[y - 1] || [];
  return !x | !y | x == w - 1 | y == h - 1 | (prvRow[x] | row[y][x - 1]) & !prvRow[x - 1];
}

การอัด

let pack = str => {
  let row = str.split('\n').map(r => [...r]),
      w = row[0].length,
      h = row.length;

  let wall = row.map((r, y) => r.map((c, x) => +/[-+|]/.test(c)));

  if(row.some((r, y) => r.some((c, x) => wall[y][x] && wallShape(wall, x, y) != c))) {
    throw "invalid maze";
  }

  row = wall.map((r, y) => r.map((v, x) => predictWall(wall, x, y, w, h) ^ v));
  row = row.map(r => r.join('')).join('');
  row = row.replace(/.{1,4}/g, s => HUFFMAN[parseInt(s.padEnd(4, '0'), 2)]);

  str =
    str.replace(/[\n|+-]/g, '').replace(/ *(\S)/g, (s, c) => {
      let n = c.charCodeAt(),
          i = '^$#'.indexOf(c);

      return (
        bin(s.length > 63 ? 0xFC000 | s.length - 1 : s.length - 1, 6) +
        bin(~i ? i : n < 91 ? (n > 80 ? 0x1F0 : 0x1E0) | ~-n & 15 : n - 94, 5)
      );
    }).trim();

  return (
    Buffer.from(
      (bin(w, 7) + bin(h, 7) + row + str)
      .match(/.{1,8}/g).map(s => parseInt(s.padEnd(8, '0'), 2))
    ).toString('binary')
  );
}

การบีบอัด

let unpack = str => {
  str = [...str].map(c => bin(c.charCodeAt(), 8)).join('');

  let x, y, n, i, s,
      ptr = 0,
      read = n => parseInt(str.slice(ptr, ptr += n), 2),
      w = read(7),
      h = read(7),
      row = [];

  for(x = s = ''; s.length < w * h;) {
    ~(i = HUFFMAN.indexOf(x += read(1))) && (s += bin(i, 4), x = '');
  }
  for(i = y = 0; y < h; y++) {
    for(row[y] = [], x = 0; x < w; x++) {
      row[y][x] = predictWall(row, x, y, w, h) ^ s[i++];
    }
  }

  row = row.map((r, y) => r.map((c, x) => wallShape(row, x, y)));

  for(i = 0; str[ptr + 10];) {
    for(
      n = (n = read(6)) == 0x3F ? read(14) + 1 : n + 1;
      n -= row[i / w | 0][i % w] == ' ';
      i++
    ) {}

    row[i / w | 0][i % w] = String.fromCharCode(
      (n = read(5)) >= 0x1E ? read(4) + (n == 0x1F ? 81 : 65) : [94, 36, 35][n] || n + 94
    );
  }
  return row.map(r => r.join('')).join('\n');
}

อย่างไร?

เขาวงกตถูกเข้ารหัสเป็นบิตสตรีมซึ่งในที่สุดจะถูกแปลงเป็นสตริง

หัวข้อ

ส่วนหัวประกอบด้วย:

ความกว้าง $w$ บน 7 บิต
ความสูง $h$ บน 7 บิต

ข้อมูลกำแพง

เราเดินผ่านเขาวงกตทั้งหมดและพยายามทำนายว่าเซลล์ถัดไปเป็นกำแพงหรือไม่ขึ้นอยู่กับเซลล์ที่พบก่อนหน้านี้ เราปล่อย $0$ ถ้าเราถูกต้องหรือ $1$ ถ้าเราผิด

ผลลัพธ์นี้ในลำดับของบิตการแก้ไขด้วย (หวังว่า) จะมีความหมายมากขึ้น $0$ ดีกว่า $1$ 's ลำดับนี้แบ่งออกเป็นไส้และจัดเก็บโดยใช้รหัส Huffman แบบตายตัว:

00 → 0000
010 → 0001
1001 → 0010
11100 → 0011
011 → 0100
เป็นต้น

เพื่อถอดรหัสกำแพง $W_n$ รูทีนการบีบอัดคำนวณคำทำนายเดียวกัน $P_n$ และสลับผลลัพธ์หากต้องการโดยใช้บิตการแก้ไข $C_n$ :

W_{n} = P_{n} \oplus ค_{n}

$W_n=P_n\oplus C_n$

รูปร่างผนังสุดท้ายจะอนุมานได้ในลักษณะที่คล้ายกับคำตอบนิคเคนเนดี้

ตัวละครพิเศษ

อักขระพิเศษแต่ละตัวจะถูกเข้ารหัสเป็น:

ระยะทางลบ $1$ จากอักขระพิเศษตัวสุดท้าย (ไม่สนใจกำแพง):
- ใน 6 บิตถ้ามันน้อยกว่า $63$
- หรือเป็น $111111$ + 14 บิตเป็นอย่างอื่น (ไม่เคยใช้ในกรณีทดสอบ แต่จำเป็นต้องมีในทางทฤษฎี)
รหัสของตัวละคร:
- เมื่อวันที่ 5 บิตถ้ามัน^, $, #หรือ[a-z]
- หรือ $11110$ + 4 บิตสำหรับ [A-O]
- หรือ $11111$ + 4 บิตสำหรับ [P-Z]

— Arnauld
แหล่งที่มา

คุณได้ลองกลไกการบีบอัดอื่น ๆ กว่าdeflate? มีจำนวนมากที่น่ากลัวบนหิ้ง!

— dfeuer

ไม่มีกฎที่บอกว่าจะต้องทำงานใน TIO!

— dfeuer

O_o ดีสงสัยว่าการบีบอัดทศนิยมจะช่วยได้หรือไม่ (โดยทั่วไปตรงกันข้ามกับ huffman พื้นที่คือ 0 ถึง 1 แบ่งออกเป็นส่วนที่มีขนาดตามอำเภอใจ (<1 แน่นอน) และการเข้ารหัสเป็นเลขฐานสองที่สั้นที่สุดที่อยู่ภายใน ชิ้นพื้นที่ที่ถูกต้อง

— เฉพาะ ASCII เท่านั้น

การเข้ารหัสทศนิยมแบบ ASCII-only @ ASCII (การเข้ารหัสเลขคณิต aka) แน่นอนควรปรับปรุงอัตราส่วนการบีบอัด แต่อาจเป็นเพียงเล็กน้อยในสตรีมข้อมูลสั้น ๆ ฉันแน่ใจว่าเป็นไปได้ที่จะปรับปรุงการเข้ารหัส Huffman และ / หรือฟังก์ชันการทำนายก่อนที่จะเปลี่ยนเป็นการเข้ารหัสทางคณิตศาสตร์แม้ว่า (ทั้งสองอย่างนี้เป็นพื้นฐานจริง ๆ ในขณะนี้)

— Arnauld

ตัวอย่างเช่น @ ASCII เท่านั้นฉันอาจลองใช้รหัสที่ยาวกว่านี้ (การใช้ nibbles นั้นเป็นการกำหนดเอง) ฉันยังสามารถเพิ่มการตั้งค่าสถานะแบบ 1 บิตในส่วนหัวที่บอกว่าข้อมูลควรถูกคลายออกด้วยรหัส Huffman แบบคงที่เริ่มต้นหรือด้วยรหัสแบบไดนามิก (ถ้ามันเปิดออกเพื่อปรับปรุงการบีบอัดของเขาวงกตบางส่วน) สิ่งหนึ่งที่ฉันลองทำก็คือหมุนเขาวงกต 90 องศาแล้วดูว่ามันบีบตัวได้ดีกว่าไหม แต่นั่นเป็นเพียงการบันทึก 1 ไบต์โดยรวม

— Arnauld

R คะแนน 668 ไบต์

สิ่งนี้ใช้ประโยชน์จากความจริงที่ว่าลักษณะของผนังถูกกำหนดโดยสภาพแวดล้อม ดังนั้นตัวอักษรวอลล์สามารถเข้ารหัสเป็นบิต ข้อมูลที่เหลือที่จะต้องเก็บไว้คือขนาดของเขาวงกตตำแหน่งของจุดเริ่มต้นและสิ้นสุดและตำแหน่งของตัวละครอื่น ๆ ที่ไม่ใช่ผนัง เนื่องจากอักขระที่ไม่ใช่แบบผนังเป็น ASCII ฉันใช้บิตที่สำคัญที่สุดของแต่ละไบต์เพื่อระบุว่ามีอักขระอื่นที่ตามมาดังนั้นคำบางคำใน mazes จึงไม่จำเป็นต้องมีที่เก็บของอักขระแต่ละตัว แยกต่างหาก โปรดทราบด้วยว่าสำหรับเขาวงกตที่น้อยกว่าหรือเท่ากับ 256 ตัวอักษร (เช่นสูงสุด 16x16 หรือสี่เหลี่ยมมุมฉากเทียบเท่า) ตำแหน่งสามารถจัดเก็บในหนึ่งไบต์ในขณะที่เขาวงกตขนาดใหญ่ตำแหน่งต้องสองไบต์

ฟังก์ชั่นยูทิลิตี้

r <- as.raw

int_as_raw <- function(int, bytes = 2) {
  if (bytes == 1) {
    r(int)
  } else {
    do.call(c, lapply(int, function(.x) r(c(.x %/% 256, .x %% 256))))
  }
}

raw_as_int <- function(raw, bytes = 2) {
  if (bytes == 1) {
    as.integer(raw)
  } else {
    sapply(
      seq(1, length(raw) - 1, 2),
      function(.x) as.integer(as.integer(raw[.x + 0:1]) %*% c(256, 1))
    )
  }
}

ขั้นตอนวิธีการบีบอัด

compress_maze <- function(maze) {
  maze_array <- do.call(rbind, strsplit(maze, ""))
  simple_maze <- r(maze_array %in% c("+", "#", "-", "|"))
  simple_maze <- packBits(c(simple_maze, rep(r(0), (8 - length(simple_maze)) %% 8)))
  maze_dim <- int_as_raw(dim(maze_array), 1)
  bytes_needed <- 1 + (length(maze_array) > 256)
  start_finish <- int_as_raw(sapply(c("^", "$"), function(.x) which(maze_array == .x)) - 1, bytes = bytes_needed)
  other_ascii_locs_rle <- rle(!(maze_array %in% c(" ", "+", "#", "-", "|", "$", "^")))
  other_ascii_locs <- cumsum(
    c(1, other_ascii_locs_rle$lengths[-length(other_ascii_locs_rle$lengths)])
  )[other_ascii_locs_rle$values]
  other_ascii_locs_length <- other_ascii_locs_rle$lengths[other_ascii_locs_rle$values]

  encode_ascii <- function(loc, len) {
    text <- charToRaw(paste(maze_array[loc:(loc + len - 1)], collapse = ""))
    if (len > 1) {
      text[1:(len - 1)] <- text[1:(len - 1)] | r(128)
    }
    c(int_as_raw(loc - 1, bytes = bytes_needed), text)
  }

  other_ascii_encoded <- Map(encode_ascii,
    other_ascii_locs,
    other_ascii_locs_length
    )
  other_ascii_encoded <- do.call(c, other_ascii_encoded)
  c(maze_dim, simple_maze, start_finish, other_ascii_encoded)
}

อัลกอริทึมการบีบอัด

decompress_maze <- function(c_maze) {
  dim_maze <- as.integer(c_maze[1:2])
  len_maze <- prod(dim_maze)
  len_maze_b <- ceiling(len_maze / 8)
  bit_maze <- rawToBits(c_maze[-(1:2)])[1:len_maze]
  dim(bit_maze) <- dim_maze
  bit_maze[-1, ] <- bit_maze[-1, ] | rawShift(bit_maze[-nrow(bit_maze), ] & r(1), 1)
  bit_maze[-nrow(bit_maze), ] <- bit_maze[-nrow(bit_maze), ] | rawShift(bit_maze[-1, ] & r(1), 1)
  bit_maze[, -1] <- bit_maze[, -1] | rawShift(bit_maze[, -ncol(bit_maze)] & r(1), 2)
  bit_maze[, -ncol(bit_maze)] <- bit_maze[, -ncol(bit_maze)] | rawShift(bit_maze[, -1] & r(1), 2)
  bit_maze[(bit_maze & r(1)) == r(0)] <- r(0)
  array_maze <- c(" ", "#", "|", "-", "+")[(as.integer(bit_maze) + 1) %/% 2 + 1]
  dim(array_maze) <- dim_maze
  bytes_needed <- 1 + (len_maze > 256)
  start_finish <- raw_as_int(c_maze[2 + len_maze_b + 1:(bytes_needed * 2)], bytes_needed) + 1
  array_maze[start_finish] <- c("^", "$")
  i <- 3 + len_maze_b + 2 * bytes_needed
  while (i < length(c_maze)) {
    loc <- raw_as_int(c_maze[i + 1:bytes_needed - 1], bytes_needed) + 1
    i <- i + bytes_needed
    text <- character(0)
    while (c_maze[i] & r(128)) {
      text <- c(text, rawToChar(c_maze[i] & r(127)))
      i <- i + 1
    }
    text <- c(text, rawToChar(c_maze[i]))
    array_maze[loc:(loc + length(text) - 1)] <- text
    i <- i + 1
  }
  apply(array_maze, 1, paste, collapse = "")
}

ลองออนไลน์!

— นิคเคนเนดี
แหล่งที่มา

ฉันรู้ว่าคุณสามารถจัดเก็บผนังเป็นบิต แต่ฉันชอบวิธีการของคุณสำหรับการบีบอัดข้อมูลตำแหน่งตัวละครที่ไม่ใช่ผนัง +1

— Neil