วงแหวนด้านในถูกเลือกในอัลกอริทึมSchönhage

ฉันพยายามที่จะใช้อัลกอริทึมการคูณจำนวนเต็มของSchönhage - Strassen แต่กด stumbling block ในขั้นตอนวนซ้ำ

ฉันมีค่าด้วยบิตและฉันต้องการที่จะคำนวณ1} ฉันคิดว่าแนวคิดดั้งเดิมคือการเลือกที่แยกเป็นชิ้นแต่ละชิ้นด้วยบิตใช้การโน้มน้าวใจของ SSA ขณะทำงานโมดูโล , แหวนที่มีความจุบิตต่อค่าจากนั้นนำชิ้นส่วนกลับมารวมกัน อย่างไรก็ตามเอาต์พุตของการบิดมีมากกว่าบิตเล็กน้อย(เช่น $x$ $n$ $x^2 \pmod {2^n+1}$ $k$ $4^k \geq 2n$ $x$ $2^k$ $2^{k-1}$ $2^{2^k}+1$ $2^k$ $2n$ $>2^k$ บิตต่อค่าเอาต์พุตซึ่งมากกว่าความจุของวงแหวนเนื่องจากแต่ละค่าเอาต์พุตเป็นผลรวมของผลิตภัณฑ์หลายตัว) จึงไม่ทำงาน ฉันต้องเพิ่มปัจจัยพิเศษอีก 2 อย่างของการเติมเต็ม

นั่นคือปัจจัยพิเศษของ 2 ในการทำลายที่ซับซ้อน มันทำให้ขั้นตอนแบบเรียกซ้ำของฉันแพงเกินไป แทนที่จะเป็นอัลกอริทึมฉันท้าย ด้วยอัลกอริทึม $F(n) = n \lg n + \sqrt{n} F(2 \sqrt{n}) = \Theta(n \; \lg n \; \lg \lg n)$ $F(n) = n \lg n + \sqrt{n} F(4 \sqrt{n}) = \Theta(n \lg^2 n)$

ฉันได้อ่านเอกสารอ้างอิงสองสามฉบับที่เชื่อมโยงจากวิกิพีเดีย แต่พวกเขาดูเหมือนจะล้วงลึกถึงรายละเอียดว่าปัญหานี้ได้รับการแก้ไขอย่างไร ตัวอย่างเช่นฉันสามารถหลีกเลี่ยงค่าใช้จ่ายในการเสริมกำลังพิเศษได้ด้วยการทำงาน modulo $2^{p 2^k} + 1$ สำหรับ $p$ ที่ไม่ใช่พลังของ 2 ... แต่จากนั้นสิ่งต่าง ๆ ก็พังทลายในภายหลังเมื่อฉันไม่มีพลัง - เหลือเพียงปัจจัย 2 และไม่สามารถใช้ Cooley-Tukey ได้โดยไม่ต้องเพิ่มจำนวนสองเท่า นอกจากนี้ $p$ ไม่อาจมีผกผันแบบโมดูโล $2^p+1$ 1 ดังนั้นยังคงมีปัจจัยบังคับจากการแนะนำ 2 อย่าง

ฉันจะเลือกแหวนที่จะใช้ในระหว่างขั้นตอนแบบเรียกซ้ำโดยไม่ทำให้เกิดความซับซ้อนเชิงซีมโทติคได้อย่างไร?

หรือในรูปแบบโค้ดหลอก:

multiply_in_ring(a, b, n):
  ...
  // vvv                          vvv //
  // vvv HOW DOES THIS PART WORK? vvv //
  // vvv                          vvv //
  let inner_ring = convolution_ring_for_values_of_size(n);
  // ^^^                          ^^^ //
  // ^^^ HOW DOES THIS PART WORK? ^^^ //
  // ^^^                          ^^^ //

  let input_bits_per_piece = ceil(n / inner_ring.order);
  let piecesA = a.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);
  let piecesB = b.splitIntoNPiecesOfSize(inner_ring.order, input_bits_per_piece);

  let piecesC = inner_ring.negacyclic_convolution(piecesA, piecesB);
  ...

ds.algorithms

— Craig Gidney
แหล่งที่มา

กรุณาอย่าโพสต์คำถามเดียวกันบนเว็บไซต์ต่างๆ แต่ละชุมชนควรมีความจริงใจในการตอบคำถามโดยไม่เสียเวลาไปกับใคร ฉันแนะนำให้คุณลบหนึ่งในสองชุด

— DW

@DW เรียบร้อยแล้ว ฉันโพสต์ข้ามหลังจาก cs ไม่ได้ให้คำตอบใด ๆ เป็นเวลาหนึ่งสัปดาห์โดยคิดว่ามันยากเกินไปสำหรับไซต์นั้น จะเชื่อมโยงคำตอบกลับอย่างชัดเจน

— Craig Gidney

ฉันเข้าใจ. หากเกิดขึ้นในอนาคตคุณสามารถตั้งค่าสถานะโพสต์ของคุณเพื่อขอความสนใจจากผู้ดูแลและขอให้ย้ายข้อมูลและเราสามารถย้ายไปที่ CSTheory ได้ ขอขอบคุณสำหรับความเข้าใจของคุณ!

— DW

มีรุ่นของอัลกอริทึมที่ใช้งานหมายเลขโมดูโลในรูปแบบ : A. Schönhage อัลกอริธึมที่รวดเร็วแบบไม่เชิงเส้นสำหรับการคูณเชิงตัวเลขและการหารของพหุนามด้วยค่าสัมประสิทธิ์ที่ซับซ้อน ใน EUROCAM '82: การประชุมพีชคณิตคอมพิวเตอร์ยุโรป, การบรรยาย หมายเหตุประกอบ วิทย์ 144, 3-15 iai.uni-bonn.de/~schoe/publi39.dvi

2^{ν 2^{n}}

$2^{\nu2^n}$

— Markus Bläser

IIRC คุณได้รับคำตอบบางส่วนจากคำถาม CS ที่ถูกลบตอนนี้ ดูเหมือนว่าน่าละอายที่จะสูญเสียสิ่งนั้น คุณสามารถรวมไว้ที่นี่ (ในคำถามเพื่อไม่ให้มีการทำเครื่องหมายคำถามว่าตอบแล้ว)

— Peter Taylor

คำตอบนี้นำมาจากบทความเรื่อง"Asymptotically fast algorithm สำหรับการคำนวณเชิงตัวเลขและการหารของ polynomials ด้วยสัมประสิทธิ์ที่ซับซ้อน"ซึ่ง Markus เชื่อมโยงในความคิดเห็น

คุณต้องการที่จะตารางจำนวนบิต, โมดูโล1 นี่คือสิ่งที่คุณทำ: $n$ $2^n + 1$

ค้นหาและที่ตอบสนองและ2s $p$ $s$ $n = (p-1) 2^s$ $s \leq p \leq 2s$
เลือกจำนวนชิ้นเพื่อแบ่งบิตเป็นและพารามิเตอร์ที่เกี่ยวข้องสำหรับขนาดชิ้น: $2^m$ $n$

$\begin{aligned} m & = ⌊ s / 2 ⌋ + 1 \\ s_{2} & = ⌈ s / 2 ⌉ + 1 \\ p_{2} & = ⌈ p / 2 ⌉ + 1 \end{aligned}$ $\begin{align} m &= \lfloor s/2 \rfloor + 1 \\s_2 &= \lceil s/2 \rceil + 1 \\ p_2 &= \lceil p/2 \rceil + 1 \end{align}$
โปรดทราบว่าและยังคงตอบสนองความคงที่ โปรดทราบว่ามีความพึงพอใจดังนั้นอินพุตจึงเหมาะกับห้องสำหรับพกพา $s_2$ $p_2$ $s_2 \leq p_2 \leq 2 s_2$ $2^m 2^{s_2} p_2 \geq 2n + m + 1$
ดำเนินการ convolutions negacyclic-based FFT บนชิ้นส่วนและส่วนที่เหลือตามปกติ

เพื่อให้เป็นความคิดที่ครอบคลุมกลอการิทึม padding ปัจจัยPตอนนี้สำหรับการวิเคราะห์ความซับซ้อน FFT จะใช้งานที่ต้องทำและเรา recursing อยู่บนชิ้นส่วนของขนาดดังนั้นตอนนี้เราสามารถทำคณิตศาสตร์หยาบมากกับการกลับมาอีกความสัมพันธ์ WRT : $p$ $n m$ $2^m$ $(p_2-1) 2^{s_2}$ $s$

\begin{aligned} F (s) & (\leq) (p - 1) 2^{s} m + 2^{m} F (⌈ s / 2 ⌉ + 1) \\ (\leq) 2 s 2^{s} (⌊ s / 2 ⌋ + 1) + 2^{⌊ s / 2 ⌋ + 1} F (⌈ s / 2 ⌉ + 1) \\ (\leq) s^{2} 2^{s} + 2 \cdot 2^{s / 2} F (s / 2 + 1) \\ (\leq) s^{2} 2^{s} + 4 (s / 2)^{2} 2^{s} + 16 (s / 4)^{2} 2^{s} + . . . \\ (\leq) 2^{s} s^{2} \lg (s) \\ (\leq) \frac{n}{\lg n} {(\lg \frac{n}{\lg n})}^{2} \lg \lg \frac{n}{\lg n} \\ (\leq) \frac{n}{\lg n} (\lg^{2} n) \lg \lg n \\ (\leq) n (\lg n) \lg \lg n \end{aligned}

$\begin{align} F(s) &(\leq)\; (p-1)2^sm + 2^m F(\lceil s/2\rceil+1) \\ &(\leq)\; 2s2^s (\lfloor s/2\rfloor+1) + 2^{\lfloor s/2\rfloor+1} F(\lceil s/2\rceil+1) \\ &(\leq)\; s^2 2^s + 2 \cdot 2^{s/2} F(s/2+1) \\ &(\leq)\; s^2 2^s + 4 (s/2)^2 2^s + 16(s/4)^2 2^s + ... \\ &(\leq)\; 2^s s^2 \lg(s) \\ &(\leq)\; \frac{n}{\lg n} \left(\lg \frac{n}{\lg n}\right)^2 \lg \lg \frac{n}{\lg n} \\ &(\leq)\; \frac{n}{\lg n} (\lg^2 n) \lg \lg n \\ &(\leq)\; n \;(\lg n) \lg \lg n \end{align}$

ซึ่งดูเหมือนว่าถูกต้องถึงแม้ว่าฉันจะโกงในขั้นตอนเหล่านั้นมากทีเดียว

'หลอกลวง' ดูเหมือนจะเป็นความจริงที่ว่าเราลงท้ายด้วยแทนที่จะในราคาฐาน ยังคงมีสองคูณสองต่อระดับ recursive เหมือนฉันถูกบ่นเกี่ยวกับในคำถาม แต่ตอนนี้ลดลงครึ่งหนึ่งของจะจ่ายเงินปันผลสองครั้งเพื่อให้มันทั้งหมดออกไปทำงาน จากนั้นในตอนท้ายเรายกเลิกปัจจัยพิเศษของ (ซึ่งอันที่จริงแล้วเป็นปัจจัย ) ขอบคุณที่ทำให้มีขนาดใหญ่เมื่อเทียบกับในเบื้องต้นลอการิทึม $s^2$ $s$ $s$ $s$ $\log n$ $p$ $s$

— Craig Gidney
แหล่งที่มา

วงแหวนด้านในถูกเลือกในอัลกอริทึมSchönhage – Strassen อย่างไร