C ++, 275,000,000+
เราจะอ้างถึงคู่ที่มีขนาดที่สามารถนำเสนอได้อย่างแม่นยำเช่น(x, 0)เป็นคู่ที่ซื่อสัตย์และคู่อื่น ๆ ทั้งหมดเป็นคู่ที่ไม่ซื่อสัตย์ของขนาดmโดยที่mคือขนาดที่รายงานของคู่นั้นไม่ถูกต้อง โปรแกรมแรกในโพสต์ก่อนหน้าใช้ชุดของคู่ที่เกี่ยวข้องกันอย่างแน่นหนาของคู่ที่ซื่อสัตย์และไม่ซื่อสัตย์:
(x, 0)และ(x, 1)ตามลำดับสำหรับxที่มีขนาดใหญ่พอ. โปรแกรมที่สองใช้คู่ที่ไม่ซื่อสัตย์ชุดเดียวกัน แต่ขยายชุดของคู่ที่ซื่อสัตย์โดยการมองหาคู่ที่ซื่อสัตย์ทั้งหมดของขนาดที่สมบูรณ์ โปรแกรมไม่สิ้นสุดภายในสิบนาที แต่พบว่าส่วนใหญ่ของผลลัพธ์เร็วมากซึ่งหมายความว่ารันไทม์ส่วนใหญ่จะเสีย แทนที่จะมองหาคู่ที่ซื่อตรงบ่อยครั้งต่อไปโปรแกรมนี้ใช้เวลาว่างในการทำสิ่งต่อไปที่เป็นตรรกะ: ขยายชุดของคู่ที่ไม่ซื่อสัตย์
จากการโพสต์ก่อนหน้านี้เรารู้ว่าสำหรับจำนวนเต็มขนาดใหญ่พอr , sqrt (r 2 + 1) = rโดยที่sqrtเป็นฟังก์ชันรากที่สองของทศนิยม แผนของการโจมตีของเราคือการหาคู่P = (x, y)เช่นว่าx 2 + y ที่2 = r 2 + 1สำหรับบางคนที่มีขนาดใหญ่พอจำนวนเต็มR มันง่ายพอที่จะทำ แต่การมองหาคู่ที่ซื่อตรงนั้นช้าเกินไปที่จะน่าสนใจ เราต้องการหาคู่เหล่านี้เป็นกลุ่มเหมือนที่เราทำเพื่อคู่ที่ซื่อสัตย์ในโปรแกรมก่อนหน้า
ให้{ v , w }เป็นคู่เวกเตอร์แบบออโธเทนเน็ต สำหรับสเกลาจริงr , || R V + W || 2 r = 2 + 1 ในℝ 2นี่เป็นผลโดยตรงของทฤษฎีบทพีทาโกรัส:
เรากำลังหาเวกเตอร์vและwว่ามันมีจำนวนเต็ม rซึ่งxและyเป็นจำนวนเต็มด้วย ในฐานะที่เป็นบันทึกด้านข้างโปรดทราบว่าชุดของคู่ที่ไม่ซื่อสัตย์ที่เราใช้ในสองโปรแกรมก่อนหน้านี้เป็นเพียงกรณีพิเศษของเรื่องนี้โดยที่{ v , w }เป็นมาตรฐานพื้นฐานของℝ 2 ; เวลานี้เราต้องการค้นหาวิธีแก้ปัญหาทั่วไปเพิ่มเติม นี่คือที่ซึ่ง Pythagorean triplets (จำนวนเต็ม triplets (a, b, c) เป็นที่พอใจ2 + b 2 = c 2ซึ่งเราใช้ในโปรแกรมก่อนหน้า) ทำการคัมแบ็กของพวกเขา
ปล่อยให้(a, b, c)เป็นทริปเปิลทาทา เวกเตอร์v = (b / c, a / c)และw = (-a / c, b / c) (และ
w = (a / c, -b / c) ) เป็น orthonormal เช่นเดียวกับที่ตรวจสอบได้ง่าย . ตามที่ปรากฎว่าสำหรับตัวเลือกใด ๆ ของ Pythagorean triplet มีจำนวนเต็มrซึ่งxและyเป็นจำนวนเต็ม เพื่อพิสูจน์สิ่งนี้และเพื่อค้นหาrและPอย่างมีประสิทธิภาพเราจำเป็นต้องมีทฤษฎีจำนวน / กลุ่มเล็กน้อย ฉันจะเก็บรายละเอียดไว้ ทั้งสองวิธีสมมติว่าเรามีหนึ่งของเราR , XและY เรายังขาดบางสิ่งอยู่เราต้องการrมีขนาดใหญ่พอและเราต้องการวิธีที่รวดเร็วในการหาคู่ที่คล้ายกันมากขึ้นจากคู่นี้ โชคดีที่มีวิธีง่ายๆในการทำสิ่งนี้ให้สำเร็จ
โปรดทราบว่าการฉายภาพของPลงบนvคือr vดังนั้นr = P · v = (x, y) · (b / c, a / c) = xb / c + ya / cทั้งหมดนี้เพื่อบอกว่าxb + ยา = RC เป็นผลให้สำหรับจำนวนเต็มทั้งหมดn , (x + bn) 2 + (y + an) 2 = (x 2 + y 2 ) + 2 (xb + ya) n + (a 2 + b 2 ) n 2 = ( r 2 + 1) + 2 (rc) n + (c 2 ) n 2 = (r + cn) 2 + 1. กล่าวอีกนัยหนึ่งขนาดกำลังสองของแบบฟอร์ม
(x + bn, y + an)คือ(r + cn) 2 + 1ซึ่งเป็นประเภทของคู่ที่เรากำลังมองหา! สำหรับขนาดใหญ่พอที่nเหล่านี้เป็นคู่ที่ไม่น่าไว้วางใจของขนาดR + CN
เป็นเรื่องที่ดีเสมอที่ได้ดูตัวอย่างที่เป็นรูปธรรม ถ้าเราใช้ Pythagorean triplet (3, 4, 5)จากนั้นที่r = 2เรามีP = (1, 2) (คุณสามารถตรวจสอบได้ว่า(1, 2) · (4/5, 3/5) = 2และชัดเจน1 2 + 2 2 = 2 2 + 1 ) การเพิ่ม5ไปยังrและ(4, 3)ไปที่Pทำให้เราไปที่r '= 2 + 5 = 7และP' = (1 + 4, 2 + 3) = (5, 5) แท้จริงและดูเถิด5 2 + 5 2 = 7 2 + 1. พิกัดต่อไปคือr '' = 12และP '' = (9, 8) , และอีกครั้ง, 9 2 + 8 2 = 12 2 + 1 , และอื่น ๆ , และอื่น ๆ ...
เมื่อRคือขนาดใหญ่พอเราเริ่มได้รับคู่ที่ไม่สุจริตกับการเพิ่มขึ้นขนาดของ5 นั่นคือประมาณ27,797,402 / 5คู่ที่ไม่น่าไว้วางใจ
ดังนั้นตอนนี้เรามีคู่ที่ไม่น่าไว้วางใจครบบริบูรณ์ เราสามารถจับคู่พวกเขาเข้ากับคู่ที่ซื่อสัตย์ของโปรแกรมแรกเพื่อก่อให้เกิดผลบวกปลอมและด้วยความระมัดระวังเราสามารถใช้คู่ที่ซื่อสัตย์ของโปรแกรมที่สองได้ นี่คือสิ่งที่โปรแกรมนี้ทำ เช่นเดียวกับโปรแกรมก่อนหน้านี้พบว่าผลลัพธ์ส่วนใหญ่เร็วเกินไป --- ได้รับผลบวกปลอม 200,000,000 ภายในไม่กี่วินาที --- จากนั้นช้าลงอย่างมาก
g++ flspos.cpp -oflspos -std=c++11 -msse2 -mfpmath=sse -O3
คอมไพล์ด้วย ในการตรวจสอบผลลัพธ์ให้เพิ่ม-DVERIFY
(ซึ่งจะช้าลงอย่างเห็นได้ชัด)
flspos
ทำงานด้วย อาร์กิวเมนต์บรรทัดคำสั่งใด ๆ สำหรับโหมด verbose
#include <cstdio>
#define _USE_MATH_DEFINES
#undef __STRICT_ANSI__
#include <cmath>
#include <cfloat>
#include <vector>
#include <iterator>
#include <algorithm>
using namespace std;
/* Make sure we actually work with 64-bit precision */
#if defined(VERIFY) && FLT_EVAL_METHOD != 0 && FLT_EVAL_METHOD != 1
# error "invalid FLT_EVAL_METHOD (did you forget `-msse2 -mfpmath=sse'?)"
#endif
template <typename T> struct widen;
template <> struct widen<int> { typedef long long type; };
template <typename T>
inline typename widen<T>::type mul(T x, T y) {
return typename widen<T>::type(x) * typename widen<T>::type(y);
}
template <typename T> inline T div_ceil(T a, T b) { return (a + b - 1) / b; }
template <typename T> inline typename widen<T>::type sq(T x) { return mul(x, x); }
template <typename T>
T gcd(T a, T b) { while (b) { T t = a; a = b; b = t % b; } return a; }
template <typename T>
inline typename widen<T>::type lcm(T a, T b) { return mul(a, b) / gcd(a, b); }
template <typename T>
T div_mod_n(T a, T b, T n) {
if (b == 0) return a == 0 ? 0 : -1;
const T n_over_b = n / b, n_mod_b = n % b;
for (T m = 0; m < n; m += n_over_b + 1) {
if (a % b == 0) return m + a / b;
a -= b - n_mod_b;
if (a < 0) a += n;
}
return -1;
}
template <typename T> struct pythagorean_triplet { T a, b, c; };
template <typename T>
struct pythagorean_triplet_generator {
typedef pythagorean_triplet<T> result_type;
private:
typedef typename widen<T>::type WT;
result_type p_triplet;
WT p_c2b2;
public:
pythagorean_triplet_generator(const result_type& triplet = {3, 4, 5}) :
p_triplet(triplet), p_c2b2(sq(triplet.c) - sq(triplet.b))
{}
const result_type& operator*() const { return p_triplet; }
const result_type* operator->() const { return &p_triplet; }
pythagorean_triplet_generator& operator++() {
do {
if (++p_triplet.b == p_triplet.c) {
++p_triplet.c;
p_triplet.b = ceil(p_triplet.c * M_SQRT1_2);
p_c2b2 = sq(p_triplet.c) - sq(p_triplet.b);
} else
p_c2b2 -= 2 * p_triplet.b - 1;
p_triplet.a = sqrt(p_c2b2);
} while (sq(p_triplet.a) != p_c2b2 || gcd(p_triplet.b, p_triplet.a) != 1);
return *this;
}
result_type operator()() { result_type t = **this; ++*this; return t; }
};
int main(int argc, const char* argv[]) {
const bool verbose = argc > 1;
const int min = 1 << 26;
const int max = sqrt(1ll << 53);
const size_t small_triplet_count = 1000;
vector<pythagorean_triplet<int>> small_triplets;
small_triplets.reserve(small_triplet_count);
generate_n(
back_inserter(small_triplets),
small_triplet_count,
pythagorean_triplet_generator<int>()
);
int found = 0;
auto add = [&] (int x1, int y1, int x2, int y2) {
#ifdef VERIFY
auto n1 = sq(x1) + sq(y1), n2 = sq(x2) + sq(y2);
if (x1 < y1 || x2 < y2 || x1 > max || x2 > max ||
n1 == n2 || sqrt(n1) != sqrt(n2)
) {
fprintf(stderr, "Wrong false-positive: (%d, %d) (%d, %d)\n",
x1, y1, x2, y2);
return;
}
#endif
if (verbose) printf("(%d, %d) (%d, %d)\n", x1, y1, x2, y2);
++found;
};
int output_counter = 0;
for (int x = min; x <= max; ++x) add(x, 0, x, 1);
for (pythagorean_triplet_generator<int> i; i->c <= max; ++i) {
const auto& t1 = *i;
for (int n = div_ceil(min, t1.c); n <= max / t1.c; ++n)
add(n * t1.b, n * t1.a, n * t1.c, 1);
auto find_false_positives = [&] (int r, int x, int y) {
{
int n = div_ceil(min - r, t1.c);
int min_r = r + n * t1.c;
int max_n = n + (max - min_r) / t1.c;
for (; n <= max_n; ++n)
add(r + n * t1.c, 0, x + n * t1.b, y + n * t1.a);
}
for (const auto t2 : small_triplets) {
int m = div_mod_n((t2.c - r % t2.c) % t2.c, t1.c % t2.c, t2.c);
if (m < 0) continue;
int sr = r + m * t1.c;
int c = lcm(t1.c, t2.c);
int min_n = div_ceil(min - sr, c);
int min_r = sr + min_n * c;
if (min_r > max) continue;
int x1 = x + m * t1.b, y1 = y + m * t1.a;
int x2 = t2.b * (sr / t2.c), y2 = t2.a * (sr / t2.c);
int a1 = t1.a * (c / t1.c), b1 = t1.b * (c / t1.c);
int a2 = t2.a * (c / t2.c), b2 = t2.b * (c / t2.c);
int max_n = min_n + (max - min_r) / c;
int max_r = sr + max_n * c;
for (int n = min_n; n <= max_n; ++n) {
add(
x2 + n * b2, y2 + n * a2,
x1 + n * b1, y1 + n * a1
);
}
}
};
{
int m = div_mod_n((t1.a - t1.c % t1.a) % t1.a, t1.b % t1.a, t1.a);
find_false_positives(
/* r = */ (mul(m, t1.c) + t1.b) / t1.a,
/* x = */ (mul(m, t1.b) + t1.c) / t1.a,
/* y = */ m
);
} {
int m = div_mod_n((t1.b - t1.c % t1.b) % t1.b, t1.a, t1.b);
find_false_positives(
/* r = */ (mul(m, t1.c) + t1.a) / t1.b,
/* x = */ m,
/* y = */ (mul(m, t1.a) + t1.c) / t1.b
);
}
if (output_counter++ % 50 == 0)
printf("%d\n", found), fflush(stdout);
}
printf("%d\n", found);
}