การวัดแบบแผนของสูตร CNF


12

เป็นที่ทราบกันอย่างกว้างขวางว่าสูตร CNF สามารถแบ่งพาร์ติชันได้ประมาณ 2 คลาส: สุ่มกับโครงสร้าง สูตร CNF ที่มีโครงสร้างซึ่งตรงกันข้ามกับสูตร CNF แบบสุ่มแสดงการเรียงลำดับบางส่วนแสดงรูปแบบที่ไม่น่าจะเกิดขึ้นโดยบังเอิญ อย่างไรก็ตามบางคนอาจพบว่าสูตรที่มีโครงสร้างแสดงระดับของการสุ่ม (เช่นบางกลุ่มของ clauses ดูเหมือนจะมีโครงสร้างที่น้อยกว่าคนอื่น ๆ ) เช่นเดียวกับสูตรสุ่มที่มีรูปแบบที่อ่อนแอของโครงสร้าง (เช่นบางกลุ่มของ clauses ) ดังนั้นดูเหมือนว่าการสุ่มของสูตรไม่ใช่แค่ใช่ / ไม่ใช่จริง

ให้เป็นฟังก์ชั่นที่กำหนดสูตร CNF F Fคืนค่าจริงระหว่าง0และ1รวม: 0หมายถึงสูตรโครงสร้างที่บริสุทธิ์ขณะที่1หมายถึงสูตรสุ่มบริสุทธิ์r:F[0,1]FF0101

ฉันสงสัยว่ามีใครบางคนเคยพยายามที่จะคิดค้นเช่นRแน่นอนว่าค่าที่ส่งคืนโดยrจะเท่ากับ (อย่างน้อยนี่คือความตั้งใจของฉัน) เพียงแค่การวัดที่ใช้ได้จริงตามเกณฑ์ที่สมเหตุสมผลบางอย่างแทนที่จะเป็นความจริงทางทฤษฎีที่มั่นคงrr

ฉันยังสนใจที่จะทราบว่ามีใครเคยกำหนดและศึกษาตัวบ่งชี้ทางสถิติใด ๆ ที่สามารถใช้ในคำจำกัดความของหรือในการพิจารณาคุณสมบัติโดยรวมที่มีประโยชน์อื่น ๆ ของสูตร จากตัวบ่งชี้ทางสถิติฉันหมายถึงสิ่งที่ต้องการr

  1. ไวรัสตับอักเสบซี (จำนวนระเบียนแปรปรวน)

    ให้เป็นฟังก์ชั่นที่ได้รับตัวแปรวีเจNกลับจำนวนครั้งที่วีเจปรากฏในF Let Vเป็นชุดของตัวแปรที่ใช้ในการเรนไฮน์ ให้ˉ h F = 1hF:NNvjNvjFVFเป็น AHC (จำนวน Hit เฉลี่ย) HCV มีการกำหนดดังต่อไปนี้: HVC=1h¯F=1|V|vjVhF(vj)

    ในกรณีสุ่ม HCV นั้นต่ำมาก (ตัวแปรทั้งหมดถูกกล่าวถึงเกือบเท่ากันจำนวนครั้ง) ในขณะที่โครงสร้างไม่ได้ (บางตัวแปร มีการใช้บ่อยมากและบางคนไม่เช่นมี "กลุ่มการใช้งาน")HVC=1|V|vjV(hF(vj)h¯F)2



  2. AID (ระดับความไม่บริสุทธิ์เฉลี่ย)

    ปล่อยให้เป็นจำนวนครั้งที่v jเกิดขึ้นเป็นบวกและให้h - F ( v j )จำนวนครั้งที่เกิดการลบ ให้ฉัน: N[ 0 , 1 ]เป็นฟังก์ชั่นที่ได้รับตัวแปรวีเจVกลับของ ID (มัวหมองปริญญา) ฟังก์ชันi ( v j )ถูกกำหนดดังนี้: i (hF+(vj)vjhF(vj)i:N[0,1]vjVi(vj) ) ตัวแปรเหล่านั้นที่เกิดขึ้นครึ่งหนึ่งของเวลาเป็นบวกและครึ่งหนึ่งของลบมีระดับความบริสุทธิ์สูงสุดในขณะที่ตัวแปรเหล่านั้นเกิดขึ้นในทางบวกหรือลบเสมอ (เช่นตัวอักษรบริสุทธิ์) มีระดับความบริสุทธิ์ต่ำสุด AID มีการกำหนดไว้อย่างง่าย ๆ ดังนี้: AID=1i(vj)=2min(hF+(vj),hF(vj))hF(vj)

    ในกรณีสุ่ม (อย่างน้อยในผู้ที่สร้างขึ้นโดยกวนตัวแปรที่มีความน่าจะเป็น0.5) AID ที่เกือบจะเท่ากับ1ในขณะที่ในกรณีที่มีโครงสร้างก็มักจะห่างไกลจาก1AID=1|V|vjVi(vj)

    0.511

  3. IDV (มัวหมองปริญญาแปรปรวน)

    IDV เป็นตัวบ่งชี้ที่แข็งแกร่งมากขึ้นกว่า AID เพียงอย่างเดียวเพราะมันบัญชีสำหรับกรณีสุ่มสร้างขึ้นโดยกวนตัวแปรที่มีความน่าจะเป็นที่แตกต่างกันกว่า0.5มันถูกกำหนดเป็น: I D V = 10.5

    IDV=1|V|vjV(i(vj)AID)2

    00

แรงจูงใจ

  1. เพื่อให้เข้าใจถึงวิธีการทำงานของสูตร CNF ได้ดีขึ้นวิธีการวัดแบบแผน / โครงสร้างของพวกเขาหากคุณสมบัติโดยรวมที่มีประโยชน์อื่น ๆ สามารถอนุมานได้โดยดูที่ตัวชี้วัดทางสถิติของพวกเขา
  2. สงสัยว่าความน่าพอใจ (หรือแม้แต่จำนวนของการแก้ปัญหา) ของสูตร CNF สามารถสรุปได้ด้วยการจัดการกับตัวบ่งชี้ทางสถิติอย่างชาญฉลาด

คำถาม

  1. มีใครเคยเสนอวิธีการวัดแบบแผนของสูตร CNF หรือไม่?
  2. มีใครเคยเสนอตัวบ่งชี้ทางสถิติใด ๆ ที่สามารถใช้ในการศึกษาหรือแม้กระทั่งอนุมานคุณสมบัติโดยรวมที่เป็นประโยชน์ของสูตร CNF ได้หรือไม่?

1
ดูกระดาษในคำตอบนี้ ( cstheory.stackexchange.com/questions/4321/… ) มันสามารถให้คำแนะนำเกี่ยวกับวิธีการกำหนดเช่น r
Marcos Villagra

1
อาจมีการอภิปรายที่เกี่ยวข้องในการวัดแบบแผนของ bit-strings mathoverflow.net/questions/37518/ …
Yaroslav Bulatov

ฉันสามารถบอกคุณได้มากตั้งแต่ฉันทำงานนี้มาระยะหนึ่งแล้ว หากคุณพิจารณา SAT สูตรสำหรับ 1 และ 2 จะเป็นเลขชี้กำลัง ในทางตรงกันข้ามสำหรับ k-SAT สูตรสำหรับ 1 และ 2 คือพหุนาม สิ่งนี้เกี่ยวข้องกับคำจำกัดความความแม่นยำของคำถาม K-SAT สุ่มของฉันซึ่งไม่มีใครอยากตอบ
Tayfun จ่าย

@Geekster: คุณต้องการที่จะให้คำตอบที่นี่?
Hsien-Chih Chang 張顯之

@Geekster: คุณหมายถึงอะไรกับ"... สูตร 1 และ 2 มีการชี้แจง" ?
Giorgio Camerani

คำตอบ:


3

ฉันแนะนำให้ยืมปรีชาฟิสิกส์ว่าโครงสร้าง "สุ่มน้อย" มีความสมมาตรมากกว่า สมมาตรสำหรับ CNF เป็นการเปลี่ยนแปลงของตัวแปรใด ๆ ที่ทำให้ฟังก์ชันคงที่ ตามเกณฑ์นั้นฟังก์ชั่นของ 3 ตัวแปรเช่น

x1x2x3.

หรือพูด

(x1x2¬x3)(x1¬x2x3)(¬x1x2x3)(¬x1¬x2¬x3).

สุ่มน้อยกว่าพูด

(x1x2¬x3)(x1¬x2x3)(¬x1¬x2x3).

โดยทั่วไปการกำหนดแนวคิดของ "สุ่ม" บนโครงสร้าง จำกัด เป็นสิ่งที่ท้าทาย ในอดีตมันถูกทดลองในลำดับเลขฐานสองซึ่งเนื้อหาเป็นโครงสร้าง จำกัด ที่ง่ายที่สุด ตัวอย่างเช่นสัญชาตญาณลำดับ 01010101 คือ "สุ่มน้อย" กว่าพูด 01001110 อย่างไรก็ตามมันรู้ได้อย่างรวดเร็วว่าไม่มีคำจำกัดความที่เป็นทางการที่สอดคล้องกันของลำดับสุ่มแน่นอน ! ดังนั้นเราต้องสงสัยว่าความพยายามไร้เดียงสาใด ๆ ในการกำหนดตัวชี้วัดแบบสุ่มสำหรับโครงสร้าง จำกัด ใด ๆ


ฉันทั้งหมดเห็นด้วยกับสัญชาตญาณ"การปรากฏตัวโครงสร้างวิธีการสมมาตรในขณะที่การสุ่มหมายถึงกรณีที่ไม่มีสมมาตร" คุณอ้างถึงซินแท็กซ์สมมาตร (ในขณะที่ความหมายของความหมายคือการเปลี่ยนฟังก์ชัน แต่ปล่อยให้พื้นที่โซลูชันไม่เปลี่ยนแปลง) ฉันเชื่อมั่นเสมอมาว่าสมมาตรเป็นกุญแจสำคัญ
Giorgio Camerani

1
@ วอลเตอร์: แนวคิดเรื่องสมมาตรเป็นความพยายามในการใช้ประโยชน์จากพีชคณิตมากกว่าอัลกอริธึม: ความซับซ้อนของอัลกอริธึมคือการวัดที่ท้าทายนิยามที่สอดคล้องกันสำหรับวัตถุ จำกัด แต่จากนั้นเราต้องกำหนดค่าความซับซ้อนให้กับแต่ละองค์ประกอบของกลุ่ม (ตัวอย่างเช่นการเปลี่ยนแปลงที่ทำให้ตัวแปรเดี่ยวนั้นง่ายกว่าที่คิดว่าสองอย่าง) - สิ่งนี้รู้สึกเหมือนเพิ่งผลักดันปัญหาไปรอบ ๆ ...
Tegiri Nenashi
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.