เป็นที่ทราบกันอย่างกว้างขวางว่าสูตร CNF สามารถแบ่งพาร์ติชันได้ประมาณ 2 คลาส: สุ่มกับโครงสร้าง สูตร CNF ที่มีโครงสร้างซึ่งตรงกันข้ามกับสูตร CNF แบบสุ่มแสดงการเรียงลำดับบางส่วนแสดงรูปแบบที่ไม่น่าจะเกิดขึ้นโดยบังเอิญ อย่างไรก็ตามบางคนอาจพบว่าสูตรที่มีโครงสร้างแสดงระดับของการสุ่ม (เช่นบางกลุ่มของ clauses ดูเหมือนจะมีโครงสร้างที่น้อยกว่าคนอื่น ๆ ) เช่นเดียวกับสูตรสุ่มที่มีรูปแบบที่อ่อนแอของโครงสร้าง (เช่นบางกลุ่มของ clauses ) ดังนั้นดูเหมือนว่าการสุ่มของสูตรไม่ใช่แค่ใช่ / ไม่ใช่จริง
ให้เป็นฟังก์ชั่นที่กำหนดสูตร CNF F ∈ Fคืนค่าจริงระหว่าง0และ1รวม: 0หมายถึงสูตรโครงสร้างที่บริสุทธิ์ขณะที่1หมายถึงสูตรสุ่มบริสุทธิ์
ฉันสงสัยว่ามีใครบางคนเคยพยายามที่จะคิดค้นเช่นRแน่นอนว่าค่าที่ส่งคืนโดยrจะเท่ากับ (อย่างน้อยนี่คือความตั้งใจของฉัน) เพียงแค่การวัดที่ใช้ได้จริงตามเกณฑ์ที่สมเหตุสมผลบางอย่างแทนที่จะเป็นความจริงทางทฤษฎีที่มั่นคง
ฉันยังสนใจที่จะทราบว่ามีใครเคยกำหนดและศึกษาตัวบ่งชี้ทางสถิติใด ๆ ที่สามารถใช้ในคำจำกัดความของหรือในการพิจารณาคุณสมบัติโดยรวมที่มีประโยชน์อื่น ๆ ของสูตร จากตัวบ่งชี้ทางสถิติฉันหมายถึงสิ่งที่ต้องการ
- ไวรัสตับอักเสบซี (จำนวนระเบียนแปรปรวน)
ให้เป็นฟังก์ชั่นที่ได้รับตัวแปรวีเจ ∈ Nกลับจำนวนครั้งที่วีเจปรากฏในF Let Vเป็นชุดของตัวแปรที่ใช้ในการเรนไฮน์ ให้ˉ h F = 1เป็น AHC (จำนวน Hit เฉลี่ย) HCV มีการกำหนดดังต่อไปนี้: HVC=1
ในกรณีสุ่ม HCV นั้นต่ำมาก (ตัวแปรทั้งหมดถูกกล่าวถึงเกือบเท่ากันจำนวนครั้ง) ในขณะที่โครงสร้างไม่ได้ (บางตัวแปร มีการใช้บ่อยมากและบางคนไม่เช่นมี "กลุ่มการใช้งาน")
- AID (ระดับความไม่บริสุทธิ์เฉลี่ย)
ปล่อยให้เป็นจำนวนครั้งที่v jเกิดขึ้นเป็นบวกและให้h - F ( v j )จำนวนครั้งที่เกิดการลบ ให้ฉัน: N → [ 0 , 1 ]เป็นฟังก์ชั่นที่ได้รับตัวแปรวีเจ ∈ Vกลับของ ID (มัวหมองปริญญา) ฟังก์ชันi ( v j )ถูกกำหนดดังนี้: i ( ) ตัวแปรเหล่านั้นที่เกิดขึ้นครึ่งหนึ่งของเวลาเป็นบวกและครึ่งหนึ่งของลบมีระดับความบริสุทธิ์สูงสุดในขณะที่ตัวแปรเหล่านั้นเกิดขึ้นในทางบวกหรือลบเสมอ (เช่นตัวอักษรบริสุทธิ์) มีระดับความบริสุทธิ์ต่ำสุด AID มีการกำหนดไว้อย่างง่าย ๆ ดังนี้: AID=1
ในกรณีสุ่ม (อย่างน้อยในผู้ที่สร้างขึ้นโดยกวนตัวแปรที่มีความน่าจะเป็น0.5) AID ที่เกือบจะเท่ากับ1ในขณะที่ในกรณีที่มีโครงสร้างก็มักจะห่างไกลจาก1
- IDV (มัวหมองปริญญาแปรปรวน)
IDV เป็นตัวบ่งชี้ที่แข็งแกร่งมากขึ้นกว่า AID เพียงอย่างเดียวเพราะมันบัญชีสำหรับกรณีสุ่มสร้างขึ้นโดยกวนตัวแปรที่มีความน่าจะเป็นที่แตกต่างกันกว่า0.5มันถูกกำหนดเป็น: I D V = 1
แรงจูงใจ
- เพื่อให้เข้าใจถึงวิธีการทำงานของสูตร CNF ได้ดีขึ้นวิธีการวัดแบบแผน / โครงสร้างของพวกเขาหากคุณสมบัติโดยรวมที่มีประโยชน์อื่น ๆ สามารถอนุมานได้โดยดูที่ตัวชี้วัดทางสถิติของพวกเขา
- สงสัยว่าความน่าพอใจ (หรือแม้แต่จำนวนของการแก้ปัญหา) ของสูตร CNF สามารถสรุปได้ด้วยการจัดการกับตัวบ่งชี้ทางสถิติอย่างชาญฉลาด
คำถาม
- มีใครเคยเสนอวิธีการวัดแบบแผนของสูตร CNF หรือไม่?
- มีใครเคยเสนอตัวบ่งชี้ทางสถิติใด ๆ ที่สามารถใช้ในการศึกษาหรือแม้กระทั่งอนุมานคุณสมบัติโดยรวมที่เป็นประโยชน์ของสูตร CNF ได้หรือไม่?