การเรียนรู้ PAC ที่เหมาะสมของ 2-DNF ภายใต้การกระจายแบบสม่ำเสมอ


10

อะไรคือผลลัพธ์ของความซับซ้อนของการสืบค้นของPAC learning 2-DNF ที่เหมาะสมกับสูตรตัวอย่างและภายใต้การแจกแจงแบบเดียวกัน ? หรือมีข้อผูกมัดใด ๆ

เพราะฉันไม่คุ้นเคยกับทฤษฎีการเรียนรู้และคำถามนี้ถูกกระตุ้นโดยสาขาที่แตกต่างกันคำตอบอาจชัดเจน ฉันตรวจสอบหนังสือโดย Kearns และ Vazirani แต่ดูเหมือนว่าพวกเขาจะไม่พิจารณาการตั้งค่านี้อย่างชัดเจน

UPD แม้ว่าพารามิเตอร์หลักที่น่าสนใจคือความซับซ้อนของแบบสอบถามเวลาทำงานก็มีความสำคัญเช่นกัน หากเป็นไปได้ควรใช้เวลาทำงานโดยประมาณจะค่อนข้างเหมือนกับความซับซ้อนของการสืบค้นหรือในพหุนามมากที่สุด

UPD ภาคผนวก B (ด้านบนของหน้า 18) ของกระดาษ "ฟังก์ชั่นการเรียนรู้ Submodular" โดย Balcan และฮาร์วีย์กล่าวว่า อย่างไรก็ตามพวกเขาไม่ได้เอ่ยถึงไม่ว่าผลลัพธ์นี้จะเป็นการเรียนรู้ที่เหมาะสมหรือให้การอ้างอิงใด ๆ


แบบสอบถามชนิดใด
Timothy Sun

เพียงแค่ตัวอย่าง นอกจากนี้ฉันคิดว่าฉันควรชัดเจนว่าคำถามเกี่ยวกับความซับซ้อนของแบบสอบถามไม่ใช่เวลาทำงาน (แก้ไข)
กริกอ Yaroslavtsev

ฉันได้ตอบคำถามของคุณแล้วโดยสมมติว่าแบบสอบถามตัวอย่างเป็นเพียงตัวอย่างแบบสุ่ม (ไม่ใช่แบบสอบถามแบบสมาชิก)
เลฟเรย์ซิ

1
ใช่คำค้นหาเป็นเพียงตัวอย่างแบบสุ่มจากการแจกแจงแบบสม่ำเสมอ
กริกอ Yaroslavtsev

คำตอบ:


14

ฉันไม่รู้ว่าคุณจะพิจารณาสิ่งต่อไปนี้ที่ไม่ใช่เรื่องไร้สาระหรือไม่ แต่นี่ฉันไป

ก่อนอื่นต้องมีความชัดเจนเพื่อไม่ให้สับสน c-DNF ด้วย k-term DNF (ซึ่งฉันมักทำ), cสูตร -DNF มากกว่าตัวแปร x1,,xn เป็นของแบบฟอร์ม i=1k(i,1i,2...i,c) ที่ไหน 1ik และ 1j, ผม,J{x1,...,xn,x¯1,...,x¯n}.

ก่อนอื่นเราสามารถถามจำนวนเทอมที่แตกต่างกันได้ใน -DNF แต่ละเทอมจะมี ของ n ตัวแปรแต่ละตัวที่ถูกทำให้เป็นโมฆะหรือไม่ทำ 2(n)เงื่อนไขที่เป็นไปได้ที่แตกต่างกัน ในอินสแตนซ์ 2-DNF แต่ละคำจะปรากฏหรือไม่ทำ|H|=22(n) "เป้าหมาย" ที่เป็นไปได้ H เป็นพื้นที่สมมุติฐาน

ลองนึกภาพอัลกอริทึมที่ใช้ ม. ตัวอย่างแล้วลองทั้งหมด |H|ตั้งสมมติฐานจนกระทั่งพบว่าสามารถทำนายตัวอย่างได้อย่างสมบูรณ์แบบ ทฤษฎีบทมีดโกนของ Occamบอกว่าคุณจะต้องทำเรื่องนี้ม.=O(1ε|(H|+1δ) ตัวอย่างสำหรับอัลกอริทึมนี้เพื่อค้นหาเป้าหมายที่มีข้อผิดพลาด ε ด้วยความน่าจะเป็น 1-δ.

ในกรณีของเราสำหรับ =2, LG|H|=O(n2)ซึ่งหมายความว่าคุณต้องการ n2 ตัวอย่างเพื่อทำการเรียนรู้ (เหมาะสม)

แต่เกมทั้งหมดในการเรียนรู้ไม่ใช่ตัวอย่างที่ซับซ้อน (แม้ว่าจะเป็นส่วนหนึ่งของเกมโดยเฉพาะอย่างยิ่งในการเรียนรู้ที่มีประสิทธิภาพ) แต่พยายามออกแบบอัลกอริธึมเวลาพหุนาม ถ้าคุณไม่ใส่ใจเรื่องประสิทธิภาพn2 เป็นคำตอบที่ง่ายที่สุดสำหรับความซับซ้อนของตัวอย่าง PAC

อัปเดต (ให้คำถามที่มีการเปลี่ยนแปลง) :

เนื่องจากคุณระบุอย่างชัดเจนว่าคุณให้ความสำคัญกับความซับซ้อนของตัวอย่างเท่านั้นฉันจึงนำเสนออัลกอริธึมแบบ brute-force Occam ซึ่งเป็นอาร์กิวเมนต์ที่ง่ายที่สุด อย่างไรก็ตามคำตอบของฉันค่อนข้างขี้อาย 2-DNF สามารถเรียนรู้ได้จริงในเวลาพหุนาม! นี่เป็นผลจากบทความต้นฉบับของ Valiant " Aory of the Learnable " ในความเป็นจริง-DNF สามารถเรียนรู้ได้สำหรับทุก ๆ =O(1).

อาร์กิวเมนต์จะเป็นดังนี้ คุณสามารถดู-DNF เป็นความแตกแยกของ n "meta-variables" และพยายามที่จะเรียนรู้ความแตกต่างโดยกำจัด meta-variables ที่ไม่สอดคล้องกับตัวอย่าง โซลูชันดังกล่าวสามารถแปลกลับไปเป็นโซลูชัน "เหมาะสม" ได้อย่างง่ายดายO(n)เวลา. จากบันทึกย่อด้านข้างยังคงเปิดอยู่ว่ามีอัลกอริธึมเวลาพหุนาม=ω(1).

ไม่ว่าจะเป็น n2ความซับซ้อนของกลุ่มตัวอย่างเป็นขอบเขตที่ต่ำกว่าคำตอบคือใช่มาก บทความนี้โดย Ehrenfeucht และคณะ แสดงให้เห็นว่า Occam ที่ถูกผูกไว้เกือบจะแน่น


1
ขอบคุณ! นี่เป็นผลลัพธ์ที่ไม่สำคัญ - ฉันไม่ได้ตระหนักว่าเวลาในการทำงานแบบเอ็กซ์โปเนนเชียลจะเป็นประโยชน์ อย่างไรก็ตามสำหรับแอปพลิเคชันที่ฉันมีอยู่ในใจจริง ๆ แล้วเวลาพหุนามเป็นที่พึงปรารถนามากขึ้น (อัพเดทคำถาม) เป็นวิธีการที่คุณอธิบายที่รู้จักกันดีที่สุดสำหรับปัญหานี้หรือไม่? มีขอบเขตที่ต่ำกว่าในความซับซ้อนของแบบสอบถาม (แม้สำหรับเวลาทำงานที่ไม่ จำกัด )?
Grigory Yaroslavtsev

อัปเดตคำถามพร้อมการอ้างอิงที่กระตุ้นคำถาม
Grigory Yaroslavtsev

1
อัปเดตคำตอบสำหรับคำถามที่อัปเดตของคุณแล้ว
Lev Reyzin

นอกจากนี้ - ในกรณีนี้ฉันไม่คิดว่าเวลาทำงานแบบเอ็กซ์โพเนนเชียลจะเป็นประโยชน์ แต่โดยทั่วไปดูเหมือนว่าจะเป็น การเรียนรู้ (ด้วยความซับซ้อนตัวอย่างที่เหมาะสมที่สุด) มักจะง่ายเมื่อคุณมีเวลาแทน
Lev Reyzin

2
ขอบคุณมาก! ฉันจะต้องใช้เวลาพอสมควรในการตรวจสอบข้อมูลอ้างอิง แต่จนถึงตอนนี้ดูเหมือนว่าจะเป็นคำตอบที่สมบูรณ์
กริกอ Yaroslavtsev
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.