อัลกอริทึมแบบจำลองแบบสอบถามทางสถิติหรือไม่


13

ฉันถามคำถามนี้ในการถามตอบที่ผ่านการตรวจสอบแล้ว แต่ดูเหมือนว่าเกี่ยวข้องกับ CS มากกว่าสถิติ

คุณสามารถยกตัวอย่างอัลกอริธึมการเรียนรู้ของเครื่องซึ่งเรียนรู้จากคุณสมบัติทางสถิติของชุดข้อมูลที่ไม่ใช่การสังเกตการณ์ของตัวเองเช่นการใช้แบบจำลองแบบสอบถามเชิงสถิติได้หรือไม่


1
รูปแบบแบบสอบถามเชิงสถิติคืออะไร
Suresh Venkat

จาก Kearns paper portal.acm.org/citation.cfm?doid=293347.293351 : "ในรูปแบบนี้อัลกอริธึมการเรียนรู้ไม่ได้รับอนุญาตให้ตรวจสอบตัวอย่างของฟังก์ชั่นเป้าหมายที่ไม่รู้จักแต่ละตัว ช่องว่างของตัวอย่างแบบสุ่ม ". ขออภัยหากไม่ชัดเจนฉันได้อัปเดตคำถามของฉันพร้อมลิงก์ไปยังบทความ
Deyaa

คำตอบ:


14

เกือบทุกอัลกอริทึมที่ทำงานในรูปแบบ PAC (ยกเว้นอัลกอริธึมการเรียนรู้พาริตี้) สามารถทำให้ทำงานในรูปแบบ SQ ได้ ดูเช่นกระดาษของ Blum และคณะ ซึ่งอัลกอริธึมที่ได้รับความนิยมจำนวนมากได้รับการแปลเป็นเทียบเท่า SQ ของพวกเขา ( Practical Privacy: the SuLQ framework ) บทความนี้เกี่ยวข้องกับ "ความเป็นส่วนตัว" แต่คุณสามารถเพิกเฉยได้นั่นเป็นเพียงการนำอัลกอริธึมมาใช้กับการสืบค้น SQ

ในทางตรงกันข้ามการเรียนรู้แบบไม่เชื่อเรื่องพระเจ้านั้นยากกว่ามากในแบบจำลอง SQ: ปัญหาการคำนวณนอกเหนือ (แม้ว่าสิ่งเหล่านี้มีความสำคัญ) ความซับซ้อนของตัวอย่างที่จำเป็นสำหรับการเรียนแบบไม่เชื่อเรื่องพระเจ้านั้นค่อนข้างเหมือนกับที่จำเป็นสำหรับการเรียนรู้อย่างแน่นอน จุดข้อมูล ในทางตรงกันข้ามการเรียนรู้แบบไม่เชื่อเรื่องพระเจ้ากลายเป็นเรื่องยากมากขึ้นในแบบจำลอง SQ - โดยปกติคุณจะต้องสร้างแบบสอบถามจำนวนมากแบบพหุนามในเชิงพหุพจน์ ดูบทความนี้โดยเฟลด์แมน ( การศึกษาลักษณะเฉพาะของการเรียนรู้แบบสอบถามเชิงสถิติด้วยแอพพลิเคชั่นเพื่อการเปลี่ยนแปลงได้ ) หรือเอกสารล่าสุดโดย Gupta และคณะ ( คำสันธานส่วนตัวและ Barrier แบบสอบถามทางสถิติ )


คำตอบที่ดีจริงๆแอรอน :) ขอบคุณมาก :)
Deyaa

7

แบบจำลอง SQ ถูกสร้างขึ้นเพื่อวิเคราะห์การเรียนรู้ที่ทนต่อเสียงรบกวน - นั่นคืออัลกอริทึมที่ทำงานโดยการทำแบบสอบถามทางสถิติจะทำงานภายใต้เสียงการจำแนกประเภท ตามที่แอรอนกล่าวอัลกอริธึม PAC ส่วนใหญ่ที่เราได้กลายเป็นสิ่งที่เท่าเทียมกันในแบบจำลอง SQ ข้อยกเว้นหนึ่งคือการกำจัดแบบเกาส์ซึ่งใช้ในการเรียนรู้ parities (หนึ่งสามารถใช้โปรแกรมที่ชาญฉลาดของมันเพื่อเรียนรู้ log (n) loglog (n) ขนาด parities ในรูปแบบเสียงการจำแนก) เรารู้ด้วยว่า parities ไม่สามารถเรียนรู้ด้วยแบบสอบถามเชิงสถิติและกลายเป็นคลาสที่น่าสนใจที่สุดเช่นต้นไม้ตัดสินใจสามารถจำลองฟังก์ชัน parity ได้ ดังนั้นในการแสวงหาของเราเพื่อรับอัลกอริทึมการเรียนรู้ PAC สำหรับชั้นเรียนที่น่าสนใจมากมาย (เช่นต้นไม้ตัดสินใจ, DNF เป็นต้น) เรารู้ว่าเราจำเป็นต้องมีอัลกอริทึมการเรียนรู้ใหม่ที่ไม่สามารถใช้ได้ในรูปแบบแบบสอบถามเชิงสถิติ


น่าสนใจ คุณมีการอ้างอิงที่ parities ไม่สามารถเรียนรู้ในรูปแบบ SQ หรือไม่?
M. Alaggan

1
มันได้รับการพิสูจน์โดย Kearns ในเอกสารต้นฉบับของเขาที่กำหนดรูปแบบ: portal.acm.org/citation.cfm?doid=293347.293351แล้วแสดงอีกครั้งโดย Blum et al โดยที่พวกเขากำหนดมิติ SQ ของ class portal.acm.org/citation .cfm? โดยพื้นฐานแล้วอาร์กิวเมนต์เป็นดังนี้: parities เป็น "pairwise อิสระ" wrt การกระจายตัวของชุดดังนั้นคุณสวยมากต้องเดา parity ที่ถูกต้องเพื่อเรียนรู้อะไรและมี parities ที่เป็นไปได้มากมาย ...
Lev Reyzin

5

ฉันต้องการชี้แจงการตอบสนองของแอรอนเล็กน้อย เกือบทุกอัลกอริทึมผู้ไม่เชื่อเรื่องพระเจ้า (อีกครั้งยกเว้นสิ่งที่ใช้การกำจัดแบบเกาส์) สามารถทำงานในรูปแบบ SQ โดยธรรมชาติแล้วการเรียนรู้แบบไม่เชื่อเรื่องพระเจ้านั้นยากกว่าการเรียนรู้แบบไม่เชื่อเรื่องพระเจ้า แต่นี่เป็นคำถามที่เป็นอิสระ


/ϵ2
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.