ฟังก์ชั่นที่ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ แต่เรียนรู้ได้


28

เรารู้ว่า (ดูเช่นทฤษฎีบทที่ 1 และ 3 ของ [1]) ภายใต้เงื่อนไขที่เหมาะสมฟังก์ชั่นที่สามารถคำนวณได้อย่างมีประสิทธิภาพโดยเครื่องทัวริงในเวลาพหุนาม ("คำนวณได้อย่างมีประสิทธิภาพ") สามารถแสดงออกโดยเครือข่ายพหุนาม ด้วยขนาดที่เหมาะสมและสามารถเรียนรู้ได้ด้วยความซับซ้อนตัวอย่างพหุนาม ("เรียนรู้ได้") ภายใต้การแจกแจงการป้อนข้อมูลใด ๆ

ที่นี่ "เรียนรู้ได้" จะเกี่ยวข้องกับความซับซ้อนของตัวอย่างเท่านั้นโดยไม่คำนึงถึงความซับซ้อนของการคำนวณ

ฉันสงสัยเกี่ยวกับปัญหาที่เกี่ยวข้องอย่างใกล้ชิด: มีฟังก์ชันที่ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพโดย Turing machine ในเวลาพหุนาม ("ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ") แต่ในขณะเดียวกันสามารถเรียนรู้ได้ด้วยความซับซ้อนของตัวอย่างพหุนาม ภายใต้การแจกแจงอินพุตใด ๆ


4
ฉันมีปัญหากับ "และสามารถเรียนรู้ได้" มีฟังก์ชั่นที่คำนวณได้อย่างมีประสิทธิภาพ (พูด DFA) ที่ยากต่อการเรียนรู้แม้กระทั่งโดยประมาณ
Aryeh

3
นี่อาจจะขาดจุด แต่สิ่งที่เกี่ยวกับชั้นเรียน (พูด) 2nฟังก์ชันบูลีน n -bi? (เช่นมากหรือน้อยฟังก์ชั่นสุ่มโดยแต่ละค่าเป็นอิสระ1กับความน่าจะเป็น2n ) สำหรับε>2n , การเรียนรู้ PAC ภายใต้การแจกแจงเครื่องแบบนั้นไม่สำคัญ (0 ตัวอย่างที่จำเป็น, ฟังก์ชันคงที่0เป็นสมมุติฐานที่ดี), แต่ดูเหมือนว่าอัลกอริทึมการประเมินใด ๆ จะต้องใช้เวลา superpolynomial (เนื่องจากไม่มีโครงสร้างของฟังก์ชัน) ฉันมักจะเข้าใจผิดคำถาม แต่
Clement C.

3
คำศัพท์ของคุณค่อนข้างสับสน เมื่อเราพูดว่า "เรียนรู้ได้อย่างมีประสิทธิภาพ" เรามักจะอ้างถึงประสิทธิภาพการคำนวณ เพียงแค่พูดว่า "เรียนรู้ได้" ก็เพียงพอที่จะบ่งบอกถึงประสิทธิภาพของตัวอย่าง
Lev Reyzin

1
@Minkov เพื่อเรียนรู้ PAC คุณควรเรียนรู้เกี่ยวกับการกระจายใด ๆ มิฉะนั้นคำถามนั้นไม่น่าสนใจ (ดังที่ Clement ชี้ให้เห็น)
Lev Reyzin

2
ทำไมคนโหวตให้ปิด ฉันคิดว่านี่เป็นคำถามที่ลึกซึ้งและลึกซึ้ง!
Aryeh

คำตอบ:


11

ฉันจะทำให้เป็นรูปแบบที่แตกต่างกันของคำถามนี้ที่ "ประสิทธิภาพ" ถูกแทนที่ด้วย "การคำนวณ"

Let Cnเป็นระดับแนวความคิดของทุกภาษาLΣ ที่รู้จักโดยเครื่องจักรทัวริงในnรัฐหรือน้อยกว่า โดยทั่วไปสำหรับxΣและfCnปัญหาของการประเมิน f(x)เป็น undecidable

แต่สมมติว่าเรามีการเข้าถึง (ที่เหมาะสมว่าจะ) PAC-learning oracle สำหรับC n นั่นคือสำหรับการใด ๆε , δ > 0 , Oracle ขอตัวอย่างการติดป้ายชื่อขนาด 0 ( n , ε , δ ) เช่นว่าสมมติเช่นตัวอย่างถูกดึง IID จากการกระจายที่ไม่รู้จักD , พยากรณ์outputs สมมติฐานC n ซึ่งมีความน่าจะเป็นเวลาอย่างน้อย1 - δมีDACnϵ,δ>0m0(n,ϵ,δ)DAf^Cn1δDข้อผิดพลาด -generalization ไม่เกินεϵเราจะแสดงให้เห็นว่าพยากรณ์นี้ไม่สามารถคำนวณได้

อันที่จริงเราจะแสดงให้เห็นว่าเป็นปัญหาที่เรียบง่ายเป็น undecidable: หนึ่งของการกำหนดให้มีข้อความตัวอย่างSไม่ว่าจะมีอยู่fCnสอดคล้องกับSSสมมติว่า (เพื่อแย้ง) ว่าKเป็นเครื่องทัวริงที่ตัดสินปัญหาความมั่นคง

เราทำข้อตกลงเกี่ยวกับสัญกรณ์ดังต่อไปนี้ ระบุΣด้วยN={0,1,2,}ผ่านการสั่งพจนานุกรมตามปกติ สำหรับx{0,1}เราบอกว่า TM M "S-prints" xถ้ามันยอมรับสตริงทั้งหมดในΣ สอดคล้องกับดัชนีi st xi=1 และไม่ยอมรับ (อาจจะไม่ใช่ หยุดทำงาน) สตริงใด ๆ ที่สอดคล้องกับดัชนีxi=0 0 ตั้งแต่ (โดยสมมติฐาน)Kคือ decidable มันตามที่ฟังก์ชั่นK~:xk , กำหนดให้เป็นที่เล็กที่สุดkดังกล่าวว่า TM บางอย่างในCk S-พิมพ์xเป็นทัวริง-คำนวณ มันต่อไปตามที่ฟังก์ชั่น g:kxซึ่งแมkN ไปน้อยที่สุด (lexicographically) สตริงx{0,1} เช่นว่าK~(x)>kสามารถคำนวณได้เช่นกัน

MMg(|M|)MM|x|MM=|M|xM{0,1}. By construction, K~(xM)>, and so xM cannot be S-printed by any TM with description length or shorter. And yet it is defined as the S-print output of a TM with description length --- a contradiction.


2
ถาม: แปลงอาร์กิวเมนต์ "infinitary" ของฉันผ่านการคำนวณให้เป็น finitary หนึ่งผ่านประสิทธิภาพ ฉันคิดว่าคำตอบสำหรับคำถามของ @ minkov นั้นเป็นลบ: คุณไม่สามารถเรียนรู้คลาสฟังก์ชั่นที่คุณไม่สามารถประเมินได้อย่างมีประสิทธิภาพ ฉันคิดว่าสิ่งนี้จะยังคงเป็นจริงถ้าคุณย้ายเกิน PAC ที่เหมาะสมหรือรับได้
Aryeh
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.