ฟังก์ชั่นที่ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ แต่เรียนรู้ได้

เรารู้ว่า (ดูเช่นทฤษฎีบทที่ 1 และ 3 ของ [1]) ภายใต้เงื่อนไขที่เหมาะสมฟังก์ชั่นที่สามารถคำนวณได้อย่างมีประสิทธิภาพโดยเครื่องทัวริงในเวลาพหุนาม ("คำนวณได้อย่างมีประสิทธิภาพ") สามารถแสดงออกโดยเครือข่ายพหุนาม ด้วยขนาดที่เหมาะสมและสามารถเรียนรู้ได้ด้วยความซับซ้อนตัวอย่างพหุนาม ("เรียนรู้ได้") ภายใต้การแจกแจงการป้อนข้อมูลใด ๆ

ที่นี่ "เรียนรู้ได้" จะเกี่ยวข้องกับความซับซ้อนของตัวอย่างเท่านั้นโดยไม่คำนึงถึงความซับซ้อนของการคำนวณ

ฉันสงสัยเกี่ยวกับปัญหาที่เกี่ยวข้องอย่างใกล้ชิด: มีฟังก์ชันที่ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพโดย Turing machine ในเวลาพหุนาม ("ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ") แต่ในขณะเดียวกันสามารถเรียนรู้ได้ด้วยความซับซ้อนของตัวอย่างพหุนาม ภายใต้การแจกแจงอินพุตใด ๆ

[1] ร้อยเอ็ด Livni, Shai Shalev-Shwartz, Ohad Shamir, " ประสิทธิภาพการคำนวณของการฝึกอบรมโครงข่ายประสาทเทียม ", 2014

— Minkov
แหล่งที่มา

ฉันมีปัญหากับ "และสามารถเรียนรู้ได้" มีฟังก์ชั่นที่คำนวณได้อย่างมีประสิทธิภาพ (พูด DFA) ที่ยากต่อการเรียนรู้แม้กระทั่งโดยประมาณ

— Aryeh

นี่อาจจะขาดจุด แต่สิ่งที่เกี่ยวกับชั้นเรียน (พูด)

2^{- \sqrt{n}}

$2^{-\sqrt{n}}$ ฟังก์ชันบูลีน

-bi? (เช่นมากหรือน้อยฟังก์ชั่นสุ่มโดยแต่ละค่าเป็นอิสระ

1

$1$ กับความน่าจะเป็น

2^{- \sqrt{n}}

$2^{-\sqrt{n}}$ ) สำหรับ

ε > 2^{- \sqrt{n}}

$\varepsilon > 2^{-\sqrt{n}}$ , การเรียนรู้ PAC ภายใต้การแจกแจงเครื่องแบบนั้นไม่สำคัญ (0 ตัวอย่างที่จำเป็น, ฟังก์ชันคงที่

0

$0$ เป็นสมมุติฐานที่ดี), แต่ดูเหมือนว่าอัลกอริทึมการประเมินใด ๆ จะต้องใช้เวลา superpolynomial (เนื่องจากไม่มีโครงสร้างของฟังก์ชัน) ฉันมักจะเข้าใจผิดคำถาม แต่

— Clement C.

คำศัพท์ของคุณค่อนข้างสับสน เมื่อเราพูดว่า "เรียนรู้ได้อย่างมีประสิทธิภาพ" เรามักจะอ้างถึงประสิทธิภาพการคำนวณ เพียงแค่พูดว่า "เรียนรู้ได้" ก็เพียงพอที่จะบ่งบอกถึงประสิทธิภาพของตัวอย่าง

— Lev Reyzin

@Minkov เพื่อเรียนรู้ PAC คุณควรเรียนรู้เกี่ยวกับการกระจายใด ๆ มิฉะนั้นคำถามนั้นไม่น่าสนใจ (ดังที่ Clement ชี้ให้เห็น)

— Lev Reyzin

ทำไมคนโหวตให้ปิด ฉันคิดว่านี่เป็นคำถามที่ลึกซึ้งและลึกซึ้ง!

— Aryeh

ฉันจะทำให้เป็นรูปแบบที่แตกต่างกันของคำถามนี้ที่ "ประสิทธิภาพ" ถูกแทนที่ด้วย "การคำนวณ"

Let $C_n$ เป็นระดับแนวความคิดของทุกภาษา $L\subseteq\Sigma^*$ ที่รู้จักโดยเครื่องจักรทัวริงใน $n$ รัฐหรือน้อยกว่า โดยทั่วไปสำหรับ $x\in\Sigma^*$ และ $f\in C_n$ ปัญหาของการประเมิน $f(x)$ เป็น undecidable

แต่สมมติว่าเรามีการเข้าถึง (ที่เหมาะสมว่าจะ) PAC-learning oracle สำหรับ nนั่นคือสำหรับการใด ๆ , Oracle ขอตัวอย่างการติดป้ายชื่อขนาด เช่นว่าสมมติเช่นตัวอย่างถูกดึง IID จากการกระจายที่ไม่รู้จัก , พยากรณ์outputs สมมติฐาน ซึ่งมีความน่าจะเป็นเวลาอย่างน้อยมี $A$ $C_n$ $\epsilon,\delta>0$ $m_0(n,\epsilon,\delta)$ $D$ $A$ $\hat f\in C_n$ $1-\delta$ $D$ ข้อผิดพลาด -generalization ไม่เกินε $\epsilon$ เราจะแสดงให้เห็นว่าพยากรณ์นี้ไม่สามารถคำนวณได้

อันที่จริงเราจะแสดงให้เห็นว่าเป็นปัญหาที่เรียบง่ายเป็น undecidable: หนึ่งของการกำหนดให้มีข้อความตัวอย่าง $S$ ไม่ว่าจะมีอยู่ $f\in C_n$ สอดคล้องกับS $S$ สมมติว่า (เพื่อแย้ง) ว่า $K$ เป็นเครื่องทัวริงที่ตัดสินปัญหาความมั่นคง

เราทำข้อตกลงเกี่ยวกับสัญกรณ์ดังต่อไปนี้ ระบุ $\Sigma^*$ ด้วย $\mathbb{N}=\{0,1,2,\ldots\}$ ผ่านการสั่งพจนานุกรมตามปกติ สำหรับ $x\in\{0,1\}^*$ เราบอกว่า TM $M$ "S-prints" $x$ ถ้ามันยอมรับสตริงทั้งหมดใน $\Sigma^*$ สอดคล้องกับดัชนี $i$ st $x_i=1$ และไม่ยอมรับ (อาจจะไม่ใช่ หยุดทำงาน) สตริงใด ๆ ที่สอดคล้องกับดัชนี $x_i=0$ 0ตั้งแต่ (โดยสมมติฐาน) $K$ คือ decidable มันตามที่ฟังก์ชั่น $\tilde K:x\mapsto k$ , กำหนดให้เป็นที่เล็กที่สุด $k$ ดังกล่าวว่า TM บางอย่างใน $C_k$ S-พิมพ์ $x$ เป็นทัวริง-คำนวณ มันต่อไปตามที่ฟังก์ชั่น $g:k\mapsto x$ ซึ่งแม $k\in\mathbb{N}$ ไปน้อยที่สุด (lexicographically) สตริง $x\in\{0,1\}^*$ เช่นว่า $\tilde K(x)>k$ สามารถคำนวณได้เช่นกัน

$M$ $M$ $g(|\langle M\rangle|)$ $\langle M\rangle$ $M$ $|x|$ $M$ $M$ $\ell=|\langle M\rangle|$ $x_M\in\{0,1\}^*$ . By construction, $\tilde K(x_M)>\ell$ , and so $x_M$ cannot be S-printed by any TM with description length $\ell$ or shorter. And yet it is defined as the S-print output of a TM with description length $\ell$ --- a contradiction.

— Aryeh
แหล่งที่มา

ถาม: แปลงอาร์กิวเมนต์ "infinitary" ของฉันผ่านการคำนวณให้เป็น finitary หนึ่งผ่านประสิทธิภาพ ฉันคิดว่าคำตอบสำหรับคำถามของ @ minkov นั้นเป็นลบ: คุณไม่สามารถเรียนรู้คลาสฟังก์ชั่นที่คุณไม่สามารถประเมินได้อย่างมีประสิทธิภาพ ฉันคิดว่าสิ่งนี้จะยังคงเป็นจริงถ้าคุณย้ายเกิน PAC ที่เหมาะสมหรือรับได้

— Aryeh