วิทยาศาสตร์คอมพิวเตอร์เชิงทฤษฎี machine-learning

5

TCS ต้องการคำตอบประเภทใดสำหรับคำถามที่ว่า“ ทำไมเครือข่ายประสาทเทียมจึงทำงานได้ดี?”

ปริญญาเอกของฉัน อยู่ในคณิตศาสตร์บริสุทธิ์และฉันยอมรับว่าฉันไม่รู้อะไรเกี่ยวกับทฤษฎี CS มากนัก อย่างไรก็ตามฉันได้เริ่มสำรวจตัวเลือกที่ไม่ใช่ทางวิชาการสำหรับอาชีพของฉันและในการแนะนำตัวเองเกี่ยวกับการเรียนรู้ของเครื่องโดยพบข้อความเช่น "ไม่มีใครเข้าใจว่าทำไมเครือข่ายประสาททำงานได้ดี" ซึ่งฉันคิดว่าน่าสนใจ คำถามของฉันโดยพื้นฐานแล้วนักวิจัยต้องการคำตอบประเภทใด? นี่คือสิ่งที่ฉันได้พบในการค้นหาสั้น ๆ ของฉันในหัวข้อ: อัลกอริทึมที่ใช้โครงข่ายประสาทอย่างง่ายนั้นค่อนข้างตรงไปตรง กระบวนการของ SGD มีความเข้าใจทางคณิตศาสตร์เป็นอย่างดีเช่นเดียวกับทฤษฎีทางสถิติ ทฤษฎีบทการประมาณสากลนั้นทรงพลังและได้รับการพิสูจน์แล้ว มีรายงานเมื่อไม่นานมานี้https://arxiv.org/abs/1608.08225ซึ่งให้คำตอบว่าการประมาณสากลนั้นมากกว่าที่เราต้องการในทางปฏิบัติจริง ๆ เพราะเราสามารถสร้างสมมติฐานที่ง่ายขึ้นเกี่ยวกับฟังก์ชันที่เราพยายามทำแบบจำลองด้วย โครงข่ายประสาทเทียม ในเอกสารดังกล่าวพวกเขาระบุ (การถอดความ) "อัลกอริทึม GOFAI เข้าใจอย่างเต็มที่ในการวิเคราะห์ แต่อัลกอริธึม ANN จำนวนมากเข้าใจเพียงการเรียนรู้ด้วยวิธีการ" ทฤษฎีการบรรจบกันของอัลกอริธึมที่นำมาใช้เป็นตัวอย่างของความเข้าใจในการวิเคราะห์ที่ดูเหมือนว่าเรามีเกี่ยวกับเครือข่ายประสาทดังนั้นคำสั่งในระดับทั่วไปนี้ไม่ได้บอกฉันมากเกี่ยวกับสิ่งที่รู้จักหรือไม่ทราบ ." ผู้เขียนแนะนำในการสรุปว่าคำถามเช่นขอบเขตที่มีประสิทธิภาพกับขนาดของเครือข่ายประสาทที่จำเป็นในการประมาณค่าพหุนามที่กำหนดนั้นเปิดกว้างและน่าสนใจ ตัวอย่างอื่น ๆ ของคำถามวิเคราะห์เชิงคณิตศาสตร์ที่ต้องได้รับคำตอบเพื่อบอกว่าเรา "เข้าใจ" เครือข่ายประสาทเทียมคืออะไร? มีคำถามที่อาจตอบเป็นภาษาทางคณิตศาสตร์ที่บริสุทธิ์กว่านี้หรือไม่? (ฉันกำลังคิดถึงวิธีการในทฤษฎีการแทนโดยเฉพาะเนื่องจากการใช้ฟิสิกส์ในบทความนี้ - และเห็นแก่ตัวเพราะมันเป็นสาขาการศึกษาของฉันอย่างไรก็ตามฉันยังสามารถจินตนาการถึงพื้นที่เช่นทฤษฎี combinatorics / กราฟเรขาคณิตเชิงพีชคณิต และโทโพโลยีให้เครื่องมือที่ทำงานได้)

52 machine-learning

10

อัลกอริทึมที่ยอดเยี่ยมการเรียนรู้ของเครื่องและไม่มีพีชคณิตเชิงเส้น

ฉันสอนหลักสูตรอัลกอริทึมขั้นสูงและต้องการรวมบางหัวข้อที่เกี่ยวข้องกับการเรียนรู้ของเครื่องซึ่งเป็นที่สนใจของนักเรียนของฉัน ด้วยเหตุนี้ฉันต้องการฟังความคิดเห็นของผู้คนเกี่ยวกับผลลัพธ์อัลกอริทึมที่น่าสนใจที่สุดในการเรียนรู้ของเครื่อง ข้อ จำกัด ที่อาจเกิดขึ้นได้ยากคือนักเรียนจะไม่เคยมีความรู้มาก่อนเกี่ยวกับพีชคณิตเชิงเส้นหรือหัวข้อหลักอื่น ๆ ในการเรียนรู้ของเครื่อง นี่คือการกระตุ้นให้พวกเขาเกี่ยวกับหัวข้อและเพื่อให้พวกเขารู้ว่า ML เป็นพื้นที่การวิจัยที่น่าตื่นเต้นสำหรับผู้เชี่ยวชาญด้านอัลกอริทึม แก้ไข: นี่เป็นหลักสูตรระดับปริญญาตรีปีสุดท้าย (เนื่องจากเราไม่มีหลักสูตรระดับบัณฑิตศึกษาในสหราชอาณาจักรเป็นหลัก) พวกเขาจะทำอย่างน้อยหนึ่งอัลกอริธึมพื้นฐานหลักสูตรล่วงหน้าและทำได้ดีในการเลือกหลักสูตรติดตามผลขั้นสูง หลักสูตรปัจจุบันของหลักสูตรขั้นสูงมีหัวข้อต่าง ๆ เช่นการแฮ็กที่สมบูรณ์แบบตัวกรอง Bloom ต้นไม้ Van Emde Boas โปรแกรมเชิงเส้นประมาณ อัลกอริธึมสำหรับปัญหา NP-hard เป็นต้นฉันไม่ได้ตั้งใจจะใช้เวลาบรรยายมากกว่าหนึ่งครั้งใน ML แต่ถ้ามีบางอย่างที่เกี่ยวข้องกับทั้งอัลกอริทึมและ ML อย่างแน่นอนก็อาจรวมอยู่ด้วย

30 ds.algorithms machine-learning teaching

1

ฟังก์ชั่นที่ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ แต่เรียนรู้ได้

เรารู้ว่า (ดูเช่นทฤษฎีบทที่ 1 และ 3 ของ [1]) ภายใต้เงื่อนไขที่เหมาะสมฟังก์ชั่นที่สามารถคำนวณได้อย่างมีประสิทธิภาพโดยเครื่องทัวริงในเวลาพหุนาม ("คำนวณได้อย่างมีประสิทธิภาพ") สามารถแสดงออกโดยเครือข่ายพหุนาม ด้วยขนาดที่เหมาะสมและสามารถเรียนรู้ได้ด้วยความซับซ้อนตัวอย่างพหุนาม ("เรียนรู้ได้") ภายใต้การแจกแจงการป้อนข้อมูลใด ๆ ที่นี่ "เรียนรู้ได้" จะเกี่ยวข้องกับความซับซ้อนของตัวอย่างเท่านั้นโดยไม่คำนึงถึงความซับซ้อนของการคำนวณ ฉันสงสัยเกี่ยวกับปัญหาที่เกี่ยวข้องอย่างใกล้ชิด: มีฟังก์ชันที่ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพโดย Turing machine ในเวลาพหุนาม ("ไม่สามารถคำนวณได้อย่างมีประสิทธิภาพ") แต่ในขณะเดียวกันสามารถเรียนรู้ได้ด้วยความซับซ้อนของตัวอย่างพหุนาม ภายใต้การแจกแจงอินพุตใด ๆ [1] ร้อยเอ็ด Livni, Shai Shalev-Shwartz, Ohad Shamir, " ประสิทธิภาพการคำนวณของการฝึกอบรมโครงข่ายประสาทเทียม ", 2014

28 cc.complexity-theory np-hardness machine-learning turing-machines lg.learning

2

หากเทคนิคการเรียนรู้ของเครื่องจักรดีขึ้นเรื่อย ๆ บทบาทของอัลกอริทึมในอนาคตคืออะไร

ลองดูอนาคต 30 ปีจากนี้ มาคิดในแง่ดีและคิดว่าพื้นที่ที่เกี่ยวข้องกับการเรียนรู้ของเครื่องจักรจะพัฒนาอย่างรวดเร็วเหมือนที่เราเห็นใน 10 ปีที่ผ่านมา นั่นจะดี แต่แล้วอะไรจะเป็นบทบาทของอัลกอริทึมแบบดั้งเดิมในอนาคต ที่นี่ด้วย "อัลกอริธึดั้งเดิม" ผมหมายถึงกระบวนการปกติที่เราปฏิบัติตามใน TCS: พิธีปัญหาการคำนวณที่ดีที่กำหนดขั้นตอนวิธีการออกแบบสำหรับการแก้ปัญหาและพิสูจน์ค้ำประกันการปฏิบัติอย่างเป็นทางการ ตอนนี้พื้นที่ใช้งานที่เราต้องใช้การออกแบบและวิเคราะห์อัลกอริทึมแบบดั้งเดิมในอนาคตคืออะไรและเป็นไปได้ยากมากที่ความก้าวหน้าของการเรียนรู้ของเครื่องจะทำให้อัลกอริทึมแบบดั้งเดิมส่วนใหญ่ไม่เกี่ยวข้องกัน? ตอนแรกนี่อาจดูเหมือนคำถามงี่เง่า: แน่นอนว่าเราจะต้องสามารถทำการเรียงลำดับการค้นหาการจัดทำดัชนีและอื่น ๆ ในอนาคต! แน่นอนว่าเราจะต้องสามารถแปลงฟูริเยร์ได้อย่างมีประสิทธิภาพ, คูณเมทริกซ์ขนาดใหญ่, หาเส้นทางที่สั้นที่สุด, แก้ปัญหาการเพิ่มประสิทธิภาพเชิงเส้น! แต่แล้วอีกครั้งเมื่อคุณเริ่มมองลึกลงไปในการใช้งานในการที่เราเป็นประเพณีที่ใช้อัลกอริทึมที่เราออกแบบมันไม่ได้เป็นที่ชัดเจนว่าการออกแบบขั้นตอนวิธีการแบบดั้งเดิมและการวิเคราะห์เป็นคำตอบที่เหมาะสมในการแก้ไขปัญหาดังกล่าวในการใช้งานที่เกี่ยวข้องกับการค้นหา , โดยปกติแล้วเรามีความสนใจในการค้นหาสิ่งที่ใกล้เคียงกับมนุษย์ในความหมายที่ไม่ชัดเจนบางอย่าง (เช่นความคล้ายคลึงกันทางความหมาย) ไม่ใช่สิ่งที่เหมาะสมที่สุดในความรู้สึกทางคณิตศาสตร์บางอย่าง (เช่นระยะแก้ไขขั้นต่ำ) ในแอพพลิเคชั่นที่เกี่ยวข้องกับการวางแผนเส้นทางโดยปกติแล้วเราสนใจค้นหาเส้นทางที่ดีตามตัวอย่าง (เช่นคนอื่นชอบมากกว่า) ไม่ใช่เส้นทางที่ดีที่สุดในแง่คณิตศาสตร์บางอย่าง (เช่นระยะทางที่สั้นที่สุดหรือราคาถูกที่สุด) และเมื่อคุณมีส่วนประกอบของมนุษย์ที่คลุมเครือในภาพอาจเป็นกรณีที่เราพยายามสอนคอมพิวเตอร์เพื่อให้ได้คำตอบที่ดีตามตัวอย่างแทนที่จะพยายามให้นักวิจัย TCS ขึ้นมา ด้วยปัญหาการคำนวณอย่างเป็นทางการที่เราสามารถแก้ไขได้ด้วยการออกแบบและวิเคราะห์อัลกอริทึมแบบดั้งเดิม ดังนั้นพื้นที่แอปพลิเคชั่น (ควรเป็นแอพพลิเคชั่นทางอุตสาหกรรมจริงและทางตรง) ซึ่งชัดเจนว่าสิ่งที่เราทำในอัลกอริทึมในอดีตก็จะเป็นวิธีที่ถูกต้อง (และวิธีเดียวที่เป็นไปได้) ในการพัฒนา อนาคต? อัลกอริทึมที่ใช้เป็นรูทีนย่อยในเทคนิคการเรียนรู้ด้วยเครื่องดูเหมือนจะเป็นตัวพิสูจน์อนาคตที่ชัดเจน แต่สิ่งนี้ขึ้นอยู่กับเทคนิคการเรียนรู้ของเครื่องโดยเฉพาะที่เราใช้และอย่างที่เราเห็นในช่วงสิบปีที่ผ่านมา .

23 ds.algorithms soft-question machine-learning

1

คุณสมบัติกราฟธรรมชาติไม่สามารถทดสอบได้

ในการทดสอบคุณสมบัติกราฟอัลกอริทึมจะค้นหากราฟเป้าหมายสำหรับการมีหรือไม่มีขอบและต้องการตรวจสอบว่าเป้าหมายนั้นมีคุณสมบัติบางอย่างหรือ -far ไม่ให้มีคุณสมบัติ (อัลกอริทึมสามารถขอให้ประสบความสำเร็จกับข้อผิดพลาดแบบ 1 ด้านหรือ 2 ด้าน) กราฟคือ -far จากการมีคุณสมบัติถ้าไม่มี\ epsilon \ binom {n} {2}ขอบสามารถเพิ่ม / ลบเพื่อสร้าง มันมีคุณสมบัติϵεϵ\epsilonεϵ\epsilonϵ ( n2)ϵ(n2)\epsilon \binom{n}{2} มีการกล่าวว่าคุณสมบัติสามารถทดสอบได้หากสามารถทดสอบในลักษณะที่ระบุไว้ข้างต้นในจำนวนแบบสอบถามย่อยแบบเส้นตรงหรือดีกว่าในจำนวนข้อความค้นหาที่ไม่ขึ้นกับnnn (แต่ไม่ใช่εϵ\epsilon ) แนวคิดของคุณสมบัติใดที่สามารถทำเป็นระเบียบได้ แต่ควรมีความชัดเจน มีผลลัพธ์มากมายที่ระบุลักษณะของคุณสมบัติที่สามารถทดสอบได้พร้อมตัวอย่างมากมายของคุณสมบัติที่ทดสอบได้ตามธรรมชาติ อย่างไรก็ตามฉันไม่ได้ตระหนักถึงคุณสมบัติตามธรรมชาติมากมายที่ไม่สามารถทดสอบได้ (พูดด้วยจำนวนการค้นหาที่คงที่) - สิ่งที่ฉันคุ้นเคยคือการทดสอบการมอร์ฟิซึ่มส์ของกราฟที่กำหนด ดังนั้นคำถามของฉันคือคุณสมบัติของกราฟธรรมชาติที่ทราบกันดีว่าไม่สามารถทดสอบได้

22 cc.complexity-theory machine-learning query-complexity property-testing

1

ปัญหาของ Warren Buffett

นี่เป็นนามธรรมของปัญหาการเรียนรู้ออนไลน์ / โจรที่ฉันได้ทำงานในช่วงฤดูร้อน ฉันไม่เคยเห็นปัญหาแบบนี้มาก่อนและมันก็ดูน่าสนใจทีเดียว หากคุณรู้จักงานที่เกี่ยวข้องใด ๆ ฉันขอขอบคุณการอ้างอิง ปัญหา การตั้งค่าเป็นของโจรติดอาวุธหลายคน คุณมีแขนไม่มี แขนแต่ละอัน i มีการแจกแจงความน่าจะเป็นที่ไม่รู้จัก แต่แน่นอนผ่านการให้รางวัลซึ่งสามารถรับได้โดยการเล่น เพื่อความเป็นรูปธรรมลองสมมุติว่าแขนแต่ละข้างของฉันจ่ายรางวัล $ 10 พร้อมความน่าจะเป็นp [i]และให้รางวัล $ 0 กับปัญหา 1-P [ผม] ในทุกรอบทีคุณเลือกชุดS [t]แขนเล่น สำหรับแขนแต่ละข้างที่คุณเลือกคุณจะต้องจ่ายค่าธรรมเนียม$ 1ล่วงหน้า สำหรับแขนที่เลือกแต่ละครั้งคุณจะได้รับรางวัลซึ่งมาจากการแจกแจงความน่าจะเป็นของรางวัล (ไม่ทราบ) ที่แขน รางวัลทั้งหมดเข้าสู่บัญชีธนาคารของคุณและค่าธรรมเนียมทั้งหมดจะถูกหักออกจากบัญชีนั้น นอกจากนี้คุณจะได้รับเครดิต$ 1เมื่อเริ่มต้นของการวนซ้ำทุกครั้ง ปัญหาคือการพัฒนานโยบายในการเลือกชุดย่อยของอาวุธที่จะเล่นในการทำซ้ำแต่ละครั้งเพื่อเพิ่มผลกำไร (เช่นรางวัลลบด้วยค่าธรรมเนียมสำหรับการเล่น) ในระยะเวลาที่ยาวนานพอสมควรภายใต้ข้อ จำกัด ที่ต้องรักษายอดเงินในบัญชี ทุกเวลา. ฉันไม่ได้ระบุว่าการแจกรางวัลแบบต่อแขนจะถูกเลือกจากการแจกแจงก่อนหน้าหรือการเลือกโดยฝ่ายตรงข้าม ตัวเลือกทั้งสองมีเหตุผล การกำหนดปฏิปักษ์เป็นที่น่าสนใจสำหรับฉันมากขึ้น แต่อาจยากที่จะทำให้ก้าวหน้า ฝ่ายตรงข้ามเลือกเวกเตอร์ (D1, D2, .. , DN) …

19 machine-learning lg.learning online-learning

5

จำเป็นต้องใช้“ คณิตศาสตร์ขั้นสูง” ในระดับใดในการวิจัย AI

ฉันกำลังเรียนคณิตศาสตร์ อย่างไรก็ตามฉันไม่คิดว่าฉันต้องการเป็นนักคณิตศาสตร์มืออาชีพในอนาคต ฉันกำลังคิดที่จะนำความรู้ด้านคณิตศาสตร์ไปใช้ในการทำวิจัยในด้านปัญญาประดิษฐ์ อย่างไรก็ตามฉันไม่แน่ใจว่าควรทำตามหลักสูตรคณิตศาสตร์กี่หลักสูตร (และหลักสูตร CS ทฤษฎีใดที่ฉันควรปฏิบัติตาม) จาก Quora ฉันเรียนรู้ว่าวิชาพีชคณิตเชิงเส้นสถิติและการปรับให้เหมาะสมที่สุดนั้นเกี่ยวข้องกับการเรียนรู้ของเครื่อง (ดูคำถามนี้ ) บางคนกล่าวว่าต้องเรียนรู้พีชคณิตเชิงเส้นความน่าจะเป็น / สถิติแคลคูลัสอัลกอริทึมพื้นฐานและตรรกะเป็นสิ่งจำเป็นในการศึกษาปัญญาประดิษฐ์ (ดูคำถามนี้ ) ฉันสามารถเรียนรู้เกี่ยวกับทุกวิชาเหล่านี้ได้ในช่วง 1.5 ปีแรกของคณิตศาสตร์ปริญญาตรีที่มหาวิทยาลัยของเรา ฉันสงสัยว่าถ้ามีวิชาคณิตศาสตร์ระดับปริญญาตรีบางวิชาที่มีประโยชน์หรือจำเป็นสำหรับการศึกษาปัญญาประดิษฐ์ สิ่งที่เกี่ยวกับ ODEs, PDEs, โทโพโลยี, ทฤษฎีการวัด, การวิเคราะห์เชิงเส้น, การวิเคราะห์ฟูริเยร์และการวิเคราะห์เกี่ยวกับ Manifold หนังสือเล่มหนึ่งที่ชี้ให้เห็นว่าคณิตศาสตร์ขั้นสูงที่ค่อนข้างมีประโยชน์ในการศึกษาปัญญาประดิษฐ์คือทฤษฎีรูปแบบ: การวิเคราะห์สุ่มของสัญญาณจริงจาก David Mumford และ Agnes Desolneux (ดูหน้านี้ ) มันรวมถึงบทเกี่ยวกับเครือมาร์คอฟ, แบบจำลองทวนเข็มนาฬิกาเกาส์, กิ๊บส์ฟิลด์, Manifolds, กลุ่ม Lie และ Lie Algebras และการประยุกต์กับทฤษฎีรูปแบบ หนังสือเล่มนี้มีประโยชน์ต่อการวิจัย AI …

19 soft-question machine-learning ai.artificial-intel

5

เป็นไปได้ไหมที่จะทดสอบว่าตัวเลขที่คำนวณได้นั้นเป็นจำนวนตรรกยะหรือจำนวนเต็ม?

เป็นไปได้ไหมที่จะทดสอบอัลกอริธึมว่าจำนวนที่คำนวณได้เป็นจำนวนตรรกยะหรือจำนวนเต็ม? ในคำอื่น ๆ ก็จะมีความเป็นไปได้สำหรับห้องสมุดที่ใช้คำนวณตัวเลขเพื่อให้ฟังก์ชั่นisIntegerหรือisRational? ฉันเดาว่ามันเป็นไปไม่ได้และนี่ก็เกี่ยวข้องกับความจริงที่ว่ามันเป็นไปไม่ได้ที่จะทดสอบว่าตัวเลขสองตัวนั้นเท่ากัน แต่ฉันไม่เห็นวิธีที่จะพิสูจน์มัน แก้ไข: จำนวนที่คำนวณได้ถูกกำหนดโดยฟังก์ชันที่สามารถส่งกลับค่าประมาณด้วยเหตุผลด้วยความแม่นยำ :สำหรับใด ๆ0 รับฟังก์ชั่นดังกล่าวเป็นไปได้หรือไม่ที่จะทดสอบว่าหรือ ?xxxfx(ϵ)fx(ϵ)f_x(\epsilon)xxxϵϵ\epsilon|x−fx(ϵ)|≤ϵ|x−fx(ϵ)|≤ϵ|x - f_x(\epsilon)| \leq \epsilonϵ>0ϵ>0\epsilon > 0x∈Qx∈Qx \in \mathrm{Q}x∈Zx∈Zx \in \mathrm{Z}

18 computability computing-over-reals lambda-calculus graph-theory co.combinatorics cc.complexity-theory reference-request graph-theory proofs np-complete cc.complexity-theory machine-learning boolean-functions combinatory-logic boolean-formulas reference-request approximation-algorithms optimization cc.complexity-theory co.combinatorics permutations cc.complexity-theory cc.complexity-theory ai.artificial-intel p-vs-np relativization co.combinatorics permutations ds.algorithms algebra automata-theory dfa lo.logic temporal-logic linear-temporal-logic circuit-complexity lower-bounds permanent arithmetic-circuits determinant dc.parallel-comp asymptotics ds.algorithms graph-theory planar-graphs physics max-flow max-flow-min-cut fl.formal-languages automata-theory finite-model-theory dfa language-design soft-question machine-learning linear-algebra db.databases arithmetic-circuits ds.algorithms machine-learning ds.data-structures tree soft-question security project-topic approximation-algorithms linear-programming primal-dual reference-request graph-theory graph-algorithms cr.crypto-security quantum-computing gr.group-theory graph-theory time-complexity lower-bounds matrices sorting asymptotics approximation-algorithms linear-algebra matrices max-cut graph-theory graph-algorithms time-complexity circuit-complexity regular-language graph-algorithms approximation-algorithms set-cover clique graph-theory graph-algorithms approximation-algorithms clustering partition-problem time-complexity turing-machines term-rewriting-systems cc.complexity-theory time-complexity nondeterminism

1

BPP กับ P เป็นปัญหาจริงหรือไม่หลังจากที่เรารู้ว่า BPP อยู่ใน P / poly

เรารู้ (ตอนนี้ประมาณ 40 ปีขอบคุณ Adleman, Bennet และ Gill) ว่าการรวมBPP P / poly และการถือBPP / poly ⊆ P / poly ที่แข็งแกร่งยิ่งขึ้น "การ / โพลี" หมายถึงว่าเราทำงานที่ไม่สม่ำเสมอ (วงจรที่แยกต่างหากสำหรับแต่ละระยะเวลาในการป้อนข้อมูลn ) ในขณะที่Pโดยไม่ต้องคนนี้ "/ โพลี" หมายถึงเรามีหนึ่งเครื่องทัวริงสำหรับทุกความยาวการป้อนข้อมูลที่เป็นไปได้n , ได้นานกว่าการพูดn = จำนวนวินาทีไปยัง "บิ๊กแบง" ถัดไป⊆⊆\subseteq ⊆⊆\subseteq nnnnnnnnn คำถามที่ 1: BPP = P (หรือ disproof) หลักฐานใหม่จะช่วยให้ความรู้ของเราหลังจากที่เรารู้จักBPP P / poly ⊆⊆\subseteq …

16 cc.complexity-theory circuit-complexity machine-learning derandomization

3

การรวมลักษณะเฉพาะของการเรียนรู้ที่แน่นอนพร้อมข้อความค้นหาการเป็นสมาชิก

แก้ไข:เนื่องจากฉันไม่ได้รับคำตอบ / ความคิดเห็นใด ๆ ในหนึ่งสัปดาห์ฉันต้องการเพิ่มว่าฉันมีความสุขที่ได้ยินอะไรเกี่ยวกับปัญหา ฉันไม่ได้ทำงานในพื้นที่ดังนั้นแม้ว่าจะเป็นเรื่องง่ายฉันอาจไม่รู้ แม้แต่ความคิดเห็นเช่น "ฉันทำงานในพื้นที่ แต่ฉันไม่เห็นลักษณะเช่นนี้" จะเป็นประโยชน์! พื้นหลัง: มีรูปแบบการเรียนรู้ที่ดีหลายอย่างในทฤษฎีการเรียนรู้ (เช่นการเรียนรู้ PAC การเรียนรู้ออนไลน์ ตัวอย่างเช่นในการเรียนรู้ PAC ความซับซ้อนของตัวอย่างของคลาสแนวคิดมีลักษณะเชิงผสมที่ดีในแง่ของมิติ VC ของคลาส ดังนั้นหากเราต้องการที่จะเรียนรู้ชั้นเรียนที่มีความแม่นยำและความมั่นใจอย่างต่อเนื่องสิ่งนี้สามารถทำได้ด้วยตัวอย่างΘ(d)Θ(d)\Theta(d)โดยที่คือมิติ VC (โปรดทราบว่าเรากำลังพูดถึงความซับซ้อนของตัวอย่างไม่ใช่ความซับซ้อนของเวลา) นอกจากนี้ยังมีคุณลักษณะที่ละเอียดยิ่งขึ้นในแง่ของความแม่นยำและความมั่นใจ ในทำนองเดียวกันรูปแบบความผิดพลาดที่ถูกผูกไว้ของการเรียนรู้ออนไลน์มีลักษณะตัวอักษรแบบ combinatorial ที่ดีddd คำถาม: ฉันต้องการที่จะรู้ว่าผลลัพธ์ที่คล้ายกันเป็นที่รู้จักกันในรูปแบบของการเรียนรู้ที่แน่นอนด้วยแบบสอบถามสมาชิก รูปแบบที่ถูกกำหนดไว้ดังต่อไปนี้: เรามีการเข้าถึงกล่องดำซึ่งการป้อนข้อมูลช่วยให้คุณ(x) เรารู้มาจากบางส่วนแนวคิดระดับCเราต้องการพิจารณาด้วยคำค้นหาน้อยที่สุดxxxf(x)f(x)f(x)fffCCCfff มีพารามิเตอร์ combinatorial ของคลาสแนวคิดที่กำหนดจำนวนของแบบสอบถามที่จำเป็นในการเรียนรู้แนวคิดในรูปแบบของการเรียนรู้ที่แน่นอนด้วยแบบสอบถามสมาชิกหรือไม่CCC สิ่งที่ฉันรู้: ที่ดีที่สุดของตัวละครเช่นฉันได้พบอยู่ในกระดาษนี้โดย Servedio และ Gortlerโดยใช้พารามิเตอร์ที่พวกเขาแอตทริบิวต์ไปBshouty, Cleve, Gavalda, คานและ Tamon พวกเขากำหนดพารามิเตอร์ combinatorial เรียกว่าโดยที่คือคลาสแนวคิดซึ่งมีคุณสมบัติดังต่อไปนี้ (ให้เป็นจำนวนคำค้นหาที่ดีที่สุดที่จำเป็นในการเรียนรู้ในรูปแบบนี้)γCγC\gamma^CCCCQCQCQ_CCCC QC=Ω(1/γC)QC=Ω(log|C|)QC=O(log|C|/γC)QC=Ω(1/γC)QC=Ω(log⁡|C|)QC=O(log⁡|C|/γC)Q_C = …

15 reference-request machine-learning lg.learning

1

การประมาณฟังก์ชั่นสากล

มันเป็นที่รู้จักกันผ่านทฤษฎีการประมาณสากลว่าเครือข่ายประสาทที่มีชั้นเดียวที่ซ่อนอยู่และฟังก์ชั่นการเปิดใช้งานโดยพลสามารถประมาณฟังก์ชั่นใด ๆ อย่างต่อเนื่อง รุ่นอื่น ๆ ที่มีตัวประมาณฟังก์ชั่นสากล

15 machine-learning function approximation

2

การเรียนรู้ควอนตัม PAC

พื้นหลัง ฟังก์ชันในเป็น PAC ที่เรียนรู้ได้ในเวลา quasipolynomial ด้วยอัลกอริทึมแบบดั้งเดิมที่ต้องใช้แบบสอบถามที่เลือกแบบสุ่มเพื่อเรียนรู้วงจรความลึก d [1] หากไม่มีอัลกอริทึมการแฟ็กเตอริงนี่ก็เป็นสิ่งที่ดีที่สุด [2] แน่นอนในคอมพิวเตอร์ควอนตัมเรารู้วิธีคำนึงถึงปัจจัยดังนั้นขอบเขตล่างนี้จึงไม่ช่วย ยิ่งไปกว่านั้นอัลกอริธึมคลาสสิคที่เหมาะสมที่สุดใช้สเปกตรัมของฟูริเยร์ของฟังก์ชั่นจึงกรีดร้องC0Aค0AC^0O ( 2)l o g( n )O ( d))O(2ล.โอก.(n)O(d))O(2^{log(n)^{O(d)}})2no ( 1 )2nโอ(1)2^{n^{o(1)}} [1] N. Linial, Y. Mansour และ N. Nisan [1993] "วงจรเชิงลึกคงที่, การแปลงฟูริเยร์, และการเรียนรู้", วารสาร ACM 40 (3): 607-620 [2] M. Kharitonov [1993] "ความแข็งการเข้ารหัสของการเรียนรู้เฉพาะการกระจาย", การดำเนินการของ ACM STOC'93, pp. 372-381 …

15 quantum-computing lg.learning machine-learning open-problem ne.neural-evol

2

ในทางทฤษฎีรับประกันว่าจะใช้วิธีการเผยแพร่ความเชื่อได้หรือไม่?

การเผยแพร่ความเชื่อได้แสดงให้เห็นว่าเป็นวิธีที่ทรงพลังมากผ่านการวิจัยในแบบจำลองความน่าจะเป็นแบบกราฟิก อย่างไรก็ตามฉันไม่รู้อะไรเกี่ยวกับความดันโลหิตที่เทียบได้กับวิธี MCMC ซึ่งเราสามารถมีแผนการประมาณแบบสุ่ม (FPRAS) แบบพหุนามแบบสมบูรณ์สำหรับปัญหา # P-complete ใครช่วยชี้ให้ฉันไปอ้างอิงบาง?

14 cc.complexity-theory reference-request graph-algorithms machine-learning st.statistics

1

มีการรวมงานการเรียนรู้ของเครื่องและทฤษฎีความซับซ้อนในรูปแบบแปลกใหม่หรือไม่?

สำหรับฉันแล้วดูเหมือนว่าผู้เชี่ยวชาญด้านการเรียนรู้เครื่องจักร / การขุดข้อมูลคุ้นเคยกับ P และ NP แต่ไม่ค่อยพูดถึงบางคลาสที่ซับซ้อนยิ่งขึ้น (เช่น NC, BPP หรือ IP) และความหมายของการวิเคราะห์ข้อมูลได้อย่างมีประสิทธิภาพ มีการสำรวจงานที่ทำเช่นนี้หรือไม่?

13 cc.complexity-theory reference-request machine-learning

1

มีคุณสมบัติการกระจายที่“ มากที่สุด” ยากต่อการทดสอบหรือไม่?

อัลกอริทึมการทดสอบการกระจายสำหรับคุณสมบัติการแจกจ่าย P (ซึ่งเป็นเพียงส่วนย่อยของการแจกแจงทั้งหมดผ่าน [n]) ได้รับอนุญาตให้เข้าถึงตัวอย่างตามการแจกแจง D บางส่วนและจำเป็นต้องตัดสินใจ (whp) ถ้าหรือd ( D , P ) > ϵ ( dที่นี่มักจะเป็นℓ 1ระยะทาง) การวัดความซับซ้อนที่พบบ่อยที่สุดคือจำนวนตัวอย่างที่ใช้โดยอัลกอริทึมD ∈ PD∈PD\in Pd( D , P) > ϵd(D,P)>ϵd(D,P)>\epsilondddℓ1ℓ1\ell_1 ตอนนี้ในการทดสอบคุณสมบัติมาตรฐานที่คุณมีการเข้าถึงแบบสอบถามเพื่อวัตถุบางอย่างขอบเขตเชิงเส้นล่างเชิงเส้นบนความซับซ้อนของแบบสอบถามนั้นชัดเจนว่าเป็นขอบเขตล่างที่แข็งแกร่งที่สุดเท่าที่จะเป็นไปได้เนื่องจากข้อความค้นหาจะเผยให้เห็นวัตถุทั้งหมด นี่เป็นกรณีสำหรับการทดสอบการกระจายเช่นกัน?nnn เท่าที่ฉันเข้าใจขอบเขตบน "เล็กน้อย" สำหรับการทดสอบคุณสมบัติของการแจกแจงคือ --- โดยขอบเขตของ Chernoff นี่เพียงพอที่จะ "จดบันทึก" การแจกแจง D 'ซึ่งใกล้เคียงกับ D ในℓ 1ระยะทางและแล้วเราก็สามารถตรวจสอบว่ามีการกระจายใด ๆ ที่ใกล้กับ D' ที่อยู่ใน P (นี้อาจใช้เวลาอนันต์ …

13 cc.complexity-theory machine-learning query-complexity property-testing

คำถามติดแท็ก machine-learning