คำถามติดแท็ก machine-learning

อัลกอริทึมการเรียนรู้ของเครื่องสร้างโมเดลของข้อมูลการฝึกอบรม คำว่า "การเรียนรู้ของเครื่อง" มีการกำหนดอย่างคลุมเครือ มันรวมถึงสิ่งที่เรียกว่าการเรียนรู้ทางสถิติการเรียนรู้เสริมการเรียนรู้แบบไม่สำรอง ฯลฯ มักเพิ่มแท็กเฉพาะเพิ่มเติม

4
จำนวนคุณสมบัติเทียบกับจำนวนการสังเกต
มีกระดาษ / หนังสือ / แนวคิดเกี่ยวกับความสัมพันธ์ระหว่างจำนวนของคุณสมบัติและจำนวนการสังเกตที่เราต้องใช้ในการฝึกอบรมลักษณนาม "ที่มีประสิทธิภาพ" หรือไม่? ตัวอย่างเช่นสมมติว่าฉันมีคุณสมบัติ 1,000 รายการและการสังเกต 10 ครั้งจากสองคลาสเป็นชุดฝึกอบรมและอีก 10 ข้อสังเกตเป็นชุดทดสอบ ฉันฝึกตัวแยกประเภท X และให้ความไว 90% และความจำเพาะ 90% ในชุดทดสอบ สมมติว่าฉันมีความสุขกับความแม่นยำนี้และฉันสามารถบอกได้ว่ามันเป็นลักษณนามที่ดี ในทางกลับกันฉันได้ประมาณฟังก์ชั่นของตัวแปร 1,000 ตัวโดยใช้ 10 คะแนนเท่านั้นซึ่งอาจดูเหมือนว่าไม่แข็งแกร่งมาก ...


2
รองรับเครื่องเวกเตอร์และการถดถอย
มีการอภิปรายที่ยอดเยี่ยมเกี่ยวกับวิธีการที่เครื่องเวกเตอร์สนับสนุนจัดการการจำแนก แต่ฉันสับสนมากเกี่ยวกับวิธีการสนับสนุนเครื่องเวกเตอร์เพื่อสรุปการถดถอย ใครสนใจที่จะสอนฉัน

4
โครงข่ายประสาทเทียมที่มีการเชื่อมต่อแบบข้ามชั้น
ฉันสนใจในการถดถอยกับเครือข่ายประสาท โครงข่ายประสาทเทียมที่ไม่มีโหนดซ่อนเร้น + การเชื่อมต่อข้ามชั้นเป็นโมเดลเชิงเส้น สิ่งที่เกี่ยวกับมุ้งประสาทเดียวกัน แต่มีโหนดที่ซ่อนอยู่? ฉันสงสัยว่าสิ่งที่จะเป็นบทบาทของการเชื่อมต่อข้ามชั้น? โดยสังเขปฉันจะบอกว่าถ้าคุณรวมการเชื่อมต่อข้ามชั้นแล้วรูปแบบสุดท้ายจะเป็นผลรวมของแบบจำลองเชิงเส้น + บางส่วนที่ไม่ใช่เชิงเส้น มีข้อได้เปรียบหรือเสียเปรียบในการเพิ่มการเชื่อมต่อข้ามชั้นไปยังตาข่ายประสาทหรือไม่?

2
วิธีลดน้ำหนัก KLD เทียบกับการสูญเสียการสร้างใหม่ในโปรแกรมเปลี่ยนเกียร์อัตโนมัติแบบแปรผัน
ในตัวอย่างโค้ดเกือบทั้งหมดที่ฉันเคยเห็น VAE ฟังก์ชั่นการสูญเสียมีการกำหนดไว้ดังนี้ (นี่คือรหัส tenorflow แต่ฉันเคยเห็นคล้ายกับ theano ไฟฉาย ฯลฯ มันสำหรับ convnet แต่ก็ไม่เกี่ยวข้องกันเกินไป เพียงแค่ส่งผลกระทบต่อแกนที่ต้องใช้เงินก้อน): # latent space loss. KL divergence between latent space distribution and unit gaussian, for each batch. # first half of eq 10. in https://arxiv.org/abs/1312.6114 kl_loss = -0.5 * tf.reduce_sum(1 + log_sigma_sq - tf.square(mu) - tf.exp(log_sigma_sq), axis=1) # …

1
มีอัลกอริทึมใดบ้างที่รวมการจำแนกและการถดถอย
ฉันสงสัยว่ามีอัลกอริทึมใดที่สามารถจำแนกและถดถอยได้ในเวลาเดียวกัน ตัวอย่างเช่นฉันต้องการให้อัลกอริทึมเรียนรู้ลักษณนามและในเวลาเดียวกันภายในแต่ละเลเบลมันก็เรียนรู้เป้าหมายอย่างต่อเนื่อง ดังนั้นสำหรับตัวอย่างการฝึกอบรมแต่ละรายการจะมีป้ายกำกับหมวดหมู่และค่าต่อเนื่อง ฉันสามารถฝึกลักษณนามก่อนแล้วจึงฝึก regressor ภายในแต่ละ label แต่ฉันแค่คิดว่าถ้ามีอัลกอริทึมที่สามารถทำทั้งสองอย่างได้มันจะวิเศษมาก

8
ทำไมจึงเป็นสิ่งสำคัญที่จะมีทฤษฎีหลักการและคณิตศาสตร์สำหรับการเรียนรู้ของเครื่อง?
ฉันสงสัยอยู่แล้วว่าทำไมการเรียนรู้ด้วยเครื่อง / ทฤษฎีอย่างมีเหตุผลจึงสำคัญ? จากมุมมองส่วนบุคคลในฐานะมนุษย์ฉันสามารถเข้าใจได้ว่าทำไมการเรียนรู้ด้วยเครื่องแบบแยกส่วนจึงสำคัญ: มนุษย์ชอบทำความเข้าใจกับสิ่งที่พวกเขากำลังทำเราค้นหาความงามและความพึงพอใจต่อความเข้าใจ จากมุมมองทางทฤษฎีคณิตศาสตร์ก็สนุก เมื่อมีหลักการที่เป็นแนวทางในการออกแบบสิ่งต่าง ๆ มีเวลาน้อยลงในการคาดเดาแบบสุ่มการลองผิดลองถูกและผิดพลาด ถ้าเราเข้าใจพูดได้ว่าโครงข่ายประสาททำงานอย่างไรเราอาจใช้เวลาที่ดีกว่าในการออกแบบพวกมันมากกว่าการลองผิดลองถูกจำนวนมหาศาล อีกไม่นานหากหลักการมีความชัดเจนและทฤษฎีก็ชัดเจนเช่นกันก็ควรจะมีความโปร่งใสมากขึ้นในระบบ สิ่งนี้เป็นสิ่งที่ดีเพราะถ้าเราเข้าใจว่าระบบทำงานอะไรอยู่ AI ก็มีความเสี่ยงที่ผู้คนจำนวนมากจะหายตัวไปในทันที หลักการดูเหมือนจะเป็นวิธีที่กระชับเพื่อสรุปโครงสร้างที่สำคัญที่โลกอาจมีและเมื่อต้องใช้เครื่องมือมากกว่าที่อื่น อย่างไรก็ตามเหตุผลเหล่านี้มีความแข็งแกร่งเพียงพอที่จะพิสูจน์การศึกษาเชิงทฤษฎีที่เข้มข้นของการเรียนรู้ด้วยเครื่องได้หรือไม่? หนึ่งในข้อวิจารณ์ที่ใหญ่ที่สุดของทฤษฎีก็คือเพราะมันยากที่จะทำพวกเขามักจะจบลงด้วยการศึกษากรณีที่ถูก จำกัด มากหรือข้อสันนิษฐานที่ต้องนำมาเป็นหลักทำให้ผลลัพธ์ไร้ประโยชน์ ฉันคิดว่าฉันได้ยินเรื่องนี้อีกครั้งในการพูดคุยที่ MIT โดยผู้สร้าง Tor การวิพากษ์วิจารณ์บางส่วนของทอร์ที่เขาเคยได้ยินเป็นข้อโต้แย้งเชิงทฤษฎี แต่โดยพื้นฐานแล้วผู้คนไม่สามารถพิสูจน์สิ่งต่าง ๆ เกี่ยวกับสถานการณ์จริงของชีวิตจริงเพราะพวกเขาซับซ้อนมาก ในยุคใหม่นี้ด้วยพลังการประมวลผลและข้อมูลที่มากมายเราสามารถทดสอบโมเดลของเราด้วยชุดข้อมูลจริงและชุดทดสอบ เราสามารถดูว่าสิ่งต่าง ๆ ทำงานโดยใช้ประสบการณ์นิยม ถ้าเราสามารถบรรลุ AGI หรือระบบที่ทำงานกับวิศวกรรมและประสบการณ์นิยมได้มันก็ยังคุ้มค่าที่จะทำตามหลักการและเหตุผลทางทฤษฎีสำหรับการเรียนรู้ของเครื่องจักรโดยเฉพาะอย่างยิ่งเมื่อขอบเขตเชิงปริมาณนั้นยากที่จะบรรลุ แต่สัญชาตญาณและคำตอบเชิงคุณภาพ บรรลุด้วยวิธีการขับเคลื่อนข้อมูล? วิธีการนี้ไม่สามารถใช้ได้ในสถิติแบบดั้งเดิมซึ่งเป็นเหตุผลที่ฉันคิดว่าทฤษฎีมีความสำคัญในช่วงเวลาเหล่านั้นเพราะคณิตศาสตร์เป็นวิธีเดียวที่เราจะมั่นใจได้ว่าสิ่งต่าง ๆ ถูกต้องหรือว่าพวกเขาทำงานจริงอย่างที่เราคิด ฉันชอบทฤษฎีความคิดส่วนตัวและความคิดส่วนตัวอยู่เสมอ แต่ด้วยพลังของความสามารถในการทดลองกับข้อมูลจริงและพลังการประมวลผลทำให้ฉันสงสัยว่าความพยายามในระดับสูง ทฤษฎีและหลักการของการเรียนรู้ของเครื่องเป็นสิ่งสำคัญจริง ๆ หรือไม่?

5
อะไรคือความแตกต่างระหว่างเครือข่ายประสาทเทียมและการเรียนรู้อย่างลึกซึ้ง?
ฉันต้องการใช้การเรียนรู้อย่างลึกซึ้งในโครงการของฉัน ฉันได้อ่านบทความสองสามฉบับและมีคำถามเกิดขึ้นกับฉัน: มีความแตกต่างระหว่างโครงข่ายประสาทเทียมกับการเรียนรู้ลึกหรือไม่? สิ่งเหล่านี้เหมือนกันหรือมีความแตกต่างที่สำคัญและสิ่งใดดีกว่ากัน

1
การเรียนรู้ที่ล้ำสมัย
ฉันทำงานกับชุดข้อมูลขนาดใหญ่เมื่อเร็ว ๆ นี้และพบว่ามีเอกสารจำนวนมากเกี่ยวกับวิธีการสตรีม หากต้องการตั้งชื่อไม่กี่: Follow-the-Regularized-Leader และ Mirror Descent: Equalence Theorems และ L1 Normalization ( http://jmlr.org/proceedings/papers/v15/mcmahan11b/mcmahan11b.pdf ) สตรีมการเรียนรู้: One-Pass SVMs ( http://www.umiacs.umd.edu/~hal/docs/daume09onepass.pdf ) เพกาซัส: ซอฟท์แวร์ย่อย GrAdient โดยประมาณครั้งแรกสำหรับ SVM http://ttic.uchicago.edu/~nati/Publications/PegasosMPB.pdf หรือที่นี่: SVM สามารถทำการสตรีมการเรียนรู้ทีละตัวอย่างได้หรือไม่ สตรีมมิ่งป่าสุ่ม ( http://research.cs.queensu.ca/home/cords2/ideas07.pdf ) อย่างไรก็ตามฉันไม่สามารถค้นหาเอกสารใด ๆ เกี่ยวกับวิธีเปรียบเทียบกับเอกสารอื่น ๆ ทุกบทความที่ฉันอ่านดูเหมือนจะทำการทดลองกับชุดข้อมูลที่แตกต่างกัน ฉันรู้เกี่ยวกับ sofia-ml, vowpal wabbit แต่ดูเหมือนว่าจะใช้วิธีการน้อยมากเมื่อเทียบกับวิธีการที่มีอยู่จำนวนมาก! อัลกอริธึมที่ใช้กันทั่วไปน้อยกว่านั้นมีประสิทธิภาพไม่เพียงพอหรือไม่? มีกระดาษพยายามทบทวนวิธีการให้มากที่สุดหรือไม่?

4
คุณจะใช้ชุดข้อมูล 'ทดสอบ' หลังจากการตรวจสอบข้ามได้อย่างไร
ในการบรรยายและแบบฝึกหัดที่ฉันเห็นพวกเขาแนะนำให้แบ่งข้อมูลของคุณออกเป็นสามส่วน: การฝึกอบรมการตรวจสอบและการทดสอบ แต่ยังไม่ชัดเจนว่าควรใช้ชุดข้อมูลการทดสอบอย่างไรและวิธีการนี้ดีกว่าการตรวจสอบข้ามชุดข้อมูลทั้งหมด สมมติว่าเราได้บันทึก 20% ของข้อมูลของเราเป็นชุดทดสอบ จากนั้นเราจะแบ่งส่วนที่เหลือแบ่งออกเป็น k เท่าและโดยใช้การตรวจสอบความถูกต้องเราพบว่าแบบจำลองที่สร้างการทำนายที่ดีที่สุดสำหรับข้อมูลที่ไม่รู้จักจากชุดข้อมูลนี้ สมมติว่าแบบจำลองที่ดีที่สุดที่เราพบมีความแม่นยำ75% แบบฝึกหัดและคำถามมากมายในเว็บไซต์ถามตอบต่างๆบอกว่าตอนนี้เราสามารถตรวจสอบโมเดลของเราในชุดข้อมูล (ทดสอบ) ที่บันทึกไว้ แต่ฉันก็ยังไม่สามารถเข้าใจได้ว่ามันถูกต้องหรือไม่ สมมติว่าเรามีความแม่นยำ70%ในชุดข้อมูลการทดสอบ แล้วเราจะทำอย่างไรต่อไป เราลองแบบอื่นแล้วลองอีกแบบจนกว่าเราจะได้คะแนนสูงในชุดทดสอบของเราหรือไม่ แต่ในกรณีนี้จริงๆมันดูเหมือนว่าเราก็จะได้พบกับรูปแบบที่เหมาะกับการ จำกัด (เพียง 20%) ชุดทดสอบของเรา ไม่ได้หมายความว่าเราจะพบกับโมเดลที่ดีที่สุดโดยทั่วไป ยิ่งกว่านั้นเราจะพิจารณาคะแนนนี้เป็นการประเมินแบบทั่วไปได้อย่างไรหากคำนวณเฉพาะในชุดข้อมูลที่ จำกัด เท่านั้น หากคะแนนนี้ต่ำเราอาจโชคไม่ดีและเลือกข้อมูลการทดสอบ "ไม่ดี" ในทางกลับกันถ้าเราใช้ข้อมูลทั้งหมดที่เรามีแล้วเลือกแบบจำลองโดยใช้การตรวจสอบความถูกต้องข้ามของ K-fold เราจะพบรูปแบบที่ทำให้การทำนายที่ดีที่สุดสำหรับข้อมูลที่ไม่รู้จักจากชุดข้อมูลทั้งหมดที่เรามี

4
เมื่อใดที่จะหลีกเลี่ยงป่าสุ่ม?
ป่าสุ่มที่รู้จักกันดีในการดำเนินการอย่างเป็นธรรมได้ดีบนความหลากหลายของงานและได้รับการเรียกว่าLeatherman วิธีการเรียนรู้ มีปัญหาประเภทใดบ้างหรือเงื่อนไขใดบ้างที่ควรหลีกเลี่ยงการใช้ฟอเรสต์แบบสุ่ม?

7
งานประจำประจำวันของนักวิทยาศาสตร์การเรียนรู้ด้วยเครื่องคืออะไร?
ตอนนี้ฉันเป็นนักศึกษาปริญญาโท CS ในมหาวิทยาลัยเยอรมันที่เขียนวิทยานิพนธ์ของฉัน ฉันจะทำเสร็จภายในสองเดือนฉันต้องตัดสินใจอย่างหนักถ้าฉันควรจะเรียนต่อระดับปริญญาเอกหรือหางานในอุตสาหกรรม เหตุผลของฉันสำหรับการทำปริญญาเอก: ฉันเป็นคนที่อยากรู้อยากเห็นมากและฉันรู้สึกว่าฉันยังขาดความรู้มากเกินไป ฉันต้องการเรียนรู้มากมายและปริญญาเอกจะช่วยฉันในเรื่องนั้นเนื่องจากฉันสามารถทำหลักสูตรที่ดีขึ้นและอ่านเอกสารจำนวนมากและเป็นผู้เชี่ยวชาญในการทำเหมืองข้อมูลและการเรียนรู้ของเครื่อง ฉันรักคณิตศาสตร์ แต่ไม่เก่งในระดับปริญญาตรีของฉัน (uni ที่ไม่ดี) ตอนนี้ใน Uni สัญชาติเยอรมันฉันรู้สึกว่าฉันได้พัฒนาทักษะทางคณิตศาสตร์ที่ยอดเยี่ยมมากมายและฉันต้องการปรับปรุงมันเพราะฉันรักคณิตศาสตร์จริง ๆ ! (ฉันแย่จริง ๆ ในวิชาคณิตศาสตร์ในระดับปริญญาตรีและในช่วงชีวิตของฉัน แต่ตอนนี้ฉันเห็นว่าฉันสามารถทำคณิตศาสตร์ได้ดี!) ฉันจะทำงานกับสิ่งที่ท้าทายทางปัญญา ฉันต้องซื่อสัตย์และพูดว่าฉันเกลียดที่จะเห็นคนอื่นที่มีระดับสูงกว่าฉัน ดังนั้นถ้าฉันเดินไปตามถนนและเห็นคนที่มีปริญญาเอกฉันไม่ต้องพูดว่า "โอ้ว้าวคนนี้ฉลาดกว่าฉัน" ฉันชอบที่จะอยู่อีกด้านหนึ่ง ;) เหตุผลของฉันที่ไม่ได้ทำปริญญาเอก: ฉันอ่านทางอินเทอร์เน็ตเกี่ยวกับการทำปริญญาเอกหรือไม่ทำ ฉันพบว่าในกรณีส่วนใหญ่และตามปกติผู้ที่มีปริญญาเอกจะทำงานประเภทเดียวกันกับผู้ที่มีปริญญาโท (นั่นเป็นการสังเกตทั่วไปทางวิทยาศาสตร์คอมพิวเตอร์ไม่ใช่เกี่ยวกับ ML / DM) ฉันสามารถเริ่มต้นอาชีพและสร้างรายได้เป็นจำนวนมากใน 1 หรือ 2 ปีจากนั้นฉันอาจเริ่มต้น บริษัท ของตัวเอง ยังไม่ชัดเจน: ฉันยังไม่รู้ว่าเป้าหมายสูงสุดของฉันคืออะไรในตอนท้าย มันจะมี บริษัท เล็ก ๆ ที่มีชื่อเสียงหรือไม่? หรือว่าจะเป็นนักวิทยาศาสตร์ที่มีชื่อเสียง? ฉันยังไม่มีคำตอบสำหรับคำถามนี้ เพื่อช่วยในการตัดสินใจฉันต้องการทราบสองสิ่ง: …

6
โครงข่ายใยประสาทรับรู้ภาพได้อย่างไร
คำถามนี้ถูกโยกย้ายจาก Stack Overflow เพราะสามารถตอบได้ในการตรวจสอบข้าม อพยพ 7 ปีที่ผ่านมา ฉันพยายามที่จะเรียนรู้ว่า Neural Network ทำงานอย่างไรกับการจดจำภาพ ฉันได้เห็นตัวอย่างและสับสนมากขึ้น ในตัวอย่างของการจดจำตัวอักษรของภาพขนาด 20x20 ค่าของแต่ละพิกเซลจะกลายเป็นเลเยอร์อินพุต ดังนั้น 400 เซลล์ประสาท จากนั้นเป็นชั้นที่ซ่อนอยู่ของเซลล์ประสาทและเซลล์ประสาทเอาท์พุท 26 จากนั้นฝึกเครือข่ายและใช้งานได้ไม่สมบูรณ์แบบ สิ่งที่ทำให้ฉันสับสนเกี่ยวกับ Neural Network คือมันเรียนรู้เกี่ยวกับสิ่งที่อยู่ในภาพได้อย่างไร คุณไม่จำเป็นต้องทำการกำหนดใหม่หรือการแบ่งส่วนหรือการวัดใด ๆ เครือข่ายเรียนรู้ที่จะเปรียบเทียบภาพและรับรู้ ตอนนี้มันเป็นเวทย์มนตร์สำหรับฉันแล้ว ที่จะเริ่มเรียนรู้เครือข่ายประสาท

4
การระบุความไม่แน่นอนของโมเดล
ฉันสงสัยว่า Bayesians ในชุมชน CrossValidated มองปัญหาความไม่แน่นอนของโมเดลอย่างไรและพวกเขาต้องการจัดการกับปัญหาอย่างไร ฉันจะพยายามตั้งคำถามของฉันในสองส่วน: ความสำคัญ (ในประสบการณ์ / ความคิดเห็นของคุณ) มีความสำคัญต่อความไม่แน่นอนของแบบจำลองอย่างไร ฉันไม่พบเอกสารใด ๆ ที่เกี่ยวข้องกับปัญหานี้ในชุมชนการเรียนรู้ของเครื่องดังนั้นฉันแค่สงสัยว่าทำไม อะไรคือวิธีการทั่วไปในการจัดการกับความไม่แน่นอนของแบบจำลอง (คะแนนโบนัสหากคุณให้การอ้างอิง) ฉันได้ยินเกี่ยวกับค่าเฉลี่ยของแบบจำลอง Bayesian แต่ฉันไม่คุ้นเคยกับเทคนิค / ข้อ จำกัด เฉพาะของวิธีการนี้ อะไรคือคนอื่นบ้างและทำไมคุณถึงชอบมากกว่ากัน?

3
ตัวแยกประเภทห้าอันดับแรกที่ควรลองก่อน
นอกจากลักษณะลักษณนามที่ชัดเจนเช่น ค่าใช้จ่ายในการคำนวณ คุณลักษณะ / ป้ายกำกับและประเภทข้อมูลที่คาดหวัง ความเหมาะสมสำหรับขนาดและมิติของชุดข้อมูล ตัวแยกประเภทห้าอันดับแรก (หรือ 10, 20)) ที่ควรลองใช้กับชุดข้อมูลใหม่เป็นอันดับแรกยังไม่ทราบมากนัก (เช่นความหมายและความสัมพันธ์ของคุณลักษณะส่วนบุคคล) ฉันมักจะลอง Naive Bayes, เพื่อนบ้านที่ใกล้ที่สุด, Decision Tree และ SVM - แม้ว่าฉันจะไม่มีเหตุผลที่ดีสำหรับการเลือกนี้นอกเหนือจากที่ฉันรู้จักพวกเขาและส่วนใหญ่เข้าใจว่าพวกเขาทำงานอย่างไร ฉันเดาว่าควรเลือกตัวแยกประเภทที่ครอบคลุมวิธีการจำแนกประเภททั่วไปที่สำคัญที่สุด คุณจะแนะนำตัวเลือกใดตามเกณฑ์นั้นหรือด้วยเหตุผลอื่นใด UPDATE:การกำหนดทางเลือกสำหรับคำถามนี้อาจเป็น: "วิธีการทั่วไปในการจำแนกประเภทใดที่มีอยู่และวิธีการเฉพาะใดที่ครอบคลุมวิธีที่สำคัญที่สุด / เป็นที่นิยม / มีแนวโน้ม?"

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.