คำถามติดแท็ก machine-learning

วิธีการและหลักการในการสร้าง "ระบบคอมพิวเตอร์ที่ปรับปรุงโดยอัตโนมัติด้วยประสบการณ์"

4
การเลือกคุณสมบัติและความแม่นยำในการจำแนกประเภท
หนึ่งในวิธีการในการเลือกชุดย่อยของคุณสมบัติที่มีอยู่สำหรับตัวจําแนกของคุณคือการจัดอันดับตามเกณฑ์ (เช่นการรับข้อมูล) แล้วคำนวณความถูกต้องโดยใช้ตัวจําแนกและชุดย่อยของคุณลักษณะที่จัดอันดับ ตัวอย่างเช่นหากคุณลักษณะของคุณคือA, B, C, D, Eและหากมีการจัดอันดับดังต่อไปD,B,C,E,Aนี้คุณจะคำนวณความถูกต้องโดยใช้DจากD, Bนั้นD, B, Cจากนั้นจึงD, B, C, E... ... จนกว่าความแม่นยำของคุณจะเริ่มลดลง เมื่อมันเริ่มลดลงคุณจะหยุดเพิ่มคุณสมบัติ ในตัวอย่างที่ 1 (ด้านบน) คุณจะต้องเลือกคุณสมบัติF, C, D, Aและวางคุณสมบัติอื่น ๆ เพื่อลดความแม่นยำของคุณ วิธีการดังกล่าวถือว่าการเพิ่มคุณสมบัติเพิ่มเติมให้กับโมเดลของคุณเพิ่มความแม่นยำของลักษณนามของคุณจนกว่าจะถึงจุดหนึ่งหลังจากนั้นการเพิ่มคุณสมบัติเพิ่มเติมจะช่วยลดความแม่นยำ (ดังที่เห็นในตัวอย่างที่ 1) อย่างไรก็ตามสถานการณ์ของฉันแตกต่างกัน ฉันใช้วิธีการที่อธิบายไว้ข้างต้นและพบว่าการเพิ่มคุณสมบัติอื่น ๆ ลดความแม่นยำจนถึงจุดหนึ่งหลังจากนั้นจะเพิ่มขึ้น ในสถานการณ์เช่นนี้คุณจะเลือกคุณสมบัติของคุณได้อย่างไร คุณเลือกFและวางที่เหลือเท่านั้น? คุณมีความคิดว่าทำไมความแม่นยำจะลดลงและเพิ่มขึ้น?

5
มิติการกระโดดในการเรียนรู้ของเครื่อง
ปัญหาการกระโดดข้ามมิติในการเรียนรู้ของเครื่องคืออะไร (เกิดขึ้นในโครงข่ายประสาทเทียมและการจดจำภาพ) ฉันทำไปแล้ว แต่สิ่งที่ฉันได้รับคือข้อมูลทางฟิสิกส์ของการเสียรูปของวัสดุ มันจะเป็นประโยชน์กับฉันมากขึ้นถ้าบางคนอธิบายด้วยตัวอย่างที่เกี่ยวข้องกับการเรียนรู้ของเครื่อง ใครสามารถช่วยฉันด้วยสิ่งนี้หรือชี้ให้ฉันไปยังแหล่งข้อมูลที่สามารถ?

2
AI เรียนรู้ที่จะลงมือทำอย่างไรเมื่อพื้นที่ปัญหาใหญ่เกินไป
ฉันเรียนรู้ได้ดีที่สุดผ่านการทดลองและตัวอย่าง ฉันเรียนรู้เกี่ยวกับเครือข่ายประสาทและมี (สิ่งที่ฉันคิดว่า) เป็นความเข้าใจที่ดีของการจัดหมวดหมู่และการถดถอยและการเรียนรู้แบบมีผู้สอนและไม่ได้ดูแล แต่ฉันก็สะดุดกับบางสิ่งที่ฉันไม่สามารถเข้าใจได้ ถ้าฉันต้องการฝึก AI ให้เล่นเกมที่ซับซ้อน ฉันกำลังคิดบางอย่างเช่น RTS (เช่น Age of Empires, Empire Earth และอื่น ๆ ) ในเกมประเภทนี้โดยทั่วไปจะมีจำนวนเอนทิตีที่ควบคุมโดยผู้เล่น (หน่วยอาคาร) แต่ละแห่งมีความสามารถแตกต่างกัน ดูเหมือนว่าปัญหาของ AI จะเป็นการจำแนก (เช่นเลือกหน่วยนั้นและการกระทำนั้น) อย่างไรก็ตามเนื่องจากจำนวนหน่วยเป็นตัวแปรหนึ่งจะจัดการกับปัญหาการจำแนกประเภทด้วยวิธีนี้ได้อย่างไร สิ่งเดียวที่ฉันนึกได้ก็คือเครือข่ายหลายเครือข่ายที่มีหลายขั้นตอน (หนึ่งสำหรับกลยุทธ์โดยรวมหนึ่งสำหรับการควบคุมหน่วยประเภทนี้หนึ่งสำหรับอาคารประเภทนั้น ฯลฯ ); แต่ดูเหมือนว่าฉันกำลังทำให้ปัญหาซับซ้อนขึ้น มีตัวอย่างที่ดีของการเรียนรู้ของเครื่อง / เครือข่ายประสาทเทียมในการเรียนรู้เกมที่ซับซ้อน (ไม่ใช่เฉพาะ RTS แต่ซับซ้อนกว่าMario )?

1
การวิเคราะห์บันทึกเซิร์ฟเวอร์โดยใช้การเรียนรู้ของเครื่อง
ฉันได้รับมอบหมายงานนี้เพื่อวิเคราะห์บันทึกเซิร์ฟเวอร์ของแอปพลิเคชันของเราซึ่งมีบันทึกข้อยกเว้นบันทึกบันทึกเหตุการณ์ฐานข้อมูล ฯลฯ ฉันยังใหม่กับการเรียนรู้ของเครื่องเราใช้ Spark พร้อมการค้นหาแบบยืดหยุ่นและ Sparks MLlib (หรือ PredictionIO) ตัวอย่างที่ต้องการ ผลลัพธ์จะสามารถทำนายตามบันทึกข้อยกเว้นที่รวบรวมเพื่อให้สามารถคาดการณ์ได้ว่าผู้ใช้คนใดมีแนวโน้มที่จะทำให้เกิดข้อยกเว้นต่อไปและคุณลักษณะใด (และสิ่งอื่น ๆ เพื่อติดตามและปรับปรุงการเพิ่มประสิทธิภาพของแอปพลิเคชัน) ฉันสามารถนำเข้าข้อมูลจาก ElasticSearch มาเป็นประกายและสร้าง DataFrames และแมปข้อมูลที่ต้องการได้สำเร็จ สิ่งที่ฉันอยากรู้คือฉันจะเข้าหาด้านการเรียนรู้ของการใช้งานเครื่องได้อย่างไร ฉันเคยผ่านบทความและเอกสารที่พูดคุยเกี่ยวกับการเตรียมข้อมูลล่วงหน้าฝึกอบรมตัวแบบข้อมูลและสร้างป้ายกำกับ คำถามที่ฉันมี ฉันจะเข้าใกล้การแปลงข้อมูลบันทึกการออกเป็นเวกเตอร์ตัวเลขซึ่งสามารถใช้กับชุดข้อมูลที่จะฝึกอบรมได้อย่างไร ฉันใช้อัลกอริทึมในการฝึกอบรมชุดข้อมูลของฉัน (ด้วยความรู้ที่ จำกัด ฉันได้รวบรวมสองสามวันที่ผ่านมาฉันกำลังคิดเกี่ยวกับการแข่งขันการถดถอยเชิงเส้นโปรดแนะนำการใช้งานที่จะดีที่สุด) เพียงมองหาข้อเสนอแนะเกี่ยวกับวิธีแก้ไขปัญหานี้ ขอบคุณ.

2
การเรียนรู้การเสริมแรงแบบมีส่วนร่วม
ฉันมีการใช้งานสำหรับตัวแทนเดียวที่ทำงานเกี่ยวกับปัญหาราคาแบบไดนามิกโดยมีเป้าหมายในการเพิ่มรายได้ให้สูงสุด อย่างไรก็ตามปัญหาที่ฉันทำงานด้วยเกี่ยวข้องกับผลิตภัณฑ์ที่แตกต่างกันหลายอย่างซึ่งเป็นการทดแทนกันดังนั้นการกำหนดราคาแบบไดนามิกทั้งหมดกับผู้เรียนอิสระดูเหมือนจะไม่ถูกต้องเนื่องจากราคาหนึ่งมีผลต่อรางวัลของอีกคนหนึ่ง เป้าหมายคือการกำหนดราคาแบบไดนามิกทั้งหมดเพื่อเพิ่มผลรวมของรายได้ของแต่ละบุคคลให้ได้มากที่สุดQ(λ)Q(λ)Q(\lambda) ฉันได้ทำการวิจัยเพื่อค้นหาสิ่งที่ประยุกต์ใช้การเรียนรู้การเสริมแรงด้วยวิธีนี้ แต่การใช้หลายเอเจนต์ที่ฉันพบเน้นไปที่เกมการแข่งขันมากกว่าการร่วมมือกันหรือพวกเขาคิดว่าความรู้ที่ไม่สมบูรณ์ของตัวแทนอื่น ความรู้ของแต่ละตัวแทนในสถานการณ์นี้) มีแอปพลิเคชันที่มีการวิจัย / จัดทำเป็นเอกสารที่ดีเกี่ยวกับการเรียนแบบร่วมมือในลักษณะนี้หรือไม่?

7
โครงการวิทยาศาสตร์ข้อมูลอธิบายทีละขั้นตอน?
ฉันกำลังมองหาเว็บไซต์หรือหนังสือที่มีตัวอย่างการปฏิบัติหลายขั้นตอนอธิบายวิธีการเลือกคุณสมบัติที่เกี่ยวข้องขั้นตอนการเลือกรุ่น ฯลฯ

1
ป้ายกำกับหลายรายการในอัลกอริทึมการเรียนรู้แบบมีผู้สอน
ฉันมีคลังข้อความที่มีหัวข้อที่เกี่ยวข้อง ตัวอย่างและได้รับการระบุว่าเป็น"A rapper Tupac was shot in LA" ["celebrity", "murder"]ดังนั้นโดยทั่วไปคุณสมบัติแต่ละอย่างของเวกเตอร์สามารถมีป้ายกำกับได้หลายรายการ (ไม่เท่ากันเวกเตอร์คุณลักษณะแรกสามารถมีป้ายกำกับได้ 3 ป้ายคือที่สองที่ 1 ที่สามที่ 5) หากฉันมีป้ายกำกับที่ตรงกับแต่ละข้อความฉันจะลองใช้ตัวจําแนกNaive Bayesแต่ฉันไม่ทราบว่าฉันควรดําเนินการต่อไปได้อย่างไรหากฉันมีฉลากได้หลายป้าย มีวิธีใดที่จะเปลี่ยน Naive Bayes ให้เป็นปัญหาการจำแนกฉลากแบบหลายฉลาก (หากมีวิธีการที่ดีกว่า - โปรดแจ้งให้เราทราบ) PSบางสิ่งเกี่ยวกับข้อมูลที่ฉันมี ประมาณ 10.000 องค์ประกอบในชุดข้อมูล ข้อความประมาณ 2-3 ประโยค สูงสุด 7 ป้ายกำกับต่อข้อความ

2
ห้องสมุดสำหรับการเรียนรู้ของเครื่องออนไลน์
ฉันกำลังมองหาแพคเกจ (ทั้งในหลาม, R หรือแพคเกจแบบสแตนด์อโลน) เพื่อทำการเรียนรู้ออนไลน์เพื่อทำนายข้อมูลสต็อก ฉันได้พบและอ่านเกี่ยวกับ Vowpal Wabbit ( https://github.com/JohnLangford/vowpal_wabbit/wiki ) ซึ่งดูเหมือนว่าจะมีแนวโน้มมาก แต่ฉันสงสัยว่ามีแพ็กเกจอื่น ๆ ขอบคุณล่วงหน้า.

2
การใช้ความแตกต่างชั่วคราวในหมากรุก
ฉันได้พัฒนาโปรแกรมหมากรุกซึ่งใช้อัลกอริทึมการตัดอัลฟ่าเบต้าและฟังก์ชั่นการประเมินที่ประเมินตำแหน่งโดยใช้คุณสมบัติดังต่อไปนี้คือวัสดุความเป็นกษัตริย์ความปลอดภัยคล่องตัวโครงสร้างจำนำและชิ้นส่วนที่ติดอยู่ ฯลฯ ..... มาจาก ฉ( p ) = w1⋅ วัสดุ+ w2⋅ kingsafety + W3⋅ ความคล่องตัว+ w4awn pawn-structure + w5⋅ ชิ้นที่ติดอยู่f(p)=w1⋅material+w2⋅kingsafety+w3⋅mobility+w4⋅pawn-structure+w5⋅trapped piecesf(p) = w_1 \cdot \text{material} + w_2 \cdot \text{kingsafety} + w_3 \cdot \text{mobility} + w_4 \cdot \text{pawn-structure} + w_5 \cdot \text{trapped pieces} โดยที่คือน้ำหนักที่กำหนดให้กับแต่ละคุณสมบัติ ณ จุดนี้ฉันต้องการปรับน้ำหนักของฟังก์ชั่นการประเมินของฉันโดยใช้ความแตกต่างชั่วคราวที่ตัวแทนเล่นกับตัวเองและในกระบวนการรวบรวมข้อมูลการฝึกอบรมจากสภาพแวดล้อมของมัน (ซึ่งเป็นรูปแบบของการเรียนรู้การเสริมแรง) ฉันได้อ่านหนังสือและบทความบางอย่างเพื่อให้เข้าใจอย่างลึกซึ้งเกี่ยวกับวิธีการใช้งานใน Java แต่ดูเหมือนว่าพวกเขาจะใช้ทฤษฎีมากกว่าการใช้งานจริง ฉันต้องการคำอธิบายโดยละเอียดและรหัสหลอกเกี่ยวกับวิธีการปรับน้ำหนักของฟังก์ชั่นการประเมินของฉันโดยอัตโนมัติตามเกมก่อนหน้าWww

4
ฉันควรใช้ขั้นตอนเริ่มต้นใดเพื่อให้เข้าใจถึงชุดข้อมูลขนาดใหญ่และฉันควรใช้เครื่องมือใด
Caveat: ฉันเป็นผู้เริ่มต้นที่สมบูรณ์เมื่อพูดถึงการเรียนรู้ด้วยเครื่องจักร แต่กระตือรือร้นที่จะเรียนรู้ ฉันมีชุดข้อมูลขนาดใหญ่และฉันพยายามค้นหารูปแบบในนั้น อาจมี / อาจไม่มีความสัมพันธ์ข้ามข้อมูลไม่ว่าจะเป็นตัวแปรที่รู้จักหรือตัวแปรที่มีอยู่ในข้อมูล แต่ที่ฉันยังไม่ได้ตระหนักคือตัวแปร / เกี่ยวข้องจริง ๆ ฉันเดาว่านี่จะเป็นปัญหาที่คุ้นเคยในโลกของการวิเคราะห์ข้อมูลดังนั้นฉันจึงมีคำถามสองสามข้อ: 'กระสุนเงิน' จะทำให้ข้อมูลทั้งหมดนี้เป็นโปรแกรมวิเคราะห์สถิติ / ข้อมูลและเพื่อบีบอัดข้อมูลที่มองหารูปแบบที่เป็นที่รู้จัก / ไม่รู้จักซึ่งพยายามค้นหาความสัมพันธ์ SPSS เหมาะสมหรือมีแอปพลิเคชันอื่นซึ่งอาจเหมาะสมกว่า ฉันควรเรียนรู้ภาษาเช่น R และหาวิธีการประมวลผลข้อมูลด้วยตนเอง สิ่งนี้จะไม่ประกอบด้วยการค้นหาความสัมพันธ์เพราะฉันจะต้องระบุสิ่งที่และวิธีการวิเคราะห์ข้อมูลด้วยตนเอง? นักขุดข้อมูลมืออาชีพจะเข้าถึงปัญหานี้ได้อย่างไรและขั้นตอนใดที่เขา / เธอต้องทำ?

3
สถิติ + วิทยาการคอมพิวเตอร์ = วิทยาศาสตร์ข้อมูล? [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัพเดตคำถามเพื่อให้เป็นหัวข้อสำหรับ Data Science Stack Exchange ปิดให้บริการใน5 ปีที่ผ่านมา ฉันต้องการที่จะกลายเป็นนักวิทยาศาสตร์ข้อมูล ฉันศึกษาสถิติประยุกต์(วิทยาศาสตร์คณิตศาสตร์ประกันภัย) ดังนั้นฉันจึงมีภูมิหลังทางสถิติที่ยอดเยี่ยม (การถดถอยกระบวนการสโตแคสติกอนุกรมเวลาการพูดถึงเพียงไม่กี่อย่าง) แต่ตอนนี้ฉันกำลังจะเรียนปริญญาโทด้านวิทยาการคอมพิวเตอร์ในระบบอัจฉริยะ นี่คือแผนการศึกษาของฉัน: การเรียนรู้ของเครื่อง การเรียนรู้ของเครื่องจักรขั้นสูง การขุดข้อมูล ตรรกะคลุมเครือ ระบบการแนะนำ ระบบข้อมูลแบบกระจาย Cloud Computing การค้นพบความรู้ ระบบธุรกิจอัจฉริยะ การดึงข้อมูล การขุดข้อความ ในตอนท้ายด้วยความรู้ทางสถิติและวิทยาศาสตร์คอมพิวเตอร์ทั้งหมดของฉันฉันสามารถเรียกตัวเองว่าเป็นนักวิทยาศาสตร์ด้านข้อมูลได้หรือไม่? หรือฉันผิด ขอบคุณสำหรับคำตอบ

1
การทำนายด้วยคุณสมบัติที่ไม่ใช่อะตอม
ฉันต้องการใช้ข้อมูลที่ไม่ใช่ปรมาณูเป็นคุณลักษณะสำหรับการคาดการณ์ สมมติว่าฉันมีตารางที่มีคุณสมบัติเหล่านี้: - Column 1: Categorical - House - Column 2: Numerical - 23.22 - Column 3: A Vector - [ 12, 22, 32 ] - Column 4: A Tree - [ [ 2323, 2323 ],[2323, 2323] , [ Boolean, Categorical ] ] - Column 5: A List [ 122, …

3
การจัดการชุดคุณลักษณะที่เพิ่มขึ้นเป็นประจำ
ฉันกำลังทำงานกับระบบตรวจจับการฉ้อโกง ในฟิลด์นี้การฉ้อโกงใหม่จะปรากฏขึ้นเป็นประจำเพื่อให้มีการเพิ่มฟีเจอร์ใหม่ในโมเดลอย่างต่อเนื่อง ฉันสงสัยว่าอะไรคือวิธีที่ดีที่สุดในการจัดการกับมัน (จากมุมมองกระบวนการพัฒนา) เพียงแค่เพิ่มคุณสมบัติใหม่ลงในเวกเตอร์ฟีเจอร์และการฝึกอบรมตัวจําแนกใหม่ดูเหมือนว่าจะไร้เดียงสาเพราะจะใช้เวลามากเกินไปในการเรียนรู้คุณสมบัติเก่าใหม่อีกครั้ง ฉันคิดว่าวิธีการฝึกอบรมตัวจําแนกสำหรับแต่ละคุณสมบัติ (หรือสองสามคุณสมบัติที่เกี่ยวข้อง) แล้วรวมผลของตัวแยกประเภทเหล่านั้นกับลักษณนามโดยรวม มีข้อเสียของวิธีการนี้หรือไม่? ฉันจะเลือกอัลกอริทึมสำหรับตัวจําแนกโดยรวมได้อย่างไร

3
วิธีการเข้ารหัสคลาสที่มี 24,000 หมวดหมู่?
ฉันกำลังทำงานกับโมเดลการถดถอยโลจิสติกส์สำหรับฟังก์ชั่นจีโนม genesหนึ่งของการป้อนข้อมูลเขตข้อมูลที่ฉันต้องการที่จะรวมเป็นตัวแปรร่วมเป็น มียีนที่รู้จักประมาณ 24,000 ตัว มีคุณสมบัติมากมายที่มีระดับความแปรปรวนในชีววิทยาการคำนวณและต้องการตัวอย่างนับแสน ถ้าฉันLabelEncoder()ยีน 24K เหล่านั้น แล้วOneHotEncoder()พวกเขา ... จะมี 24,000 คอลัมน์ที่จะทำให้การฝึกอบรมของฉันเร็วขึ้นสำหรับซีพียู quad-core i7 2.2 GHz หรือไม่? ถ้าเป็นเช่นนั้นมีวิธีอื่นในการเข้ารหัสที่ฉันสามารถทำได้ด้วยหรือไม่ ฉันควรพยายามอุทิศเลเยอร์ของแบบจำลองของฉันกับคุณสมบัตินี้หรือไม่? นี่หมายความว่าฉันต้องการโหนดอินพุต 24K หรือไม่

2
Convolutional1D, Convolutional2D และ Convolutional 3D แตกต่างกันอย่างไร?
ฉันได้เรียนรู้เกี่ยวกับเครือข่ายประสาทเทียม เมื่อดูKerasตัวอย่างฉันพบวิธีการแปลงข้อมูลที่แตกต่างกันสามวิธี กล่าวคือ 1D, 2D และ 3D อะไรคือความแตกต่างระหว่างสามเลเยอร์เหล่านี้? กรณีการใช้งานของพวกเขาคืออะไร? มีลิงค์หรือข้อมูลอ้างอิงเพื่อแสดงกรณีการใช้งานหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.