คำถามติดแท็ก machine-learning

สำหรับคำถามที่เกี่ยวข้องกับการเรียนรู้ของเครื่องจักร (ML) ซึ่งเป็นชุดของวิธีการที่สามารถตรวจจับรูปแบบข้อมูลโดยอัตโนมัติแล้วใช้รูปแบบที่ไม่เปิดเผยเพื่อคาดการณ์ข้อมูลในอนาคตหรือทำการตัดสินใจประเภทอื่น ๆ ภายใต้ความไม่แน่นอน (เช่นการวางแผน เพื่อรวบรวมข้อมูลเพิ่มเติม) ML มักจะถูกแบ่งออกเป็นการเรียนรู้แบบมีผู้สอนไม่มีผู้ดูแลและเสริมกำลัง การเรียนรู้อย่างลึกซึ้งเป็นส่วนย่อยของ ML ที่ใช้โครงข่ายประสาทเทียมแบบลึก

2
ทำไมเอนโทรปีของการไขว้กันจึงกลายเป็นฟังก์ชั่นการสูญเสียมาตรฐานและไม่ใช่ Kullbeck Leibler divergence?
Cross entropy นั้นเหมือนกับ KL divergence บวกกับเอนโทรปีของการกระจายเป้าหมาย KL เท่ากับศูนย์เมื่อทั้งสองการแจกแจงเหมือนกันซึ่งดูเหมือนง่ายสำหรับฉันมากกว่าเอนโทรปีของการกระจายเป้าหมายซึ่งเป็นสิ่งที่เอนโทรปีของการจับคู่ข้ามตรงกัน ฉันไม่ได้บอกว่ามีข้อมูลเพิ่มเติมในอีกเรื่องหนึ่งยกเว้นว่ามุมมองของมนุษย์อาจพบว่าศูนย์ใช้งานง่ายกว่าเชิงบวก แน่นอนหนึ่งมักจะใช้วิธีการประเมินเพื่อดูว่าการจัดหมวดหมู่เกิดขึ้นได้ดีเพียงใด แต่ทางเลือกของเอนโทรปีในประวัติศาสตร์ KL คืออะไร?

6
ความแตกต่างระหว่างการเรียนรู้ของเครื่องและการเรียนรู้อย่างลึกซึ้งคืออะไร?
บางคนสามารถอธิบายความแตกต่างระหว่างการเรียนรู้ของเครื่องและการเรียนรู้เชิงลึกให้ฉันได้หรือไม่ เป็นไปได้หรือไม่ที่จะเรียนรู้การเรียนรู้อย่างลึกซึ้งโดยไม่ต้องเรียนรู้ด้วยเครื่อง?

2
การเรียนรู้อย่างครึกครื้นเกินเหตุเมื่อใด
ตัวอย่างเช่นสำหรับการจำแนกอีเมลเป็นสแปมมันคุ้มค่าหรือไม่ - จากมุมมองของเวลา / ความถูกต้อง - เพื่อใช้การเรียนรู้อย่างลึกซึ้ง (ถ้าเป็นไปได้) แทนที่จะใช้อัลกอริทึมการเรียนรู้ของเครื่องอื่น การเรียนรู้เชิงลึกจะทำให้อัลกอริทึมการเรียนรู้ของเครื่องจักรอื่น ๆ เช่นไร้เดียงสาเบย์ไม่จำเป็นหรือไม่?

5
เหตุใด C ++ จึงใช้กันอย่างแพร่หลายน้อยกว่าใน AI
ฉันแค่อยากรู้ว่าทำไมวิศวกรการเรียนรู้ของเครื่องและโปรแกรมเมอร์ AI ใช้ภาษาอย่างหลามเพื่อทำงาน AI และไม่ใช่ C ++ ถึงแม้ว่า C ++ จะเป็นภาษาที่ทรงพลังมากกว่าภาษาไพ ธ อน

3
การเปลี่ยนแปลงของโครงข่ายประสาทเทียม
กำหนดเครือข่ายประสาทfffที่ใช้เป็น input nnnข้อมูลจุด: x1,…,xnx1,…,xnx_1, \dots, x_nx_n เราบอกว่าfffเป็นการเปลี่ยนแปลงที่ไม่แปรเปลี่ยนถ้า f(x1...xn)=f(pi(x1...xn))f(x1...xn)=f(pi(x1...xn))f(x_1 ... x_n) = f(pi(x_1 ... x_n)) สำหรับการเปลี่ยนแปลงใด ๆปี่pipipi ใครช่วยแนะนำจุดเริ่มต้น (บทความตัวอย่างหรือกระดาษอื่น ๆ ) สำหรับการเปลี่ยนแปลงโครงข่ายประสาทเทียม

1
กฎการประมวลผลข้อมูลจาก Gestalt จิตวิทยายังคงใช้ในการมองเห็นคอมพิวเตอร์ในวันนี้?
ทศวรรษที่ผ่านมามีและเป็นหนังสือในแมชชีนวิชันซึ่งใช้กฎการประมวลผลข้อมูลต่าง ๆ จากจิตวิทยา gestalt ได้ผลลัพธ์ที่น่าประทับใจด้วยรหัสน้อยหรือฮาร์ดแวร์พิเศษในการระบุภาพและการประมวลผลภาพ วันนี้มีการใช้วิธีการดังกล่าวหรือไม่ มีความคืบหน้าเกี่ยวกับเรื่องนี้หรือไม่? หรือโปรแกรมการวิจัยนี้ลดลง? ภายในวันนี้ฉันหมายถึงปี 2559 ไม่ใช่ปี 1995 หรือปี 2005

4
สมองมนุษย์ใช้งานฟังก์ชั่นการเปิดใช้งานอะไร
สมองของมนุษย์ใช้ฟังก์ชั่นเปิดใช้งานเฉพาะหรือไม่? ฉันได้ลองทำวิจัยแล้วและเนื่องจากมันเป็นโครงข่ายว่าสัญญาณถูกส่งผ่านเซลล์ประสาทหรือไม่มันฟังดูเหมือน ReLU มาก อย่างไรก็ตามฉันไม่พบบทความเดียวที่ยืนยันเรื่องนี้ หรือมันเป็นเหมือนฟังก์ชั่นขั้นตอน (ส่ง 1 ถ้ามันอยู่เหนือ treshold แทนที่จะเป็นค่าอินพุต)

2
จะเลือกฟังก์ชั่นการเปิดใช้งานได้อย่างไร?
ฉันเลือกฟังก์ชั่นการเปิดใช้งานสำหรับเลเยอร์เอาต์พุตขึ้นอยู่กับเอาต์พุตที่ฉันต้องการและคุณสมบัติของฟังก์ชั่นการเปิดใช้งานที่ฉันรู้ ตัวอย่างเช่นฉันเลือกฟังก์ชัน sigmoid เมื่อฉันจัดการกับความน่าจะเป็น ReLU เมื่อฉันจัดการกับค่าบวกและฟังก์ชันเชิงเส้นเมื่อฉันจัดการกับค่าทั่วไป ในเลเยอร์ที่ซ่อนอยู่ฉันใช้ ReLU ที่มีการรั่วไหลเพื่อหลีกเลี่ยงเซลล์ประสาทที่ตายแล้วแทนที่จะเป็น ReLU และ tanh แทนที่จะเป็น sigmoid แน่นอนฉันไม่ได้ใช้ฟังก์ชันเชิงเส้นในหน่วยที่ซ่อนอยู่ อย่างไรก็ตามตัวเลือกสำหรับพวกเขาในเลเยอร์ที่ซ่อนอยู่ส่วนใหญ่เกิดจากการลองผิดลองถูก มีกฎใด ๆ ของฟังก์ชั่นการเปิดใช้งานที่น่าจะทำงานได้ดีในบางสถานการณ์ ใช้คำว่าสถานการณ์ทั่วไปเท่าที่จะทำได้: อาจหมายถึงความลึกของเลเยอร์ความลึกของ NN กับจำนวนของเซลล์ประสาทสำหรับเลเยอร์นั้นไปยังออพติไมเซอร์ที่เราเลือก เลเยอร์นั้นไปยังแอปพลิเคชันของ NN นี้เป็นต้น ในคำตอบของเขา / เธอ cantordust หมายถึงฟังก์ชั่นการเปิดใช้งานอื่น ๆ ที่ฉันไม่ได้พูดถึงเช่น ELU และ SELU ข่าวสารนี้มีมากกว่ายินดี อย่างไรก็ตามฟังก์ชั่นการเปิดใช้งานเพิ่มเติมที่ฉันค้นพบยิ่งฉันสับสนในการเลือกฟังก์ชั่นที่จะใช้ในเลเยอร์ที่ซ่อนอยู่ และฉันไม่คิดว่าการพลิกเหรียญเป็นวิธีที่ดีในการเลือกฟังก์ชั่นการเปิดใช้งาน

1
ทำไมคุณไม่เห็นเลเยอร์การออกกลางคันในตัวอย่างการเรียนรู้การเสริมแรง?
ฉันได้ดูการเรียนรู้การเสริมแรงและโดยเฉพาะการเล่นกับการสร้างสภาพแวดล้อมของตัวเองเพื่อใช้กับ OpenAI Gym AI ฉันกำลังใช้ตัวแทนจากโครงการ stable_baselines เพื่อทดสอบกับมัน สิ่งหนึ่งที่ฉันสังเกตเห็นได้ในตัวอย่าง RL เกือบทั้งหมดคือดูเหมือนจะไม่มีเลเยอร์ดรอปเอาต์ในเครือข่ายใด ๆ เลย ทำไมนี้ ฉันได้สร้างสภาพแวดล้อมที่จำลองราคาสกุลเงินและตัวแทนง่าย ๆ โดยใช้ DQN ที่พยายามเรียนรู้เวลาที่จะซื้อและขาย ฝึกมันมากกว่าหนึ่งล้าน timesteps นำมาจากชุดของข้อมูลที่เฉพาะเจาะจงซึ่งประกอบด้วยข้อมูลราคา 5 นาทีหนึ่งเดือนที่ดูเหมือนว่าจะมีค่าเกินจำนวนมาก ถ้าฉันประเมินเอเจนต์และโมเดลเทียบกับมูลค่าข้อมูลของเดือนอื่น ๆ ดังนั้นฟังดูเหมือนการโอเวอร์คลาสสิกแบบดั้งเดิม แต่มีเหตุผลทำไมคุณไม่เห็นเลเยอร์การออกกลางคันในเครือข่าย RL หรือไม่ มีกลไกอื่น ๆ ที่จะลองและจัดการกับการสวมใส่เกินได้ไหม? หรือในตัวอย่าง RL หลายเรื่องไม่สำคัญ เช่นอาจมีเพียงวิธีเดียวที่แท้จริงในการทำคะแนนสูงสุดในเกม 'breakout' ดังนั้นคุณอาจจะเรียนรู้อย่างแน่นอนและไม่จำเป็นต้องพูดคุยกัน? หรือถือว่าเป็นธรรมชาติที่วุ่นวายของสภาพแวดล้อมเองควรให้ผลลัพธ์ที่แตกต่างกันมากพอที่คุณไม่จำเป็นต้องมีชั้นการออกกลางคัน

4
มีกลยุทธ์อะไรบ้างในการจดจำสื่อที่ทำขึ้นมา?
ด้วยความสามารถที่เพิ่มมากขึ้นในการสร้างภาพปลอมราคาถูกเสียงปลอมและวิดีโอปลอมทำให้กลายเป็นปัญหาที่เพิ่มขึ้นด้วยการรับรู้สิ่งที่เป็นจริงและสิ่งที่ไม่ใช่ แม้ตอนนี้เราจะเห็นตัวอย่างของแอปพลิเคชั่นที่สร้างสื่อปลอมในราคาเพียงเล็กน้อย (ดูDeepfake , FaceAppและอื่น ๆ ) เห็นได้ชัดว่าหากมีการใช้แอปพลิเคชันเหล่านี้ในทางที่ผิดพวกเขาอาจถูกใช้เพื่อทำให้ภาพลักษณ์ของบุคคลอื่นเสื่อม Deepfake สามารถใช้เพื่อทำให้คนดูนอกใจคู่ของตน อาจใช้แอปพลิเคชันอื่นเพื่อทำให้ดูเหมือนว่านักการเมืองพูดถึงสิ่งที่ขัดแย้ง เทคนิคใดบ้างที่สามารถใช้ในการรับรู้และป้องกันสื่อที่ทำขึ้นโดยทำเทียม

2
เครือข่ายผู้ให้คำปรึกษาทั่วไปทำงานอย่างไร
ฉันกำลังอ่านเกี่ยวกับเครือข่าย adversarial (GANs) และฉันมีข้อสงสัยเกี่ยวกับมัน จนถึงตอนนี้ฉันเข้าใจว่าใน GAN มีเครือข่ายประสาทสองประเภทที่แตกต่างกัน: หนึ่งคือกำเนิด ( ) และเลือกปฏิบัติอื่น ( ) เครือข่ายนิวรัลแบบกำเนิดสร้างข้อมูลบางอย่างซึ่งเครือข่ายนิวรัลแบบเลือกปฏิบัติตัดสินความถูกต้อง GAN เรียนรู้โดยผ่านฟังก์ชั่นการสูญเสียไปยังเครือข่ายทั้งสองGGGDDD discriminative ( ) neural nets ในตอนแรกรู้ได้อย่างไรว่าข้อมูลที่สร้างโดยนั้นถูกต้องหรือไม่? เราต้องฝึกก่อนแล้วเพิ่มมันเข้าไปใน GAN ด้วยหรือไม่?DDDGGGDDDGGG ลองพิจารณาสุทธิที่ผ่านการฝึกอบรมของฉันซึ่งสามารถจัดประเภทรูปภาพที่มีความแม่นยำร้อยละ 90 หากเราเพิ่มสุทธินี้ไปยัง GAN มีความน่าจะเป็น 10% มันจะจำแนกภาพผิด หากเราฝึก GAN ด้วยสุทธินี้แล้วมันจะมีข้อผิดพลาด 10% เหมือนกันในการจำแนกภาพหรือไม่? ถ้าใช่แล้วทำไม GAN ถึงแสดงผลลัพธ์ที่มีแนวโน้มDDDDDDDDD

1
ออกแบบ AI สำหรับการวิเคราะห์ไฟล์บันทึก
ฉันกำลังพัฒนาเครื่องมือ AI เพื่อค้นหาข้อผิดพลาดของอุปกรณ์ที่รู้จักและค้นหารูปแบบของความล้มเหลวใหม่ ล็อกไฟล์นี้เป็นไปตามเวลาและมีข้อความที่รู้จัก (ข้อมูลและข้อผิดพลาด) ฉันกำลังใช้ไลบรารี JavaScript เหตุการณ์จะลดลงเพื่อแสดงข้อมูลในแบบที่นุ่มนวล รูปแบบและค้นหารูปแบบที่เป็นไปได้ใหม่ ฉันมีข้อกำหนดบางอย่าง: 1 - เครื่องมือจะต้องเป็น ไม่มีการพึ่งพาการติดตั้งสภาพแวดล้อมพิเศษหรือ b ยิ่งน้อยยิ่งดี (สถานการณ์ที่สมบูรณ์แบบคือการเรียกใช้เครื่องมือทั้งหมดบนเบราว์เซอร์ในโหมดสแตนด์อโลน); 2 - ความเป็นไปได้ที่จะทำให้ตัววิเคราะห์รูปแบบมีการแยกส่วนชนิดของโมดูลหนึ่งโมดูลต่อข้อผิดพลาด; อัลกอริทึมชนิดที่แนะนำในการทำสิ่งนี้คืออะไร (โครงข่ายประสาทเทียมอัลกอริทึมพันธุกรรม ฯลฯ ) มีบางอย่างในการใช้งาน JavaScript ใช่ไหม ถ้าไม่ใช่ภาษาที่ดีที่สุดในการทำ AI นี้คืออะไร?

2
ควรดูเครือข่ายที่ตกค้างในระดับลึกเป็นเครือข่ายหรือไม่
คำถามเกี่ยวกับสถาปัตยกรรมของ Deep Residual Networks ( ResNets ) รูปแบบที่ชนะอันดับ 1 ในงาน"Large Scale Visual Recognition Challenge 2015" (ILSVRC2015)ในห้าเส้นทางหลัก: การจำแนกประเภทของ ImageNet:“ ล้ำลึก” (อ้างถึงยานน์) ตาข่าย 152 ชั้น การตรวจจับ ImageNet: ดีขึ้นกว่า 2% 16% การแปล ImageNet: 27% ดีกว่าที่ 2 การตรวจจับ COCO: ดีขึ้นกว่า 2% 11% การแบ่งส่วน COCO: ดีกว่าอันดับ 2 ถึง 12% ที่ มา: การ แข่งขัน MSRA @ …

1
เครือข่ายประสาทประเภทต่าง ๆ ใช้สำหรับทำอะไร?
ฉันพบแผ่นโกงโครงข่ายประสาทต่อไปนี้ (แผ่นโกงสำหรับ AI, โครงข่ายประสาทเทียม, การเรียนรู้ของเครื่อง, การเรียนรู้ลึกและข้อมูลขนาดใหญ่ ) เครือข่ายประสาทประเภทต่าง ๆ เหล่านี้ใช้ทำอะไร? ตัวอย่างเช่นเครือข่ายประสาทใดสามารถใช้สำหรับการถดถอยหรือการจำแนกซึ่งสามารถใช้สำหรับการสร้างลำดับ ฯลฯ ฉันต้องการภาพรวมสั้น ๆ (1-2 บรรทัด) ของแอปพลิเคชันของพวกเขา

4
วิธีล่าสุดในการฝึกอบรมบอทแชทคืออะไร?
ฉันต้องการฝึกบอทที่ใช้การป้อนข้อความจดจำบางหมวดหมู่และตอบคำถามตามนั้น นอกจากนี้ในเวอร์ชั่น 2.0 ฉันต้องการให้ bot ตอบรับอินพุตด้วยเช่นกัน ขั้นตอนวิธีการเรียนรู้ของเครื่อง / AI ล่าสุดที่เหมือนกันมีอะไรบ้าง? โปรดแจ้งให้เราทราบ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.