มีโดเมนใดที่ Bayesian Networks มีประสิทธิภาพสูงกว่าเครือข่ายประสาทหรือไม่


48

เครือข่ายนิวรัลได้รับผลลัพธ์สูงสุดในงาน Computer Vision (ดูMNIST , ILSVRC , Kaggle Galaxy Challenge ) ดูเหมือนว่าพวกเขาจะเหนือกว่าทุก ๆ วิธีใน Computer Vision แต่ยังมีงานอื่น ๆ :

ฉันไม่แน่ใจเกินไปเกี่ยวกับ ASR (การรู้จำเสียงอัตโนมัติ) และการแปลด้วยเครื่อง แต่ฉันคิดว่าฉันก็เคยได้ยินว่า (เกิดขึ้นอีก) เครือข่ายประสาท (เริ่มต้น) มีประสิทธิภาพเหนือกว่าวิธีอื่น ๆ

ขณะนี้ฉันกำลังเรียนรู้เกี่ยวกับ Bayesian Networks และฉันสงสัยว่าในกรณีใดโมเดลเหล่านี้มักจะถูกนำไปใช้ ดังนั้นคำถามของฉันคือ:

มีการแข่งขันที่ท้าทาย / (Kaggle) หรือไม่ที่รัฐมีศิลปะคือ Bayesian Networks หรืออย่างน้อยก็มีรูปแบบที่คล้ายกันมาก?

(หมายเหตุด้านข้าง: ผมเคยเห็นยังต้นไม้ตัดสินใจ , 2 , 3 , 4 , 5 , 6 , 7ผู้ชนะในความท้าทายหลาย Kaggle ล่าสุด)


ไม่ใช่คำถามของโดเมน มันเป็นคำถามว่าคุณมีข้อมูลมากแค่ไหนคุณเป็นนักบวชที่เก่งและไม่ว่าคุณต้องการโปสเตอร์
Emre

1
@Emre ซึ่งเป็นคำถามของโดเมน ... (และแน่นอนว่าเงินเมื่อคุณมีความเป็นไปได้ที่จะไม่เพียง แต่ใช้ชุดข้อมูลที่มีอยู่ แต่ยังสามารถจ้างคนเพื่อสร้าง / ติดป้ายข้อมูลใหม่)
Martin Thoma

มันจะเป็นคำถามของโดเมนหากมีคุณสมบัติบางอย่างของข้อมูลโครงสร้างบางส่วนที่อัลกอริทึมหนึ่งใช้ประโยชน์จากดีกว่าอื่น แต่นั่นไม่ใช่สิ่งที่ฉันแนะนำ
Emre

2
ดังนั้นคำตอบสำหรับคำถามของคุณเป็นแล้วไม่มี ขวา? เพราะคำตอบทั้งหมดดูเหมือนจะชี้ให้เห็นถึงข้อได้เปรียบของเครือข่ายแบบเบย์มากกว่าแบบจำลองการทำนายอื่น ๆ แต่ฉันไม่เคยเห็นการแข่งขัน Kaggle ใด ๆ ที่พวกเขาทำได้ดีกว่าแบบจำลองอื่น ๆ ใครช่วยได้บ้าง เพราะเหตุผลและข้อได้เปรียบที่เป็นไปได้ทั้งหมดเช่นการขาดข้อมูลที่เพียงพอและการเลือกนักบวชที่ดีในคำตอบนั้นดูดีในทางทฤษฎี แต่ก็ยังไม่ตอบคำถามด้วยการให้อย่างน้อยหนึ่งตัวอย่าง
MNLR

สิ่งหนึ่งที่เครือข่ายแบบเบย์นั้นมีประโยชน์สำหรับการเรียนรู้ / งานที่ไม่ได้รับการดูแลซึ่งจำนวนข้อมูลค่อนข้าง จำกัด เครือข่ายประสาทมีประสิทธิภาพดีกว่าคนอื่นเมื่อมีข้อมูลจำนวนมากที่ต้องทำการฝึก
xji

คำตอบ:


31

หนึ่งในพื้นที่ที่ใช้วิธีแบบเบย์บ่อยครั้งคือต้องการความสามารถในการตีความของระบบการทำนาย คุณไม่ต้องการให้หมอประสาทและบอกว่ามันแม่นยำ 95% คุณต้องการอธิบายสมมติฐานที่วิธีการของคุณใช้รวมถึงกระบวนการตัดสินใจที่วิธีการใช้

พื้นที่ที่คล้ายกันคือเมื่อคุณมีความรู้เกี่ยวกับโดเมนมาก่อนและต้องการใช้ในระบบ



ดูเพิ่มเติม: มะนาว
Martin Thoma

18

เครือข่ายแบบเบย์และเครือข่ายประสาทไม่ได้แยกจากกัน อันที่จริงแล้วเครือข่ายแบบเบย์เป็นเพียงคำศัพท์หนึ่งสำหรับ พวกมันมีประโยชน์มากในการออกแบบฟังก์ชั่นเครือข่ายประสาทเทียม ยานน์เลคันนี้ได้ชี้ออกจากที่นี่: https://plus.google.com/+YannLeCunPhD/posts/gWE7Jca3Zoq

ตัวอย่างหนึ่ง

p(x)=zp(x|z)p(z)dz.
p(x|z)q(z|x)p(z|x)

สามารถฝึกสองส่วนร่วมกันได้หรือไม่?
nn0p

16

คำตอบที่ยอดเยี่ยมแล้ว

หนึ่งโดเมนที่ฉันนึกถึงและทำงานอย่างกว้างขวางคือโดเมนการวิเคราะห์ลูกค้า

ฉันต้องเข้าใจและคาดการณ์การเคลื่อนไหวและแรงจูงใจของลูกค้าเพื่อแจ้งและเตือนทั้งการสนับสนุนลูกค้าการตลาดและทีมการเติบโต

ดังนั้นที่นี่เครือข่ายประสาททำงานได้ดีมากในการทำนายแบบปั่นป่วน ฯลฯ แต่ฉันพบและชอบสไตล์เครือข่ายแบบเบย์และนี่คือเหตุผลที่เลือกมัน:

  1. ลูกค้ามักมีลวดลาย พวกเขามักจะมีเหตุผลในการลงมือทำ และด้วยเหตุผลนั้นจะเป็นสิ่งที่ทีมของฉันได้ทำเพื่อพวกเขาหรือพวกเขาได้เรียนรู้ด้วยตัวเอง ดังนั้นทุกอย่างมีก่อนหน้านี้ที่นี่และในความเป็นจริงเหตุผลนั้นสำคัญมากเพราะเป็นเชื้อเพลิงในการตัดสินใจส่วนใหญ่ของลูกค้า
  2. การเคลื่อนไหวของลูกค้าและทีมการเจริญเติบโตในช่องทางการตลาด / การขายทุกครั้งเป็นผลที่เกิดขึ้น ดังนั้นความรู้ก่อนมีความสำคัญเมื่อมันมาถึงการแปลงลูกค้าเป้าหมายในอนาคตเป็นลูกค้า

ดังนั้นแนวคิดเรื่องก่อนจึงมีความสำคัญมากเมื่อพูดถึงการวิเคราะห์ลูกค้าซึ่งทำให้แนวคิดของเครือข่ายแบบเบย์สำคัญกับโดเมนนี้


การเรียนรู้ที่แนะนำ:

วิธีการแบบเบย์สำหรับโครงข่ายประสาท

เครือข่ายแบบเบย์ในการวิเคราะห์ธุรกิจ


15

บางครั้งคุณสนใจมากเกี่ยวกับการเปลี่ยนผลลัพธ์เป็นการทำนายผลลัพธ์

เครือข่ายประสาทที่ได้รับข้อมูลการฝึกอบรมที่เพียงพอจะมีแนวโน้มที่จะทำนายผลลัพธ์ได้ดีขึ้น แต่เมื่อคุณสามารถทำนายผลลัพธ์ได้คุณอาจต้องการคาดการณ์ผลของการเปลี่ยนแปลงคุณลักษณะการป้อนข้อมูลในผลลัพธ์

ตัวอย่างจากชีวิตจริงการรู้ว่าบางคนมีอาการหัวใจวายมีประโยชน์ แต่ความสามารถในการบอกคนว่าถ้าพวกเขาหยุดทำ XX ความเสี่ยงจะลดลง 30% ซึ่งมีประโยชน์มากกว่ามาก

เช่นเดียวกันกับการรักษาลูกค้าเมื่อรู้ว่าทำไมลูกค้าถึงหยุดช้อปปิ้งกับคุณมีค่ามากพอ ๆ กับการคาดการณ์ลูกค้าที่มีแนวโน้มจะหยุดซื้อของกับคุณ

นอกจากนี้เครือข่าย Bayesian ที่เรียบง่ายกว่าที่คาดการณ์ได้ดีน้อยลง แต่นำไปสู่การดำเนินการเพิ่มเติมที่เกิดขึ้นบ่อยครั้งอาจจะดีกว่าเครือข่าย Bayesian ที่ "ถูกต้อง" มากขึ้น

ข้อได้เปรียบที่ใหญ่ที่สุดของเครือข่ายแบบเบย์ผ่านเครือข่ายประสาทคือพวกเขาสามารถใช้สำหรับการอนุมานเชิงสาเหตุ สาขานี้มีความสำคัญพื้นฐานต่อสถิติและการเรียนรู้ของเครื่องจักรและจูเดียเพิร์ลได้รับรางวัลทัวริงสำหรับการวิจัยนี้


แต่สามารถใช้เครือข่ายประสาทเทียมเพื่อกำหนดบทบาทและความสำคัญของคุณสมบัติที่แตกต่างได้ใช่ไหม
Hossein

7

เครือข่ายแบบเบย์อาจมีประสิทธิภาพสูงกว่าเครือข่ายประสาทในการตั้งค่าข้อมูลขนาดเล็ก หากข้อมูลก่อนหน้านี้ได้รับการจัดการอย่างเหมาะสมผ่านโครงสร้างเครือข่าย priors และไฮเปอร์พารามิเตอร์อื่น ๆ มันอาจมีความได้เปรียบเหนือ Neural Networks โครงข่ายประสาทเทียมโดยเฉพาะโครงข่ายที่มีเลเยอร์มากขึ้นเป็นที่รู้จักกันดีว่าเป็นข้อมูลที่หิว ข้อมูลจำนวนมากที่มีความหมายเกือบจะเป็นสิ่งจำเป็นในการฝึกอบรมอย่างถูกต้อง


4

ฉันโพสต์ลิงค์นี้ใน Redditและได้รับข้อเสนอแนะมากมาย บางคนโพสต์คำตอบของพวกเขาที่นี่ คำตอบนี้ควรรวมการโพสต์ reddit (ฉันทำให้ชุมชนเป็นวิกิดังนั้นฉันจึงไม่ได้รับคะแนน)



2

ฉันทำตัวอย่างเล็ก ๆ ครั้งนี้ จากนั้นฉันคิดว่า Bayesian Networks เป็นที่ต้องการหากคุณต้องการจับภาพการกระจาย แต่ชุดฝึกอบรมการป้อนข้อมูลของคุณไม่ครอบคลุมการกระจายที่ดี ในกรณีเช่นนี้แม้แต่เครือข่ายประสาทที่ทำให้การกระจายทั่วไปไม่สามารถสร้างการกระจายได้


-3

ฉันไม่เห็นด้วยอย่างยิ่งที่อวนประสาททำดีแล้วผู้เรียนคนอื่น ๆ ในความเป็นจริงมุ้งอวนทำออกมาได้ไม่ดีเมื่อเทียบกับวิธีอื่น นอกจากนี้ยังไม่มีวิธีการแม้จะมีคำแนะนำในการเลือกพารามิเตอร์ที่ผึ้งชนิดนี้ทำบ่อยครั้งโดยบังเอิญ นอกจากนี้ยังมีเป็ดบางตัวที่พูดคุยแบบสุ่มในฟอรัมเกี่ยวกับวิธีการที่มุ้งที่ดีมากไม่ใช่เพราะพวกเขามีหลักฐานบางอย่างเกี่ยวกับเรื่องนั้น แต่เพราะพวกเขาสนใจเรื่องคำแฟนซี คุณลองใช้โครงข่ายประสาทเพื่อเปรียบเทียบกับ xgboost หรือไม่ฉันจะไม่ลองใช้โครงข่ายประสาทใด ๆ จนกว่ามันจะเป็นตัวเองที่มีสติสัมปชัญญะ. ดังนั้นจนกว่าจะถึงเวลานั้นการสร้างความสุขให้กับระบบประสาท :)


3
นี่มันคลุมเครือและสนทนาเกินไปที่จะให้คำตอบที่ดี ข้อมูลเฉพาะข้อเท็จจริงและการแก้ไขบางอย่างจะปรับปรุงให้ดีขึ้น
Sean Owen

,, ข้อเท็จจริงเฉพาะ '' ควรระบุโดยผู้ที่โพสต์ข้อความเช่นนั้นบอกว่ามุ้งที่ดีที่สุดคุณไม่สามารถพูดได้ว่าโครงข่ายประสาทกำลังทำดีเพราะพวกเขาฟังดูมีข้อมูลในเครือข่ายประสาทที่อาจทำเช่นนั้น เลวในลักษณะที่ knn ได้รับจากผลลัพธ์ที่ดีกว่า
gm1

1
แม้ว่าฉันจะไม่ปฏิเสธมุมมองของคุณ แต่คุณก็ควรที่จะไม่ตอบคำถามของคุณ ดังนั้นโปรดพิจารณาเพิ่มเป็นความคิดเห็น และโปรดเพิ่มหลักฐานที่เป็นรูปธรรมและทฤษฎีที่สนับสนุนคำตอบของคุณมิฉะนั้นมันอาจถูกมองว่าเป็นคำพูดโวยวายโดยผู้ชมในอนาคต :)
Dawny33

1
@ gm1 ฉันเดาว่าคุณหมายถึงฉันด้วย ",, ข้อเท็จจริงที่เฉพาะเจาะจง" "ควรระบุโดยผู้ที่โพสต์ข้อความอย่างที่บอกว่าตาข่ายประสาทดีที่สุด" โปรดทราบว่าฉันไม่ได้เขียนข้อความซึ่งเป็นเรื่องทั่วไป ฉันเขียนว่า NN ชนะในการแข่งขัน / งาน CV มากมาย และฉันได้เพิ่มความท้าทายสองประการที่วิธีโครงข่ายประสาทเทียมชนะ
Martin Thoma

สวัสดีมีการแข่งขัน Kaggle บางอย่างที่อวนประสาททำได้ดี (สมมติว่าพวกเขาไม่ได้ใช้อวนประสาทรวมกับแบบจำลองอื่น ๆ ) แต่นี่เป็นสัดส่วนเล็กน้อยของการแข่งขัน Kaggle ทั้งหมดคุณสามารถใช้เครือข่ายประสาทเพื่อไป 3 อันดับแรกใน kaggle TFI ฉันคิดว่าฉันสามารถทำได้ทั้ง LB สาธารณะและส่วนตัวที่มีโมเดลที่ไม่ใช่แบบเส้นตรง
gm1
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.