ตรวจสอบเครื่องจักร Boltzmann ที่ จำกัด
เครื่อง Boltzmann ที่ถูก จำกัด (RBM) เป็นรูปแบบกำเนิดซึ่งเรียนรู้การแจกแจงความน่าจะเป็นเหนืออินพุต นั่นหมายความว่าหลังจากได้รับการฝึกฝน RBM สามารถสร้างตัวอย่างใหม่จากการแจกแจงความน่าจะเป็นที่เรียนรู้ได้ การแจกแจงความน่าจะเป็นในหน่วยที่มองเห็นได้มอบให้โดย
ที่
และเป็นฟังก์ชัน ,คือ อคติสำหรับโหนดที่มองเห็นได้และคือน้ำหนักตั้งแต่ถึง p ( v ∣ h ) = V ∏ i = 0 p ( v i ∣ h ) , p ( v i ∣ h ) = σ ( a i + H ∑ j = 0 w j i h j ) σ a i i w j i h j v ฉัน p ( v ∣ hโวลต์
p ( v ∣ h ) = ∏i = 0Vp ( vผม| H ) ,
p(vi∣h)=σ(ai+∑j=0Hwjihj)
σaiiwjihjvi. จากสองสมการเหล่านี้มันตามที่เพียงขึ้นอยู่กับรัฐที่ซ่อนอยู่{H} นั่นหมายความว่าข้อมูลเกี่ยวกับวิธีสร้างตัวอย่างมองเห็นได้จะต้องเก็บไว้ในหน่วยที่ซ่อนน้ำหนักและอคติ
เอชวีp(v∣h)hv
การใช้ RBM สำหรับการจำแนกประเภท
เมื่อใช้ RBM สำหรับงานการจัดหมวดหมู่คุณใช้แนวคิดต่อไปนี้: เนื่องจากข้อมูลเกี่ยวกับวิธีการสร้างข้อมูลการฝึกอบรมหรือการทดสอบของคุณถูกบันทึกไว้ในหน่วยที่ซ่อนอยู่คุณสามารถแยกปัจจัยพื้นฐานเหล่านี้ได้โดยป้อนตัวอย่างการฝึกอบรม หน่วยที่มองเห็นได้ของ RBM เผยแพร่ไปข้างหน้าไปยังหน่วยที่ซ่อนอยู่และใช้เวกเตอร์ของหน่วยที่ซ่อนอยู่นี้เป็นเวกเตอร์คุณลักษณะ คุณจะไม่ย้อนกลับไปยังหน่วยที่มองเห็นได้อีกต่อไปh
เวกเตอร์ที่ซ่อนอยู่นี้เป็นเพียงข้อมูลแปลงรูปแบบซึ่งไม่สามารถแยกประเภทได้ด้วยตัวเอง ในการจำแนกประเภทคุณจะต้องฝึกอบรมตัวจําแนกใด ๆ (ตัวจําแนกเชิงเส้น SVM เครือข่ายประสาท feedforward หรือสิ่งอื่น ๆ ) ด้วยเวกเตอร์ที่ซ่อนอยู่แทนข้อมูลการฝึกอบรม "ดิบ" เป็นอินพุต
หากคุณกำลังสร้างเครือข่ายความเชื่อลึก (DBN) - ซึ่งใช้ในการฝึกอบรมโครงข่ายประสาทเทียมไปข้างหน้าอย่างล้ำลึกในรูปแบบที่ไม่ได้รับการดูแล - คุณจะต้องใช้เวกเตอร์ที่ซ่อนอยู่นี้และใช้เป็นข้อมูลป้อนเข้ากับ RBM ใหม่ ด้านบนของมัน ด้วยวิธีนี้คุณสามารถฝึกอบรมเลเยอร์เครือข่ายทีละชั้นจนได้ขนาดที่ต้องการโดยไม่ต้องใช้ข้อมูลที่มีป้ายกำกับ ในที่สุดคุณจะเพิ่มเช่นเลเยอร์ softmax ที่ด้านบนและฝึกอบรมเครือข่ายทั้งหมดด้วย backpropagation ในงานการจำแนกของคุณ