@ThomasH เป็นคำตอบที่ยอดเยี่ยมและสัมผัสกับคำถามของการใช้บทลงโทษรองในวิธีที่แม่นยำมาก
ที่นี่ฉันแค่เพิ่มความคิดเห็นเกี่ยวกับปัญหาสองด้าน
ลงโทษพฤติกรรมที่ผิดพลาดและเสริมสร้างพฤติกรรมที่ถูกต้อง
แม้ว่า "ทฤษฎี" จะทำงานแบบเดียวกันกับ "reinforcer side" และ "punisher side" และเอฟเฟกต์จะมีประสิทธิภาพเท่าที่ควรเราไม่ควรลืมว่าการยับยั้งพฤติกรรมไม่ได้สอนสุนัขว่าควรทำอะไรแทนและเพ่งความสนใจไปที่ ส่วน "ไม่" ของการฝึกอบรมนำไปสู่การจัดการขนาดเล็ก : คุณต้องสอนสุนัขในสิ่งที่เขาไม่ควรทำอย่างต่อเนื่อง แม้ว่าสุนัขจะเรียนรู้ว่าเขาไม่ควรทำ X ในสถานการณ์ที่กำหนด แต่เขาก็ยังมีอิสระที่จะแสดง Y, Z และอื่น ๆ ถ้าคุณสอนเขาในเชิงบวก (เสริมกำลัง) ให้เขาทำ W แทนนั่นอาจจะเป็นการหยุดวงจรอุบาทว์ ทำให้ทุกคนมีความสุข
การเสริมแรง / การลงโทษอัตราผันแปร
@ThomasH อธิบายแนวคิดของผู้บังคับกองกำลังรองหรือการลงโทษ
แง่มุมหนึ่งที่ต้องจำไว้คือตรงกันข้ามกับผู้สนับสนุนหลัก / การลงโทษผู้ที่ได้รับรางวัลรองต้องได้รับรางวัล (ไม่ทางใดก็ทางหนึ่ง) โดยใช้ตารางเวลาที่หลากหลาย
อาหารเป็นตัวเสริมหลัก ทุกครั้งที่สุนัขได้รับชิ้นส่วนอาหารเขาเสริม
แต่คำหลักเช่น "ใช่" หรือการคลิกอาจกลายเป็นเครื่องมือช่วยสำรองลำดับที่สองได้ มันถูกเชื่อมโยงไปยังผู้สนับสนุนหลักที่ตามมา ประเด็นสำคัญคือมันใช้งานได้เพราะสุนัขได้เรียนรู้ว่าผู้เสริมกำลังรายที่สองได้รับรางวัลจากผู้ดูแลหลัก เมื่อสิ่งนี้ได้รับการเรียนรู้การเชื่อมโยงจะต้องได้รับการดูแลด้วยรางวัลจริง ที่จุดเริ่มต้น (ในระหว่างการฝึกอบรม) รางวัลจะมาทุกครั้งจากนั้นก็สามารถได้รับรางวัลพร้อมกำหนดการผันแปร ตารางตัวแปรนั้นเพิ่มความแข็งแกร่งให้กับลิงก์เนื่องจากสุนัขไม่สามารถคาดการณ์ได้ว่าจะให้รางวัลหลักเมื่อใด
โปรดทราบว่านี่มักจะนำไปใช้กับreinforcers ในระดับอุดมศึกษา : คิว "นั่ง" เป็นจริง reinforcer มันอาจนำไปสู่ reinforcer อื่น (คลิกที่ตัวอย่างเช่น) ซึ่งจะนำไปสู่รางวัลจริง
เรามักจะไม่แยกความแตกต่างระหว่างผู้สั่งซื้อรายที่สอง (การคลิก) จากผู้สั่งการขั้นต้น (ตัวอย่างเช่นรางวัลอาหาร) นั่นจะทำให้การเชื่อมโยงระหว่างสองสิ่งนั้นแข็งแกร่งมากและจะมีการใช้อัตราตัวแปรระหว่างคิว (ตัวช่วยเสริมอันดับที่สาม) และการคลิก
อย่างไรก็ตามในกรณีของการลงโทษคุณไม่มี "การลงโทษในระดับอุดมศึกษา" ที่แท้จริงดังนั้นอัตราผันแปรของ "การสนับสนุน" (เข้าใจว่าเป็นการลงโทษในกรณีนี้) อยู่ระหว่างการลงโทษรอง ("ไม่") และการลงโทษจริง ( กล่อง).