การเสริมแรงเชิงลบ: วิธีการแทนที่วัตถุ?

18

My Beauce Shepherd ตอนนี้อายุ 9 เดือนเราได้ติดตามพฤติกรรมการเรียนกับผู้ฝึกสอนส่วนบุคคลและทุกอย่างเป็นไปด้วยดี ก่อนที่สุนัขจะทำตามที่เขาต้องการและตอนนี้เขาแค่ฟังดีจริง ๆ !

ตามคำแนะนำของครูฝึกพฤติกรรมบางอย่างได้รับการเสริมแรงในทางบวกและในทางลบ ปัญหาที่เรามีอยู่ในขณะนี้คือพฤติกรรมที่เราเพิ่มขึ้นในทางลบ เราใช้กล่องโลหะเพื่อทำเสียงสุนัขเกลียดและเชื่อฟัง มันมักจะใช้หลังจาก "ไม่" เป็นบทลงโทษที่สอง ทุกอย่างทำงานได้อย่างสมบูรณ์และตอนนี้เราไม่จำเป็นต้องใช้กล่องนี้อีกต่อไปเพราะเขาทำงานอย่างถูกต้อง

ปัญหาคือเราคิดว่าเราจะต้องเปลี่ยนกล่องเป็นอย่างอื่นเพราะตอนนี้เขารู้แล้วว่าถ้าเราไม่มีกล่องมันจะไม่มีเสียงเลยดังนั้นเขาจึงมีส่วนร่วมในพฤติกรรมที่ไม่ต้องการ มันเริ่มเป็นปัญหาอย่างที่เราต้องพกกล่องไปทุกหนทุกแห่งในตอนนี้เพราะถ้าเราไม่มีมันเขาจะใช้โอกาสที่เหมาะสม

มีวิธีที่เราสามารถแก้ไขได้โดยแทนที่กล่องด้วยร่างกายของเราหรืออะไร?

หมายเหตุ: เขาถูกยกเลิกเมื่อเดือนที่แล้วและเขากำลังกล้าเราน้อยลงเล็กน้อย แต่ก็ยังทำได้เมื่อเราไม่มีกล่องที่มีประโยชน์

ขอขอบคุณ

dogs behavior training

— Salketer
แหล่งที่มา

1

อาจเป็นไปได้ว่าคุณควรถามคำถามนี้กับเทรนเนอร์ของคุณ แต่เมื่อการเสริมแรงเชิงลบ (กล่องโลหะ) ทำงานเพื่อควบคุมพฤติกรรมที่ไม่พึงประสงค์ของเขาตอนนี้คุณไม่ควรเริ่มเสริมพฤติกรรมที่ดีหรือไม่? ตัวอย่างเช่นหากสุนัขของฉันยังคงขึ้นไปบนโซฟาฉันอาจ (1) เขย่ากล่องโลหะเพื่อกีดกันมันและเมื่อเขารู้ว่าการไปที่โซฟานั้นไม่เป็นที่ต้องการฉันจะ (2) สรรเสริญและปฏิบัติอย่างไม่เห็นแก่ตัวทุกครั้งที่เขา วางบนพื้นใกล้โซฟาหรือคล้ายกัน

— Steve D

1

:) ฉันรักที่สุนัขสามารถเรียนรู้สิ่งเหล่านี้ได้ด้วยตัวเองหลังจากการสังเกตุ ... "ไม่มีกล่องเฮ้ฉันทำได้ทุกอย่างที่ฉันต้องการ!" :) :) :)

— woliveirajr

10

เมื่อใดก็ตามที่คุยเรื่องเงื่อนไขการทำงานมันจะช่วยพูดภาษาเดียวกันได้:

การเสริมกำลัง:การกระทำที่ออกแบบมาเพื่อเพิ่มความถี่ในการทำงาน
การลงโทษ:การกระทำที่ออกแบบมาเพื่อลดความถี่ของพฤติกรรม
แง่บวก:การมีตัวกระตุ้น
ติดลบ:ไม่มีการกระตุ้น

คำเหล่านี้สามารถรวมกันได้สี่แบบ ( หมายเหตุ:ตัวอย่างในวงเล็บคือตัวอย่างไม่ใช่คำแนะนำ!):

การเสริมแรงเชิงบวก:นำเสนอการกระตุ้นเพื่อเพิ่มความถี่ของพฤติกรรม (เช่นให้การรักษาเมื่อสุนัขนั่งตามคำสั่ง)
การเสริมแรงเชิงลบ:ลบตัวกระตุ้นเพื่อเพิ่มความถี่ของพฤติกรรม (เช่นบุรุษไปรษณีย์หายไปหลังจากที่สุนัขเห่าอยู่)
การลงโทษเชิงบวก:นำเสนอมาตรการกระตุ้นเพื่อลดความถี่ของพฤติกรรม (เช่นตีสุนัขเมื่อมันปัสสาวะบนพรม)
การลงโทษติดลบ:ลบสิ่งกระตุ้นเพื่อลดความถี่ของพฤติกรรม (เช่นออกจากห้องเมื่อสุนัขกระโดดเข้าหาคุณ)

ในทางปฏิบัติสิ่งเหล่านี้อาจทำให้งง ตัวอย่างเช่นคุณทำเสียงดังกับกล่องเป็นสิ่งกระตุ้นที่ออกแบบมาเพื่อลดความถี่ของพฤติกรรมดังนั้นในทางเทคนิคมันก็เป็นตัวอย่างของการลงโทษในทางบวก แต่ถ้าคุณหยุดเสียงเมื่อสุนัขทำพฤติกรรมที่ถูกต้องคุณก็ลบสิ่งกระตุ้น เพิ่มความถี่ของพฤติกรรมที่ถูกต้องเฮ้ presto! การเสริมแรงเชิงลบ

แต่นั่นเป็นการสันนิษฐานว่าสุนัขของคุณมีพฤติกรรมที่ถูกต้อง คุณไม่ได้ระบุว่าพฤติกรรมที่ไม่พึงประสงค์คืออะไรหรือมีพฤติกรรมทางเลือกที่ต้องการที่คุณพยายามเสริมกำลัง หากสิ่งที่คุณทำกับเสียงรบกวนกำลังพยายามหยุดเขาทำอะไรสักอย่างคุณก็จะได้รับการลงโทษมากกว่าการเสริมกำลังทางลบ

ไม่ว่าในกรณีใดปัญหาส่วนหนึ่งของคุณอาจเป็นไปได้ว่าคุณใช้ผู้สนับสนุนหลักและผู้ลงโทษขั้นพื้นฐานเท่านั้นนั่นคือปัญหาที่สุนัขไม่จำเป็นต้องเรียนรู้ ตัวอย่างเช่นอาหารเป็นตัวช่วยหลัก สุนัขรู้ว่าอาหารเป็นสิ่งที่ดีโดยไม่ต้องเรียนรู้ เสียงส่วนใหญ่เป็นการลงโทษขั้นต้นเนื่องจากสุนัขรู้สึกไม่สบายใจที่จะได้ยิน ในทางกลับกันผู้สนับสนุนและผู้ลงโทษรองคือสุนัขที่ได้เรียนรู้

ตัวอย่างคลาสสิกคือระฆังของ Pavlov ที่เขาจะส่งเสียงทุกครั้งที่เขาให้อาหารสุนัข โดยการจับคู่ตัวเสริมหลักกับตัวกระตุ้นอย่างต่อเนื่องตัวกระตุ้นสามารถเริ่มทำหน้าที่เป็นตัวเสริมรองได้ นั่นคือสุนัขรู้ว่าระฆังส่งสัญญาณการมาถึงของอาหารและจะตอบสนองตามนั้น

คุณพูดถึงว่าคุณใช้คำว่า "ไม่" (หวังว่าด้วยเสียงที่ดุดันสุนัขมีความชำนาญในการออกเสียงสูงต่ำ) เมื่อบอกสุนัขของคุณพร้อมกับเสียง "ไม่" ควรทำหน้าที่เป็นผู้ลงโทษขั้นที่สองเช่นเดียวกับการยกย่องในฐานะรองสำรอง แต่คุณอาจล้มเหลวในการยุติเสียงที่เกิดขึ้นอย่างค่อยเป็นค่อยไปโดยการเริ่มต้นที่จะพูดว่า "ไม่" แต่ไม่ทำเสียงดัง

ปัญหาคือตอนนี้สุนัขของคุณได้รับความจริงที่ว่า "ไม่" ไม่มีกล่องรอบหมายถึงไม่มีการลงโทษหลักคือทั้งสองไม่เกี่ยวข้องและดังนั้นเขาจะบันทึกเมื่อมันไม่อยู่

ฉันขอแนะนำให้คุณเปิดคำถามใหม่ที่อธิบายถึงพฤติกรรมที่แท้จริงที่คุณต้องการกีดกันและเราอาจช่วยคุณหาวิธีการที่จะใช้สุนัขในการเรียนรู้สิ่งที่คุณต้องการ ทำ.

— ThomasH
แหล่งที่มา

5

@ThomasH เป็นคำตอบที่ยอดเยี่ยมและสัมผัสกับคำถามของการใช้บทลงโทษรองในวิธีที่แม่นยำมาก

ที่นี่ฉันแค่เพิ่มความคิดเห็นเกี่ยวกับปัญหาสองด้าน

ลงโทษพฤติกรรมที่ผิดพลาดและเสริมสร้างพฤติกรรมที่ถูกต้อง

แม้ว่า "ทฤษฎี" จะทำงานแบบเดียวกันกับ "reinforcer side" และ "punisher side" และเอฟเฟกต์จะมีประสิทธิภาพเท่าที่ควรเราไม่ควรลืมว่าการยับยั้งพฤติกรรมไม่ได้สอนสุนัขว่าควรทำอะไรแทนและเพ่งความสนใจไปที่ ส่วน "ไม่" ของการฝึกอบรมนำไปสู่การจัดการขนาดเล็ก : คุณต้องสอนสุนัขในสิ่งที่เขาไม่ควรทำอย่างต่อเนื่อง แม้ว่าสุนัขจะเรียนรู้ว่าเขาไม่ควรทำ X ในสถานการณ์ที่กำหนด แต่เขาก็ยังมีอิสระที่จะแสดง Y, Z และอื่น ๆ ถ้าคุณสอนเขาในเชิงบวก (เสริมกำลัง) ให้เขาทำ W แทนนั่นอาจจะเป็นการหยุดวงจรอุบาทว์ ทำให้ทุกคนมีความสุข

การเสริมแรง / การลงโทษอัตราผันแปร

@ThomasH อธิบายแนวคิดของผู้บังคับกองกำลังรองหรือการลงโทษ

แง่มุมหนึ่งที่ต้องจำไว้คือตรงกันข้ามกับผู้สนับสนุนหลัก / การลงโทษผู้ที่ได้รับรางวัลรองต้องได้รับรางวัล (ไม่ทางใดก็ทางหนึ่ง) โดยใช้ตารางเวลาที่หลากหลาย

อาหารเป็นตัวเสริมหลัก ทุกครั้งที่สุนัขได้รับชิ้นส่วนอาหารเขาเสริม

แต่คำหลักเช่น "ใช่" หรือการคลิกอาจกลายเป็นเครื่องมือช่วยสำรองลำดับที่สองได้ มันถูกเชื่อมโยงไปยังผู้สนับสนุนหลักที่ตามมา ประเด็นสำคัญคือมันใช้งานได้เพราะสุนัขได้เรียนรู้ว่าผู้เสริมกำลังรายที่สองได้รับรางวัลจากผู้ดูแลหลัก เมื่อสิ่งนี้ได้รับการเรียนรู้การเชื่อมโยงจะต้องได้รับการดูแลด้วยรางวัลจริง ที่จุดเริ่มต้น (ในระหว่างการฝึกอบรม) รางวัลจะมาทุกครั้งจากนั้นก็สามารถได้รับรางวัลพร้อมกำหนดการผันแปร ตารางตัวแปรนั้นเพิ่มความแข็งแกร่งให้กับลิงก์เนื่องจากสุนัขไม่สามารถคาดการณ์ได้ว่าจะให้รางวัลหลักเมื่อใด

โปรดทราบว่านี่มักจะนำไปใช้กับreinforcers ในระดับอุดมศึกษา : คิว "นั่ง" เป็นจริง reinforcer มันอาจนำไปสู่ reinforcer อื่น (คลิกที่ตัวอย่างเช่น) ซึ่งจะนำไปสู่รางวัลจริง

เรามักจะไม่แยกความแตกต่างระหว่างผู้สั่งซื้อรายที่สอง (การคลิก) จากผู้สั่งการขั้นต้น (ตัวอย่างเช่นรางวัลอาหาร) นั่นจะทำให้การเชื่อมโยงระหว่างสองสิ่งนั้นแข็งแกร่งมากและจะมีการใช้อัตราตัวแปรระหว่างคิว (ตัวช่วยเสริมอันดับที่สาม) และการคลิก

อย่างไรก็ตามในกรณีของการลงโทษคุณไม่มี "การลงโทษในระดับอุดมศึกษา" ที่แท้จริงดังนั้นอัตราผันแปรของ "การสนับสนุน" (เข้าใจว่าเป็นการลงโทษในกรณีนี้) อยู่ระหว่างการลงโทษรอง ("ไม่") และการลงโทษจริง ( กล่อง).

— เซดริกเอช
แหล่งที่มา