ความแตกต่างระหว่างการถดถอยแบบ PLS กับการสร้างแบบจำลองพา ธ PLS คำติชมของ PLS


12

คำถามนี้ถูกถามที่นี่แต่ไม่มีใครให้คำตอบที่ดี ดังนั้นฉันคิดว่ามันเป็นความคิดที่ดีที่จะนำมันขึ้นมาอีกครั้งและฉันต้องการที่จะเพิ่มความคิดเห็น / คำถามเพิ่มเติม

  • คำถามแรกคือ "PLS path modelling" กับ "PLS regression" ต่างกันอย่างไร? เพื่อให้เป็นเรื่องทั่วไปยิ่งขึ้นการสร้างแบบจำลองสมการโครงสร้าง (SEM) การสร้างแบบจำลองเส้นทางและการถดถอยคืออะไร เพื่อความเข้าใจที่ถดถอยของฉันมุ่งเน้นไปที่การทำนายในขณะที่ SEM ให้ความสำคัญกับความสัมพันธ์ระหว่างการตอบสนองและการทำนายและการสร้างแบบจำลองเส้นทางเป็นกรณีพิเศษของ SEM?

  • คำถามที่สองของฉันคือ PLS ที่น่าเชื่อถือแค่ไหน เมื่อไม่นานมานี้มีการวิพากษ์วิจารณ์มากมายที่เน้นในRönkköและคณะ 2559และRönkköและคณะ 2015ซึ่งนำไปสู่การปฏิเสธเอกสารตาม PLS ในวารสารระดับสูงเช่นวารสารการจัดการการดำเนินงาน ( นี่คือบันทึกจากบรรณาธิการวารสาร):

    เรามีแผนกปฏิเสธจริงทุกต้นฉบับ PLS-based เพราะเราได้ข้อสรุปว่า PLS ได้รับโดยไม่มีข้อยกเว้นวิธีการสร้างแบบจำลองที่ไม่ถูกต้องในทุกชนิดของรูปแบบการใช้งาน OM นักวิจัย

    ฉันควรทราบว่าสาขาของฉันคือสเปกโทรสโกปีการจัดการ / จิตวิทยาหรือสถิติ ในเอกสารที่ลิงก์ด้านบนผู้เขียนกำลังพูดถึง PLS เป็นวิธี SEM แต่สำหรับฉันคำวิจารณ์ของพวกเขาดูเหมือนจะใช้กับการถดถอย PLS เช่นกัน


ลิงก์ของคุณอยู่เบื้องหลัง paywalls
Jeremy Miles

คุณพูดถูก! และฉันขอโทษฉันมี PDF แต่ฉันไม่แน่ใจว่าฉันสามารถอัปโหลดหรือแชร์ได้ไหม วิทยาศาสตร์ควรจะเป็นฟรี :)
Ress

PLS ถดถอยจะมีการอธิบายและพูดคุยกันในรายละเอียดค่อนข้างบางในstats.stackexchange.com/questions/179733 น่าเสียดายที่ฉันไม่รู้อะไรเกี่ยวกับ "การสร้างแบบจำลองเส้นทาง"
อะมีบา

ฉันคิดว่า "การสร้างแบบจำลองเส้นทาง" เป็นเพียงชื่ออื่นสำหรับ SEM
rep_ho

จากบทความปี 2559: "ตำราเบื้องต้นส่วนใหญ่เกี่ยวกับ PLS กลอสเตอร์ตามวัตถุประสงค์ของน้ำหนักโดยอ้างว่า PLS เป็น SEM และดังนั้นจึงต้องให้ความได้เปรียบเหนือการถดถอยด้วยคอมโพสิต (เช่น Gefen et al., 2011) อย่างไรก็ตามงานดังกล่าว บ่อยครั้งไม่ได้ชี้ให้เห็นอย่างชัดเจนว่า PLS เองก็เป็นเพียงแค่การถดถอยด้วยคอมโพสิต กำลังทำให้เข้าใจผิด แรงผลักดันหลักของการโต้แย้งที่ฉันสามารถดูว่าผู้เขียนยืนยันว่า SEM จะต้องมีโครงสร้างทางทฤษฎีที่บริสุทธิ์และพวกเขาก็ดูถูกสมการเชิงโครงสร้างที่ได้มาจากสังเกตุ แต่ PLS ได้รับสมการ 'โครงสร้าง' ผ่านความแปรปรวนร่วม
ReneBt

คำตอบ:


9

คำถามแรกคือ "PLS path modelling" กับ "PLS regression" ต่างกันอย่างไร?

ไม่มีพวกเขามีความหมายเหมือนกัน

เพื่อให้เป็นเรื่องทั่วไปยิ่งขึ้นการสร้างแบบจำลองสมการโครงสร้าง (SEM) การสร้างแบบจำลองเส้นทางและการถดถอยคืออะไร เพื่อความเข้าใจที่ถดถอยของฉันมุ่งเน้นไปที่การทำนายในขณะที่ SEM ให้ความสำคัญกับความสัมพันธ์ระหว่างการตอบสนองและการทำนายและการสร้างแบบจำลองเส้นทางเป็นกรณีพิเศษของ SEM?

SEM เป็นรูปแบบของการถดถอย การถดถอยเป็นวิธีการใด ๆ ที่สัมพันธ์กับตัวแปรอิสระและตัวแปรตามและรวมถึงวิธีการที่ใช้ตัวแปรหลายตัวที่จัดการเป็นเอนทิตีแยกต่างหาก SEM ใช้ความสัมพันธ์ทางคณิตศาสตร์ระหว่างตัวแปรเพื่อ จำกัด ตัวแบบสุดท้ายในกรณีของ PLS นี่คือความแปรปรวนร่วม ความเข้าใจของฉันคือการสร้างแบบจำลองเส้นทางเป็นโดเมน - (ไม่ใช่ของฉันฉันเป็นนักสเปกโทรสโกปีเช่นคุณ)

คำถามที่สองของฉันคือ PLS ที่น่าเชื่อถือแค่ไหน เมื่อไม่นานมานี้มีการวิพากษ์วิจารณ์มากมายที่เน้นในRönkköและคณะ 2559 และRönkköและคณะ 2015

มีการโต้แย้งอย่างดีเยี่ยมในHenseler และคณะ 2013 เชื่อกันทั่วไปและความเป็นจริงเกี่ยวกับ PLS ความกังวลหลักของRönkköและคณะ คือ PLS นั้นทำงานได้ไม่ดีในบางสถานการณ์ที่สมมติว่ามีปัจจัยแฝงร่วมกัน ความจริงแล้ว PLS ออกแบบมาเพื่อจัดการกับปัจจัยแฝงหลายอย่างสถานการณ์ที่พบได้ทั่วไปในโลกแห่งความเป็นจริง

เชื่อถือได้แค่ไหน? สำหรับสเปกโทรสโกปีเป็นเครื่องมือที่ยอดเยี่ยม แต่มีข้อ จำกัด มันมีความเสี่ยงที่จะเกิด overfitting เนื่องจากสามารถสร้างแบบจำลองที่ซับซ้อนที่จับการมีส่วนร่วมจากปัจจัยพื้นฐานหลายอย่าง ด้วยเหตุนี้จึงจำเป็นต้องใช้ด้วยความระมัดระวังและการตรวจสอบภายนอกที่เหมาะสมนั้นเป็นสิ่งจำเป็น แต่จากนั้นคำเตือนเหล่านี้จะใช้กับเครื่องมือสร้างแบบจำลองทั้งหมด ฉันทำงานส่วนใหญ่ในชุดข้อมูลโลกแห่งความจริงเป็นเวลา 2 ทศวรรษและฉันไม่ได้พบชุดข้อมูลการทดลองใด ๆ ที่มีเพียงปัจจัยเดียวทั่วไปที่สนับสนุนการเปลี่ยนแปลงของตัวแปรตาม (ไม่อิงจากข้อมูลหรือทฤษฎีทางวิทยาศาสตร์)


1
+1 แม้ว่าฉันต้องการคำตอบนี้มีรายละเอียดเพิ่มเติมเกี่ยวกับ Ronkko และคณะ vs Henseler และคณะ ความไม่เห็นด้วย. ฉันไม่ได้เป็นนักสเปกโทรสโกทุกคน แต่ฉันมีความเข้าใจค่อนข้างดีเกี่ยวกับ PLS เป็นวิธีการทำให้เป็นมาตรฐานสำหรับการถดถอยเชิงเส้น (นั่นคือวิธีการนำเสนอในองค์ประกอบของการเรียนรู้ทางสถิติโดย Hastie et al.) ฉันคิดว่ามันเรียกว่า PLS1 ในวิชาเคมี ที่นี่ "ประสิทธิภาพ" เกี่ยวข้องกับข้อผิดพลาดในการสร้างใหม่เราสามารถใช้การตรวจสอบข้ามเพื่อเลือกความแข็งแรงของการทำให้เป็นมาตรฐานเป็นต้นนี่คือการตั้งค่าที่คุ้นเคยสำหรับทุกคนที่พบการถดถอยของสันหรือ PCR หรืออะไรทำนองนั้น
อะมีบา

[ต่อเนื่อง] ฉันยังรับรู้ถึง PLS2 ที่มีตัวแปรหลายตัว แต่ฉันไม่แน่ใจว่าจะใช้บ่อยแค่ไหน ในเวลาเดียวกันจากการพยายามเข้าใจว่า Ronkko และคณะ หมายความว่าดูเหมือนว่าจุดสนใจของ "SEM" นั้นเกี่ยวกับการเชื่อมโยง X หลาย ๆ เข้ากับ Y หลายจุด (เช่น PLS2 หรือไม่) และอาจตีความความสัมพันธ์ระหว่าง X และ Y มากกว่าการคาดการณ์ Y เช่นนี้ ฉันไม่แน่ใจด้วยซ้ำว่า "ประสิทธิภาพ" หมายถึงอะไรและฉันไม่รู้ว่าพวกเขาต้องการใช้อะไรแทน PLS เมื่อพวกเขาวิจารณ์ PLS
อะมีบา

ขอบคุณทั้ง ReneBT และอะมีบา ฉันโพสต์คำถามนี้ใน Reddit ที่นี่และมีคน (soumya_ray) ตอบว่าการถดถอยและ SEM แตกต่างกันโดยพื้นฐาน เธอไม่ได้อธิบายความแตกต่างทางเทคนิค Btw คำตอบของเธอขัดกับสิ่งที่คุณพูด (คำตอบของคุณเหมาะสมกับฉัน)
Ress

Btw ฉันเลือกวงโดยใช้ PLS ฉันยืนยันจุดของคุณเกี่ยวกับประสิทธิภาพของ PLS ในขณะที่มันอาจส่งผลให้มีการคาดการณ์ที่ดี (ทั้งในการทดสอบและการสอบเทียบ) แต่ตัวแบบอาจผิดพลาดพื้นฐานหรืออย่างน้อยก็ยากที่จะตีความเพราะมันเลือกตัวแปรพยากรณ์ที่ไม่เกี่ยวข้องกับ ตัวแปรตอบกลับ
Ress

ความคิดเห็นเพิ่มเติมเกี่ยวกับประเด็นสำคัญที่ผู้เขียนกล่าวถึงคือ "อัลกอริทึม PLS จึงสร้างน้ำหนักที่เพิ่มความสัมพันธ์ระหว่างคอมโพสิตที่อยู่ติดกันเมื่อเทียบกับคอมโพสิตถ่วงน้ำหนักที่ใช้เป็นจุดเริ่มต้นโดยใช้ความสัมพันธ์ใด ๆ ในข้อมูล ไม่รับประกันความสำเร็จในระดับโลกที่เหมาะสม " เป็นข้อกังวลที่ถูกต้องโดยสรุปสิ่งที่ว่าแบบจำลองจะใช้กับประชากรที่มีโครงสร้างความแปรปรวนร่วมเดียวกันซึ่งไม่ได้ทำให้ PLS ไม่ถูกต้อง แต่หมายความว่าต้องสร้างและใช้แบบจำลองด้วยความระมัดระวัง
ReneBt
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.