ในการถดถอยสมการกำลังสองน้อยที่สุด (PLSR) หรือการสร้างแบบจำลองสมการเชิงโครงสร้างบางส่วน (PLS-SEM) คำว่า "บางส่วน" หมายถึงอะไร
ในการถดถอยสมการกำลังสองน้อยที่สุด (PLSR) หรือการสร้างแบบจำลองสมการเชิงโครงสร้างบางส่วน (PLS-SEM) คำว่า "บางส่วน" หมายถึงอะไร
คำตอบ:
ผมอยากจะตอบคำถามนี้ส่วนใหญ่ขึ้นอยู่กับมุมมองทางประวัติศาสตร์ซึ่งเป็นที่น่าสนใจมาก เฮอร์แมนโวลด์ผู้คิดค้นวิธีกำลังสองน้อยที่สุด (PLS) บางส่วนไม่ได้เริ่มใช้คำว่าPLS (หรือแม้กระทั่งพูดถึงคำบางส่วน ) ทันที ในช่วงเริ่มต้น (2509-2512) เขาเรียกว่าวิธีนี้เป็นNILES - ตัวย่อของคำศัพท์และชื่อของบทความเริ่มต้นของเขาในหัวข้อนี้การประมาณค่าเชิงเส้นโดยซ้ำขั้นตอนน้อยที่สุดสี่เหลี่ยมจัตุรัสตีพิมพ์ในปี 2509
ดังที่เราเห็นกระบวนการที่เรียกว่าบางส่วนในภายหลังนั้นเรียกว่าซ้ำโดยมุ่งเน้นไปที่ลักษณะวนซ้ำของกระบวนการประเมินน้ำหนักและตัวแปรแฝง (LVs) คำว่า "กำลังสองน้อยที่สุด" มาจากการใช้การถดถอยสี่เหลี่ยมน้อยที่สุด (OLS)เพื่อประเมินพารามิเตอร์ที่ไม่รู้จักอื่น ๆ ของแบบจำลอง (Wold, 1980) ดูเหมือนว่าคำว่า"บางส่วน"มีรากฐานอยู่ในขั้นตอนของ NILES ซึ่งนำมาใช้"ความคิดในการแบ่งพารามิเตอร์ของแบบจำลองเป็นชุดย่อยเพื่อให้สามารถประมาณได้ในส่วน" (Sanchez, 2013, p. 216; .
การใช้คำว่า PLS ครั้งแรกเกิดขึ้นในขั้นตอนการประมาณค่าแบบไม่เชิงเส้นไม่เชิงเส้นบางส่วน (NIPALS) ซ้ำซึ่งตีพิมพ์ในช่วงถัดไปของประวัติศาสตร์ PLS - ระยะเวลาการสร้างแบบจำลอง NIPALS 1970 และ 1980 กลายเป็นยุคการสร้างแบบจำลองที่นุ่มนวลเมื่อได้รับอิทธิพลจากวิธี LISREL ของ Karl Joreskog ต่อ SEM, Wold เปลี่ยนวิธีการ NIPALS เป็นแบบจำลองที่อ่อนนุ่ม ) ปี 1990 ช่วงเวลาต่อไปในประวัติศาสตร์ PLS ซึ่ง Sanchez (2013) เรียกช่วงเวลา "ช่องว่าง" ถูกทำเครื่องหมายส่วนใหญ่โดยการลดการใช้งาน โชคดีที่เริ่มต้นจากยุค 2000 ( รวมระยะเวลา) PLS กลับมาอีกครั้งในฐานะวิธีการวิเคราะห์ SEM ยอดนิยมโดยเฉพาะในสาขาสังคมศาสตร์
อัปเดต (เพื่อตอบสนองต่อความคิดเห็นของอะมีบา):
ปรับปรุง 2 (ชี้แจงเพิ่มเติม):
ในการตอบข้อกังวลที่แสดงออกมาในคำตอบของอะมีบาฉันต้องการอธิบายบางสิ่ง ฉันคิดว่าเราจำเป็นต้องแยกแยะการใช้คำว่า "บางส่วน" ระหว่าง NIPALS และ PLS นั่นสร้างคำถามแยกกันสองข้อเกี่ยวกับ 1) ความหมายของ "บางส่วน" ใน NIPALS และ 2) ความหมายของ "บางส่วน" ใน PLS (นั่นคือคำถามดั้งเดิมโดย Phil2014) ในขณะที่ฉันไม่แน่ใจเกี่ยวกับอดีต
ตาม Wold, Sjöströmและ Eriksson (2001)
"บางส่วน" ใน PLS ระบุว่านี่เป็นการถดถอยบางส่วนเนื่องจาก ...
กล่าวอีกนัยหนึ่ง "บางส่วน" เกิดจากข้อเท็จจริงที่ว่าการสลายตัวข้อมูลโดยอัลกอริทึม NIPALS สำหรับ PLS อาจไม่รวมถึงส่วนประกอบทั้งหมดดังนั้น "บางส่วน" ฉันสงสัยว่าเหตุผลเดียวกันนี้ใช้กับ NIPALS โดยทั่วไปหากเป็นไปได้ที่จะใช้อัลกอริทึมกับข้อมูล "บางส่วน" นั่นจะอธิบาย "P" ใน NIPALS
ในแง่ของการใช้คำว่า "ไม่เชิงเส้น" ในความหมาย NIPALS (อย่าสับสนกับPLS ไม่เชิงเส้นซึ่งหมายถึงตัวแปรที่ไม่เป็นเชิงเส้นของวิธี PLS!) ผมคิดว่ามันหมายถึงไม่ได้ไปอัลกอริทึมของตัวเองแต่รูปแบบไม่เชิงเส้นซึ่งสามารถ วิเคราะห์โดยใช้ NIPALS เชิงเส้นถดถอย
อัปเดต 3 (คำอธิบายของ Herman Wold):
ในขณะที่กระดาษ 1969 ของ Herman Wold ดูเหมือนว่าจะเป็นกระดาษที่เร็วที่สุดใน NIPALS ฉันได้พยายามค้นหาเอกสารแรกสุดอีกเล่มหนึ่งในหัวข้อนี้ นั่นคือกระดาษโดย Wold (1974) ที่ "บิดา" ของ PLS นำเสนอเหตุผลของเขาสำหรับการใช้คำว่า "บางส่วน" ในคำนิยาม NIPALS (หน้า 71):
3.1.4 การประเมิน NIPALS: ซ้ำ OLS หากตัวแปรหนึ่งตัวหรือมากกว่าของแบบจำลองแฝงอยู่ความสัมพันธ์ของตัวทำนายจะไม่เพียง แต่พารามิเตอร์ที่ไม่รู้จัก แต่ยังรวมถึงตัวแปรที่ไม่ทราบด้วยผลลัพธ์ที่ทำให้ปัญหาการประมาณค่ากลายเป็นไม่เชิงเส้น ตามที่ระบุใน 3.1 (iii), NIPALS แก้ปัญหานี้โดยกระบวนการวนซ้ำ, พูดด้วยขั้นตอน s = 1, 2, ... แต่ละขั้นตอนเกี่ยวข้องกับการถดถอย OLS จำนวน จำกัด , หนึ่งสำหรับแต่ละตัวทำนายความสัมพันธ์ของตัวแบบ การถดถอยแต่ละครั้งจะให้การประมาณค่าพร็อกซีสำหรับชุดย่อยของพารามิเตอร์ที่ไม่รู้จักและตัวแปรแฝง (ดังนั้นจึงเป็นชื่อบางส่วนกำลังสองน้อยที่สุด) และการประมาณค่าพร็อกซีเหล่านี้จะถูกใช้ในขั้นตอนถัดไปของกระบวนการ
อ้างอิง
Rosipal, R. (2011) ไม่เชิงเส้นกำลังสองน้อยบางส่วน: ภาพรวม ใน Lodhi H. และ Yamanishi Y. ( สหพันธรัฐ ), Chemoinformatics และมุมมองการเรียนรู้ด้วยเครื่องจักรขั้นสูง: วิธีการคำนวณที่ซับซ้อนและเทคนิคการทำงานร่วมกัน , หน้า 169-189 ACCM, IGI Global ดึงข้อมูลจากhttp://aiolos.um.savba.sk/~roman/Papers/npls_book11.pdf
Sanchez, G. (2013) การสร้างแบบจำลองเส้นทาง PLS ด้วย R. Berkeley, CA: Trowchez Editions เรียกดูจากhttp://gastonsanchez.com/PLS_Path_Modeling_with_R.pdf
ทุ่ง, H. (1974) การไหลของสาเหตุที่มีตัวแปรแฝง: การแบ่งส่วนของวิธีในแง่ของการสร้างแบบจำลอง NIPALS รีวิวเศรษฐกิจยุโรป, 5 , 67-86 สำนักพิมพ์นอร์ทฮอลแลนด์
ทุ่ง, H. (1980) การสร้างแบบจำลองและการประเมินผลเมื่อความรู้เชิงทฤษฎีมีน้อย: ทฤษฎีและการประยุกต์ของกำลังสองน้อยที่สุดบางส่วน ใน J. Kmenta และ JB Ramsey (Eds.) การประเมินโมเดลเศรษฐมิติหน้า 47-74 นิวยอร์ก: นักวิชาการสื่อมวลชน เรียกดูจากhttp://www.nber.org/chapters/c11693
ทุ่ง, S. , Sjöström, M. , & Eriksson, L. (2001) PLS-regression: เครื่องมือพื้นฐานของเคมีบำบัด เคมีและระบบห้องปฏิบัติการอัจฉริยะ, 58 , 109-130 ดอย: 10.1016 / S0169-7439 (01) 00155-1 สืบค้นจากhttp://www.libpls.net/publication/PLS_basic_2001.pdf
องค์ประกอบของการเรียนรู้ทางสถิติมาตรา 3.5.2 หรือเช่น Rosipal และเครเมอปี 2005ภาพรวมและความก้าวหน้าล่าสุดในสี่เหลี่ยมอย่างน้อยบางส่วน
อย่างไรก็ตามในอดีตตามที่ @Alksandr อธิบายอย่างชัดเจน (+1), PLS ได้รับการแนะนำโดย Wold ที่ใช้อัลกอริทึม NIPALS ของเขาเพื่อนำไปใช้ NIPALS ย่อมาจาก "ไม่เชิงเส้นที่มีการวนซ้ำบางส่วนกำลังสองน้อย" ดังนั้น P ใน PLS ที่เห็นได้ชัดจาก NIPALS
(ทำไมเขาถึงเรียกมันว่า "ไม่เป็นเชิงเส้น" แต่ฉันก็ยังไม่เข้าใจ)
คำนี้ทำให้เข้าใจผิดอย่างน่าทึ่งเพราะถ้านี่เป็น "บางส่วน" ดังนั้นทุกขั้นตอนวิธีการคาดหวัง - สูงสุดก็คือ "บางส่วน" ด้วยเช่นกัน (ในความเป็นจริง NIPALS สามารถถูกมองว่าเป็นรูปแบบดั้งเดิมของ EM ดูRoweis 1998 ) ฉันคิดว่า PLS เป็นผู้สมัครที่ดีสำหรับการประกวดคำศัพท์ที่ทำให้เข้าใจผิดมากที่สุดในเครื่อง อนิจจามันไม่น่าจะเปลี่ยนแปลงแม้จะมีความพยายามของ Wold Jr. (ดูความคิดเห็นของ @ Momo ด้านบน)