ฉันเพิ่งมีลูกค้ามาให้ฉันทำการวิเคราะห์ bootstrap เพราะผู้ตรวจสอบ FDA บอกว่าการถดถอยข้อผิดพลาดในตัวแปรของพวกเขาไม่ถูกต้องเพราะเมื่อรวบรวมข้อมูลจากไซต์การวิเคราะห์รวมถึงการรวมข้อมูลจากสามไซต์ที่สองไซต์รวมตัวอย่างบางอย่าง เหมือน.
พื้นหลัง
ลูกค้ามีวิธีการทดสอบใหม่ที่ต้องการแสดงคือ "เทียบเท่า" กับวิธีที่ได้รับอนุมัติแล้ว วิธีการของพวกเขาคือการเปรียบเทียบผลลัพธ์ของทั้งสองวิธีที่ใช้กับตัวอย่างเดียวกัน สามไซต์ถูกใช้เพื่อทำการทดสอบ ข้อผิดพลาดในตัวแปร (Deming regression) ถูกนำไปใช้กับข้อมูลในแต่ละไซต์ แนวคิดก็คือว่าหากการถดถอยแสดงให้เห็นว่าพารามิเตอร์ของความชันนั้นใกล้เคียงกับ 1 และการสกัดกั้นใกล้ 0 นี่จะแสดงให้เห็นว่าเทคนิคการทดสอบทั้งสองนั้นให้ผลลัพธ์เกือบเหมือนกันดังนั้นจึงควรได้รับการอนุมัติวิธีการใหม่ ที่ไซต์ 1 มีตัวอย่าง 45 รายการให้พวกเขาสังเกตการณ์ 45 คู่ ไซต์ที่ 2 มี 40 ตัวอย่างและไซต์ 3, 43 ตัวอย่าง พวกเขาทำการแยก Deming regressions สามครั้งแยกกัน (สมมติว่ามีอัตราส่วน 1 สำหรับข้อผิดพลาดในการวัดสำหรับสองวิธี) ดังนั้นอัลกอริธึมจึงลดผลรวมของระยะทางยกฉากตั้งฉาก
ในการส่งลูกค้าของพวกเขาชี้ให้เห็นว่าตัวอย่างบางส่วนที่ใช้ในไซต์ 1 และ 2 เหมือนกัน ในการทบทวนผู้ตรวจสอบของ FDA กล่าวว่าการถดถอยของ Deming นั้นไม่ถูกต้องเนื่องจากมีการใช้ตัวอย่างทั่วไปซึ่งทำให้เกิด "สัญญาณรบกวน" ซึ่งทำให้สมมติฐานของโมเดลนั้นไม่ถูกต้อง พวกเขาขอให้มีการปรับบูตสแตรปกับผลลัพธ์ Deming เพื่อพิจารณาการรบกวนนี้
ณ จุดนั้นเนื่องจากลูกค้าไม่ทราบวิธีที่จะทำ bootstrap ฉันถูกนำเข้ามาการรบกวนคำแปลกและฉันก็ไม่แน่ใจว่าสิ่งที่ผู้ตรวจสอบได้รับที่ ฉันสันนิษฐานว่าจุดนั้นเป็นเพราะข้อมูลที่รวมกันมีตัวอย่างทั่วไปจะมีความสัมพันธ์กับตัวอย่างทั่วไปและดังนั้นข้อผิดพลาดของตัวแบบจะไม่เป็นอิสระทั้งหมด
การวิเคราะห์ของลูกค้า
การถดถอยทั้งสามแบบนั้นคล้ายคลึงกันมาก แต่ละคนมีพารามิเตอร์ความชันใกล้กับ 1 และสกัดกั้นใกล้ 0 ช่วงความเชื่อมั่น 95% ประกอบด้วย 1 และ 0 สำหรับความชันและการสกัดกั้นตามลำดับในแต่ละกรณี ความแตกต่างที่สำคัญคือความแปรปรวนของสารตกค้างที่สูงขึ้นเล็กน้อยที่ไซต์ 3 นอกจากนี้พวกเขาเปรียบเทียบสิ่งนี้กับผลลัพธ์จากการทำ OLS และพบว่าพวกเขาจะคล้ายกันมาก (ในกรณีเดียวเท่านั้น ในกรณีที่ OLS CI สำหรับความชันไม่ได้มี 1 ขอบเขตบนของช่วงเวลานั้นเป็นอะไรที่ 0.99
ด้วยผลลัพธ์ที่คล้ายกันมากในทั้งสามไซต์ที่รวมข้อมูลของเว็บไซต์ดูเหมือนสมเหตุสมผล ลูกค้าทำการรวมกลุ่ม Deming regression ซึ่งนำไปสู่ผลลัพธ์ที่คล้ายกัน ได้รับผลลัพธ์เหล่านี้ฉันได้เขียนรายงานสำหรับลูกค้าที่โต้แย้งข้อเรียกร้องว่าการถดถอยนั้นไม่ถูกต้อง ข้อโต้แย้งของฉันคือเนื่องจากมีข้อผิดพลาดในการวัดที่คล้ายกันในตัวแปรทั้งสองไคลเอ็นต์มีสิทธิ์ใช้ Deming regression เป็นวิธีแสดงข้อตกลง / ความขัดแย้ง การถดถอยแต่ละไซต์ไม่มีปัญหาของข้อผิดพลาดที่สัมพันธ์กันเนื่องจากไม่มีตัวอย่างซ้ำภายในไซต์ที่กำหนด การรวมข้อมูลเพื่อให้ได้ช่วงความมั่นใจที่เข้มงวดมากขึ้น
ความยากลำบากนี้สามารถแก้ไขได้ด้วยการรวมข้อมูลกับตัวอย่างทั่วไปจากไซต์ 1 ที่พูดออกไป อีกทั้งเว็บไซต์สามรุ่นนี้ไม่มีปัญหาและใช้ได้จริง เรื่องนี้ดูเหมือนว่าฉันจะให้หลักฐานที่แข็งแกร่งของข้อตกลงแม้ว่าจะไม่รวมกำไร ยิ่งไปกว่านั้นการวัดยังดำเนินการอย่างเป็นอิสระที่ไซต์ 1 และ 2 สำหรับไซต์ทั่วไป ดังนั้นฉันจึงคิดว่าแม้แต่การวิเคราะห์รวมที่ใช้ข้อมูลทั้งหมดก็ใช้ได้เพราะข้อผิดพลาดการวัดสำหรับตัวอย่างที่ไซต์ 1 นั้นไม่มีความสัมพันธ์กับข้อผิดพลาดการวัดในตัวอย่างที่สอดคล้องกันที่ไซต์ 2 นี่เป็นเพียงการทำซ้ำจุดในการออกแบบ พื้นที่ซึ่งไม่ควรมีปัญหา มันไม่ได้สร้างความสัมพันธ์ / "สัญญาณรบกวน"
ในรายงานของฉันฉันเขียนว่าการวิเคราะห์ bootstrap นั้นไม่จำเป็นเพราะไม่มีความสัมพันธ์ที่ต้องปรับตัว โมเดลไซต์ทั้งสามนั้นใช้ได้ (ไม่มี "สัญญาณรบกวน" ที่เป็นไปได้ภายในไซต์) และการวิเคราะห์แบบกลุ่มสามารถทำได้โดยลบตัวอย่างทั่วไปที่ไซต์ 1 เมื่อทำการรวมกำไร การวิเคราะห์รวมดังกล่าวไม่สามารถมีปัญหาสัญญาณรบกวน การปรับบูตสแตรปไม่จำเป็นเพราะไม่มีอคติในการปรับ
สรุปผลการศึกษา
ลูกค้าเห็นด้วยกับการวิเคราะห์ของฉัน แต่กลัวที่จะนำไปใช้กับ FDA พวกเขาต้องการให้ฉันทำการปรับ bootstrap ต่อไป
คำถามของฉัน
A) คุณเห็นด้วยกับ (1) การวิเคราะห์ผลลัพธ์ของลูกค้าของฉันและ (2) การโต้แย้งของฉันว่า bootstrap นั้นไม่จำเป็น
B) เมื่อพิจารณาว่าฉันต้อง bootstrap Deming regression จะมีโพรซีเดอร์ SAS หรือ R ที่พร้อมใช้งานสำหรับการทำ Deming regression บนตัวอย่าง bootstrap หรือไม่
แก้ไข: ตามคำแนะนำของ Bill Huber ฉันวางแผนที่จะดูขอบเขตของการถดถอยข้อผิดพลาดในตัวแปรโดยการถดถอยทั้ง y กับ x และ x on y เราทราบอยู่แล้วว่าสำหรับ OLS รุ่นเดียวคำตอบนั้นเป็นหลักเหมือนกับข้อผิดพลาดในตัวแปรเมื่อความแปรปรวนข้อผิดพลาดสองค่าถือว่าเท่ากัน หากนี่เป็นความจริงสำหรับการถดถอยอื่น ๆ ฉันคิดว่านั่นจะแสดงให้เห็นว่าการถดถอยของ Deming นั้นเป็นทางออกที่เหมาะสม คุณเห็นด้วยไหม?
เพื่อให้เป็นไปตามคำขอของลูกค้าฉันจำเป็นต้องทำการวิเคราะห์ bootstrap ที่ร้องขอซึ่งกำหนดไว้อย่างชัดเจน ฉันคิดว่ามันผิดที่จะให้ bootstrap เพราะมันไม่ได้แก้ปัญหาที่แท้จริงของลูกค้า ดังนั้นฉันจะให้พวกเขาทั้งการวิเคราะห์และขออย่างน้อยพวกเขาบอก FDA ว่านอกเหนือจากการทำ bootstrap ฉันได้ผกผันการถดถอยและ จำกัด ขอบเขตการถดถอยของ Deming ซึ่งฉันคิดว่าเหมาะสมกว่า นอกจากนี้ฉันคิดว่าการวิเคราะห์จะแสดงให้เห็นว่าวิธีการของพวกเขานั้นเทียบเท่ากับการอ้างอิงและการถดถอยของ Deming ก็เพียงพอแล้ว
ฉันวางแผนที่จะใช้โปรแกรม R ที่ @whuber แนะนำในคำตอบของเขาเพื่อให้ฉันสามารถบูตการถดถอยของ Deming ได้ ฉันไม่คุ้นเคยกับ R มากนัก แต่ฉันคิดว่าฉันสามารถทำได้ ฉันติดตั้ง R พร้อมกับ R Studio แล้ว มันจะทำให้มันง่ายพอสำหรับมือใหม่อย่างฉันหรือไม่?
นอกจากนี้ฉันมี SAS และการเขียนโปรแกรมที่สะดวกสบายยิ่งขึ้นใน SAS ดังนั้นหากใครรู้วิธีการทำเช่นนี้ใน SAS ฉันจะขอบคุณที่รู้เกี่ยวกับมัน