บล็อกในการออกแบบการทดลองคืออะไร


20

ฉันมีคำถามสองข้อเกี่ยวกับแนวคิดของบล็อกในการออกแบบการทดลอง: (1) ความแตกต่างระหว่างบล็อกและปัจจัยคืออะไร (2) ฉันพยายามอ่านหนังสือบางเล่ม แต่มีบางอย่างที่ไม่ชัดเจน: ดูเหมือนว่าผู้แต่งมักจะคิดว่าไม่มีการโต้ตอบระหว่าง "block factor" กับปัจจัยอื่น ๆ มันถูกต้องหรือไม่และถ้าเป็นเพราะอะไร

คำตอบ:


13
  1. บล็อกเป็นปัจจัย เป้าหมายหลักของการบล็อกคือการลดรูปแบบที่ไม่ได้อธิบาย(SSResidual)ของการออกแบบ - เปรียบเทียบกับการออกแบบที่ไม่ถูกบล็อก - เราไม่สนใจเอฟเฟกต์บล็อกต่อ seแต่เราปิดกั้นเมื่อเราสงสัยว่า "เสียง" ที่พื้นหลังจะทำให้เกิดผลกระทบของปัจจัยที่แท้จริง
    เราจัดกลุ่มหน่วยการทดลองไว้ในบล็อก "เป็นเนื้อเดียวกัน" ซึ่งทุกระดับของปัจจัยหลักจะแสดงเท่า ๆ กัน การวิเคราะห์ความแปรปรวนของการออกแบบบล็อกควบคุมแบบสุ่มแยกระยะเวลาที่เหลือของปัจจัยเดียวที่เทียบเท่าการออกแบบที่สมบูรณ์แบบสุ่มในบล็อกและส่วนประกอบที่เหลือ อย่างไรก็ตามเราควรทราบว่าองค์ประกอบหลังมีองศาอิสระน้อยกว่าในการออกแบบ CR แบบปัจจัยเดียวซึ่งนำไปสู่การประมาณการที่สูงขึ้นสำหรับMSResidual=SSResidual/d.f.{}
    การตัดสินใจที่จะปิดกั้นหรือไม่ปิดกั้นควรทำเมื่อเราพิจารณาว่าการลดลงของส่วนที่เหลือจะมากกว่าชดเชยการลดลงของ df

  2. โดยปกติแบบจำลองการเติมจะถูกติดตั้งกับข้อมูลการออกแบบ RCB ซึ่งตัวแปรการตอบสนองเป็นการรวมกันที่เพิ่มขึ้นของปัจจัยและเอฟเฟกต์บล็อกและสันนิษฐานว่าไม่มีปฏิสัมพันธ์ระหว่างสองสิ่งนี้ ฉันคิดว่าสิ่งนี้มีสาเหตุมาจากความจริงที่ว่า RCB ไม่ได้ช่วยให้เราสามารถแยกแยะปฏิสัมพันธ์ BxF จากความแปรปรวนภายในบล็อคและความแปรปรวนภายในหน่วยทดลอง บรรทัดล่างคือเราไม่ต้องมีปฏิสัมพันธ์ใด ๆ เนื่องจากเราไม่สามารถวัดได้ เราสามารถทดสอบได้ว่ามันมีอยู่ด้วยสายตาหรือด้วยการทดสอบของ Tukey

ทรัพยากรที่ดีในการออกแบบการทดลองนี้


(+1) อีกอ่านที่ดีคือเมอรีของการออกแบบและวิเคราะห์การทดลอง
chl

ขอบคุณ @chl มอนต์โกเมอรี่อยู่ในรายการช้อปปิ้งของฉัน แต่ฉันเลือกที่จะไม่ซื้อเพราะมันมุ่งเน้นทางวิศวกรรมมากกว่านิเวศวิทยา ฉันได้สังเกตเห็นว่ารุ่นใหม่มีกำหนดจะเผยแพร่ในเดือนเมษายน 2012 คุณจะอัปเดตคู่หู R ของคุณหรือไม่
Charlie

1
ขอบคุณทุกๆคน. ฉันค่อนข้างมีความคิดทางคณิตศาสตร์แล้วฉันมีปัญหาในการอ่านหนังสือเช่น Montgomery ที่มีข้อความมากเกินไปและมีคณิตศาสตร์ไม่เพียงพอ
Stéphane Laurent

@Charlie Yup นั่นเป็นโครงการที่มีอายุย้อนไปถึงปี 2549 เมื่อไม่มีมุมมองงาน Doe CRAN Task อยู่เลย ฉันจะทำงานต่อในเวอร์ชั่นที่ 6 ด้วยความหวังว่าจะเสร็จในปีนี้ (แต่ฉันบอกว่าทุก ๆ ปีใหม่ดังนั้น ... ) นอกเหนือจากการใช้งานแบบ 'ลำเอียง' ฉันยังคิดว่าข้อความนี้ยังคงยอดเยี่ยมสำหรับนักจิตวิทยาและนักชีววิทยา
chl

1
@ Stéphaneฉันสามารถแนะนำให้ดูที่เครื่องบินตอบคำถามที่ซับซ้อนโดย Christensen: DoE น้อยกว่าคณิตศาสตร์มากขึ้นและอินโทรที่ดีกับรุ่นเชิงเส้น
chl

8

นี่คือคำตอบที่กระชับ รายละเอียดและตัวอย่างจำนวนมากอาจพบได้ในเอกสารส่วนใหญ่ที่ออกแบบการทดลอง โดยเฉพาะอย่างยิ่งในพืชไร่

บ่อยครั้งที่นักวิจัยไม่สนใจผลบล็อกต่อ แต่เขาต้องการเพียงบัญชีสำหรับความแปรปรวนในการตอบสนองระหว่างบล็อก ดังนั้นฉันใช้เพื่อดูบล็อกเป็นปัจจัยที่มีบทบาทเฉพาะ โดยทั่วไปแล้วเอฟเฟกต์บล็อกนั้นถือว่าเป็นเอฟเฟกต์แบบสุ่ม ในที่สุดหากคุณคาดหวังว่า 'ผลการรักษา' จะแตกต่างจากบล็อกถึงบล็อกการโต้ตอบควรได้รับการพิจารณา


7

นี่คือการถอดความคำอธิบายที่ฉันโปรดปรานจากอดีตอาจารย์ Freedom King ของฉัน

คุณกำลังศึกษาว่าขนมปังแป้งและอุณหภูมิในการอบมีผลต่อความอร่อยของขนมปังอย่างไร คุณมีระดับคะแนนความอร่อย และสมมติว่าคุณกำลังซื้อแป้งขนมปังบรรจุกล่องจาก บริษัท อาหารบางแห่งแทนที่จะผสมเอง ขนมปังอบแต่ละก้อนเป็นหน่วยทดลอง

สมมติว่าคุณมี 2 doughs และ 8 อุณหภูมิคุณสามารถใส่ขนมปัง 4 ก้อนในเตาอบในครั้งเดียวและคุณต้องการเรียกใช้ก้อนn=160

ในรูปแบบแฟคทอเรียลแบบสุ่มสมบูรณ์ (ไม่มีบล็อก) คุณจะสุ่มตัดสินใจลำดับที่ขนมปังอบ สำหรับขนมปังแต่ละก้อนคุณจะต้องเปิดเตาอบเปิดแพคเกจแป้งขนมปังแล้วอบ สิ่งนี้จะเกี่ยวข้องกับการเรียกใช้เตาอบ 160 ครั้งหนึ่งครั้งสำหรับขนมปังแต่ละก้อน2×2

หรือคุณสามารถรักษารันเตาอบเป็นปัจจัยการปิดกั้น ในกรณีนี้คุณจะต้องเปิดเตาอบ 40 ครั้งซึ่งอาจทำให้การรวบรวมข้อมูลเร็วขึ้น แต่ละเตาอบจะมีสี่ก้อน แต่ไม่จำเป็นต้องเป็นสองประเภทแป้งแต่ละประเภท (สัดส่วนที่แน่นอนจะถูกเลือกแบบสุ่ม) คุณจะมี 5 เตาอบวิ่งสำหรับแต่ละอุณหภูมิ สิ่งนี้จะช่วยให้คุณบัญชีความแปรปรวนระหว่างการทำงานของเตาอบที่อุณหภูมิเดียวกัน

แม้แต่นักเล่นคุณก็สามารถบล็อกได้โดยใช้แป้งและใช้เตาอบ ในการออกแบบนี้คุณจะมีแป้งสองประเภทในแต่ละเตาอบ

เมื่อฉันมีเวลาคิดถึงมันฉันจะอัปเดตสิ่งนี้ต่อไปด้วยชื่อแฟนซีที่เหมาะสมสำหรับการออกแบบการทดสอบเหล่านั้น


BTW มันเป็นโครงสร้างการรักษาปัจจัยไม่2 2 × 22×82×2
Dennis

นี่เป็นตัวอย่างของการบล็อกที่ไม่สมบูรณ์หรือไม่
SmallChess

6

การออกแบบการทดลองเป็นการรวมกันของสามโครงสร้าง:

  1. โครงสร้างการรักษา: การรักษาเกิดจากปัจจัยที่น่าสนใจอย่างไร?
  2. โครงสร้างการออกแบบ: หน่วยการทดลองถูกจัดกลุ่มและกำหนดให้กับการรักษาอย่างไร?
  3. โครงสร้างการตอบสนอง: การสังเกตเป็นอย่างไร

บล็อกคือ "ปัจจัย" ที่เป็นของโครงสร้างการออกแบบ (เพื่อแยกความแตกต่างมันไม่ควรเรียกพวกเขาว่า "ปัจจัยการบล็อก" กับ "ปัจจัยการรักษา" เป็นตัวอย่างที่ดีของพารามิเตอร์ที่สร้างความรำคาญ : พารามิเตอร์ของโมเดลที่คุณต้องมีและมีสถานะที่คุณต้องพิจารณา แต่มีค่าที่ไม่น่าสนใจเป็นพิเศษ โปรดทราบว่าสิ่งนี้ไม่เกี่ยวข้องกับลักษณะของปัจจัย - ปัจจัยการบล็อกอาจได้รับการแก้ไขหรือสุ่มเช่นเดียวกับปัจจัยการรักษาอาจได้รับการแก้ไขหรือสุ่ม

กฎส่วนบุคคลของฉันเกี่ยวกับปัจจัยที่อยู่ในการออกแบบการทดลองคือ: ถ้าฉันต้องการประเมินพารามิเตอร์ที่เกี่ยวข้องกับปัจจัยและเปรียบเทียบพวกเขาภายในปัจจัยหรือพารามิเตอร์ปัจจัยอื่น ๆ มันเป็นของโครงสร้างการรักษา ถ้าฉันไม่สนใจเกี่ยวกับค่าของพารามิเตอร์ที่เกี่ยวข้องและไม่สนใจที่จะเปรียบเทียบพวกเขาปัจจัยที่อยู่ในโครงสร้างการออกแบบ

ดังนั้นในตัวอย่างขนมปังที่อื่นในหัวข้อนี้ฉันต้องกังวลเกี่ยวกับความแตกต่างแบบรันไทม์ แต่ผมไม่สนใจที่จะเปรียบเทียบ Run Run 1 VS 24. เตาอบวิ่งอยู่ในการออกแบบโครงสร้าง ฉันไม่ต้องการที่จะเปรียบเทียบทั้งสองสูตรแป้ง: สูตรเป็นโครงสร้างการรักษา ฉันสนใจอุณหภูมิเตาอบ: นั่นเป็นโครงสร้างการรักษาด้วย มาสร้างการออกแบบการทดลองกันเถอะ

โครงสร้างการออกแบบมีปัจจัยหนึ่ง (เรียกใช้เตาอบ, Run) และโครงสร้างการรักษาสองปัจจัย (สูตรและอุณหภูมิ) เนื่องจากการทดสอบทุกครั้งจะต้องเป็นอุณหภูมิเดียว (เล็กน้อย) อุณหภูมิและการวิ่งจะต้องเกิดขึ้นในระดับเดียวกันของการออกแบบการทดลอง อย่างไรก็ตามมีพื้นที่สำหรับ 4 ก้อนในแต่ละ Run เห็นได้ชัดว่าเราสามารถเลือกอบ 1, 2, 3 หรือ 4 ก้อนต่อการรัน

ถ้าเราอบก้อนละหนึ่งรอบและสุ่มลำดับของการนำเสนอสูตรเราจะได้รับโครงสร้างการออกแบบแบบสุ่มสมบูรณ์ (CRD) หากเราอบสองก้อนหนึ่งในสูตรต่อการเรียกใช้แต่ละครั้งเรามีโครงสร้างการออกแบบบล็อกที่สมบูรณ์แบบสุ่ม (RCB) โปรดทราบว่ามันเป็นสิ่งสำคัญที่แต่ละสูตรเกิดขึ้นภายในแต่ละ Run หากไม่มียอดคงเหลือนั้นการเปรียบเทียบสูตรจะปนเปื้อนด้วยความแตกต่างของการเรียกใช้ ข้อควรจำ: เป้าหมายของการบล็อกคือการกำจัดความแตกต่าง Run. หากเราอบขนมปังสามก้อนต่อการดำเนินการเราอาจจะบ้า: 3 ไม่ได้เป็นปัจจัยที่ 160 ดังนั้นเราจะมีหนึ่งหรือสองบล็อกขนาดแตกต่างกัน ความเป็นไปได้ที่สมเหตุสมผลอื่น ๆ คือสี่ก้อนต่อการวิ่ง ในกรณีนี้เราจะอบสองก้อนของแต่ละสูตรในแต่ละ Run นี่คือโครงสร้าง RCB เราสามารถประเมินความแปรปรวนภายในการดำเนินการโดยใช้ความแตกต่างระหว่างสองก้อนของแต่ละสูตรในการทดสอบแต่ละครั้ง

หากเราเลือกหนึ่งในโครงสร้างการออกแบบ RCB เอฟเฟกต์อุณหภูมิจะถูกสุ่มโดยสมบูรณ์ในระดับการวิ่ง สูตรถูกวางซ้อนในอุณหภูมิและมีโครงสร้างข้อผิดพลาดที่แตกต่างจากอุณหภูมิเนื่องจากแต่ละแป้งจะปรากฏในการทำงานแต่ละครั้ง ความแตกต่างของการดูสูตรและสูตรอาหารโดยการเติมแบบไม่เติมแป้ง (การทำงานร่วมกัน) ไม่มีความแปรปรวนแบบวิ่งต่อเนื่อง ในทางเทคนิคแล้วสิ่งนี้เรียกว่าโครงสร้างการออกแบบแบบแยกส่วนหรือการออกแบบโครงสร้างการวัดซ้ำ

นักวิจัยคนไหนจะใช้ อาจ RCB กับสี่ก้อน: 40 วิ่งเทียบกับ 80 กับ 160 มีน้ำหนักมาก อย่างไรก็ตามสิ่งนี้สามารถแก้ไขได้ - หากความกังวลคือเตาอบแบบบ้านมากกว่าการผลิตภาคอุตสาหกรรมอาจมีเหตุผลที่จะใช้ CRD หากเชื่อว่าคนทำขนมปังที่บ้านไม่ค่อยอบขนมปังหลายก้อน


2
ฉันไม่ได้ติดตามการวิเคราะห์การทดลองขนมปังของคุณอาจเป็นเพราะมีการพูดถึงการออกแบบที่แตกต่างกันหลายประการและคุณไม่ได้ระบุว่าคุณหมายถึงใคร นั่นทำให้ความคิดเห็นส่วนใหญ่ของคุณสับสนมากกว่าการให้แสงสว่าง หากคุณสามารถเคลียร์สิ่งนี้ได้ผมเชื่อว่าคำตอบของคุณจะโดดเด่น
whuber

1
ความสำคัญของ # 2 ควรได้รับการเปิดเผย การวิเคราะห์สามารถดำเนินการตามการมอบหมายแบบสุ่มของการรักษาทดลอง: บล็อกแสดงถึงข้อ จำกัด ในการมอบหมายแบบสุ่มนั้น
Scortchi - Reinstate Monica

1
@whuber นั่นเป็นเพราะผมไม่ได้วิเคราะห์ว่าผมได้รับการออกแบบการทดสอบจากพารามิเตอร์เหล่านั้นเดอโนโว ชี้แจงในการแก้ไข
Dennis

3

ฉันคิดว่าเวลาส่วนใหญ่เป็นเพียงเรื่องของการประชุมน่าจะเหมาะสมกับแต่ละสาขา ฉันคิดว่าในบริบททางการแพทย์ในสองปัจจัย anova หนึ่งในปัจจัยที่มักจะเรียกว่า "การรักษา" และ "บล็อก" อื่น ๆ

โดยทั่วไปแล้วตามที่ ocram กล่าวว่าลูกเล่นบล็อกจะเป็นเอฟเฟกต์แบบสุ่ม แต่ฉันไม่คิดว่ามันจะเป็นระบบ ให้บอกว่าคุณต้องการประเมินประสิทธิภาพของการรักษาทางการแพทย์ที่แตกต่างกัน:

  • การออกแบบครั้งแรก: ผู้ป่วยแต่ละรายใช้การรักษาเพียงครั้งเดียวและวัดประสิทธิภาพในระดับที่เหมาะสม คุณสงสัยว่าเพศของผู้ป่วยเป็นที่สนใจ: คุณจะมี "บล็อก" ของผู้ชายและบล็อกของผู้ป่วยเพศหญิง ในกรณีนี้การบล็อกเป็นปัจจัยที่มีผลคงที่

  • การออกแบบที่สอง: ผู้ป่วยแต่ละคนพยายามรักษาทั้งหมดในเวลาที่แตกต่างกัน เนื่องจากมีความแตกต่างระหว่างผู้ป่วยคุณจึงพิจารณาผู้ป่วยแต่ละรายว่าเป็น "บล็อก" คุณมีความสนใจในการมีอยู่ของความแปรปรวนดังกล่าวในประชากร แต่ไม่ได้อยู่ในค่าของมันในผู้ป่วยเหล่านี้โดยเฉพาะ ในกรณีนี้บล็อกเป็นปัจจัยที่มีผลแบบสุ่ม

ฉันสอนเฉพาะสิ่งนี้พยายามยึดถือหลักการของโดเมน (ในฝรั่งเศส) ตามที่ฉันได้รับจากตำรา แต่ฉันไม่เคยเข้าร่วมการทดลองทางคลินิก (และไม่ต้องการ) ... ดังนั้นนี่จึงเป็น แค่สองเซ็นต์ของฉัน ... !


1
2k

@chl ฉันคิดว่าคุณพูดถูก! ฉันเป็นเพียงการยกตัวอย่างขั้นพื้นฐานมากบาง ...
เอลวิส

มันเป็นสิ่งที่ดี (ตัวอย่างหนึ่งที่มีการทดลองผลผลิต / พืชผลจากพืชไร่จะทำให้ชัดเจนยิ่งขึ้น) ฉันเพิ่งชี้ให้เห็นว่า "การบล็อก" ขยายเกินแนวคิด "ปัจจัย" และความแตกต่างแบบคงที่และแบบสุ่ม
CHL

@chl หากคุณมีการอ้างอิงที่ดี (และเรียบง่าย) เกี่ยวกับประเภทของสิ่งนี้ฉันยินดีที่จะอ่านมัน (และคุณควรโพสต์เป็นคำตอบ) ... (ไม่ใช่การอ้างอิงที่เรียบง่ายเป็นที่ยอมรับเช่นกัน!)
Elvis

คุณหมายถึงexample(aov)หรือแพ็กเกจR agricolae ? :-)
chl
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.