จับคู่กับการทดสอบ t แบบไม่จับคู่


20

สมมติว่าฉันมีหนู 20 ตัว ฉันจับคู่เมาส์ด้วยวิธีใดวิธีหนึ่งเพื่อให้ได้ 10 คู่ สำหรับจุดประสงค์ของคำถามนี้อาจเป็นการจับคู่แบบสุ่มหรืออาจเป็นการจับคู่ที่เหมาะสมเช่นพยายามจับคู่หนูจากครอกเดียวกันที่มีเพศเดียวกันมีน้ำหนักเท่ากันหรืออาจเป็นการจับคู่ที่โง่อย่างจงใจ พยายามจับคู่หนูด้วยน้ำหนักที่ไม่เท่าที่ควรจะเป็น จากนั้นฉันใช้ตัวเลขสุ่มเพื่อกำหนดเมาส์หนึ่งตัวในแต่ละคู่ให้กับกลุ่มควบคุมและอีกเมาส์หนึ่งไปยังกลุ่มที่ต้องปฏิบัติ ตอนนี้ฉันทำการทดลองโดยรักษาเฉพาะหนูที่จะได้รับการรักษา แต่อย่างอื่นก็ไม่ได้สนใจว่าจะมีการเตรียมการอะไรก็ตาม

เมื่อมีใครมาวิเคราะห์ผลลัพธ์คนหนึ่งอาจใช้การทดสอบ t แบบไม่คู่หรือการทดสอบแบบจับคู่ ถ้ามีคำตอบจะแตกต่างกันอย่างไร? (โดยทั่วไปฉันสนใจในความแตกต่างอย่างเป็นระบบของพารามิเตอร์ทางสถิติใด ๆ ที่จำเป็นต้องมีการประมาณ)

เหตุผลที่ฉันถามสิ่งนี้คือกระดาษที่ฉันเพิ่งมีส่วนร่วมถูกวิพากษ์วิจารณ์จากนักชีววิทยาในการใช้การทดสอบแบบจับคู่ t-test มากกว่าการทดสอบแบบไม่มีคู่ แน่นอนในการทดลองจริงสถานการณ์ไม่ได้รุนแรงอย่างที่สถานการณ์ฉันร่างไว้และในความคิดของฉันเหตุผลที่ดีสำหรับการจับคู่ แต่นักชีววิทยาไม่เห็นด้วย

ฉันคิดว่ามันเป็นไปไม่ได้ที่จะปรับปรุงนัยสำคัญทางสถิติอย่างไม่ถูกต้อง (ลดค่า p) ในสถานการณ์ที่ฉันร่างโดยใช้การทดสอบแบบจับคู่ t- การทดสอบมากกว่าการทดสอบแบบไม่มีคู่แม้ว่ามันจะไม่เหมาะสมในการจับคู่ อย่างไรก็ตามมันอาจแย่ลงอย่างมีนัยสำคัญทางสถิติถ้าหนูถูกจับคู่ไม่ดี ถูกต้องหรือไม่

คำตอบ:


23

ฉันเห็นด้วยกับประเด็นที่ทั้งแฟรงค์และปีเตอร์ทำ แต่ฉันคิดว่ามีสูตรง่าย ๆ ที่เป็นหัวใจของปัญหาและอาจคุ้มค่าสำหรับ OP ที่จะต้องพิจารณา

ให้และYเป็นสองตัวแปรสุ่มที่ไม่ทราบความสัมพันธ์กันXY

ให้Z=X-Y

ความแปรปรวนของคืออะไรZ

นี่คือสูตรง่ายๆ: จะเป็นอย่างไรถ้าCov ( X , Y ) > 0 (เช่นXและYมีความสัมพันธ์เชิงบวก)

var(Z)=var(X)+var(Y)-2Cov(X,Y).
Cov(X,Y)>0XY

จากนั้นvar(Z)<var(X)+var(Y). ในกรณีนี้หากการจับคู่เกิดขึ้นเนื่องจากมีความสัมพันธ์เชิงบวกเช่นเมื่อคุณจัดการกับเรื่องเดียวกันก่อนและหลังการจับคู่ช่วยเนื่องจากความแตกต่างของการจับคู่แบบอิสระมีความแปรปรวนต่ำกว่าความแปรปรวนที่คุณได้รับสำหรับกรณีที่ไม่มีคู่ วิธีการลดความแปรปรวน การทดสอบมีประสิทธิภาพมากขึ้น สิ่งนี้สามารถแสดงได้อย่างมากกับข้อมูลแบบวนรอบ ฉันเห็นตัวอย่างในหนังสือที่พวกเขาต้องการดูว่าอุณหภูมิในวอชิงตัน ดี.ซี. สูงกว่าในนิวยอร์กซิตี้หรือไม่ ดังนั้นพวกเขาจึงใช้อุณหภูมิเฉลี่ยต่อเดือนในทั้งสองเมืองเป็นเวลา 2 ปี แน่นอนว่ามีความแตกต่างอย่างมากในช่วงปีนี้เนื่องจากฤดูกาลทั้งสี่ การเปลี่ยนแปลงนี้มีขนาดใหญ่เกินไปสำหรับการทดสอบแบบไม่จับคู่เพื่อตรวจจับความแตกต่าง อย่างไรก็ตามการจับคู่ตามเดือนเดียวกันในปีเดียวกันจะลดผลกระทบตามฤดูกาลนี้และการจับคู่ทดสอบแสดงให้เห็นอย่างชัดเจนว่าอุณหภูมิเฉลี่ยใน DC มีแนวโน้มสูงกว่าในนิวยอร์ก X i (อุณหภูมิที่ NY ในเดือน A ) และ Y i (อุณหภูมิใน DC ในเดือน A ) มีความสัมพันธ์เชิงบวกเนื่องจากฤดูกาลเหมือนกันใน NY และ DC และเมืองอยู่ใกล้พอที่พวกเขามักจะได้สัมผัสกับระบบสภาพอากาศแบบเดียวกันที่ ส่งผลกระทบต่ออุณหภูมิ DC อาจอุ่นขึ้นเล็กน้อยเพราะอยู่ไกลออกไปทางใต้เสื้อXผมAYผมA

โปรดทราบว่าค่าความแปรปรวนร่วมขนาดใหญ่หรือความสัมพันธ์ที่มากขึ้นคือการลดความแปรปรวน

ตอนนี้สมมติว่าเป็นลบCov(X,Y)

จากนั้น ) ตอนนี้การจับคู่จะแย่กว่าการไม่จับคู่เพราะความแปรปรวนเพิ่มขึ้นจริง ๆ !var(Z)>var(X)+var(Y)

เมื่อและYไม่เกี่ยวข้องกันมันอาจไม่สำคัญว่าวิธีการที่คุณใช้ กรณีการจับคู่แบบสุ่มของปีเตอร์เป็นเหมือนสถานการณ์นี้XY


3
ไมเคิลเพราะ "<" และ ">" มีความหมายพิเศษบนหน้าเว็บเพื่อหลีกเลี่ยงการมีข้อความจำนวนมากที่หายไปจากการดูคุณคุณจำเป็นต้องใช้มาร์กอัป Xสำหรับพวกเขาในสมการ (รหัสคือ "\ lt" และ "\ gt" ตามลำดับ) ฉันทำเครื่องหมายสมการทั้งสองที่ทำให้เกิดปัญหานี้ให้คุณ ในอนาคตโปรดอ่านสิ่งที่คุณโพสต์ทันทีหลังจากโพสต์เพื่อให้แน่ใจว่าผู้คนเห็นสิ่งที่คุณคิดว่าพวกเขาจะเห็นและจากนั้นคุณสามารถตั้งค่าสถานะการโพสต์ของคุณ TEX
whuber

@whuber ขอบคุณ ฉันมักจะตรวจสอบระหว่างและหลังการโพสต์เพราะฉันพบว่าฉันสับสนสมการมากโดยเฉพาะอย่างยิ่งเมื่อห้อย การพลาดสิ่งนี้เป็นเรื่องผิดปกติและอาจเกิดขึ้นเพราะมันเป็นการโพสต์ที่ยาวนานและฉันเพิ่งไปทำอย่างอื่นอย่างไม่ระมัดระวังที่ฉันต้องการหรือจำเป็นต้องทำ บางครั้งโทรศัพท์ก็กวนใจฉันและฉันก็ลืมตรวจสอบ เกี่ยวกับสัญลักษณ์พิเศษที่ทำให้ข้อความหายไปในโพสต์ฉันสังเกตว่า ฉันคิดว่าวิธีแก้ปัญหาง่ายๆคือเพื่อให้แน่ใจว่าคุณออกจากช่องว่างหลังจากสัญลักษณ์ ฉันคิดว่ามันได้ผลกับฉันในอดีต
Michael R. Chernick

+1 ตรงจุดจริงๆ โปรดทราบว่าถ้าและYจะไม่มีความสมบูรณ์แบบในตัวอย่างของคุณ , Var ( Z ) = Var ( X ) + Var ( Y ) XYvar(Z)=var(X)+var(Y)
gung - Reinstate Monica

@MichaelChernick สำหรับกรณีที่ Cov (X, Y) <0, ฉันมีคำถาม: หากเป้าหมายของฉันคือการอนุมาน E [X] -E [Y] จากการทดลองของฉันจากนั้นฉันก็ทำการศึกษาแบบจับคู่เมื่อฉัน วิเคราะห์ข้อมูลของฉันฉันยังคงมีความสุขที่ผลการทดสอบของฉันคือการทำให้การทดลองแบบสุ่มไม่ได้ผล ฉันจะทำสิ่งนี้ได้ไหม เพราะถ้าคุณทำการทดลองแบบสุ่มที่ไม่ได้คู่อย่างแท้จริงคุณสามารถได้รับผลลัพธ์ที่แท้จริง จากนั้นฉันก็สามารถหาค่าเฉลี่ยของแต่ละกลุ่ม (เพิกเฉยเรื่องการจับคู่) และนำความแตกต่างของค่าเฉลี่ยของทั้งสองกลุ่ม นี่เป็นตัวประมาณค่าที่เป็นกลางของ E [Z] สำหรับความแปรปรวนของตัวประมาณของฉันฉันแค่ใช้ ...
KevinKim

@MichaelChernick ความแปรปรวนของกลุ่มตัวอย่าง X และ Y และกลุ่มรวมพวกเขาขึ้น
KevinKim

7

แทนที่จะจับคู่มันอาจจะดีกว่าที่จะเข้าใจรูปแบบข้อมูลพื้นฐาน หากทำการจับคู่เพื่อจัดการกับความแตกต่างที่ไม่สามารถควบคุมได้มันมักจะเป็นกรณี (ยกเว้นในการศึกษาคู่) ว่าการจับคู่เพียงบางส่วนควบคุมแหล่งที่มาของความแปรปรวนและการถดถอยหลายครั้งจะทำได้ดีกว่า นี่เป็นเพราะการจับคู่กับตัวแปรต่อเนื่องส่งผลให้เกิดความแปรปรวนที่เหลืออยู่บ่อยครั้งเนื่องจากไม่สามารถทำการจับคู่กับตัวแปรดังกล่าวได้อย่างแม่นยำ


2
หากเราทุกคนกำลังถดถอยทำไมหนังสือเกี่ยวกับการออกแบบการทดลองเช่นหนังสือของเดวิดคอคส์เน้นถึงความสำคัญของการจับคู่หรือการจัดกลุ่มในการทดลองทางชีววิทยา การจับคู่หลีกเลี่ยงข้อสันนิษฐานที่ซ่อนอยู่ของการพึ่งพาเชิงเส้นที่เกี่ยวข้องในการถดถอย แต่อาจมีเหตุผลอื่น ๆ : ใคร ๆ ??
David Epstein

6

การทดสอบสองแบบ (จับคู่และไม่จับคู่) ถามคำถามที่แตกต่างกันเพื่อให้พวกเขาได้รับคำตอบที่แตกต่างกัน การจับคู่ที่ถูกต้องเกือบตลอดเวลามีประสิทธิภาพมากกว่าการจับคู่ซึ่งเป็นจุดจับคู่ที่แท้จริง ดังนั้นเนื่องจากคุณบอกว่าการจับคู่ถูกต้องเป็นไปได้ว่าค่า p สำหรับการทดสอบที่จับคู่ของคุณจะต่ำกว่าสำหรับข้อมูลเดียวกันที่ไม่มีการจับคู่ แน่นอนคุณสามารถทำได้และดูด้วยตัวคุณเอง

ดังนั้นคำตอบสำหรับปัญหาของคุณนั้นสำคัญไม่ใช่เชิงสถิติ การจับคู่ของคุณถูกต้องหรือไม่

คุณจะได้รับผลลัพธ์ที่สำคัญจากการจับคู่แบบสุ่มมากกว่าจากการทดสอบแบบไม่จับคู่หรือไม่? มาดูกัน:

set.seed(2910110192)
x <- rnorm(100, 10, 2)
y <- rnorm(100, 10, 2)
t.test(x, y)
t.test(x, y, paired = T)

ใช่คุณสามารถทำได้แม้ว่าที่นี่ความแตกต่างจะมีขนาดเล็กมาก แต่ทั้งคู่มีค่า p ต่ำกว่า ฉันรันโค้ดนั้นหลายครั้ง ไม่น่าแปลกใจที่บางครั้งหนึ่ง p ต่ำกว่าบางครั้งอื่น ๆ แต่ความแตกต่างมีขนาดเล็กในทุกกรณี อย่างไรก็ตามฉันแน่ใจว่าในบางสถานการณ์ความแตกต่างของค่า p อาจมีขนาดใหญ่


ขอบคุณสำหรับคำตอบ แต่คำถามของฉันถามถึงความแตกต่างอย่างเป็นระบบ เห็นได้ชัดว่าในระยะยาวของ x และ y, x และ y บางครั้งดูเหมือนว่าพวกเขามีการจับคู่ที่ดีมากและบางครั้งราวกับว่าพวกเขาได้รับการจับคู่อย่างไม่ดี แน่นอนว่าเป็นคำถามเชิงสถิติว่าในการเลือก x และ y แบบสุ่มการแจกแจงค่า p จะเหมือนกันในการทดสอบสองครั้ง ฉันคิดว่ามันไม่ควรยากเกินไปสำหรับคนที่รู้สถิติเชิงทฤษฎีมากกว่าที่ฉันทำเพื่อคำนวณการกระจายตัวตามทฤษฎีทั้งสองของค่า p ฉันเดาว่าพวกเขาเหมือนกัน
David Epstein

ในกรณีจริงที่ฉันเกี่ยวข้อง p-value สำหรับ unpaired อยู่ที่ประมาณ. 04 และเป็นคู่. 001 ตามที่นักชีววิทยาที่สำคัญเราควรจะอ้างอิง. 04 ตามที่ฉันปรับปรุง p-value อย่างยิ่งบ่งชี้ว่าการจับคู่ของเราถูกต้อง ฉันอ้างว่ามีคำถามเชิงวัตถุในสถิติที่นี่พร้อมกับคำตอบที่มีวัตถุประสงค์และนั่นไม่ใช่แค่คำถามของการตัดสินทางชีววิทยาที่ดีเกี่ยวกับความถูกต้องของการจับคู่โดยเฉพาะ --- หลังดูเหมือนจะเป็นความคิดเห็นของ Peter Flom และ นักชีววิทยาที่สำคัญ
David Epstein

1
ฉันคิดว่าสถิติบอกเล่าเรื่องราว ควรเปิดเผยผลลัพธ์ทั้งคู่ แต่ตราบใดที่ข้อมูลนั้นถูกต้องและสามารถอธิบายความสัมพันธ์ได้การทดสอบที่จับคู่นั้นมีความแม่นยำมากขึ้นเพราะคำนึงถึงความสัมพันธ์
Michael R. Chernick

5

ตอนนี้ฉันเข้าใจดียิ่งขึ้นสิ่งที่ทำให้ฉันกังวลเกี่ยวกับการทดสอบแบบจับคู่กับการทดสอบแบบไม่จับคู่และค่า p ที่เกี่ยวข้อง การค้นพบเป็นการเดินทางที่น่าสนใจและมีความประหลาดใจมากมายระหว่างทาง ความประหลาดใจอย่างหนึ่งเกิดขึ้นจากการสืบสวนเรื่องการมีส่วนร่วมของไมเคิล นี่ไม่สามารถแก้ไขได้ในแง่ของคำแนะนำการปฏิบัติ ยิ่งกว่านั้นเขาพูดในสิ่งที่ฉันคิดว่านักสถิติทุกคนเชื่ออย่างแท้จริงและเขามีผู้สนับสนุนหลายคนเพื่อสำรองสิ่งนี้ อย่างไรก็ตามตามทฤษฎีแล้วมันไม่ถูกต้องอย่างแท้จริง ฉันค้นพบสิ่งนี้ด้วยการหาสูตรสำหรับค่า p แล้วคิดให้ถี่ถ้วนว่าจะใช้สูตรอย่างไรเพื่อนำไปสู่ตัวอย่างเคาน์เตอร์ ฉันเป็นนักคณิตศาสตร์โดยการฝึกอบรมและตัวอย่างเคาน์เตอร์ก็คือ "ตัวอย่างเคาน์เตอร์ของนักคณิตศาสตร์" ไม่ใช่สิ่งที่คุณจะเจอในสถิติเชิงปฏิบัติ สิ่งที่ฉันพยายามค้นหาเมื่อฉันถามคำถามเริ่มแรก

นี่คือรหัส R ที่ให้ตัวอย่างเคาน์เตอร์:

vLength <- 10; meanDiff <-10^9; numSamples <- 3;
pv <- function(vLength,meanDiff) {
    X <- rnorm(vLength)
    Y <- X - meanDiff + rnorm(vLength,sd=0.0001)
    Paired <- t.test(X,Y,var.equal=T,paired=T)
    NotPaired <- t.test(X,Y,var.equal=T,paired=F)
    c(Paired$p.value,NotPaired$p.value,cov(X,Y))
}
ans <- replicate(numSamples,pv(vLength,meanDiff))

สังเกตคุณสมบัติดังต่อไปนี้: X และ Y เป็น 10-tuples สองตัวที่มีความแตกต่างกันมากและเกือบคงที่ สำหรับตัวเลขสำคัญหลายตัวความสัมพันธ์คือ 1.000 .... ค่า p สำหรับการทดสอบแบบไม่มีคู่มีขนาดเล็กกว่าค่า p-value ประมาณ 10 ^ 40 เท่าสำหรับการทดสอบแบบจับคู่ ดังนั้นสิ่งนี้ขัดแย้งกับบัญชีของไมเคิลหากว่าคนอ่านบัญชีของเขาอย่างแท้จริงสไตล์นักคณิตศาสตร์ นี่เป็นส่วนหนึ่งของคำตอบของฉันที่เกี่ยวข้องกับคำตอบของ Michael


นี่คือความคิดที่กระตุ้นโดยคำตอบของปีเตอร์ ในระหว่างการอภิปรายคำถามเดิมของฉันฉันคาดเดาในความคิดเห็นว่าการแจกแจงค่าเฉพาะสองค่า p ที่เสียงแตกต่างกันในความเป็นจริงเหมือนกัน ตอนนี้ฉันสามารถพิสูจน์ได้ สิ่งที่สำคัญกว่านั้นคือหลักฐานแสดงให้เห็นถึงลักษณะพื้นฐานของค่า p ดังนั้นพื้นฐานที่ไม่มีข้อความ (ที่ฉันเคยเจอ) รบกวนที่จะอธิบาย บางทีนักสถิติมืออาชีพทุกคนรู้ความลับ แต่สำหรับฉันความหมายของ p-value ดูเหมือนจะแปลกและประดิษฐ์ขึ้นมาเสมอ ก่อนที่จะมอบความลับของนักสถิติให้ฉันระบุคำถาม

n>1n2(n-1)n-1ระดับความอิสระ. การแจกแจงสองแบบนี้แตกต่างกันดังนั้นการกระจายตัวของ p-values ​​ที่เกี่ยวข้องจะเป็นอย่างไร หลังจากคิดไปมากแล้วฉันก็รู้ว่าการเลิกจ้างการคาดเดาที่เห็นได้ชัดนี้ง่ายเกินไป

:(0,)(0,)[0,1]

พี=เสื้อ(s)ds
(-,)[0,)

[0,1]

n-1[0,1]2(n-1)[0,1][0,1]


ฉันไม่คิดว่าค่า p จะมีสิ่งลึกลับที่ซ่อนอยู่ บางคนมีช่วงเวลาที่ลำบากด้วย มันเป็นความน่าจะเป็นของการสังเกตค่าว่าเป็น extereme หรือมากเกินความเป็นจริงที่สังเกตได้เมื่อสมมติฐานว่างเป็น TRUE ฉันคิดว่าคุณมีสิทธิ์นั้นในสูตรหนึ่งของคุณ ฉันคิดว่าคุณระบุว่าค่า p มีการกระจายอย่างสม่ำเสมอ ใช่ฉันเห็นด้วยกับว่าเมื่อสมมติฐานว่างเปล่าเป็นจริง โปรดทราบว่าการทดสอบ t ของคุณสมมติฐานว่างอาจไม่เป็นจริง จากนั้นค่า p ไม่เหมือนกัน ควรมีสมาธิอย่างใกล้ชิดกับ 0
Michael R. Chernick

ประการที่สองเรากำลังพูดถึงสองสถิติการทดสอบที่แตกต่างกัน หนึ่งจะขึ้นอยู่กับการจับคู่และหนึ่งในไม่ได้อยู่ในตัวอย่างของคุณ ไม่ว่าฉันจะพูดถึงมันในคำตอบของฉันหรือไม่การทดสอบ t unpaired มีการแจกแจง t ส่วนกลางที่มีองศาอิสระ 2n-2 ในขณะที่การแจกแจง t ที่สอดคล้องกันสำหรับการทดสอบ paired t มี n-1 องศาอิสระ ดังนั้นคนที่มีจำนวนอิสระมากขึ้นก็จะอยู่ใกล้กับการแจกแจงแบบปกติมาตรฐานมากกว่าอีกอันหนึ่ง ไม่สำคัญว่าเมื่อคุณใช้การทดสอบเหล่านี้กับข้อมูลจริงหรือไม่? No! ไม่ใช่เมื่อ n มีขนาดใหญ่พอสมควร
Michael R. Chernick

หมายเหตุด้านข้างข้อ จำกัด ของการทดสอบแบบจับคู่ต้องการขนาดตัวอย่างที่เท่ากันซึ่งคุณควรมีหากข้อมูลทั้งหมดสามารถจับคู่ได้ แต่การทดสอบแบบไม่มีคู่นั้นใช้ได้กับขนาดตัวอย่างที่ไม่เท่ากัน ดังนั้นโดยทั่วไปการทดสอบแบบไม่มีคู่จะมีองศาอิสระ n + m-2
Michael R. Chernick

คำตอบของคุณยาวและเป็นนามธรรมและฉันพยายามลุย แต่ฉันไม่เข้าใจตัวอย่าง ฉันแค่ไม่เห็นว่าคุณใช้สมมุติฐานว่างและข้อมูลจริงที่ใด ค่า p ที่สังเกตได้นั้นเป็นส่วนสำคัญของการแจกแจงทีที่เหมาะสมสำหรับสถิติการทดสอบที่ได้จากข้อมูล คุณเปรียบเทียบตัวเลขเหล่านั้นสำหรับการแจกแจงสองครั้งและชุดข้อมูลทั่วไปเดียวกัน หากคุณมีเงื่อนไขกับข้อมูลที่สังเกตได้การแจกแจงแบบเดียวกันไม่มีบทบาท ฉันขอโทษ แต่ฉันไม่เห็นว่าคำตอบของคุณตอบคำถามของคุณจริงๆ
Michael R. Chernick

Michael: แค่ให้ความสนใจกับรหัส R ที่ฉันให้ ใช้เวลาเพียงไม่กี่วินาทีในการเรียกใช้ สมมุติฐานว่างคือ X และ Y มาจากการกระจายตัวแบบเดียวกันซึ่งแน่นอนว่าเท็จในกรณีของฉัน ในตัวอย่างของฉัน Cov (X, Y)> 0 และอย่างไรก็ตามการทดสอบแบบไม่มีคู่ช่วยให้ความสำคัญมากกว่าการทดสอบแบบจับคู่
David Epstein

1

ฉันจะเสนอมุมมองอื่น บ่อยครั้งที่การจับคู่เสร็จแล้วจะลดอคติ สมมติว่าคุณสนใจว่าการเปิดรับ E เป็นปัจจัยเสี่ยงต่อผลลัพธ์ที่ต่อเนื่อง Y หรือไม่สำหรับวิชา E + แต่ละวิชาคุณจะได้อายุและเพศที่ตรงกับเพศที่เป็น E- ตอนนี้เราสามารถทำการทดสอบแบบจับคู่หรือทดสอบแบบไม่จับคู่ ฉันคิดว่าเราควรพิจารณาการจับคู่อย่างชัดเจนและทำการทดสอบแบบจับคู่ มันมีหลักการมากขึ้นในการคำนึงถึงการออกแบบ ไม่ว่าจะคำนึงถึงการจับคู่ในการวิเคราะห์ว่าเป็นปัญหาของการแลกเปลี่ยนความแปรปรวนทางอคติหรือไม่ การบัญชีสำหรับการจับคู่ในการวิเคราะห์ให้ความคุ้มครองอคติมากขึ้น แต่สามารถเพิ่มความแปรปรวนได้ การทำแบบทดสอบ t-unpaired อาจมีประสิทธิภาพมากกว่า แต่ก็ไม่ได้ให้การป้องกันกับอคติใด ๆ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.