ขนาดเอฟเฟกต์คืออะไร ... และทำไมถึงมีประโยชน์?


18

ฉันมีพื้นหลังสถิติระดับเบื้องต้น - ระดับบัณฑิตศึกษา (สมมติว่าฉันรู้สถิติทางคณิตศาสตร์และความน่าจะเป็นในระดับปริญญาตรี (เช่น Wackerly et al., ความน่าจะเป็นของรอสส์) และมีความรู้เกี่ยวกับทฤษฎีการวัด)

ฉันเพิ่งเริ่มงานออกแบบการทดลองและการรายงานสถิติในสถิติการศึกษาและได้ถูกวางไว้ในโครงการที่โดยทั่วไปฉันกำลังประเมินตัวชี้วัดความรับผิดชอบสำหรับโรงเรียนและต้องวิเคราะห์ข้อมูลเสนอการเปลี่ยนแปลง ฯลฯ โปรดทราบว่าฉันเป็นเพียงคนเดียว หนึ่งในแผนกของฉันมีพื้นหลังสถิติทางคณิตศาสตร์

ในตำแหน่งของฉันผู้คนแนะนำอย่างยิ่งให้ใช้ขนาดเอฟเฟกต์เพื่อวัดประสิทธิภาพของโปรแกรม ครั้งเดียวที่ฉันเคยได้ยินเรื่องขนาดเอฟเฟกต์มาจากเพื่อนของฉันซึ่งเรียนจิตวิทยา ความประทับใจของฉันคือ

Effect Size=Difference of MeansStandard Deviation.

มีประโยชน์อย่างไรเกี่ยวกับตัวชี้วัดนี้ผ่านการทดสอบสมมติฐานแบบดั้งเดิมและทำไมฉันจึงต้องสนใจมัน ให้ฉันดูเหมือนว่าไม่มีอะไรมากไปกว่าสถิติทดสอบสำหรับสองตัวอย่าง -test ฉันไม่เห็นว่ามีประโยชน์เลยนอกจากอาจทำให้ทุกอย่างในระดับเดียวกัน (ซึ่งเป็นเหตุผลว่าทำไมทุกคน "ทำให้ปกติ" อะไรก็ได้) แต่ฉันคิดว่าสถิติการทดสอบ และp- value เป็นที่ต้องการtp


ฉันสับสนเล็กน้อยโดย "พื้นหลังสถิติระดับเบื้องต้น - ระดับบัณฑิตศึกษา"; คำสองคำแรกดูเหมือนจะขัดแย้งกัน คุณช่วยอธิบายสิ่งที่รวมอยู่ด้วยได้ไหม? นั่นเป็นสิ่งที่เหมือนกับการเริ่มต้นสถิติระดับบัณฑิตศึกษาหรืออย่างอื่นใช่ไหม
Glen_b -Reinstate Monica

2
@Glen_b ใช่มันคือการเริ่มต้นสถิติระดับบัณฑิตศึกษา สมมติว่าฉันรู้สถิติทางคณิตศาสตร์และความน่าจะเป็นในระดับปริญญาตรี (เช่น Wackerly et al., Ross 'น่าจะเป็น) และมีความรู้เกี่ยวกับทฤษฎีการวัด
Clarinetist

3
ฉันเห็นอกเห็นใจ OP มาจากภูมิหลังทางคณิตศาสตร์ / สถิติมันมักจะทำให้สับสนเพื่อหารือเกี่ยวกับสถิติกับผู้ที่ได้รับการฝึกฝนในหลักสูตรปริญญาเอกสังคมวิทยาหรือจิตวิทยาเพราะพวกเขามีเงื่อนไขที่แตกต่างกันสำหรับทุกสิ่ง :) และบางครั้งก็มีความคิดที่เข้มงวดเกี่ยวกับวิธีการทำสิ่งต่าง ๆ การฝึกฝนเชิงสถิติที่ดีที่สุดเช่นการพยายามโน้มน้าวให้ผู้ตรวจสอบ / บรรณาธิการที่ดื้อรั้นว่าการสร้างแบบจำลองสมการโครงสร้างไม่ใช่วิธีแก้ปัญหาทั้งหมดหรือความเป็นเชิงเส้นนั้นไม่ใช่ข้อสันนิษฐานที่ดีเสมอไป! อย่างไรก็ตามฉันได้เรียนรู้ที่จะรวมตัวกันกับชุมชนนั้นค่อนข้างดีหลังจากผ่านไปหลายปี!
CrockGill

คำตอบ:


20

นั่นคือหนึ่งในตัวชี้วัดของขนาดของผล แต่มีหลายคนอื่น ๆ แน่นอนมันเป็นไม่ได้สถิติทดสอบ วัดของคุณที่มีขนาดผลมักจะเรียกว่าโคเฮนd (พูดอย่างเคร่งครัดที่ถูกต้องเท่านั้นหาก SD เป็นที่คาดกันผ่านทาง MLE-IE โดยไม่ต้องแก้ไขของ Bessel ); โดยทั่วไปเรียกว่า 'ความแตกต่างเฉลี่ยที่เป็นมาตรฐาน' บางทีนี่อาจทำให้ชัดเจนว่าt d : dtdtd
นั่นคือ "/

d=x¯2x¯1SDt=x¯2x¯1SEt=x¯2x¯1SDN
/N "" จากสูตรสำหรับความแตกต่างค่าเฉลี่ยที่เป็นมาตรฐาน

โดยทั่วไปแล้วการนำขนาดตัวอย่างออกมาจากค่าจะให้ข้อมูลจริง สมมติว่าเอฟเฟกต์ที่แท้จริงนั้นไม่ได้มีค่าเท่ากับ ถึงตำแหน่งทศนิยมที่ไม่มีที่สิ้นสุดคุณสามารถบรรลุระดับความสำคัญที่คุณอาจต้องการได้อย่างเพียงพอ0N พี -value ให้ข้อมูลเกี่ยวกับวิธีการมั่นใจว่าเราสามารถจะอยู่ในการปฏิเสธสมมติฐาน แต่ไม่ได้โดยวิธีการใหญ่มหันต์ผลที่ได้คือกับวิธีการที่คุณมีข้อมูลมาก แน่นอนมันเป็นเรื่องดีที่จะรู้ว่าเราควรจะปฏิเสธสมมติฐาน แต่ก็ยังจะดีจะทราบว่าผลของการศึกษาของคุณผลิตกำไรขนาดใหญ่สำหรับเด็กนักเรียนหรือเป็นที่น่ารำคาญและเป็นเพียงคนเดียวอย่างมีนัยสำคัญเนื่องจากการที่มีขนาดใหญ่ยังไม่มีข้อความ NpN


15

ฉันคาดหวังว่าใครบางคนที่มีภูมิหลังในพื้นที่ที่เกี่ยวข้องมากกว่า (จิตวิทยาหรือการศึกษาพูด) จะพูดสอดกับคำตอบที่ดีกว่า แต่ฉันจะให้มันยิง

" ขนาดผล " เป็นคำที่มีความหมายมากกว่าหนึ่ง - ซึ่งหลายปีที่ผ่านมานำการสนทนาบางอย่างสับสนจนในที่สุดฉันก็มาถึงการตระหนักว่า ที่นี่เรากำลังจัดการกับเวอร์ชันเบี่ยงเบนมาตรฐานอย่างชัดเจน ("ส่วนเบี่ยงเบนมาตรฐานที่เปลี่ยนแปลงโดย"

ส่วนหนึ่งของเหตุผลในการดู "ขนาดของเอฟเฟ็กต์" ในสาขาวิชาที่พวกเขาพบบ่อยคือพวกเขามักจะมีตัวแปรที่มีค่าเฉพาะที่ไม่ได้มีความหมายโดยกำเนิด แต่ถูกสร้างขึ้นเพื่อพยายามวัดสิ่งที่ซ่อนอยู่ ที่.

ตัวอย่างเช่นลองจินตนาการว่าคุณกำลังพยายามวัดความพึงพอใจในงาน (อาจเป็นแบบจำลองที่เกี่ยวข้องกับตัวแปรอิสระบางตัวรวมถึงการปฏิบัติที่น่าสนใจเช่น) คุณไม่มีทางที่จะไปถึงที่นั่นได้โดยตรง แต่คุณสามารถลองสร้างแบบสอบถามเพื่อให้ได้มุมมองที่แตกต่างกันโดยอาจใช้บางอย่างเช่นมาตราส่วน Likert

นักวิจัยที่แตกต่างกันอาจมีวิธีการที่แตกต่างกันในการวัดความพึงพอใจในงานดังนั้นการวัดของ "ความพึงพอใจ" สองชุดของคุณจึงไม่สามารถเทียบเคียงได้โดยตรง แต่ถ้าพวกเขามีความถูกต้องในรูปแบบต่างๆ พวกเขาอาจมีเหตุผลวัดความพึงพอใจ) จากนั้นพวกเขาอาจหวังว่าจะมีขนาดผลคล้ายกันมาก; ที่ขนาดเอฟเฟกต์อย่างน้อยจะเทียบเคียงได้มากกว่า


3
ทำหน้าที่ได้ดีมากในการแนะนำแนวคิด 'สร้าง' โดยไม่มีเทคนิค แต่ในงาน Clarinetist คุณจะต้องเข้าใจความคิดนี้ในเชิงลึก ฉันขอแนะนำแหล่งต้นฉบับในบทความ 'validity', Cronbach & Meehl's 1,955 บทความใน Psychological Bulletin: Psych.colorado.edu/~willcutt/pdfs/Cronbach_1955.pdf
David C. Norris

7

สูตรข้างต้นเป็นวิธีที่คุณคำนวณโคเฮน dสำหรับตัวอย่างที่เกี่ยวข้อง (ซึ่งอาจเป็นสิ่งที่คุณมี) หากพวกเขาไม่เกี่ยวข้องคุณสามารถใช้ความแปรปรวนแบบพูแทน มีสถิติที่แตกต่างกันซึ่งจะบอกคุณเกี่ยวกับขนาดของเอฟเฟกต์ แต่ Cohen's d เป็นตัวชี้วัดมาตรฐานที่สามารถเปลี่ยนแปลงได้ระหว่าง 0 และ 3 หากคุณมีตัวแปรที่แตกต่างกันจำนวนมาก พวกเขาทั้งหมดเข้าด้วยกัน ในทางกลับกันหลายคนชอบทำความเข้าใจขนาดผลกระทบในแง่ของหน่วยวัด ทำไมต้องคำนวณ d เมื่อคุณมีค่า p อยู่แล้ว?dช่วยเราตอบคำถามเกี่ยวกับว่ามันคุ้มค่าที่จะทำการแทรกแซงหรือไม่ (โดยไม่คำนึงถึงค่า p) ในวิทยาศาสตร์การแพทย์พวกเขาชอบพิจารณาNNTและประเมินสิ่งนี้ในแง่ของความรุนแรงของสภาพที่เป็นปัญหา ดูทรัพยากรที่ยอดเยี่ยมนี้จาก @krstoffr http://rpsychologist.com/d3/cohend/ นี่คือตัวอย่างจากชุดข้อมูลที่ฉันกำลังทำงานอยู่ ฉันกำลังดูการแทรกแซงพฤติกรรมที่ดำเนินการในโรงเรียนวัดโดยใช้แบบสอบถามทางจิตวิทยาที่ผ่านการตรวจสอบ (ผลิตข้อมูล Likert) ตัวแปรเกือบทั้งหมดของฉันแสดงการเปลี่ยนแปลงที่มีนัยสำคัญทางสถิติบางทีอาจไม่แปลกใจเพราะฉันมีกลุ่มตัวอย่างจำนวนมาก (n = ~ 250) อย่างไรก็ตามสำหรับตัวแปรบางตัวแล้ว Cohen's dค่อนข้างเล็กพูด 0.12 ซึ่งบ่งชี้ว่าแม้ว่าจะมีการเปลี่ยนแปลงแน่นอนมันอาจไม่ใช่การเปลี่ยนแปลงที่สำคัญทางคลินิกและดังนั้นจึงมีความสำคัญต่อการอภิปรายและตีความสิ่งที่เกิดขึ้นในข้อมูล แนวคิดนี้มีการใช้กันอย่างแพร่หลายในด้านจิตวิทยาและวิทยาศาสตร์สุขภาพที่ผู้ปฏิบัติงาน (หรือโรงเรียนในกรณีของคุณ) จำเป็นต้องพิจารณาอรรถประโยชน์ทางคลินิกของการรักษา (หรือสิ่งที่พวกเขากำลังทดลองด้วย) โคเฮน


2

สิ่งที่คุณเขียนไม่ใช่สถิติการทดสอบ เป็นการวัดที่ใช้เพื่อกำหนดความแตกต่างของทั้งสองวิธี โดยทั่วไปแล้วขนาดของเอฟเฟกต์จะใช้ในการหาปริมาณว่าสมมติฐานนั้นว่างเปล่าไปไกลแค่ไหน ตัวอย่างเช่นหากคุณทำการวิเคราะห์พลังงานสำหรับตัวอย่างทั้งสองเสื้อ- ทดสอบคุณอาจหาปริมาณพลังงานเป็นฟังก์ชันของขนาดเอฟเฟกต์ (สำหรับค่าคงที่ n) คุณเพิ่งเขียน (ซึ่งฉันคิดว่าเรียกว่า Cohen's D) ในบริบทอื่นขนาดของเอฟเฟกต์อาจเป็นอย่างอื่น

นอกจากนี้ยังไม่ใช่เรื่องแปลกที่จะรายงานขนาดผลโดยใช้ปริมาณตัวอย่างซึ่งอาจตรงกับสถิติที่คุ้นเคยเช่นความสัมพันธ์ของแพร์สัน - ขนาดผลกระทบที่แท้จริงคือค่าสัมประสิทธิ์สหสัมพันธ์พื้นฐานที่สร้างข้อมูล แต่ความสัมพันธ์ตัวอย่างยังเป็นข้อมูลที่เป็นประโยชน์ต่อ มีบางครั้ง จุดประสงค์ในการหาปริมาณว่าสมมติฐานที่เป็นโมฆะนั้นห่างไกลเพียงใดจากข้อมูลที่สังเกตได้ไม่ทางใดก็ทางหนึ่งแทนที่จะเป็นเพียงการรายงานพีมูลค่าและเรียกมันว่าวัน


2

ในความเป็นจริง, p-ค่าอยู่ในขณะนี้ในที่สุด 'ออกจากแฟชั่น' เช่นกัน: http://www.nature.com/news/psychology-journal-bans-p-values-1.17001 การทดสอบสมมติฐาน Null สมมติฐานที่สำคัญ (NHST) ผลิตได้มากกว่าคำอธิบายขนาดตัวอย่างของคุณเพียงเล็กน้อย (*) การแทรกแซงการทดลองใด ๆ จะมีผลบางอย่างซึ่งกล่าวได้ว่าสมมุติฐานว่างของ 'ไม่มีผล' นั้นเป็นเท็จเสมอในความหมายที่เข้มงวด . ดังนั้นการทดสอบที่ไม่สำคัญหมายความว่าขนาดตัวอย่างของคุณไม่ใหญ่พอ การทดสอบ 'ที่สำคัญ' หมายความว่าคุณรวบรวมข้อมูลเพียงพอที่จะ 'ค้นหา' บางอย่าง

'ขนาดของเอฟเฟกต์' หมายถึงความพยายามในการแก้ไขปัญหานี้โดยแนะนำมาตรการในระดับธรรมชาติของปัญหา ในทางการแพทย์ซึ่งการรักษามักจะมีผลกระทบบางอย่าง (แม้ว่าจะเป็นผลของยาหลอก) ความคิดของ 'ผลทางคลินิกที่มีความหมาย' ถูกนำมาใช้เพื่อป้องกันความน่าจะเป็น 50% ก่อนหน้านี้ว่า 'การรักษา' จะพบว่ามี สถิติ) ผลกระทบเชิงบวกอย่างมีนัยสำคัญ '(แต่จิ๋ว) ในการศึกษาขนาดใหญ่โดยพลการ

ถ้าฉันเข้าใจธรรมชาติของงานของคุณ Clarinetist แล้วในตอนท้ายของวันเป้าหมายที่ถูกต้องตามกฎหมายของมันคือการแจ้งการกระทำ / การแทรกแซงที่ปรับปรุงการศึกษาในโรงเรียนภายใต้ขอบเขตของคุณ ดังนั้นการตั้งค่าของคุณเป็นหนึ่งในการตัดสินใจเชิงทฤษฎีและวิธีการแบบเบย์เป็นวิธีที่เหมาะสมที่สุด (และไม่ซ้ำกัน [1] ) วิธีการ

แน่นอนว่าวิธีที่ดีที่สุดที่จะเข้าใจวิธีการ frequentist เป็นใกล้เคียงกับวิธีการแบบเบย์ ขนาดผลกระทบโดยประมาณนั้นสามารถเข้าใจได้โดยมีเป้าหมายที่การวัดศูนย์กลางสำหรับการกระจายตัวหลังเบย์ในขณะที่ค่า p สามารถเข้าใจได้ว่ามีจุดมุ่งหมายที่จะวัดส่วนท้ายของด้านหลังนั้น ดังนั้นเมื่อรวมปริมาณสองอย่างนี้เข้าด้วยกันจะมีส่วนสำคัญของ Bayesian posterior ที่ประกอบขึ้นเป็นข้อมูลทางธรรมชาติสำหรับมุมมองการตัดสินใจเชิงทฤษฎีเกี่ยวกับปัญหาของคุณ (อีกทางหนึ่งคือช่วงความเชื่อมั่นที่เกิดขึ้นบ่อยครั้งกับขนาดของเอฟเฟกต์สามารถเข้าใจได้เช่นกันว่าเป็นช่วงเวลาที่เชื่อได้อย่างน่าทึ่ง)

ในสาขาจิตวิทยาและการศึกษาวิธีการแบบเบย์เป็นที่นิยมมาก เหตุผลหนึ่งสำหรับเรื่องนี้คือมันเป็นเรื่องง่ายที่จะติดตั้ง 'สร้าง' ลงในแบบจำลองเบย์เป็นตัวแปรแฝง คุณอาจต้องการดู 'หนังสือลูกสุนัข' โดยJohn K. Kruschkeนักจิตวิทยา ในการศึกษา (ที่คุณมีนักเรียนซ้อนในห้องเรียนซ้อนกันในโรงเรียนซ้อนกันในเขต, ... ), การสร้างแบบจำลองลำดับชั้นไม่สามารถหลีกเลี่ยงได้ และแบบจำลอง Bayesian นั้นยอดเยี่ยมสำหรับการสร้างแบบจำลองแบบลำดับชั้นด้วย ในบัญชีนี้คุณอาจต้องการตรวจสอบ Gelman & Hill [2]

[1]: Robert, Christian P. The Bayesian Choice: จากรากฐานการตัดสินใจไปสู่การดำเนินการเชิงคำนวณ ฉบับที่ 2 Springer ตำราในสถิติ นิวยอร์ก: สปริงเกอร์, 2007

[2]: Gelman, Andrew และ Jennifer Hill การวิเคราะห์ข้อมูลโดยใช้การถดถอยและตัวแบบหลายระดับ / ลำดับชั้น. วิธีการวิเคราะห์เพื่อการวิจัยทางสังคม. เคมบริดจ์; นิวยอร์ก: สำนักพิมพ์มหาวิทยาลัยเคมบริดจ์, 2550


สำหรับข้อมูลเพิ่มเติมเกี่ยวกับ 'การเชื่อมโยงกัน' จากมุมมองที่ไม่จำเป็นต้องเต้นคุณกับรูปปั้นอิฐแบบเบย์ดูที่ [3]

[3]: Robins, James และ Larry Wasserman “ การปรับสภาพความน่าจะเป็นและการเชื่อมโยง: การทบทวนแนวคิดพื้นฐานบางอย่าง” วารสารสมาคมสถิติอเมริกัน 95 ฉบับที่ 95 452 (1 ธันวาคม 2000): 1340–46 ดอย: 10.1080 / 01621459.2000.10474344

(*) ใน [4], Meehl ขัดจังหวะ NHST อย่างงดงามยิ่งขึ้น แต่ไม่ขัดน้อยกว่าที่ฉันทำ:

เนื่องจากสมมติฐานว่างเป็นเสมือนเท็จเสมอตารางสรุปการวิจัยในแง่ของรูปแบบของ“ ความแตกต่างที่สำคัญ” นั้นมีความซับซ้อนมากกว่าเล็กน้อยผลลัพธ์ที่ไม่สามารถตีความได้ของฟังก์ชันกำลังทางสถิติ

[4]: Meehl, Paul E. “ ความเสี่ยงเชิงทฤษฎีและเครื่องหมายดอกจันแบบตาราง: เซอร์คาร์ล, เซอร์โรนัลด์, และความก้าวหน้าของจิตวิทยาเบา ๆ ” วารสารการให้คำปรึกษาและจิตเวชคลินิก 46 (1978): 806-34 http://www3.nd.edu/~ghaeffel/Meehl(1978).pdf


และนี่คือคำพูดที่เกี่ยวข้องจาก Tukey: /stats//a/728/41404


1
" การแทรกแซงการทดลองใด ๆจะมีผลกระทบบางอย่าง" (ความสำคัญของฉัน) เป็นคำที่ค่อนข้างแข็งแกร่งเช่นเดียวกับที่ตามมา "เสมอ" ในบางสาขาของการศึกษามันอาจเป็นกฎง่ายๆ แต่ฉันคิดว่ามีอันตรายในการกวาดเกินไป ฉันขอแนะนำด้วยว่า "[NHST] ให้ผลมากกว่าขนาดคำอธิบายตัวอย่างของคุณเพียงเล็กน้อย" สามารถพิสูจน์ได้: ค่า p-โผล่ออกมาจากการโต้ตอบระหว่างทั้งขนาดตัวอย่างและขนาดของเอฟเฟกต์
Silverfish

@ Silververfish ขอบคุณสำหรับการตอบกลับของคุณ ฉันจะเชิญคุณให้ตัวอย่างที่มุมมองของฉันเกี่ยวกับค่า p จะเป็น 'อันตราย' (BTW ฉันใส่ตัวเอียงบางตัวและใช้วลี "ในความหมายที่เข้มงวด" ในการคาดการณ์การร้องเรียนเช่นคุณการเรียกร้องของฉันยังคงอยู่) นอกจากนี้แม้ว่า p-value แน่นอน "โผล่ออกมาจากการมีปฏิสัมพันธ์" ของ อีกสองปัจจัยหนึ่งในนั้น (ขนาดตัวอย่าง) ส่วนใหญ่เป็นพารามิเตอร์การออกแบบฟรีเลือกโดยพลการ ตัวเลือกโดยพลการนั้นคือสิ่งที่ค่า p จึงสะท้อนออกมา ต้องการตัวเลขสองตัวอย่างชัดเจน ทำไมไม่ปลายทางของช่วงความมั่นใจ?
David C. Norris

2
เป็นตัวอย่าง: ตัวอย่างใด ๆ ที่เราอาจคาดหวังว่าสมมติฐานว่างจะเป็นจริงหรืออย่างน้อยก็ในกรณีที่เราไม่สามารถระบุได้อย่างชัดเจนว่าเรามั่นใจว่ามันผิดโดยไม่ต้องทำการทดลองหรือดูข้อมูล ไม่ใช่ค่า null ทั้งหมดที่เป็นเท็จ: พิจารณาการวิจัยในด้านจิตศาสตร์เช่นกระแสจิตและการทดลองล่วงหน้า แต่ค่า null จำนวนมากเป็นความจริงในสาขาที่คุณอาจพิจารณาว่า "ถูกต้องทางวิทยาศาสตร์" มากกว่าเช่นจีโนมิกส์
Silverfish

5
-1 มีปัญหามากมายที่นี่ IMO ความจริงที่ว่าวารสารจิตวิทยา 1 ฉบับที่ถูกแบนห้ามค่า p ไม่ได้หมายความว่า "ค่า p ตอนนี้กลายเป็น 'แฟชั่น' การแบนได้รับการวิพากษ์วิจารณ์อย่างกว้างขวาง (รวมถึงแถลงการณ์ที่สุภาพโดย ASAและยังไม่ได้รับการบันทึกโดยวารสารอื่น ๆ ในช่วงหลายเดือนที่ผ่านมาฉันทราบว่าวารสารไม่ต้องการเปลี่ยนไปใช้วิธีการแบบเบส์ แต่จะพิจารณาเป็นกรณี ๆ ไป
gung - Reinstate Monica

3
อย่างไรก็ตามในการทดลองจริงกระบวนการของการสุ่มหน่วยแบ่งวิถีภายนอกที่เกิดจากการทดสอบเส้นทางสาเหตุโดยตรงจาก X ถึง Y มันเป็นข้ออ้างทางอภิปรัชญาที่แปลกประหลาดเพื่อยืนยันว่าตัวแปรทั้งหมดมีการเชื่อมโยงสาเหตุโดยตรงในทั้งสองทิศทาง แต่ถ้าคุณ อย่าถือมันเป็นสิ่งที่ไม่สอดคล้องกันที่จะอ้างว่า "สมมติฐานว่างของ 'ไม่มีผล' เป็นเท็จเสมอ"
gung - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.