ใครที่ใช้ / ประดิษฐ์ค่า p เป็นอันดับแรก


30

ฉันพยายามเขียนบทความในบล็อกเกี่ยวกับค่า p และฉันคิดว่ามันน่าสนใจที่จะกลับไปที่จุดเริ่มต้นทั้งหมดซึ่งดูเหมือนจะเป็นกระดาษ 1900 ของ Pearson หากคุณคุ้นเคยกับกระดาษแผ่นนั้นคุณจะจำได้ว่าสิ่งนี้ครอบคลุมการทดสอบความเหมาะสม

เพียร์สันค่อนข้างหลวมกับภาษาของเขาเมื่อมันมาถึงค่า p เขาใช้ "อัตราต่อรอง" ซ้ำ ๆ เมื่ออธิบายวิธีตีความค่า p ของเขา ตัวอย่างเช่นในหน้า 168 เมื่อพูดถึงผลลัพธ์ของการทอยลูกเต๋าซ้ำ 12 ลูกเต๋าเขากล่าวว่า " ... ซึ่งทำให้เราไปที่ P = .00000016 หรืออัตราต่อรองคือ 62,499 ต่อ 1 กับระบบการเบี่ยงเบนแบบสุ่ม การเลือกด้วยอัตราต่อรองดังกล่าวมันจะสมเหตุสมผลที่จะสรุปว่าลูกเต๋าแสดงอคติต่อคะแนนที่สูงขึ้น "

ในบทความนี้เขาอ้างถึงงานก่อนหน้านี้รวมถึงหนังสือ 1891 บนสี่เหลี่ยมอย่างน้อยโดย Merriman

แต่เพียร์สันจัดทำแคลคูลัสสำหรับ p-values ​​(ความดีของการทดสอบพอดี)

เพียร์สันเป็นคนแรกที่คิดค่า p หรือไม่? เมื่อฉันค้นหาค่า p จะมีการพูดถึง Fisher และงานของเขาในทศวรรษ 1920

แก้ไข: และขอขอบคุณสำหรับการกล่าวถึง Laplace - เขาดูเหมือนจะไม่ได้อยู่กับสมมติฐานว่าง (Pearson ดูเหมือนจะทำโดยปริยายแม้ว่าเขาจะไม่เคยใช้คำว่าในกระดาษ 1900 ของเขา) เพียร์สันมองไปที่ความดีของการทดสอบแบบพอดีจาก: หากการนับนั้นมาจากกระบวนการที่ไม่เอนเอียงความน่าจะเป็นที่การนับที่สังเกต (และนับความเบี่ยงเบนมากขึ้น) เกิดขึ้นจากการแจกแจงแบบสมมติคืออะไร

การรักษาความน่าจะเป็น / อัตราต่อรองของเขา (เขาแปลงความน่าจะเป็นเป็นราคา) แสดงให้เห็นว่าเขากำลังทำงานกับความคิดโดยนัยของสมมติฐานว่าง นอกจากนี้เขายังกล่าวด้วยว่าความน่าจะเป็นที่เกิดขึ้นจากค่า x ^ 2 แสดงถึงอัตราต่อรอง "กับระบบการเบี่ยงเบนที่ไม่น่าจะเป็นไปได้หรือไม่น่าจะเป็นไปได้มากกว่าที่นี่" - ภาษาที่เราจำได้

Arbuthnot ไปไกลขนาดนั้นหรือไม่?

อย่าลังเลที่จะใส่ความคิดเห็นของคุณเป็นคำตอบ มันคงจะดีถ้าได้เห็นการสนทนา


7
บทความนี้แสดงให้เห็นว่ามันถูกใช้โดย Laplace ซึ่งจะกำหนดขอบเขตที่ต่ำกว่า: en.wikipedia.org/wiki/…

9
หนึ่งอาจโต้แย้งว่า Arbuthnot (1710) ในข้อโต้แย้งสำหรับพระเจ้าสุขุมนำมาจากความสม่ำเสมอสม่ำเสมอที่สังเกตในการเกิดของทั้งสองเพศอาจจะนับ เขาใช้แบบจำลองเหรียญ ('cross and pile') และก่อนอื่นคำนวณความน่าจะเป็นที่จะได้หัวเท่าหางก่อนที่จะชี้ให้เห็นว่า "โอกาสจะเกิดขึ้นในเงื่อนไขบางข้อถัดจากตรงกลางและจะโน้มตัวหนึ่ง ด้านหรืออื่น ๆ แต่มันเป็นไปไม่ได้มาก (ถ้ามีโอกาสเกิดขึ้นเท่านั้น) ว่าพวกเขาจะไม่ถึงเท่าที่สุดขีด "; เราสามารถเห็นเขาเข้ามาใกล้กับแนวคิดเรื่องค่า p ที่นั่น
Glen_b -Reinstate Monica

4
อยากรู้อยากเห็นดาวิดในรายการของเขาjstor.org/stable/2685564?seq=1#page_scan_tab_contentsแสดงให้เห็นว่าคำที่ใช้ P-value ถูกใช้ครั้งแรกในปี 1943 โดย Deming ในหนังสือของเขา "การปรับสถิติข้อมูล" ฉันรู้ว่าคุณกำลังตามแนวคิดไม่ใช่คำ แต่ฉันพบว่ามันน่าสนใจที่จะเห็นเมื่อคำนั้นปรากฏขึ้นในที่สุด
mdewey

2
ผู้ที่คิดค้นอาจเป็นเรื่องยากที่จะค้นหา แต่ใครจะโทษว่าการใช้ p-values ​​ในปัจจุบันเป็นเรื่องของฟิชเชอร์อย่างแน่นอน
Carlos Cinelli

1
เรากำหนดค่า p-value เป็น 'ความน่าจะเป็นที่จะได้ผลลัพธ์ภายในช่วงที่แน่นอน (มักจะมีค่าบางอย่างหรือมากกว่านั้นมากสำหรับสถิติที่คำนวณเช่นใช้โดย Pearson ในปี 1900) เนื่องจากสมมติฐานบางอย่างถูกต้อง'
Sextus Empiricus

คำตอบ:


19

Jacob Bernoulli (~ 1700) - John Arbuthnot (1710) - Nicolaus Bernoulli (1710s) - Abraham de Moivre (1718)

กรณีของArbuthnot 1 ดูคำอธิบายในหมายเหตุด้านล่างนี้นอกจากนี้ยังสามารถอ่านได้ในหลักคำสอนของโอกาสของเดอมัยฟอร์(2261) จากหน้า 251-254ที่ขยายแนวความคิดนี้ต่อไป

De Moivre สร้างสองขั้นตอน / ความก้าวหน้า:

  1. การประมาณค่าปกติของการแจกแจงแบบเบอร์นูลีซึ่งช่วยในการคำนวณความน่าจะเป็นสำหรับผลลัพธ์ที่อยู่ภายในหรือนอกช่วงที่กำหนด ในส่วนก่อนหน้าตัวอย่างเกี่ยวกับกรณีของ Arbuthnot, de Moivre เขียนเกี่ยวกับการประมาณค่าของเขา (ตอนนี้เรียกว่าการแจกแจงแบบเกาส์ / ปกติ) สำหรับการแจกแจงเบอร์นูลลี การประมาณนี้ช่วยให้สามารถคำนวณค่า p (ซึ่ง Arbuthnot ไม่สามารถทำได้)

  2. ลักษณะทั่วไปของการโต้แย้งของอาร์บุธนอท เขากล่าวว่า "วิธีการให้เหตุผลนี้อาจนำไปใช้อย่างเป็นประโยชน์ในการสอบถามที่น่าสนใจอื่น ๆ " (ซึ่งอาจให้เครดิตบางส่วนแก่ de Moivre เพื่อดูการบังคับใช้โดยทั่วไปของการโต้แย้ง)


  • อ้างอิงจากสเดอมอยร์จาค็อบเบอร์นูลีเขียนถึงปัญหานี้ในArs Conjectandi ของเขา De Moivre ตั้งชื่อเป็นภาษาอังกฤษว่า 'การกำหนดขีด จำกัด ภายในความน่าจะเป็นของเหตุการณ์อาจเข้าใกล้ความน่าจะเป็นที่กำหนดโดยการทำซ้ำการทดลองซ้ำ ๆ แต่ข้อความต้นฉบับโดย Bernouilli เป็นภาษาละติน ฉันไม่ทราบว่าละตินเพียงพอที่จะสามารถคิดออกได้ว่าเบอร์นูลลีกำลังเขียนเกี่ยวกับแนวคิดเช่นค่า p หรือมากกว่าเช่นกฎของจำนวนมาก สิ่งที่น่าสนใจคือ Bernouilli อ้างว่ามีความคิดเหล่านี้เป็นเวลา 20 ปี (และปี 1713 ก็ได้รับการตีพิมพ์หลังจากที่เขาเสียชีวิต 1705 ดังนั้นจึงดูเหมือนว่าจะนำหน้าวันที่ 1710 ที่กล่าวถึงในความคิดเห็นโดย @Glen_b สำหรับ Arbuthnot)

  • แหล่งหนึ่งของแรงบันดาลใจสำหรับ de Moivre คือ Nicolaus Bernouilli ซึ่งในปี 1712/1713 ได้ทำการคำนวณความน่าจะเป็นของจำนวนเด็กชายที่เกิดมาไม่น้อยกว่า 7037 และไม่ใหญ่กว่า 7363 เมื่อ 14,000 เป็นจำนวนเด็กที่เกิดทั้งหมดและ ความน่าจะเป็นของเด็กชายคือ 18/35

    (ตัวเลขสำหรับปัญหานี้อยู่บนพื้นฐานของ 80 ปีของสถิติสำหรับลอนดอน. เขาเขียนเกี่ยวกับเรื่องนี้ในจดหมายถึงปิแอร์เรย์มอนด์เดอ Montmort ตีพิมพ์ในฉบับที่สอง (1713) ของ Montmort ของเรียงความ d'วิเคราะห์ sur les โชว์เดออันตราย .)

    การคำนวณที่ฉันไม่ได้ติดตามได้กลายเป็นความน่าจะเป็นที่ 43.58 ต่อ 1 (การใช้คอมพิวเตอร์ที่รวมความน่าจะเป็นเทอมทั้งหมดของทวินามจาก 7037 ถึง 7363 ฉันได้รับ 175: 1 ดังนั้นฉันอาจตีความการทำงาน / การคำนวณของเขาผิด )


1: John Arbuthnot เขียนเกี่ยวกับกรณีนี้ในอาร์กิวเมนต์สำหรับแผนการของพระเจ้าซึ่งนำมาจากความสม่ำเสมอที่สังเกตได้ในการเกิดของทั้งสองเพศ (1710)

128214836000000000000000000000

Arbuthnot: ดังนั้นโอกาสของ A จะใกล้เคียงกับปริมาณที่น้อยมากอย่างน้อยก็น้อยกว่าเศษส่วนที่กำหนดได้ จากที่ใดมันจะตามมาว่าเป็นศิลปะไม่ใช่โอกาสที่จะควบคุม


เขียนโดยStackExchangeStrike


อาจเป็นไปได้ว่าประวัติความเป็นไปได้ของการผกผันโดย Andrew Dale อาจช่วยได้มากขึ้น (ในการค้นหาคำแปลของ Bernoulli ฉันพบว่าเขาแปลเนื้อเรื่องที่เกี่ยวข้องที่กล่าวถึงโดย de Moivre) ในวันแรก ๆ ความน่าจะเป็นแบบผกผันซึ่งตอนนี้ถือว่าเป็นเทคนิคแบบเบย์มากขึ้นอาจเป็นเครื่องมือที่ใช้บ่อยในการตีความและการใช้งาน
Sextus Empiricus

3

ฉันมีสามลิงค์ที่สนับสนุน / ข้อโต้แย้งที่สนับสนุนวันที่ ~ 1600-1650 สำหรับสถิติที่พัฒนาขึ้นอย่างเป็นทางการและเร็วกว่านั้นสำหรับการใช้ความน่าจะเป็น

หากคุณยอมรับการทดสอบสมมุติฐานเป็นพื้นฐานการคาดการณ์ความน่าจะเป็นพจนานุกรมพจนานุกรมออนไลน์จะเสนอสิ่งนี้:

" สมมติฐาน (n.)

1590s "คำสั่งเฉพาะ" 1650s, "ข้อเสนอ, สันนิษฐานและนำไปใช้เพื่อรับ, ใช้เป็นหลักฐาน," จากภาษาฝรั่งเศสกลางและโดยตรงจากสมมติฐานละตินตอนปลาย, จากสมมติฐานภาษากรีก "ฐาน, รากฐาน, รากฐาน," ดังนั้นในการขยายการใช้ "พื้นฐานของการโต้แย้ง, การคาดคะเน "ตัวอักษร" การวางภายใต้ "จาก hypo-" ภายใต้ "(ดู hypo-) + วิทยานิพนธ์" การวางข้อเสนอ "(จากรูปแบบ reduplicated ในรูปแบบของราก PIE * dhe-" การตั้งค่าวาง ") คำศัพท์ทางตรรกะ ความรู้สึกทางวิทยาศาสตร์แคบลงมาจากยุค 1640 "

ข้อเสนอWiktionary :

"บันทึกมาตั้งแต่ปี 2139 จากภาษาฝรั่งเศสกลางจากสมมติฐานละตินตอนปลายจากภาษากรีกโบราณ h (hupóthesis," ฐาน, พื้นฐานของการโต้แย้ง, การคาดคะเน "), ตัวอักษร" วางใต้ ", จากὑποτίθημι (hupotíthēmi," ฉันตั้งค่า ก่อนหน้าแนะนำ”) จากὑπό (hupó,“ ด้านล่าง”) + τίθημι (títhēmi,“ ฉันใส่, วาง”)

คำนามสมมติฐาน (พหูพจน์สมมุติฐาน)

(วิทยาศาสตร์) ใช้อย่างหลวม ๆ การคาดเดาเบื้องต้นอธิบายการสังเกตปรากฏการณ์หรือปัญหาทางวิทยาศาสตร์ที่สามารถทดสอบได้โดยการสังเกตเพิ่มเติมการสืบสวนและ / หรือการทดลอง ในฐานะศัพท์ทางวิทยาศาสตร์ให้ดูใบเสนอราคาที่แนบมา เปรียบเทียบกับทฤษฎีและใบเสนอราคาที่นั่น ใบเสนอราคา▲

  • 2548, Ronald H. Pine, http://www.csicop.org/specialarticles/show/intelligent_design_or_no_model_creationism , 15 ตุลาคม 2548:

    มีคนจำนวนมากเกินไปที่ได้รับการสอนในโรงเรียนว่านักวิทยาศาสตร์ในการพยายามคิดอะไรบางอย่างก่อนอื่นจะเกิดขึ้นกับ "สมมติฐาน" (การเดาหรือการคาดเดา - ไม่จำเป็นต้องแม้แต่การเดา "การศึกษา") ... [แต่ t] เขาใช้คำว่า "สมมุติฐาน" ในทางวิทยาศาสตร์โดยเฉพาะเหตุผลที่สมเหตุสมผลสมเหตุสมผลคำอธิบายที่ให้ความรู้เกี่ยวกับเหตุผลว่าทำไมปรากฏการณ์บางอย่างจึงเกิดขึ้นหรือเกิดขึ้น สมมติฐานสามารถเป็นยังไม่ทดลอง; สามารถผ่านการทดสอบแล้ว; อาจได้รับการปลอมแปลง; อาจยังไม่ได้รับการปลอมแปลงแม้ว่าจะผ่านการทดสอบแล้ว หรืออาจได้รับการทดสอบในรูปแบบมากมายนับไม่ถ้วนเวลาโดยไม่ต้องปลอมแปลง; และอาจเป็นที่ยอมรับในระดับสากลโดยชุมชนวิทยาศาสตร์ ความเข้าใจในคำว่า "สมมุติฐาน" ที่ใช้ในวิทยาศาสตร์ต้องเข้าใจหลักการที่แฝงอยู่ใน ความคิดของมีดโกนและคาร์ลตกใจประหลาดเกี่ยวกับ "ความผิดพลาดได้" - รวมถึงความคิดที่ว่าสมมติฐานทางวิทยาศาสตร์ใด ๆ ที่น่านับถือต้องโดยหลักการแล้วต้องเป็น "ความสามารถในการ" ที่พิสูจน์แล้วว่าผิด ไม่มีใครสามารถพิสูจน์ได้ว่าเป็นจริง แง่มุมหนึ่งของความเข้าใจที่ถูกต้องของคำว่า "สมมุติฐาน" ที่ใช้ในวิทยาศาสตร์คือว่ามีเพียงไม่กี่เปอร์เซ็นต์ของสมมติฐานที่อาจจะกลายเป็นทฤษฎีหายไป "

เกี่ยวกับความน่าจะเป็นและสถิติที่ Wikipediaมอบให้:

" การรวบรวมข้อมูล

การสุ่มตัวอย่าง

เมื่อไม่สามารถรวบรวมข้อมูลการสำรวจสำมะโนประชากรแบบเต็มนักสถิติจะรวบรวมข้อมูลตัวอย่างโดยการพัฒนาการออกแบบการทดลองที่เฉพาะเจาะจงและตัวอย่างการสำรวจ สถิติเองยังมีเครื่องมือสำหรับการทำนายและพยากรณ์ผ่านตัวแบบสถิติ ความคิดของการหาข้อสรุปจากข้อมูลตัวอย่างที่จะเริ่มต้นรอบกลาง-1600 ในการเชื่อมต่อกับการประมาณประชากรและการพัฒนาสารตั้งต้นของการประกันชีวิต (อ้างอิง: Wolfram, Stephen (2002). วิทยาศาสตร์ชนิดใหม่. Wolfram Media, Inc. p. 1,082. ไอ 1-57955-008-8)

ในการใช้ตัวอย่างเป็นแนวทางสำหรับประชากรทั้งหมดเป็นสิ่งสำคัญที่จะต้องแสดงถึงประชากรโดยรวมอย่างแท้จริง การสุ่มตัวอย่างที่เป็นตัวแทนทำให้มั่นใจได้ว่าการอนุมานและข้อสรุปสามารถขยายจากกลุ่มตัวอย่างเป็นประชากรโดยรวม ปัญหาสำคัญอยู่ที่การพิจารณาว่าตัวอย่างที่เลือกนั้นเป็นตัวแทนจริงหรือไม่ สถิติเสนอวิธีการประเมินและแก้ไขอคติใด ๆ ภายในตัวอย่างและขั้นตอนการรวบรวมข้อมูล นอกจากนี้ยังมีวิธีการออกแบบการทดลองสำหรับการทดลองที่สามารถลดปัญหาเหล่านี้เมื่อเริ่มการศึกษาเสริมสร้างความสามารถในการมองเห็นความจริงเกี่ยวกับประชากร

ทฤษฎีการสุ่มตัวอย่างเป็นส่วนหนึ่งของวินัยทางคณิตศาสตร์ของทฤษฎีความน่าจะเป็น ความน่าจะเป็นที่ใช้ในสถิติทางคณิตศาสตร์เพื่อศึกษาการแจกแจงตัวอย่างของสถิติตัวอย่างและโดยทั่วไปแล้วคุณสมบัติของกระบวนการทางสถิติ การใช้วิธีการทางสถิติใด ๆ ที่ถูกต้องเมื่อระบบหรือประชากรภายใต้การพิจารณาเป็นไปตามสมมติฐานของวิธีการ ความแตกต่างในมุมมองระหว่างทฤษฎีความน่าจะเป็นแบบคลาสสิกและทฤษฎีการสุ่มตัวอย่างคือประมาณว่าทฤษฎีความน่าจะเป็นนั้นเริ่มต้นจากพารามิเตอร์ที่กำหนดของประชากรทั้งหมดเพื่ออนุมานความน่าจะเป็นที่เกี่ยวข้องกับกลุ่มตัวอย่าง อนุมานทางสถิติ แต่การเคลื่อนไหวในทิศทางที่ตรงข้าม - inductively อนุมานจากตัวอย่างพารามิเตอร์ของประชากรขนาดใหญ่หรือทั้งหมด

จาก "Wolfram, Stephen (2002). วิทยาศาสตร์ชนิดใหม่. Wolfram Media, Inc. p. 1,082":

"การวิเคราะห์ทางสถิติ

•ประวัติ การคำนวณราคาต่อรองสำหรับเกมแห่งโอกาสนั้นเกิดขึ้นแล้วในสมัยโบราณ จุดเริ่มต้นของยุค 1200ผลลัพธ์ที่ซับซ้อนมากขึ้นตามการคำนวณความน่าจะเป็นที่ได้รับจากการรวมตัวกันของนักมานุษยวิทยาและนักคณิตศาสตร์ด้วยวิธีการที่ถูกต้องอย่างเป็นระบบซึ่งพัฒนาขึ้นในช่วงกลางปี ​​1600 และต้นปี 1700. แนวคิดของการอนุมานจากข้อมูลตัวอย่างเกิดขึ้นในช่วงกลางปี ​​1600 ที่เกี่ยวข้องกับการประเมินประชากรและการพัฒนาผู้นำของการประกันชีวิต วิธีการหาค่าเฉลี่ยเพื่อแก้ไขสิ่งที่สันนิษฐานว่าเป็นข้อผิดพลาดแบบสุ่มของการสังเกตเริ่มใช้เป็นหลักในช่วงกลางทศวรรษที่ 1700 ในขณะที่กำลังสองน้อยที่สุดที่เหมาะสม รูปแบบสุ่มระหว่างบุคคลเริ่มมีการนำไปใช้ในชีววิทยาในช่วงกลางปี ​​1800 และวิธีการคลาสสิกจำนวนมากที่ใช้ในการวิเคราะห์ทางสถิติได้รับการพัฒนาในปลายปี 1800 และต้นปี 1900 ในบริบทของการวิจัยทางการเกษตร ในแบบจำลองความน่าจะเป็นพื้นฐานทางฟิสิกส์เป็นหัวใจสำคัญของการนำกลศาสตร์สถิติมาใช้ในปลายปี 1800 และกลศาสตร์ควอนตัมในต้นปี 1900

แหล่งอื่น ๆ :

"รายงานนี้ส่วนใหญ่ไม่ใช่คำศัพท์ทางคณิตศาสตร์กำหนดค่า p สรุปต้นกำเนิดประวัติศาสตร์ของวิธีการค่า p เพื่อทดสอบสมมติฐานอธิบายการใช้งานต่างๆของp≤0.05ในบริบทของการวิจัยทางคลินิกและอธิบายการเกิดขึ้นของp≤ 5 × 10−8 และค่าอื่น ๆ เป็นเกณฑ์สำหรับการวิเคราะห์เชิงสถิติจีโนม "

ส่วน "ต้นกำเนิดประวัติศาสตร์" ระบุ:

[1]

[1] Arbuthnott J. อาร์กิวเมนต์ของพระเจ้าพรอวิเดนซ์ซึ่งนำมาจากการสังเกตอย่างสม่ำเสมออย่างต่อเนื่องในการเกิดของทั้งสองเพศ Phil Trans 1710; 27: 186–90 ดอย: 10.1098 / rstl.1710.0011 เผยแพร่เมื่อวันที่ 1 มกราคม 1710

"P-values ​​มีการแพทย์และสถิติที่เชื่อมโยงกันมานาน John Arbuthnot และ Daniel Bernoulli เป็นทั้งแพทย์นอกเหนือจากการเป็นนักคณิตศาสตร์และการวิเคราะห์อัตราส่วนเพศที่เกิด (Arbuthnot) และการเอียงของวงโคจรของดาวเคราะห์ (Bernoulli) ให้ทั้งสอง ตัวอย่างที่มีชื่อเสียงที่สุดของการทดสอบความสำคัญหากแพร่หลายในวารสารทางการแพทย์เป็นมาตรฐานที่พวกเขาได้รับการตัดสินค่า P- ยังเป็นที่นิยมอย่างมากกับวิชาชีพแพทย์ในทางกลับกันพวกเขาจะต้อง คำติชมอย่างสม่ำเสมอจากนักสถิติและปกป้องอย่างไม่เต็มใจเท่านั้นตัวอย่างเช่นเมื่อสิบปีก่อนที่นักชีวสถิติที่มีชื่อเสียงโด่งดังมาร์ตินการ์ดเนอร์และดั๊กอัลท์แมน5 - 7145789ร่วมกับเพื่อนร่วมงานคนอื่น ๆ จัดทำแคมเปญที่ประสบความสำเร็จเพื่อโน้มน้าววารสารการแพทย์ของอังกฤษเพื่อให้ความสำคัญกับค่า P-P น้อยลงและมีความมั่นใจมากขึ้น วารสารระบาดวิทยาได้สั่งห้ามพวกเขาโดยสิ้นเชิง เมื่อเร็ว ๆ นี้การโจมตีได้ปรากฏตัวขึ้นแม้ในสื่อ{} ค่า P จึงดูเหมือนจะเป็นวิชาที่เหมาะสมสำหรับวารสารระบาดวิทยาและชีวสถิติ บทความนี้แสดงถึงมุมมองส่วนตัวของสิ่งที่อาจมีการพูดเพื่อปกป้องพวกเขา10,11

ฉันจะเสนอการป้องกันแบบ จำกัด ของค่า P เท่านั้น ... "

อ้างอิง

1 Hald A. A history of probability and statistics and their appli- cations before 1750. New York: Wiley, 1990.
2 Shoesmith E, Arbuthnot, J. In: Johnson, NL, Kotz, S, editors. Leading personalities in statistical sciences. New York: Wiley, 1997:7–10. 
3 Bernoulli, D. Sur le probleme propose pour la seconde fois par l’Acadamie Royale des Sciences de Paris. In: Speiser D,
editor. Die Werke von Daniel Bernoulli, Band 3, Basle:
Birkhauser Verlag, 1987:303–26. 
4 Arbuthnot J. An argument for divine providence taken from
the constant regularity observ’d in the births of both sexes. Phil Trans R Soc 1710;27:186–90. 
5 Freeman P. The role of P-values in analysing trial results. Statist Med 1993;12:1443 –52. 
6 Anscombe FJ. The summarizing of clinical experiments by
significance levels. Statist Med 1990;9:703 –8.
7 Royall R. The effect of sample size on the meaning of signifi- cance tests. Am Stat 1986;40:313 –5.
8 Senn SJ. Discussion of Freeman’s paper. Statist Med
1993;12:1453 –8.
9 Gardner M, Altman D. Statistics with confidence. Br Med J
1989.
10 Matthews R. The great health hoax. Sunday Telegraph 13
September, 1998. 
11 Matthews R. Flukes and flaws. Prospect 20–24, November 1998.

@Martijn Weterings : "เป็น Pearson ในปี 1900 การฟื้นฟูหรือแนวคิดนี้ (บ่อย) ปรากฏก่อนหน้านี้อย่างไร Jacob Bernoulli คิดอย่างไรเกี่ยวกับ 'ทฤษฎีบททองคำ' ของเขาในความรู้สึกบ่อยหรือในความหมาย Bayesian (Ars Conjectandi บอกอะไรและเป็นอย่างไร มีแหล่งที่มาเพิ่มเติม)?

สมาคมสถิติอเมริกันมีหน้าเว็บเกี่ยวกับประวัติความเป็นมาของสถิติซึ่งพร้อมด้วยข้อมูลนี้มีโปสเตอร์ (ทำซ้ำในส่วนด้านล่าง) ชื่อ "เส้นเวลาของสถิติ"

  • โฆษณา 2: หลักฐานการสำรวจสำมะโนประชากรเสร็จในช่วงราชวงศ์ฮั่นรอด

  • 1500s: Girolamo Cardano คำนวณความน่าจะเป็นของการทอยลูกเต๋าแบบต่างๆ

  • 1600s: Edmund Halley เกี่ยวข้องกับอัตราการตายถึงอายุและพัฒนาตารางมรณะ

  • 1700s: Thomas Jefferson นำการสำรวจสำมะโนประชากรของสหรัฐครั้งแรก

  • 1839: สมาคมสถิติอเมริกันถูกสร้างขึ้น

  • 1894: คำว่า "เบี่ยงเบนมาตรฐาน" ถูกนำมาใช้โดย Karl Pearson

  • 1935: RA Fisher เผยแพร่การออกแบบการทดลอง

เส้นเวลาบางส่วนของสถิติ

ในส่วน "ประวัติศาสตร์" ของเว็บเพจ " กฎจำนวนมาก " ของวิกิพีเดียมันอธิบาย:

"นักคณิตศาสตร์ชาวอิตาลีGerolamo Cardano (1501–1576)ระบุโดยไม่มีข้อพิสูจน์ว่าค่าความถูกต้องของสถิติเชิงประจักษ์มีแนวโน้มที่จะดีขึ้นตามจำนวนการทดลอง นี่คือกรงเล็บเป็นกฎจำนวนมากแล้ว รูปแบบพิเศษของ LLN (สำหรับตัวแปรสุ่มเลขฐานสอง) ได้รับการพิสูจน์ครั้งแรกโดย Jacob Bernoulli เขาใช้เวลากว่า 20 ปีในการพัฒนาหลักฐานทางคณิตศาสตร์อย่างเข้มงวดซึ่งตีพิมพ์ใน Ars Conjectandi ของเขา (The Art of Conjecturing) ในปี ค.ศ. 1713 ในปี 1713 เขาตั้งชื่อทฤษฎีบททองคำว่า "ทฤษฎีบทของเบอร์นูลลี" สิ่งนี้ไม่ควรสับสนกับหลักการของเบอร์นูลลีซึ่งตั้งตามชื่อหลานชายของจาค็อบเบอร์นูลลี Daniel Bernoulli ในปี 1837 SD Poisson อธิบายเพิ่มเติมภายใต้ชื่อ "la loi des grands nombres" ("กฎหมายจำนวนมาก") หลังจากนั้นก็เป็นที่รู้จักกันภายใต้ชื่อทั้งสอง แต่ "

หลังจาก Bernoulli และ Poisson ตีพิมพ์ความพยายามนักคณิตศาสตร์คนอื่น ๆ ก็มีส่วนช่วยในการปรับแต่งกฎหมายเช่น Chebyshev, Markov, Borel, Cantelli และ Kolmogorov และ Khinchin "


คำถาม: เพียร์สันเป็นคนแรกที่คิดค่า p หรือไม่?

ไม่อาจจะไม่

ใน " ถ้อยแถลงของ ASA เรื่องค่า p: บริบทกระบวนการและวัตถุประสงค์ " (09 มิ.ย. 2559) โดย Wasserstein และ Lazar, doi: 10.1080 / 00031305.2016.1154108มีแถลงการณ์อย่างเป็นทางการเกี่ยวกับคำนิยามของ p-value (ซึ่งไม่มี สงสัยไม่ได้ตกลงกันโดยทุกสาขาใช้หรือปฏิเสธค่า p) ซึ่งอ่าน:

" p-Value คืออะไร

อย่างไม่เป็นทางการ p-value คือความน่าจะเป็นภายใต้แบบจำลองทางสถิติที่ระบุว่าการสรุปทางสถิติของข้อมูล (เช่นตัวอย่างความแตกต่างเฉลี่ยระหว่างกลุ่มเปรียบเทียบสองกลุ่ม) จะเท่ากับหรือมากเกินกว่าค่าที่สังเกตได้

3. หลักการ

...

6.ค่า p-value ไม่ได้ให้หลักฐานที่ดีเกี่ยวกับแบบจำลองหรือสมมติฐาน

นักวิจัยควรตระหนักว่าค่า p โดยไม่มีบริบทหรือหลักฐานอื่นให้ข้อมูลที่ จำกัด ตัวอย่างเช่นค่า p-0.05 ใกล้ที่นำเสนอด้วยตัวเองมีหลักฐานที่อ่อนแอเพียงอย่างเดียวต่อสมมติฐานว่าง ในทำนองเดียวกัน p-value ที่ค่อนข้างใหญ่ไม่ได้หมายความถึงหลักฐานที่สนับสนุนสมมติฐานว่าง; สมมติฐานอื่น ๆ อีกมากมายอาจจะเท่าเทียมกันหรือมากกว่านั้นสอดคล้องกับข้อมูลที่สังเกตได้ ด้วยเหตุผลเหล่านี้การวิเคราะห์ข้อมูลจึงไม่ควรจบด้วยการคำนวณค่า p เมื่อแนวทางอื่นเหมาะสมและเป็นไปได้ ".

การปฏิเสธสมมติฐานว่างอาจเกิดขึ้นก่อนเพียร์สัน

หน้า Wikipedia เกี่ยวกับตัวอย่างแรกของสถานะการทดสอบสมมติฐานว่าง :

ตัวเลือกแรกของสมมติฐานว่าง

Paul Meehl แย้งว่าความสำคัญของญาณวิทยาของการเลือกสมมติฐานว่างเปล่านั้นไม่ได้รับการยอมรับอย่างมาก เมื่อสมมติฐานว่างถูกทำนายโดยทฤษฎีการทดสอบที่แม่นยำยิ่งขึ้นจะเป็นการทดสอบที่รุนแรงยิ่งขึ้นของทฤษฎีพื้นฐาน เมื่อสมมติฐานว่างเริ่มต้นที่ "ไม่แตกต่าง" หรือ "ไม่มีผล" การทดสอบที่แม่นยำยิ่งขึ้นคือการทดสอบที่รุนแรงน้อยกว่าของทฤษฎีที่กระตุ้นการทดลอง การตรวจสอบต้นกำเนิดของการปฏิบัติหลังอาจเป็นประโยชน์:

1778: Pierre Laplace เปรียบเทียบวันเกิดของเด็กชายและเด็กหญิงในหลายเมืองในยุโรป เขากล่าวว่า: "เป็นเรื่องธรรมดาที่จะสรุปว่าความเป็นไปได้เหล่านี้เกือบจะอยู่ในอัตราส่วนเดียวกัน" ดังนั้นสมมุติฐานของ Laplace ที่ว่าต้นกำเนิดของเด็กชายและเด็กหญิงควรได้รับเท่าเทียมกัน "ภูมิปัญญาดั้งเดิม"

2443: คาร์ลเพียร์สันพัฒนาการทดสอบไคสแควร์เพื่อตัดสินว่า "รูปแบบของเส้นโค้งความถี่ที่ระบุจะอธิบายตัวอย่างที่ดึงมาจากประชากรที่กำหนดได้อย่างมีประสิทธิภาพหรือไม่" ดังนั้นสมมุติฐานว่างก็คือประชากรถูกอธิบายโดยการแจกแจงบางอย่างที่ทำนายไว้โดยทฤษฎี เขาใช้เป็นตัวอย่างตัวเลขห้าและหกในลูกเต๋า Weldon โยนข้อมูล

2447: คาร์ลเพียร์สันพัฒนาแนวคิดของ "ฉุกเฉิน" เพื่อตรวจสอบว่าผลลัพธ์ที่เป็นอิสระจากปัจจัยหมวดหมู่ที่กำหนด ที่นี่สมมติฐานว่างเป็นค่าเริ่มต้นว่าสองสิ่งที่ไม่เกี่ยวข้อง (เช่นการก่อรอยแผลเป็นและอัตราการตายจากไข้ทรพิษ) สมมุติฐานว่างในกรณีนี้ไม่ได้ถูกทำนายโดยทฤษฎีหรือภูมิปัญญาดั้งเดิม แต่แทนที่จะเป็นหลักการของความไม่แยแสที่ทำให้ฟิชเชอร์และคนอื่น ๆ ยกเลิกการใช้ "ความน่าจะเป็นแบบผกผัน"

แม้จะมีบุคคลใดก็ตามที่ได้รับเครดิตจากการปฏิเสธสมมติฐานว่าง แต่ฉันไม่คิดว่ามันสมเหตุสมผลที่จะติดป้ายชื่อพวกเขาว่า " ค้นพบความสงสัยตามการคำนวณทางคณิตศาสตร์ที่อ่อนแอ"


ฉันได้ค้นหางานจาก Daniel Bernouilli (ฉบับที่สองคือ 1,808 แต่งานตัวเองมาจาก 1734) "RECHERCHES PHYSYQUES ET ASTRONOMIQUES, sur le problèmeเสนอ la la la la la cédémie Royale des Sciences de Paris: Quelle est la la la la la la ก่อให้เกิดร่างกาย de l'inclinaison des แผน des Orbites des Planetes ที่ตราไว้หุ้นแผนสามัคคี au de l'Equateur de la révolution du Soleil Autour de ลูกชายขวาน. et d'où vient que les inclinaisons เด CES Orbites ฉากdifférentes entre Elles E-rara ch / zut / wihibe / content / titleinfo / 13426461
Sextus Empiricus

กล่าวถึงสิ่งที่ต้องการน่าจะเป็นที่ความชอบของทุกหกดาวเคราะห์เกิดขึ้นในเดียวกันของ 17 ภาคซึ่งเป็น 5 มันคือการคำนวณความน่าจะเป็น แต่ก็มีค่า p ไม่มาก 1:175
Sextus Empiricus
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.