คำถามติดแท็ก history

คำถามเกี่ยวกับประวัติของสถิติ

6
ฉันจะค้นพบการกระจายตัวแบบปกติได้อย่างไร?
อะไรคือการสืบทอดครั้งแรกของการแจกแจงแบบปกติคุณสามารถทำซ้ำสิ่งที่ได้มาและอธิบายในบริบททางประวัติศาสตร์ได้ไหม ฉันหมายความว่าถ้ามนุษยชาติลืมเกี่ยวกับการแจกแจงแบบปกติวิธีที่น่าจะเป็นไปได้ที่ฉันจะค้นพบมันอีกครั้งและสิ่งที่น่าจะเป็นไปได้มากที่สุดคืออะไร? ฉันเดาว่าการพิสูจน์ครั้งแรกต้องมาเป็นผลพลอยได้จากการพยายามหาวิธีที่รวดเร็วในการคำนวณการแจกแจงความน่าจะเป็นแบบไม่ต่อเนื่องขั้นพื้นฐานเช่นทวินาม ถูกต้องหรือไม่

1
ต้นกำเนิดของสัญกรณ์สไตล์วิลกินสันเช่น (1 | id) สำหรับเอฟเฟกต์แบบสุ่มในสูตรโมเดลผสมใน R
สูตรโมเดลใน R เช่น y ~ x + a*b + c:d จะขึ้นอยู่กับที่เรียกว่าสัญกรณ์วิลกินสัน : วิลกินสันและโรเจอร์ส 1973 สัญลักษณ์คำอธิบายของปัจจัยรุ่นสำหรับการวิเคราะห์ความแปรปรวน บทความนี้ไม่ได้กล่าวถึงสัญลักษณ์สำหรับรุ่นผสม (ซึ่งอาจไม่มีอยู่ในตอนนั้น) ดังนั้นสูตรผสมโมเดลที่ใช้ในlme4และแพ็คเกจที่เกี่ยวข้องใน R เช่น y ~ x + a*b + c:d + (1|school) + (a*b||town) มาจาก? ใครแนะนำพวกเขาเป็นครั้งแรกและเมื่อไหร่ มีข้อตกลงใด ๆ เช่นคำว่า "สัญกรณ์วิลกินสัน" สำหรับพวกเขาหรือไม่? ฉันหมายถึงเฉพาะเงื่อนไขเช่น (model formula | grouping variable) (model formula || grouping variable)

2
สุดยอดแห่งการเรียนรู้ทั่วไปจากข้อมูลใน '69
ฉันพยายามที่จะเข้าใจบริบทของ Minsky และ Papert book ชื่อ "Perceptrons" ที่มีชื่อเสียงตั้งแต่ปี 1969 ดังนั้นจึงมีความสำคัญต่อเครือข่ายประสาท เท่าที่ฉันรู้แล้วยังไม่มีอัลกอริทึมการเรียนรู้แบบมีผู้ควบคุมอื่นยกเว้นสำหรับ perceptron: ต้นไม้ตัดสินใจเริ่มมีประโยชน์จริง ๆ ในปลายปี 70s ป่าสุ่มและ SVM เป็น 90s ดูเหมือนว่าวิธี jackknife เป็นที่รู้จักกันอยู่แล้ว แต่ไม่ได้ตรวจสอบ k-cross (70s) หรือ bootstrap (1979?) Wikipedia กล่าวว่ากรอบสถิติแบบคลาสสิกของ Neyman-Pearson และ Fisher ยังคงไม่เห็นด้วยใน '50s แม้ว่าจะมีความพยายามครั้งแรกในการอธิบายทฤษฎีลูกผสมอยู่ใน' 40s ดังนั้นคำถามของฉัน: อะไรคือวิธีการที่ทันสมัยของการแก้ปัญหาทั่วไปของการทำนายจากข้อมูล?

1
มีใครนอกเหนือจาก Egon Pearson ที่เข้าถึงกระดาษของ Gosset ในปี 1904?
มีใครนอกเหนือจาก Egon Pearson ที่เข้าถึง 1904 รายงานของ William Sealy Gosset "การประยุกต์ใช้ 'กฎข้อผิดพลาด' ในการทำงานของโรงเบียร์" หรือไม่? ฉันเดาว่ามันเป็นทรัพย์สินของกินเนสส์ แต่ด้วยความสำคัญทางประวัติศาสตร์มันคงเป็นเรื่องที่น่าสนใจมากหากใครบางคนรู้ว่าจะเอามือไปทำอะไร

2
ทำไมจึงเรียกว่าส่วนเบี่ยงเบน "มาตรฐาน"
ฉันมีคำถามที่เรียบง่ายและอาจเห็นได้ชัดว่าทำไมค่าเบี่ยงเบนมาตรฐานจึงเรียกว่า " มาตรฐาน " เป็นเพราะมันเป็นมาตรฐานการเปรียบเทียบชุดข้อมูลและผลลัพธ์ที่เกี่ยวกับการกระจายตัวของพวกเขา? การค้นหาใน Exchange Exchange ไม่ได้ทำให้เกิดคำถามนี้ขึ้นและการค้นหาโดย Google ในนิรุกติศาสตร์ของคำนั้นให้คุณค่าอย่างมาก

4
เรื่องราวสงครามที่การตัดสินใจผิดพลาดนั้นขึ้นอยู่กับข้อมูลทางสถิติ?
ฉันคิดว่ามันยุติธรรมที่จะบอกว่าสถิติเป็นวิทยาศาสตร์ประยุกต์ดังนั้นเมื่อมีการคำนวณค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานมันเป็นเพราะมีใครบางคนกำลังมองหาการตัดสินใจบางอย่างขึ้นอยู่กับตัวเลขเหล่านั้น ส่วนหนึ่งของการเป็นนักสถิติที่ดีฉันก็หวังว่าจะสามารถ "รับรู้" ได้เมื่อข้อมูลตัวอย่างสามารถเชื่อถือได้และเมื่อการทดสอบทางสถิติบางอย่างบิดเบือนความจริงในข้อมูลจริงที่เราสนใจเป็นโปรแกรมเมอร์ที่สนใจในการวิเคราะห์ ชุดข้อมูลขนาดใหญ่ฉันกำลังเรียนรู้สถิติและทฤษฎีความน่าจะเป็นบางอย่าง แต่ฉันไม่สามารถสั่นคลอนความรู้สึกที่ดุด่าว่าหนังสือทุกเล่มที่ฉันดูเป็นเหมือนนักการเมืองที่ลุกขึ้นมาบนเวทีและพูดสิ่งต่าง ๆ ทั้งหมดแล้วต่อท้าย ข้อจำกัดความรับผิดชอบต่อไปนี้ในตอนท้ายของคำพูดของพวกเขา: ตอนนี้ฉันไม่ได้พูดว่ามันดีหรือไม่ดี แต่ตัวเลขบอกว่ามันดีดังนั้นคุณควรโหวตให้ฉัน บางทีคุณอาจได้รับสิ่งนั้น แต่บางทีคุณอาจไม่ได้คำถามนี้ ฉันจะไปหาเรื่องราวสงครามโดยนักสถิติที่การตัดสินใจบางอย่างอยู่บนพื้นฐานของข้อมูลทางสถิติที่ภายหลังกลายเป็นผิดอย่างสมบูรณ์?

1
มีวิธีการทางสถิติใดที่ล้าสมัยและควรละเว้นจากตำราเรียน [ปิด]
ตามที่เป็นอยู่ในปัจจุบันคำถามนี้ไม่เหมาะสำหรับรูปแบบคำถาม & คำตอบของเรา เราคาดหวังคำตอบที่จะได้รับการสนับสนุนจากข้อเท็จจริงการอ้างอิงหรือความเชี่ยวชาญ แต่คำถามนี้อาจเรียกร้องให้มีการถกเถียงอภิปรายโต้แย้งหรือการอภิปรายเพิ่มเติม หากคุณรู้สึกว่าคำถามนี้สามารถปรับปรุงและเปิดใหม่ได้โปรดไปที่ศูนย์ช่วยเหลือเพื่อขอคำแนะนำ ปิดให้บริการใน6 ปีที่ผ่านมา ในการตอบคำถามเกี่ยวกับช่วงความเชื่อมั่นสำหรับสัดส่วนทวินามฉันได้ชี้ให้เห็นข้อเท็จจริงที่ว่าการประมาณปกติเป็นวิธีที่ไม่น่าเชื่อถือซึ่งเป็นแบบโบราณ ไม่ควรสอนเป็นวิธีแม้ว่าอาจมีข้อโต้แย้งว่ามันถูกรวมเป็นส่วนหนึ่งของบทเรียนเกี่ยวกับสิ่งที่ทำให้วิธีการที่เพียงพอ อะไรคือวิธีการทางสถิติ 'มาตรฐาน' อื่น ๆ ที่ผ่านการใช้งานตามวันที่แล้วและควรละเว้นจากตำราเรียนในอนาคต (เพื่อให้มีพื้นที่สำหรับแนวคิดที่มีประโยชน์)

1
คาร์ลเพียร์สันคิดสถิติไคสแควร์อย่างไร
เพียร์สันเกิดขึ้นได้อย่างไรกับสถิติเพียร์สันไคสแควร์ในปี 1900 ที่ K~χ2K=∑(Oij−Eij)2EijK=∑(Oij−Eij)2Eij K = \sum \frac{(O_{ij} -E_{ij})^2}{E_{ij}} K∼χ2K∼χ2 K \sim \chi^2 เขาคิดแบบไคสแควร์แล้วคิดมาตรวัดKKK (วิธีการจากล่างขึ้นบน) หรือเขาคิดค่าสถิติและต่อมาพิสูจน์ว่ามันเป็นไปตามการแจกแจงไคสแควร์ (บนลงล่าง)? ฉันต้องการที่จะรู้ว่าทำไมเขาถึงเลือกว่ารูปแบบที่เฉพาะเจาะจงและไม่ได้อื่น ๆ เช่นหรือΣ | O i j - E i j | และทำไมเขาจึงแบ่งสี่เหลี่ยมกับตัวส่วน∑(Oij−Eij)2∑(Oij−Eij)2\sum(O_{ij} -E_{ij})^2∑|Oij−Eij|∑|Oij−Eij|\sum|O_{ij} -E_{ij}|

2
ต้นกำเนิดของเครือข่ายประสาทเทียม autoencoder คืออะไร?
ฉันค้นหาใน Google, Wikipedia, Google scholar และอื่น ๆ แต่ไม่พบต้นกำเนิดของ Autoencoders บางทีมันอาจเป็นหนึ่งในแนวคิดเหล่านั้นที่มีการพัฒนาอย่างค่อยเป็นค่อยไปและเป็นไปไม่ได้ที่จะย้อนกลับไปยังจุดเริ่มต้นที่ชัดเจน แต่ถึงกระนั้นฉันก็ยังอยากจะสรุปบางส่วนของขั้นตอนหลักของการพัฒนาของพวกเขา บทที่เกี่ยวกับ autoencodersในเอียน Goodfellow, โยชัวเบนจิโอและหนังสือการเรียนรู้ลึกแอรอน Courville กล่าวว่า: แนวคิดของ autoencoders เป็นส่วนหนึ่งของภูมิทัศน์ทางประวัติศาสตร์ของโครงข่ายประสาทเทียมมานานหลายทศวรรษ (LeCun, 1987; Bourlard และ Kamp, 1988; Hinton and Zemel, 1994) ตามเนื้อผ้า autoencoders ถูกนำมาใช้เพื่อลดมิติหรือการเรียนรู้คุณสมบัติ งานนำเสนอนี้โดย Pascal Vincent พูดว่า: Denoising ที่ใช้ autoencoders แบบดั้งเดิมนั้นมีการนำมาใช้ก่อนหน้านี้มาก (LeCun, 1987; Gallinari และคณะ, 1987) ซึ่งเป็นทางเลือกสำหรับเครือข่าย Hopfield (Hopfield, 1982) …

1
ในฟอเรสต์ฟอเรสต์ทำไมคุณสมบัติย่อยบางส่วนของคุณสมบัติแบบสุ่มจึงถูกเลือกที่ระดับโหนดแทนที่จะเป็นระดับต้นไม้
คำถามของฉัน:ทำไมป่าสุ่มพิจารณาย่อยสุ่มของคุณสมบัติสำหรับการแยกในระดับโหนดภายในแต่ละต้นไม้มากกว่าในระดับต้นไม้ ? ข้อมูลประกอบ:นี่เป็นคำถามเชิงประวัติ ดีบุกกามโฮตีพิมพ์บทความนี้เกี่ยวกับการสร้าง "ป่าตัดสินใจ" โดยการสุ่มเลือกชุดย่อยของคุณสมบัติที่จะใช้สำหรับการเติบโตในแต่ละต้นไม้ในปี 1998 หลายปีต่อมาในปี 2001 ลีโอเบรแมนตีพิมพ์สุ่มป่าเขาน้ำเชื้อกระดาษประเด็นเซตคุณลักษณะแบบสุ่ม เลือกที่แต่ละโหนดภายในแต่ละต้นไม่ใช่ที่แต่ละต้น ในขณะที่ Breiman อ้างถึง Ho เขาไม่ได้อธิบายการย้ายจากระดับต้นไม้ไปเป็นการเลือกคุณลักษณะแบบสุ่มในระดับโหนด ฉันสงสัยว่าอะไรเป็นแรงจูงใจในการพัฒนานี้โดยเฉพาะ ดูเหมือนว่าการเลือกชุดย่อยคุณลักษณะที่ระดับต้นไม้จะยังคงบรรลุความสัมพันธ์ที่ต้องการของต้นไม้ ทฤษฎีของฉัน:ฉันไม่ได้เห็นสิ่งนี้พูดชัดแจ้งที่อื่น แต่ดูเหมือนว่าวิธีการย่อยแบบสุ่มจะมีประสิทธิภาพน้อยกว่าในแง่ของการประเมินความสำคัญของคุณลักษณะ เพื่อให้ได้การประมาณค่าความสำคัญของตัวแปรสำหรับต้นไม้แต่ละต้นคุณลักษณะจะได้รับการพิจารณาแบบสุ่มทีละตัวและการเพิ่มขึ้นของการจำแนกประเภทหรือเพิ่มข้อผิดพลาดสำหรับการสำรวจนอกถุงจะถูกบันทึก ตัวแปรที่การจำแนกประเภทผิดพลาดหรือเพิ่มข้อผิดพลาดเป็นผลมาจากการเปลี่ยนแปลงแบบสุ่มนี้มีค่าสูงคือตัวแปรที่มีความสำคัญที่สุด ถ้าเราใช้วิธีการสุ่มสเปซสำหรับแต่ละต้นไม้เราเป็นเพียงการพิจารณาของพีคุณลักษณะ มันอาจใช้เวลาหลายต้นที่จะต้องพิจารณาทุกหน้าทำนายแม้แต่ครั้งเดียว ในทางกลับกันถ้าเราพิจารณาส่วนย่อยที่แตกต่างกันมผมของพีให้บริการในแต่ละโหนดเราจะพิจารณาแต่ละคุณลักษณะครั้งมากขึ้นหลังจากที่ต้นไม้น้อยลงทำให้เราประมาณการที่แข็งแกร่งมากขึ้นมีความสำคัญคุณลักษณะmmmppppppmimim_ippp สิ่งที่ฉันได้ดูไปแล้ว:จนถึงตอนนี้ฉันได้อ่านกระดาษของ Breiman และกระดาษของ Ho แล้วทำการค้นหาออนไลน์แบบกว้าง ๆ เพื่อเปรียบเทียบวิธีต่างๆโดยไม่ต้องค้นหาคำตอบที่ชัดเจน โปรดทราบว่าคำถามที่คล้ายกันถูกถามก่อน คำถามนี้จะเพิ่มเติมอีกเล็กน้อยโดยรวมถึงการเก็งกำไรของฉัน / ทำงานเพื่อแก้ไขปัญหาที่เป็นไปได้ ฉันจะสนใจคำตอบการอ้างอิงที่เกี่ยวข้องหรือการศึกษาแบบจำลองเปรียบเทียบสองแนวทาง หากไม่มีการเตรียมพร้อมฉันวางแผนที่จะทำการจำลองสถานการณ์ของตัวเองโดยเปรียบเทียบทั้งสองวิธี

3
ดังนั้นการกระจายเบต้า
เนื่องจากฉันแน่ใจว่าทุกคนที่นี่รู้อยู่แล้ว PDF ของการแจกแจงเบต้าX∼B(a,b)X∼B(a,b)X \sim B(a,b)มอบให้โดย f(x)=1B(a,b)xa−1(1−x)b−1f(x)=1B(a,b)xa−1(1−x)b−1f(x) = \frac{1}{B(a,b)}x^{a-1}(1-x)^{b-1} ฉันตามล่าหาสถานที่เพื่ออธิบายต้นกำเนิดของสูตรนี้ แต่ฉันหามันไม่เจอ ทุกบทความที่ฉันพบในการแจกแจงเบต้าดูเหมือนว่าจะให้สูตรนี้แสดงให้เห็นถึงรูปร่างบางส่วนของมันแล้วตรงไปยังการอภิปรายช่วงเวลาและต่อจากที่นั่น ฉันไม่ชอบใช้สูตรทางคณิตศาสตร์ที่ไม่สามารถหามาอธิบายได้ สำหรับดิสทริบิวชันอื่น ๆ (เช่นแกมม่าหรือทวินาม) มีการได้มาอย่างชัดเจนที่ฉันสามารถเรียนรู้และใช้งานได้ แต่ฉันไม่พบอะไรแบบนั้นสำหรับการแจกแจงแบบเบต้า ดังนั้นคำถามของฉันคือ: ต้นกำเนิดของสูตรนี้คืออะไร? มันจะมาจากหลักการแรกในบริบทใดก็ตามที่ถูกพัฒนามาตั้งแต่แรก? [เพื่อความกระจ่างแจ้งฉันไม่ได้ถามเกี่ยวกับวิธีการใช้การแจกแจงแบบเบต้าในสถิติแบบเบย์หรือความหมายในทางปฏิบัติในทางปฏิบัติ (ฉันได้อ่านตัวอย่างเบสบอล) ฉันแค่อยากรู้วิธีการหา PDF มีคำถามก่อนหน้านี้ที่ถามสิ่งที่คล้ายกัน แต่มันถูกทำเครื่องหมาย (ฉันคิดว่าไม่ถูกต้อง) เป็นคำถามซ้ำที่ไม่ได้แก้ปัญหาดังนั้นฉันจึงไม่สามารถค้นหาความช่วยเหลือได้ที่นี่] แก้ไข 2017-05-06: ขอบคุณทุกคนสำหรับคำถาม ฉันคิดว่าคำอธิบายที่ดีของสิ่งที่ฉันต้องการมาจากคำตอบอย่างใดอย่างหนึ่งที่ฉันได้รับเมื่อฉันถามอาจารย์ผู้สอนหลักสูตรนี้: "ฉันเดาว่าผู้คนจะได้รับความหนาแน่นปกติเป็นขีด จำกัด ของผลรวมของ n สิ่งหารด้วย sqrt (n) และคุณสามารถหาความหนาแน่นของปัวซองได้จากแนวคิดของเหตุการณ์ที่เกิดขึ้นในอัตราคงที่เช่นเดียวกันเพื่อให้ได้ ความหนาแน่นของเบต้าคุณจะต้องมีความคิดบางอย่างเกี่ยวกับสิ่งที่ทำให้การกระจายตัวของเบต้าเป็นอิสระจากและมีเหตุผลก่อนที่จะมีความหนาแน่น " ดังนั้นความคิด "ab initio" ในความคิดเห็นน่าจะใกล้เคียงกับสิ่งที่ฉันกำลังมองหา ฉันไม่ใช่นักคณิตศาสตร์ แต่ฉันรู้สึกสะดวกสบายที่สุดเมื่อใช้คณิตศาสตร์ที่ฉันสามารถหามาได้ หากต้นกำเนิดนั้นสูงเกินกว่าที่ฉันจะจัดการได้ดังนั้นไม่ว่าจะเป็น แต่ถ้าไม่ใช่ฉันก็อยากจะเข้าใจพวกเขา

3
การมีส่วนร่วมทางสถิติหลักของ Ronald Fisher คืออะไร
ริชาร์ดว์คินส์ได้อธิบายโรนัลด์ฟิชเชอร์เป็น "พ่อของสถิติที่ทันสมัยและการออกแบบการทดลอง" สายซึ่งเป็นที่ยกมาในฟิชเชอร์ของวิกิพีเดียประวัติ และยังมีแอนเดอรส์ฮาลด์เรียกเขาว่า "อัจฉริยะที่เกือบจะโดดเดี่ยวเดียวดายสร้างรากฐานสำหรับวิทยาศาสตร์ทางสถิติที่ทันสมัย" ในหนังสือของเขาประวัติศาสตร์ของคณิตศาสตร์สถิติ ฉันแค่สงสัยว่าสิ่งที่เขาทำเพื่อให้ผู้คนให้เขาประเมินสูงเช่นนี้?

2
ทำไมการกระจายเรขาคณิตและการกระจาย hypergeometric เรียกเช่นนี้?
ทำไมการกระจายเชิงเรขาคณิตและการกระจายhypergeometricเรียกว่า "เรขาคณิต" และ "hypergoemetric" ตามลำดับ? เป็นเพราะ pmfs ของพวกเขามีรูปแบบพิเศษหรือไม่? ขอบคุณ!


2
ทำไมโทมัสเบย์ถึงพบว่าทฤษฎีบทของเบย์ท้าทายมาก?
นี่คือประวัติศาสตร์ของคำถามวิทยาศาสตร์มากกว่านี้ แต่ฉันหวังว่ามันจะอยู่ในหัวข้อที่นี่ ฉันได้อ่านว่าโทมัสเบย์สามารถค้นพบทฤษฎีบทของเบย์สำหรับกรณีพิเศษของชุดยูนิฟอร์มมาก่อนเท่านั้นและถึงอย่างนั้นเขาก็ต้องดิ้นรนกับมัน เมื่อพิจารณาว่าทฤษฎีบทของนายพลเบย์นั้นสำคัญเพียงใดในการรักษาที่ทันสมัยทำไมมันถึงท้าทายสำหรับเบย์และนักคณิตศาสตร์คนอื่น ๆ ในเวลานั้น? สำหรับการเปรียบเทียบPhilosophiæ Naturalis Principia Principia Mathematica ของ Isaac Newton ได้รับการตีพิมพ์ 36 ปีก่อนงานหลักของ Bayes ซึ่งตีพิมพ์ในเชิงต้อ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.