คำถามติดแท็ก history

คำถามเกี่ยวกับประวัติของสถิติ

2
Jürgen Schmidhuber ถูกนำเสนอโดยเครือข่ายผู้ต่อต้านคนอื่นหรือไม่?
ฉันอ่านในhttps://en.wikipedia.org/wiki/Generative_adversarial_networks : [เครือข่ายผู้ให้คำปรึกษาทั่วไป] ได้รับการแนะนำโดย Ian Goodfellow และคณะในปี 2014 แต่Jurgen Schmidhuberอ้างว่าได้ทำงานคล้าย ๆ กันมาก่อนหน้านี้ในทิศทางนั้น (เช่นมีการถกเถียงกันที่ NIPS 2016 ระหว่างการฝึกสอนเครือข่ายผู้ไม่ประสงค์ดี: https://channel9.msdn.com/Events/Neural-Information-Processing-Systems- Conference / Neural-Information-Processing- Systems-Conference-NIPS-2016 / Generative-Adversarial-Networksดู 1 ชม. 3 นาที) ความคิดที่อยู่เบื้องหลังเครือข่ายผู้ให้คำปรึกษาที่ก่อกำเนิดเป็นครั้งแรกที่Jürgen Schmidhuber เปิดตัวต่อสาธารณชน ถ้าไม่ความคิดของJürgen Schmidhub นั้นคล้ายกันมากแค่ไหน?

2
ใครที่ใช้ / ประดิษฐ์ค่า p เป็นอันดับแรก
ฉันพยายามเขียนบทความในบล็อกเกี่ยวกับค่า p และฉันคิดว่ามันน่าสนใจที่จะกลับไปที่จุดเริ่มต้นทั้งหมดซึ่งดูเหมือนจะเป็นกระดาษ 1900 ของ Pearson หากคุณคุ้นเคยกับกระดาษแผ่นนั้นคุณจะจำได้ว่าสิ่งนี้ครอบคลุมการทดสอบความเหมาะสม เพียร์สันค่อนข้างหลวมกับภาษาของเขาเมื่อมันมาถึงค่า p เขาใช้ "อัตราต่อรอง" ซ้ำ ๆ เมื่ออธิบายวิธีตีความค่า p ของเขา ตัวอย่างเช่นในหน้า 168 เมื่อพูดถึงผลลัพธ์ของการทอยลูกเต๋าซ้ำ 12 ลูกเต๋าเขากล่าวว่า " ... ซึ่งทำให้เราไปที่ P = .00000016 หรืออัตราต่อรองคือ 62,499 ต่อ 1 กับระบบการเบี่ยงเบนแบบสุ่ม การเลือกด้วยอัตราต่อรองดังกล่าวมันจะสมเหตุสมผลที่จะสรุปว่าลูกเต๋าแสดงอคติต่อคะแนนที่สูงขึ้น " ในบทความนี้เขาอ้างถึงงานก่อนหน้านี้รวมถึงหนังสือ 1891 บนสี่เหลี่ยมอย่างน้อยโดย Merriman แต่เพียร์สันจัดทำแคลคูลัสสำหรับ p-values ​​(ความดีของการทดสอบพอดี) เพียร์สันเป็นคนแรกที่คิดค่า p หรือไม่? เมื่อฉันค้นหาค่า p จะมีการพูดถึง Fisher และงานของเขาในทศวรรษ 1920 …

6
เหตุใดค่าที่คาดหมายจึงตั้งชื่อเช่นนั้น
ฉันเข้าใจว่าเราได้ 3.5 เป็นค่าที่คาดไว้สำหรับการรีดแม่พิมพ์ 6 ด้านที่ยุติธรรม แต่โดยสัญชาตญาณฉันสามารถคาดหวังให้แต่ละหน้ามีโอกาสเท่ากันที่ 1/6 ดังนั้นค่าที่คาดหวังของการรีดตายไม่ควรเป็นหนึ่งในจำนวนระหว่าง 1-6 ด้วยความน่าจะเป็นที่เท่ากันหรือ กล่าวอีกนัยหนึ่งเมื่อถามคำถามว่าอะไรคือค่าคาดหวังของการขว้างปา 6-fair ที่ยุติธรรม? ใครควรตอบว่า 'โอ้มันอาจเป็นอะไรก็ได้ระหว่าง 1-6 โดยมีโอกาสเท่ากัน' แทนที่จะเป็น 3.5 ในสังหรณ์โลกแห่งความเป็นจริงมีใครสามารถอธิบายได้ว่าคุณค่าที่ฉันควรคาดหวังในการขว้างปา 3.5 นั้นมีค่าอย่างไร? อีกครั้งฉันไม่ต้องการสูตรหรือแหล่งที่มาสำหรับความคาดหวัง

3
ที่มาของคำว่า "การทำให้เป็นมาตรฐาน"
เมื่อฉันแนะนำแนวคิดให้กับนักเรียนของฉันฉันมักจะพบว่ามันสนุกที่จะบอกพวกเขาว่าคำศัพท์มาจากที่ไหน (ตัวอย่างเช่น "การถดถอย" เป็นคำที่มีต้นกำเนิดที่น่าสนใจ) ฉันไม่สามารถเปลี่ยนประวัติ / พื้นหลังของคำว่า "การทำให้เป็นมาตรฐาน" ในการเรียนรู้ทางสถิติ / เครื่อง ดังนั้นสิ่งที่เป็นที่มาของคำว่ากู ?

1
ตารางสถิติในหนังสือเก่าผิดวัตถุประสงค์หรือไม่
ฉันจำได้ว่าเคยอ่านมานานแล้วว่าในหนังสือเก่า (ก่อนยุคคอมพิวเตอร์) ตัวเลขสุดท้ายของปริมาณทางทฤษฎีที่แสดงในภาคผนวกนั้นไม่ถูกต้องเพื่อที่จะกีดกันการลอกเลียนแบบ (ความคิดจะเป็นเช่นนั้น ภาคผนวกที่ตัวเลขสุดท้ายเหมือนกันกับที่พบในของคุณจากนั้นผู้เขียนคนนั้นจะต้องลอกเลียนตารางของคุณ) ฉันพยายามค้นหาแหล่งที่มาของเรื่องนี้หรือลิงค์ไปยังที่กล่าวถึง แต่หลังจากการค้นหาหลายชั่วโมงฉันไม่สามารถทำได้

3
ประวัติความเป็นมาของทฤษฎีก่อนหน้านี้ที่ไม่เป็นทางการ
ฉันกำลังเขียนเรียงความเชิงทฤษฎีสั้น ๆ สำหรับหลักสูตรสถิติแบบเบย์ (ในสาขาเศรษฐศาสตร์) กับนักบวชที่ไม่รู้เรื่องและฉันพยายามเข้าใจซึ่งเป็นขั้นตอนในการพัฒนาทฤษฎีนี้ ในตอนนี้ไทม์ไลน์ของฉันมีสามขั้นตอนหลัก: หลักการความเฉยเมยของ Laplace (1812), นักบวชที่ไม่แปรเปลี่ยน (Jeffreys (1946)), อ้างอิงจากเบอร์นาร์โดก่อน (1979) จากการทบทวนวรรณกรรมของฉันฉันได้เข้าใจว่าหลักการไม่แยแส (Laplace) เป็นเครื่องมือแรกที่ใช้แทนการขาดข้อมูลก่อนหน้านี้ แต่ความไม่แน่นอนของความไม่แปรเปลี่ยนได้นำไปสู่การละทิ้งจนกระทั่งยุค 40 เมื่อ Jeffreys แนะนำวิธีการของเขา คุณสมบัติที่ต้องการของค่าคงที่ การเกิดขึ้นของความขัดแย้งของคนชายขอบเนื่องจากการใช้ความไม่ระมัดระวังอย่างไม่เหมาะสมก่อนหน้าในยุค 70 ผลักให้เบอร์นาร์โดอธิบายรายละเอียดของทฤษฎีก่อนหน้านี้อย่างละเอียดเพื่อจัดการกับปัญหานี้ การอ่านวรรณกรรมผู้แต่งทุกคนต่างอ้างถึงการมีส่วนร่วม: เอนโทรปีสูงสุดของเจย์เนส, กล่องและความเป็นไปได้ในการแปลข้อมูล, Zellner, ... ในความเห็นของคุณอะไรคือขั้นตอนสำคัญที่ฉันขาดหายไป แก้ไข : ฉันเพิ่มการอ้างอิง (หลัก) ของฉันหากมีคนต้องการ: 1) การเลือกก่อนโดยกฎอย่างเป็นทางการ, Kass, Wasserman 2) แคตตาล็อกของนักบวชที่ไม่มีข้อมูล Yang, Berger 3) การตีความแบบไม่เป็นทางการของ Bayesians Priors และปัญหาเกี่ยวกับการก่อสร้างและการใช้งาน

2
ใครเป็นคนคิดค้นต้นไม้ตัดสินใจ
ฉันพยายามติดตามผู้ที่คิดค้นโครงสร้างข้อมูลและอัลกอริทึมการตัดสินใจต้นไม้ ในรายการวิกิพีเดียเกี่ยวกับแผนผังการตัดสินใจมีการอ้างว่า "ID3 และ CART ถูกประดิษฐ์ขึ้นอย่างอิสระในเวลาเดียวกัน (ระหว่างปี 1970 ถึง 1980)" ID3 ถูกนำเสนอในภายหลัง: Quinlan, JR 1986 การเหนี่ยวนำต้นไม้การตัดสินใจ จักร เรียน 1, 1 (มี.ค. 1986), 81-106 ดังนั้นฉันไม่แน่ใจว่าการอ้างสิทธิ์เป็นจริง ผมพบว่าการใช้ Google หนังสืออ้างอิงถึง 1959 หนังสือสถิติชุดการตัดสินใจและ 1958 คอลเลกชันของเอกสารการทำงาน บริบทไม่ชัดเจนและดูเหมือนว่าพวกเขาจะไม่นำเสนออัลกอริทึม อย่างไรก็ตามพวกเขาไม่ได้กำหนดโครงสร้างข้อมูลและถือว่าเป็นที่รู้จักกันดี เมื่อใช้ Google Scholar ฉันพบการอ้างอิงถึงปี 1853 แต่สิ่งเหล่านี้เป็นการแยกวิเคราะห์ข้อผิดพลาดและไม่ใช่การอ้างอิงจริงตั้งแต่วันนั้น
24 cart  history 

3
ทำไมการกระจายโลจิสติกส์จึงเรียกว่า“ โลจิสติกส์”?
"โลจิสติกส์" เกี่ยวกับการกระจายโลจิสติกส์ในวิธีสามัญสำนึกคืออะไร นิรุกติศาสตร์ของและเหตุผลศัพท์สำหรับชื่อไม่ใช่แค่นิยามคณิตศาสตร์บริสุทธิ์?

1
Howlers เกิดจากการใช้การถดถอยแบบขั้นตอน
ฉันตระหนักดีถึงปัญหาของการเลือกตามขั้นตอน / ไปข้างหน้า / ถอยหลังในตัวแบบการถดถอย มีหลายกรณีที่นักวิจัยประนามวิธีและชี้ทางเลือกที่ดีกว่า ฉันอยากรู้ว่ามีเรื่องราวใดบ้างที่มีอยู่ที่การวิเคราะห์ทางสถิติ: ใช้การถดถอยแบบขั้นตอน ทำข้อสรุปที่สำคัญบางประการตามโมเดลสุดท้าย ข้อสรุปนั้นผิดส่งผลลบต่อบุคคลการวิจัยหรือองค์กรของพวกเขา ความคิดของฉันเกี่ยวกับเรื่องนี้หากวิธีการแบบขั้นตอนไม่ดีแล้วก็ควรจะมีผลตามมาใน "โลกแห่งความจริง" สำหรับการใช้มัน

1
ประวัติของกล่องแปลงคืออะไรและการออกแบบ“ กล่องและหนวด” พัฒนาอย่างไร?
หลายแหล่งวันที่ออกแบบ "แผนกล่อง" คลาสสิกกับจอห์น Tukeyและ "แผนผังแผน" ของ 2513 การออกแบบที่ดูเหมือนจะค่อนข้างคงที่ตั้งแต่นั้นมากับเอ็ดเวิร์ด Tufteตัดลงมาเป็นกล่องรุ่น - พล็อตไม่ทันตั้งตัวขณะแผนการของไวโอลิน - แม้ว่าจะเป็นข้อมูลที่แตกต่างของพล็อตกล่อง - ยังคงได้รับความนิยมน้อยลง ข้อเสนอแนะของคลีฟแลนด์ที่เคราขยายออกไปเป็นร้อยละ 10 และ 90 มีผู้สนับสนุนบางส่วนดูCox (2009)แต่ไม่ใช่บรรทัดฐาน Hadley Wickham และ Lisa Stryjewski เขียนกระดาษที่ไม่ได้เผยแพร่เกี่ยวกับประวัติความเป็นมาของแผนการกล่องแต่ดูเหมือนว่ามันจะไม่ครอบคลุมถึงบรรพบุรุษของกล่องแปลง แล้วพล็อตปัจจุบัน "แพร่หลาย" และ "หนวด" จึงเกิดขึ้นได้อย่างไร การสร้างภาพข้อมูลแบบใดที่วิวัฒนาการมาจากการออกแบบก่อนหน้านี้มีข้อได้เปรียบที่สำคัญและทำไมพวกเขาถึงดูเหมือนจะถูกบดบังดังนั้นการใช้งานอย่างละเอียดตามแบบแผนการของ Tukey? คำตอบที่แสดงให้เห็นจะเป็นโบนัส แต่จะถูกนำไปอ้างอิงที่ดำลึกในอดีตกว่า Wickham และ Stryjewski จะเป็นประโยชน์ อ้างอิง Cox, NJ (2009) Stata พูด: การสร้างและการแปลงกล่องแปลง Stata Journal , …

1
เมื่อถูกคำว่า“อคติ” ประกาศเกียรติคุณหมายถึง ?
เมื่อถูกคำว่า "อคติ" ประกาศเกียรติคุณหมายถึง ?E [ θ^- θ ]E[θ^-θ]\mathbb{E}[\hat{\theta}-\theta] เหตุผลที่ฉันกำลังคิดเกี่ยวกับเรื่องนี้ในตอนนี้ก็เพราะฉันดูเหมือนจะจำ Jaynes ในข้อความทฤษฎีความน่าจะเป็นของเขาวิจารณ์การใช้คำว่า "อคติ" ที่ใช้ในการอธิบายสูตรนี้และแนะนำทางเลือกอื่น จากทฤษฎีความน่าจะเป็นของเจย์เนส, ส่วนที่ 17.2 "เครื่องมือประมาณค่าที่เป็นกลาง:" เหตุใดออร์โธดอกซ์จึงให้ความสำคัญกับความลำเอียงที่พูดเกินจริงเช่นนั้น เราสงสัยว่าเหตุผลหลักคือพวกเขาติดกับดักทางจิตของการสร้างของพวกเขาเอง เมื่อเราเรียกปริมาณ 'bias' ซึ่งทำให้ดูเหมือนสิ่งเลวทรามต่ำช้าซึ่งเราต้องกำจัดค่าใช้จ่ายทั้งหมด ถ้ามันถูกเรียกแทน 'องค์ประกอบของความผิดพลาด orthogonal กับความแปรปรวน' ตามที่แนะนำโดยรูปแบบของพีทาโกรัส (17.2) มันจะชัดเจนว่าการมีส่วนร่วมของทั้งสองข้อผิดพลาดนั้นอยู่ในระดับที่เท่าเทียมกัน มันเป็นความเขลาที่จะลดค่าใช้จ่ายในการเพิ่มอีกอันหนึ่ง นี่เป็นเพียงราคาเดียวที่จ่ายสำหรับการเลือกคำศัพท์ทางเทคนิคที่มีภาระทางอารมณ์ ออร์ทอดอกซ์ตกอยู่ในข้อผิดพลาดทางยุทธวิธีนี้อย่างต่อเนื่อง( ⟨ บีตา⟩ - α )(⟨β⟩-α)(\langle\beta\rangle-\alpha)

3
เหตุใดจึงมี -1 ในฟังก์ชันความหนาแน่นของการแจกแจงแบบเบต้า
การแจกแจงเบต้าปรากฏภายใต้การกำหนดค่าสองค่า (หรือที่นี่ ) f ( x ) ∝ x α ( 1 - x ) βf(x)∝xα(1−x)β(1) f(x) \propto x^{\alpha} (1-x)^{\beta} \tag{1} หรือสิ่งที่ดูเหมือนว่าจะใช้บ่อยกว่าปกติ f ( x ) ∝ x α - 1 ( 1 - x ) β - 1f(x)∝xα−1(1−x)β−1(2) f(x) \propto x^{\alpha-1} (1-x)^{\beta-1} \tag{2} แต่ทำไมถึงมี " - 1−1-1 " ในสูตรที่สอง? …

3
ระยะเวลาในประวัติศาสตร์ของสถิติ
ประวัติศาสตร์ของวิทยาศาสตร์หลายแขนงสามารถแบ่งออกเป็นช่วงเวลาเล็ก ๆ น้อย ๆ ที่มักจะเริ่มต้นด้วยการค้นพบที่สำคัญบางอย่าง แต่ฉันไม่เคยเห็นอะไรที่คล้ายกันในช่วงเวลาของสถิติ เห็นได้ชัดว่ามีบางวันที่สำคัญที่ถือได้ว่าเป็นจุดเริ่มต้นของช่วงเวลาใหม่ (Pascal + Fermat, Bayes, Pearson, Tukey, .. ) อย่างน้อยที่สุดเราสามารถแบ่งประวัติของสถิติออกเป็นระยะเวลาสั้น ๆ ได้หรือไม่? โปรดทราบว่าคำถามที่คล้ายกันเพียงข้อเดียวนี้เกี่ยวข้องกับนักสถิติที่มีชื่อเสียงเท่านั้นไม่เกี่ยวกับช่วงเวลาในประวัติศาสตร์
18 history 

2
เมื่อไหร่ที่ MCMC กลายเป็นเรื่องธรรมดา?
ไม่มีใครรู้ว่าในปี MCMC กลายเป็นเรื่องธรรมดา (เช่นวิธีการที่นิยมสำหรับการอนุมานแบบเบย์)? ลิงก์ไปยังจำนวนบทความ MCMC (เจอร์นัล) ที่ตีพิมพ์เมื่อเวลาผ่านไปจะเป็นประโยชน์อย่างยิ่ง
18 bayesian  mcmc  history 

2
เหตุใดจึงเลือกตัวอักษร Q ในการเรียนรู้ Q
เหตุใดจึงเลือกตัวอักษร Q ในชื่อของ Q-learning ตัวอักษรส่วนใหญ่จะถูกเลือกเป็นตัวย่อเช่นหมายถึงนโยบายและหมายถึงคุณค่า แต่ฉันไม่คิดว่า Q เป็นคำย่อของคำใด ๆππ\pivvv

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.