คำถามติดแท็ก mathematical-statistics

ทฤษฎีทางคณิตศาสตร์ของสถิติที่เกี่ยวข้องกับคำจำกัดความที่เป็นทางการและผลลัพธ์ทั่วไป

1
สถิติเพียงพอปัญหาเฉพาะ / ปรีชาญาณ
ฉันสอนตัวเองสถิติบางอย่างเพื่อความสนุกสนานและฉันมีความสับสนบางอย่างเกี่ยวกับสถิติที่เพียงพอ ฉันจะเขียนความสับสนในรูปแบบรายการ: หากการจัดจำหน่ายที่มีพารามิเตอร์แล้วมันจะมีnสถิติเพียงพอ?nnnnnn มีการติดต่อโดยตรงใด ๆ ระหว่างสถิติที่เพียงพอและพารามิเตอร์หรือไม่? หรือทำสถิติที่เพียงพอเพียงทำหน้าที่เป็นแหล่งรวมของ "ข้อมูล" เพื่อให้เราสามารถสร้างการตั้งค่าใหม่เพื่อให้เราสามารถคำนวณค่าประมาณเดียวกันสำหรับพารามิเตอร์ของการแจกแจงต้นแบบ การแจกแจงทั้งหมดมีสถิติเพียงพอหรือไม่ กล่าวคือ ทฤษฎีการแยกตัวประกอบสามารถล้มเหลวได้หรือไม่? การใช้ตัวอย่างข้อมูลของเราเราถือว่าการแจกแจงว่าข้อมูลน่าจะมาจากและสามารถคำนวณการประมาณ (เช่น MLE) สำหรับพารามิเตอร์สำหรับการแจกแจง สถิติที่เพียงพอก็เป็นวิธีที่สามารถคำนวณค่าประมาณเดียวกันสำหรับพารามิเตอร์โดยไม่ต้องพึ่งพาข้อมูลเองใช่ไหม ชุดของสถิติที่เพียงพอทั้งหมดจะมีสถิติที่น้อยที่สุดหรือไม่ นี่คือเนื้อหาที่ฉันใช้เพื่อพยายามทำความเข้าใจกับหัวข้อ: https://onlinecourses.science.psu.edu/stat414/node/283 จากสิ่งที่ฉันเข้าใจว่าเรามีทฤษฎีการแยกตัวประกอบที่แยกการกระจายตัวของข้อต่อออกเป็นสองหน้าที่ แต่ฉันไม่เข้าใจว่าเราสามารถแยกสถิติที่เพียงพอได้อย่างไรหลังจากแยกตัวประกอบการกระจายออกเป็นฟังก์ชันของเรา คำถามปัวซองที่ให้ไว้ในตัวอย่างนี้มีการแยกตัวประกอบที่ชัดเจน แต่แล้วมันก็ระบุว่าสถิติที่เพียงพอคือค่าเฉลี่ยตัวอย่างและผลรวมตัวอย่าง เรารู้ได้อย่างไรว่าสิ่งเหล่านั้นเป็นสถิติที่เพียงพอเพียงแค่ดูที่รูปแบบของสมการแรก มันเป็นวิธีการที่เป็นไปได้ที่จะดำเนินการ MLE เดียวกันประมาณการโดยใช้สถิติเพียงพอถ้าสมการที่สองของผลตีนเป็ดบางครั้งจะขึ้นอยู่กับค่าของข้อมูลXiXiX_iเอง? ตัวอย่างเช่นในกรณีปัวซองฟังก์ชันที่สองขึ้นอยู่กับการผกผันของผลคูณของแฟคทอเรียลของข้อมูลและเราจะไม่มีข้อมูลอีกต่อไป! ทำไมจะขนาดตัวอย่างไม่เป็นสถิติที่เพียงพอในความสัมพันธ์กับตัวอย่าง Poisson บนหน้าเว็บ ? เราต้องการให้nสร้างบางส่วนของฟังก์ชั่นแรกอีกครั้งดังนั้นทำไมมันถึงมีสถิติไม่เพียงพอเช่นกัน?nnnnnn

4
ใครใช้ R กับแพ็คเกจ multicore, SNOW หรือ CUDA สำหรับการคำนวณที่เข้มข้นของทรัพยากร
ใครของคุณในฟอรัมนี้ใช้ "> R กับmulticore , snow packages หรือCUDAดังนั้นสำหรับการคำนวณขั้นสูงที่ต้องใช้พลังงานมากกว่า CPU แบบเวิร์กสเตชัน? คุณใช้คอมพิวเตอร์เครื่องไหนในการคำนวณสคริปต์เหล่านี้ที่บ้าน / ที่ทำงานหรือคุณมี เข้าถึงศูนย์ข้อมูลได้ที่ไหน? พื้นหลังของคำถามเหล่านี้มีดังต่อไปนี้: ฉันกำลังเขียน วท.ม. วิทยานิพนธ์เกี่ยวกับ R และการคำนวณที่มีประสิทธิภาพสูงและต้องการความรู้อย่างมากเกี่ยวกับผู้ที่ใช้อาร์จริงฉันอ่านว่า R มีผู้ใช้ 1 ล้านคนในปี 2008 แต่นั่นเป็นสถิติผู้ใช้เพียงอย่างเดียวที่ฉันสามารถหาได้ในหัวข้อนี้ คำตอบ! ขอแสดงความนับถือเฮ็น

3
ความสัมพันธ์ระหว่างการแจกแจงเบต้าและรูปแบบการถดถอยโลจิสติกคืออะไร?
คำถามของฉันคืออะไรความสัมพันธ์ทางคณิตศาสตร์ระหว่างการแจกแจงเบต้าและสัมประสิทธิ์ของตัวแบบการถดถอยโลจิสติกคืออะไร? เพื่อแสดงให้เห็นถึง:ฟังก์ชันลอจิสติก (sigmoid) ได้รับจาก f(x)=11+exp(−x)f(x)=11+exp⁡(−x)f(x) = \frac{1}{1+\exp(-x)} และมันถูกใช้เพื่อสร้างโมเดลความน่าจะเป็นในโมเดลการถดถอยโลจิสติก ให้AAAเป็น dichotomous (0,1)(0,1)(0,1)ทำคะแนนผลลัพธ์และXXX a matrix ออกแบบ แบบจำลองการถดถอยโลจิสติกจะได้รับจาก P(A=1|X)=f(Xβ).P(A=1|X)=f(Xβ).P(A=1|X) = f(X \beta). หมายเหตุXXXมีคอลัมน์แรกของค่าคงที่111 (สกัดกั้น) และββ\betaเป็นคอลัมน์เวกเตอร์ของสัมประสิทธิ์การถดถอย ตัวอย่างเช่นเมื่อเรามีหนึ่ง regressor (ปกติมาตรฐาน) xxxและเลือกβ0=1β0=1\beta_0=1 (สกัดกั้น) และβ1=1β1=1\beta_1=1เราสามารถจำลองผลลัพธ์ 'การแจกแจงความน่าจะเป็น' พล็อตนี้จะแจ้งเตือนของการกระจายเบต้า (เช่นการทำแปลงสำหรับทางเลือกอื่น ๆ ของββ\beta ) ที่มีความหนาแน่นจะได้รับจาก g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1).g(y;p,q)=Γ(p)Γ(q)Γ(p+q)y(p−1)(1−y)(q−1).g(y;p,q) = \frac{\Gamma(p)\Gamma(q)}{\Gamma(p+q)} y^{(p-1)} (1-y)^{(q-1)}. ใช้โอกาสสูงสุดหรือวิธีการในช่วงเวลาที่มันเป็นไปได้ที่จะประเมินและQจากการกระจายของP ( = 1 | X ) ดังนั้นคำถามของฉันลงมาที่: ความสัมพันธ์ระหว่างตัวเลือกของβและpและqคืออะไร? สิ่งนี้เพื่อเริ่มต้นด้วยที่อยู่กรณี …

2
เหตุใดยอดสูงสุดของสะพานบราวเนียนจึงมีการกระจาย Kolmogorov – Smirnov?
การกระจาย Kolmogorov-Smirnov เป็นที่รู้จักจากการทดสอบ Kolmogorov-Smirnov อย่างไรก็ตามมันยังเป็นการกระจายของยอดสูงสุดของสะพานบราวเนียน เนื่องจากสิ่งนี้ไม่ชัดเจน (สำหรับฉัน) ฉันจึงขอให้คุณอธิบายอย่างง่าย ๆ เกี่ยวกับความบังเอิญนี้ ยินดีต้อนรับการอ้างอิงยัง

2
ค่าเฉลี่ยของเมทริกซ์บวกแน่นอนมีค่าบวกแน่นอนเช่นกันหรือไม่?
ค่าเฉลี่ยของเมทริกซ์บวก - แน่นอนหลายค่าจำเป็นต้องมีค่าบวกกึ่งบวกหรือกึ่งบวกแน่นอน? ค่าเฉลี่ยคือค่าเฉลี่ยขององค์ประกอบที่ฉลาด

1
สัญชาตญาณของตัวอย่างที่แลกเปลี่ยนได้ภายใต้สมมติฐานว่างคืออะไร
การทดสอบการเปลี่ยนรูป (เรียกอีกอย่างว่าการทดสอบแบบสุ่มการทดสอบแบบสุ่มอีกครั้งหรือการทดสอบที่แน่นอน) มีประโยชน์มากและมีประโยชน์เมื่อสมมติฐานของการแจกแจงปกติที่ต้องการโดยตัวอย่างเช่นt-testไม่พบและเมื่อการเปลี่ยนแปลงของค่าโดยการจัดอันดับ การทดสอบแบบไม่มีพารามิเตอร์Mann-Whitney-U-testจะนำไปสู่การสูญเสียข้อมูลมากขึ้น อย่างไรก็ตามไม่ควรมองข้ามสมมุติฐานข้อเดียวและข้อเดียวเพียงข้อเดียวเมื่อใช้การทดสอบชนิดนี้คือข้อสมมติฐานของความสามารถแลกเปลี่ยนได้ของตัวอย่างภายใต้สมมติฐานว่าง เป็นที่น่าสังเกตว่าวิธีการแบบนี้สามารถใช้ได้เมื่อมีตัวอย่างมากกว่าสองตัวอย่างเช่นสิ่งที่นำไปใช้ในcoinแพ็คเกจ R คุณช่วยกรุณาใช้ภาษาที่เป็นรูปเป็นร่างหรือปรีชาเชิงแนวคิดในภาษาอังกฤษธรรมดาเพื่อแสดงสมมติฐานนี้ได้หรือไม่? นี่จะมีประโยชน์มากในการอธิบายปัญหาที่ถูกมองข้ามในหมู่ผู้ที่ไม่ใช่นักสถิติเช่นฉัน หมายเหตุ: จะเป็นประโยชน์อย่างมากหากพูดถึงกรณีที่การใช้การทดสอบการเปลี่ยนแปลงไม่ถือหรือไม่ถูกต้องภายใต้สมมติฐานเดียวกัน ปรับปรุง: สมมติว่าฉันมี 50 วิชาที่รวบรวมจากคลินิกท้องถิ่นในเขตของฉันโดยการสุ่ม พวกเขาถูกสุ่มให้รับยาหรือยาหลอกในอัตราส่วน 1: 1 พวกเขาทั้งหมดถูกวัดสำหรับ Paramerter 1 Par1ที่ V1 (พื้นฐาน), V2 (3 เดือนต่อมา) และ V3 (1 ปีต่อมา) วิชาทั้งหมด 50 กลุ่มสามารถแบ่งเป็น 2 กลุ่มตามคุณสมบัติ A; ค่าบวก = 20 และค่าลบ = 30 นอกจากนี้ยังสามารถจัดกลุ่มย่อยได้อีก 2 กลุ่มตามคุณลักษณะ B; B positive = …
15 hypothesis-testing  permutation-test  exchangeability  r  statistical-significance  loess  data-visualization  normal-distribution  pdf  ggplot2  kernel-smoothing  probability  self-study  expected-value  normal-distribution  prior  correlation  time-series  regression  heteroscedasticity  estimation  estimators  fisher-information  data-visualization  repeated-measures  binary-data  panel-data  mathematical-statistics  coefficient-of-variation  normal-distribution  order-statistics  regression  machine-learning  one-class  probability  estimators  forecasting  prediction  validation  finance  measurement-error  variance  mean  spatial  monte-carlo  data-visualization  boxplot  sampling  uniform  chi-squared  goodness-of-fit  probability  mixture  theory  gaussian-mixture  regression  statistical-significance  p-value  bootstrap  regression  multicollinearity  correlation  r  poisson-distribution  survival  regression  categorical-data  ordinal-data  ordered-logit  regression  interaction  time-series  machine-learning  forecasting  cross-validation  binomial  multiple-comparisons  simulation  false-discovery-rate  r  clustering  frequency  wilcoxon-mann-whitney  wilcoxon-signed-rank  r  svm  t-test  missing-data  excel  r  numerical-integration  r  random-variable  lme4-nlme  mixed-model  weighted-regression  power-law  errors-in-variables  machine-learning  classification  entropy  information-theory  mutual-information 

3
บทสรุปของ Neyman-Pearson สามารถนำไปใช้กับกรณีที่โมฆะอย่างง่ายและทางเลือกไม่ได้อยู่ในตระกูลเดียวกันของการแจกแจงหรือไม่?
บทแทรกของ Neyman-Pearson สามารถนำไปใช้กับกรณีที่เป็นโมฆะง่ายและทางเลือกง่าย ๆ ไม่ได้เป็นของครอบครัวเดียวกันของการแจกแจง? จากการพิสูจน์ฉันไม่เห็นว่าทำไมถึงทำไม่ได้ ตัวอย่างเช่นเมื่อ Simple Null เป็นการแจกแจงแบบปกติและทางเลือกง่าย ๆ คือการแจกแจงแบบเอ็กซ์โพเนนเชียล คือการทดสอบอัตราส่วนความน่าจะเป็นวิธีที่ดีในการทดสอบ null คอมโพสิตกับทางเลือกคอมโพสิตเมื่อทั้งสองเป็นของครอบครัวที่แตกต่างกันของการกระจาย? ขอบคุณและขอแสดงความนับถือ!

1
ผลคูณของตัวแปรสุ่มอิสระสองตัว
ฉันมีตัวอย่างประมาณ 1,000 ค่า ข้อมูลเหล่านี้จะได้รับจากผลิตภัณฑ์ของทั้งสองตัวแปรสุ่มอิสระξ∗ψξ∗ψ\xi \ast \psi ψ ตัวแปรสุ่มครั้งแรกที่มีการกระจายชุดξ∼U(0,1)ξ∼U(0,1)\xi \sim U(0,1) ) ไม่รู้จักการแจกแจงของตัวแปรสุ่มตัวที่สอง ฉันจะประเมินการกระจายตัวของตัวแปรสุ่มตัวที่สอง ( ) ได้อย่างไรψψ \psi

1
ทำไมเราถึงรักษาความแปรปรวนได้
ฉันมาข้ามความแปรปรวนเปลี่ยนแปลงการรักษาเสถียรภาพในขณะที่อ่านKaggle เรียงความวิธี พวกเขาใช้การแปลงความเสถียรของผลต่างเพื่อแปลงค่าคัปปาก่อนที่จะรับค่าเฉลี่ยแล้วเปลี่ยนกลับ แม้หลังจากอ่านวิกิเกี่ยวกับความแปรปรวนของการแปรปรวนที่ทำให้เกิดความแปรปรวนฉันไม่เข้าใจทำไมเราถึงทำให้ความแปรปรวนของความมั่นคงมีอยู่จริง? เราได้รับประโยชน์อะไรจากสิ่งนี้?

3
บางคำถามเกี่ยวกับการสุ่มทางสถิติ
จากความแร้นแค้นทางสถิติของ Wikipedia : การสุ่มทั่วโลกและการสุ่มในท้องถิ่นนั้นแตกต่างกัน แนวคิดเชิงปรัชญาส่วนใหญ่เกี่ยวกับการสุ่มนั้นเป็นสากล - เพราะพวกมันอยู่บนพื้นฐานความคิดที่ว่า "ในระยะยาว" ลำดับนั้นดูสุ่มอย่างแท้จริงแม้ว่าบางลำดับย่อยจะไม่ดูสุ่ม ในการสุ่มตัวเลขที่มีความยาวเพียงพออย่างแท้จริงอาจเป็นไปได้ว่าจะมีการเรียงลำดับแบบยาวของศูนย์ แต่ในทั้งลำดับอาจเป็นแบบสุ่ม Local Randomness หมายถึงแนวคิดที่ว่าสามารถมีความยาวของลำดับขั้นต่ำที่การแจกแจงแบบสุ่มจะถูกประมาณแม้แต่ตัวเลขที่สร้างขึ้นโดยกระบวนการสุ่มอย่างแท้จริงจะลด "การสุ่มแบบท้องถิ่น" ของตัวอย่าง (มันอาจเป็นแบบสุ่มเฉพาะที่สำหรับลำดับ 10,000 หลัก แต่การวนน้อยกว่า 1,000 อาจไม่ปรากฏแบบสุ่ม ตัวอย่างเช่นทั้งหมด) ลำดับที่แสดงรูปแบบจึงไม่ได้รับการพิสูจน์ว่าไม่สุ่มทางสถิติ ตามหลักการของทฤษฎีแรมซีย์วัตถุขนาดใหญ่อย่างเพียงพอจะต้องมีโครงสร้างพื้นฐานที่กำหนด ("ความไม่สมบูรณ์สมบูรณ์เป็นไปไม่ได้") ฉันไม่เข้าใจความหมายของประโยคทั้งสองเป็นตัวหนา ประโยคแรกหมายความว่ามีบางสิ่งที่ทำให้เกิดการสุ่มตามลำดับที่ความยาวมากกว่าและไม่ใช่การสุ่มแบบท้องถิ่นที่ความยาวสั้นกว่าหรือไม่ ตัวอย่างในวงเล็บทำงานอย่างไร ประโยคที่สองหมายความว่าลำดับที่แสดงรูปแบบไม่สามารถพิสูจน์ได้ว่าไม่ได้สุ่มตัวอย่างเชิงสถิติหรือไม่? ทำไม? ขอบคุณ

5
เหตุใดข้อสันนิษฐานเรื่อง Normality ในการถดถอยเชิงเส้น
คำถามของฉันง่ายมาก: ทำไมเราถึงเลือกตามปกติเนื่องจากการแจกแจงที่ข้อผิดพลาดตามมาในข้อสันนิษฐานของการถดถอยเชิงเส้น? ทำไมเราไม่เลือกคนอื่นเหมือนเครื่องแบบเสื้อหรืออะไร?

1
อะไรคือ“ ความคาดหวังความเป็นไปได้สูงสุดที่ตั้งเป้าหมายไว้”?
ฉันพยายามทำความเข้าใจกับเอกสารของ Mark van der Laan เขาเป็นนักสถิติเชิงทฤษฎีที่ Berkeley ที่ทำงานกับปัญหาที่ทับซ้อนกันอย่างมีนัยสำคัญกับการเรียนรู้ของเครื่อง ปัญหาหนึ่งสำหรับฉัน (นอกเหนือจากคณิตศาสตร์ลึก) คือเขามักจะอธิบายวิธีการเรียนรู้ของเครื่องที่คุ้นเคยโดยใช้คำศัพท์ที่แตกต่างกันโดยสิ้นเชิง หนึ่งในแนวคิดหลักของเขาคือ "ความคาดหวังสูงสุดตามเป้าหมาย" TMLE ใช้ในการวิเคราะห์ข้อมูลเชิงการเซ็นเซอร์จากการทดลองที่ไม่มีการควบคุมในลักษณะที่ช่วยให้การประเมินผลกระทบแม้ในที่ที่มีปัจจัยรบกวน ฉันสงสัยอย่างยิ่งว่ามีแนวคิดแบบเดียวกันหลายอย่างอยู่ภายใต้ชื่ออื่นในสาขาอื่น แต่ฉันยังไม่เข้าใจดีพอที่จะจับคู่มันกับอะไรก็ได้โดยตรง ความพยายามในการเชื่อมช่องว่างกับ "การวิเคราะห์ข้อมูลเชิงคำนวณ" อยู่ที่นี่: การเข้าสู่ยุคของวิทยาศาสตร์ข้อมูล: การเรียนรู้แบบเป้าหมายและการบูรณาการสถิติและการวิเคราะห์ข้อมูลเชิงคำนวณ และการแนะนำสำหรับนักสถิติอยู่ที่นี่: การอนุมานสาเหตุเชิงสาเหตุสูงสุดตามเป้าหมาย: ส่วนที่ 1 จากวินาที: ในบทความนี้เราพัฒนาตัวประมาณความน่าจะเป็นเป้าหมายสูงสุดเฉพาะของผลกระทบเชิงสาเหตุของการแทรกแซงจุดเวลาหลายจุด สิ่งนี้เกี่ยวข้องกับการใช้การสูญเสียการเรียนรู้ระดับสูงเพื่อรับการประเมินเบื้องต้นของปัจจัยที่ไม่ทราบของสูตรการคำนวณ G และต่อมาใช้ฟังก์ชันพารามิเตอร์ความผันผวนที่เหมาะสมที่สุดที่เป็นเป้าหมายเฉพาะพารามิเตอร์ การประมาณค่าพารามิเตอร์ความผันผวนด้วยการประมาณค่าความน่าจะเป็นสูงสุดและวนซ้ำขั้นตอนการอัปเดตของปัจจัยเริ่มต้นจนถึงการลู่เข้า ขั้นตอนการอัพเดทโอกาสสูงสุดที่เป็นเป้าหมายซ้ำ ๆ นี้ทำให้ตัวประมาณค่าผลลัพธ์ของผลลัพธ์เชิงสาเหตุมีความแข็งแกร่งเป็นสองเท่าในแง่ที่ว่ามีความสอดคล้องกันหากตัวประมาณค่าเริ่มต้นสอดคล้องกัน หรือตัวประมาณของฟังก์ชันความผันผวนที่เหมาะสมนั้นสอดคล้องกัน ฟังก์ชั่นความผันผวนที่ดีที่สุดจะถูกระบุอย่างถูกต้องหากการแจกแจงแบบมีเงื่อนไขของโหนดในกราฟเชิงสาเหตุระบุการแทรกแซงอย่างใดอย่างหนึ่ง ในคำศัพท์ของเขา "การเรียนรู้ขั้นสูง" คือการเรียนรู้ทั้งมวลด้วยทฤษฎีที่มีน้ำหนักที่ไม่เป็นลบ แต่สิ่งที่เขาหมายถึงโดย "การใช้ฟังก์ชั่นความผันผวนที่ดีที่สุดเฉพาะพารามิเตอร์เป้าหมายพารามิเตอร์ หรือแบ่งเป็นสามคำถามที่แตกต่างกัน TMLE มีการเรียนรู้แบบขนานในเครื่องเรียนรู้ว่าอะไรคือ "รูปแบบพารามิเตอร์ที่มีประโยชน์น้อยที่สุด" และ "ฟังก์ชันความผันผวน" ในสาขาอื่นคืออะไร

1
ความไม่เท่าเทียมกันของ Oracle: ในแง่พื้นฐาน
ฉันกำลังอ่านกระดาษที่ใช้ความไม่เท่าเทียมกันของออราเคิลเพื่อพิสูจน์บางสิ่ง แต่ฉันไม่สามารถเข้าใจสิ่งที่มันกำลังพยายามทำอยู่ เมื่อฉันค้นหาทางออนไลน์เกี่ยวกับ 'Oracle Inequality' บางแหล่งก็นำฉันไปยังบทความ "Candes, Emmanuel J. 'การประมาณทางสถิติสมัยใหม่ผ่านทางอสมการ oracle' "ซึ่งสามารถพบได้ที่นี่https://statweb.stanford.edu/~candes/papers/NonlinearEstimation.pdf แต่หนังสือเล่มนี้ดูเหมือนจะหนักเกินไปสำหรับฉันและฉันเชื่อว่าฉันขาดข้อกำหนดเบื้องต้นบางอย่าง คำถามของฉันคือ: คุณจะอธิบายได้อย่างไรว่าความไม่เท่าเทียมกันของ oracle สำหรับสาขาวิชาที่ไม่ใช่คณิตศาสตร์ (รวมถึงวิศวกร) ประการที่สองวิธีที่คุณแนะนำให้พวกเขาไปเกี่ยวกับข้อกำหนดเบื้องต้น / หัวข้อก่อนที่จะพยายามเรียนรู้บางสิ่งบางอย่างเช่นหนังสือดังกล่าวข้างต้น ฉันขอแนะนำว่าคนที่มีความเข้าใจอย่างเป็นรูปธรรมและมีประสบการณ์ที่ดีในสถิติมิติสูงควรตอบคำถามนี้

2
Wolfram Mathworld ทำผิดที่อธิบายการแจกแจงความน่าจะเป็นแบบแยกโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือไม่?
โดยปกติการแจกแจงความน่าจะเป็นเหนือตัวแปรที่ไม่ต่อเนื่องนั้นถูกอธิบายโดยใช้ฟังก์ชันความน่าจะเป็นมวล (PMF): เมื่อทำงานกับตัวแปรสุ่มต่อเนื่องเราจะอธิบายการแจกแจงความน่าจะเป็นโดยใช้ฟังก์ชันความหนาแน่นของความน่าจะเป็น (PDF) แทนที่จะเป็นฟังก์ชันมวลความน่าจะเป็น - การเรียนรู้อย่างลึกซึ้งโดย Goodfellow, Bengio และ Courville อย่างไรก็ตามWolfram Mathworldใช้ PDF เพื่ออธิบายการแจกแจงความน่าจะเป็นผ่านตัวแปรที่ไม่ต่อเนื่อง: นี่เป็นความผิดพลาดหรือไม่? หรือมันไม่สำคัญอะไร

2
ตัวอย่างของสถิติที่ไม่เป็นอิสระจากการกระจายตัวของตัวอย่าง?
นี่คือคำจำกัดความของสถิติในวิกิพีเดีย ทฤษฎีทางสถิติกำหนดสถิติว่าเป็นฟังก์ชันของตัวอย่างที่ฟังก์ชันนั้นมีความเป็นอิสระจากการแจกตัวอย่าง นั่นคือฟังก์ชั่นสามารถระบุไว้ก่อนที่จะตระหนักถึงข้อมูล คำว่าสถิติใช้สำหรับทั้งฟังก์ชันและค่าของฟังก์ชันในตัวอย่างที่กำหนด ฉันคิดว่าฉันเข้าใจคำจำกัดความส่วนใหญ่นี้อย่างไรก็ตามส่วน - ที่ฟังก์ชันมีความเป็นอิสระจากการแจกแจงตัวอย่างฉันไม่สามารถแยกแยะได้ ความเข้าใจเกี่ยวกับสถิติของฉันจนถึงตอนนี้ ตัวอย่างคือชุดของความเข้าใจของจำนวนการบางอย่างอิสระกระจายเหมือนกัน (IID) ตัวแปรสุ่มที่มีการแจกแจงแบบ F (10 ความเข้าใจของการโยนลูกเต๋ายุติธรรมด้าน 20, 100 ความเข้าใจ 5 ม้วนลูกเต๋ายุติธรรม 6 ด้านที่ สุ่ม 100 คนจากประชากร) ฟังก์ชั่นที่มีโดเมนเป็นชุดนั้นและมีช่วงที่เป็นตัวเลขจริง (หรือบางทีมันอาจจะสามารถผลิตสิ่งอื่น ๆ เช่นเวกเตอร์หรือวัตถุทางคณิตศาสตร์อื่น ๆ ... ) จะได้รับการพิจารณาสถิติ เมื่อฉันคิดถึงตัวอย่างค่าเฉลี่ยมัธยฐานความแปรปรวนทั้งหมดจะสมเหตุสมผลในบริบทนี้ มันเป็นฟังก์ชั่นในชุดของการรับรู้ (การวัดความดันโลหิตจากตัวอย่างแบบสุ่ม) ฉันยังสามารถดูวิธีการรูปแบบการถดถอยเชิงเส้นอาจจะถือว่าเป็นสถิติที่yi=α+β⋅xiyi=α+β⋅xiy_{i} = \alpha + \beta \cdot x_{i} - นี้ไม่ได้เป็นเพียงฟังก์ชั่นในชุดของความเข้าใจหรือไม่? ที่ฉันสับสน สมมติว่าความเข้าใจของฉันจากด้านบนถูกต้องฉันไม่สามารถเข้าใจได้ว่าฟังก์ชันใดที่อาจไม่เป็นอิสระจากการแจกแจงตัวอย่าง ฉันพยายามนึกตัวอย่างเพื่อให้เข้าใจ แต่ก็ไม่มีโชค ความเข้าใจใด ๆ …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.