คำถามติดแท็ก maximum

ค่าสูงสุดคือการสังเกตที่ใหญ่ที่สุดหรือเล็กที่สุดในกลุ่มตัวอย่าง ตัวอย่างเช่นค่าต่ำสุดของตัวอย่าง (สถิติลำดับแรก) และค่าสูงสุดของตัวอย่าง (สถิติลำดับที่ n) ที่เกี่ยวข้องกับค่ามากคือการแจกแจงค่ามากแบบไม่แสดงอาการ *

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

4
คุณจะคำนวณฟังก์ชันความหนาแน่นของความน่าจะเป็นของค่าสูงสุดของตัวอย่างของตัวแปรสุ่มชุด IID ได้อย่างไร
รับตัวแปรสุ่ม Y=max(X1,X2,…,Xn)Y=max(X1,X2,…,Xn)Y = \max(X_1, X_2, \ldots, X_n) โดยที่XiXiX_iเป็นตัวแปรชุด IID ฉันจะคำนวณ PDF ของYYYอย่างไร
45 pdf  maximum 

3
การกระจายตัวของเศษไม้ที่ใหญ่ที่สุด (spacings)
ปล่อยให้แท่งที่มีความยาว 1 แตกเป็นชิ้นเล็ก ๆ น้อย ๆ โดยมีการสุ่มk + 1k+1k+1การกระจายตัวของความยาวของส่วนที่ยาวที่สุดคืออะไร? เป็นทางการมากขึ้นให้เป็น IIDและให้เป็นคำสั่งทางสถิติที่เกี่ยวข้องนั่นคือเราเพียงแค่สั่ง ตัวอย่างในลักษณะที่{(k)} ให้ขวา)( ยู1, … คุณk)(ยู1,...ยูk)(U_1, \ldots U_k)ยู( 0 , 1 )ยู(0,1)U(0,1)U ( 1 ) ≤ U ( 2 ) ≤ , … , ≤ U ( k ) Z k = สูงสุด( U ( 1 ) , U ( …

2
เราจะหาความน่าจะเป็นที่ตัวแปรสุ่มสูงสุดได้อย่างไร
\newcommand{\P}{\mathbb{P}}สมมติว่าเรามีตัวแปรสุ่มอิสระ , ,ด้วยวิธีการ จำกัดและความแปรปรวน , , 2 ฉันกำลังมองหาขอบเขตการกระจายฟรีที่น่าจะเป็นที่ใดมีขนาดใหญ่กว่าอื่น ๆ ทั้งหมด ,ฉันNNNX1X1X_1……\ldotsXnXnX_nμ1≤…≤μNμ1≤…≤μN\mu_1 \leq \ldots \leq \mu_Nσ21σ12\sigma_1^2……\ldotsσ2NσN2\sigma_N^2Xi≠XNXi≠XNX_i \neq X_NXjXjX_jj≠ij≠ij \neq i กล่าวอีกนัยหนึ่งถ้าเพื่อความง่ายเราถือว่าการแจกแจงของนั้นต่อเนื่อง (เช่น ) ฉันกำลังมองหาขอบเขตบน: ถ้าเราสามารถใช้อสมการของ Chebyshev เพื่อรับ: \ P (X_1 = \ max_j X_j) = \ P (X_1> X_2) \ leq \ frac {\ sigma_1 ^ 2 + \ sigma_2 ^ …

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
อาจหมายถึงการบวกส่วนเบี่ยงเบนมาตรฐานหนึ่งค่าเกินค่าสูงสุดหรือไม่
ฉันมีค่าเฉลี่ย 74.10 และส่วนเบี่ยงเบนมาตรฐาน 33.44 สำหรับตัวอย่างที่มีค่าต่ำสุด 0 และสูงสุด 94.33 อาจารย์ของฉันถามฉันว่าค่าเฉลี่ยบวกหนึ่งส่วนเบี่ยงเบนมาตรฐานสูงกว่าค่าสูงสุดได้อย่างไร ฉันแสดงตัวอย่างมากมายเกี่ยวกับเรื่องนี้ แต่เธอไม่เข้าใจ ฉันต้องการการอ้างอิงเพื่อแสดงให้เธอเห็น อาจเป็นบทหรือย่อหน้าใด ๆ จากหนังสือสถิติที่พูดถึงเรื่องนี้โดยเฉพาะ

1
การหาฟังก์ชั่นความหนาแน่นในท้องถิ่นโดยใช้เส้นโค้ง
ฉันพยายามหาค่าสูงสุดในพื้นที่สำหรับฟังก์ชันความหนาแน่นของความน่าจะเป็น (พบได้โดยใช้densityวิธีของ R ) ฉันไม่สามารถใช้วิธี "ดูรอบ ๆ เพื่อนบ้าน" แบบง่าย ๆ (ที่จุดหนึ่งมองไปรอบ ๆ เพื่อดูว่าเป็นระดับสูงสุดในพื้นที่ที่เกี่ยวกับเพื่อนบ้าน) หรือไม่เนื่องจากมีข้อมูลจำนวนมาก นอกจากนี้ดูเหมือนว่ามีประสิทธิภาพและทั่วไปมากกว่าที่จะใช้การแก้ไข Spline แล้วค้นหารากของอนุพันธ์อันดับ 1 เมื่อเทียบกับการสร้าง "มองไปรอบ ๆ เพื่อนบ้าน" ด้วยการยอมรับข้อบกพร่องและพารามิเตอร์อื่น ๆ ดังนั้นคำถามของฉัน: เมื่อพิจารณาจากฟังก์ชันsplinefunจะหาค่าสูงสุดในท้องถิ่นได้อย่างไร มีวิธีง่าย ๆ / เป็นมาตรฐานในการค้นหาอนุพันธ์ของฟังก์ชันที่ส่งคืนโดยใช้ splinefunหรือไม่? มีวิธีที่ดีกว่า / มาตรฐานในการหาค่าสูงสุดในท้องถิ่นของฟังก์ชันความหนาแน่นของความน่าจะเป็นหรือไม่? สำหรับการอ้างอิงด้านล่างเป็นพล็อตของฟังก์ชั่นความหนาแน่นของฉัน ฟังก์ชั่นความหนาแน่นอื่น ๆ ที่ฉันทำงานด้วยนั้นคล้ายกันในรูปแบบ ฉันควรจะบอกว่าฉันใหม่กับ R แต่ไม่ใช่เรื่องใหม่สำหรับการเขียนโปรแกรมดังนั้นอาจมีไลบรารีหรือแพ็คเกจมาตรฐานสำหรับการบรรลุสิ่งที่ฉันต้องการ ขอบคุณสำหรับความช่วยเหลือของคุณ!!
15 r  pdf  splines  maximum 

1
Caret glmnet กับ cv.glmnet
ดูเหมือนจะมีความสับสนมากในการเปรียบเทียบการใช้glmnetภายในcaretเพื่อค้นหาแลมบ์ดาที่ดีที่สุดและใช้cv.glmnetในการทำงานเดียวกัน มีการตั้งคำถามมากมายเช่น: โมเดลการจำแนกประเภท train.glmnet vs. cv.glmnet วิธีที่เหมาะสมในการใช้ glmnet กับคาเร็ตคืออะไร? การตรวจสอบข้าม `glmnet 'โดยใช้` คาเร็ต' แต่ไม่ได้รับคำตอบซึ่งอาจเป็นเพราะความสามารถในการทำซ้ำของคำถาม ตามคำถามแรกฉันให้ตัวอย่างที่คล้ายกัน แต่มีคำถามเดียวกัน: ทำไม lambdas โดยประมาณแตกต่างกันอย่างไร library(caret) library(glmnet) set.seed(849) training <- twoClassSim(50, linearVars = 2) set.seed(849) testing <- twoClassSim(500, linearVars = 2) trainX <- training[, -ncol(training)] testX <- testing[, -ncol(testing)] trainY <- training$Class # Using glmnet to …

2
ความแปรปรวนของค่าสูงสุดของกลุ่มตัวอย่างคืออะไร?
ฉันกำลังหาขอบเขตของความแปรปรวนของตัวแปรสุ่มสูงสุดชุด กล่าวอีกนัยหนึ่งฉันกำลังมองหาสูตรปิดสำหรับเช่นนั้น ที่X = \ {X_1, \ ldots, X_M \}ได้รับการแก้ไข ชุดของMตัวแปรสุ่มด้วยวิธีการ จำกัด\ mu_1 \ ldots \ mu_Mและแปรปรวน\ sigma_1 ^ 2 \ ldots \ sigma_M ^ 2BBBVar(maxiXi)≤B,Var(maxiXi)≤B, \mbox{Var}(\max_i X_i) \leq B \enspace, X={X1,…,XM}X={X1,…,XM}X = \{ X_1, \ldots, X_M \}MMMμ1,…,μMμ1,…,μM\mu_1, \ldots, \mu_Mσ21,…,σ2Mσ12,…,σM2\sigma_1^2, \ldots, \sigma_M^2 ฉันสามารถสรุปได้ว่า Var(maxiXi)≤∑iσ2i,Var(maxiXi)≤∑iσi2, \mbox{Var}(\max_i X_i) \leq \sum_i \sigma_i^2 \enspace, …

3
วันนี้มีใครบางคนที่เร็วกว่า Usain Bolt ไหม?
แก้ไข: ฉันสนใจในปัญหาทางเทคนิคและวิธีการในการกำหนดโอกาสสูงสุด "จริง" ในประชากรที่กำหนดให้สถิติตัวอย่าง มีปัญหาเกี่ยวกับการประเมินความเป็นไปได้ของนักวิ่งที่เร็วกว่า Mr. Bolt จากช่วงเวลาบันทึกการตั้งค่าที่ชัดเจนและละเอียดอ่อน ขำขันฉันด้วยการจินตนาการว่านี่จะไม่เป็นอย่างนั้น Usain Bolt เป็นมนุษย์ที่วัดได้เร็วที่สุดในระยะ 100 เมตร อย่างไรก็ตามจากจำนวนนักกีฬาจำนวนน้อยดูเหมือนว่ามนุษย์ที่เร็วที่สุดที่ "จริง" ยังมีชีวิตอยู่กำลังนั่งบนโซฟาอยู่ที่ไหนสักแห่งและไม่เคยพยายามประกอบอาชีพการแข่งขัน ฉันพยายามใช้ความจริงที่ว่าความแตกต่างระหว่างตัวอย่างที่ส่วนท้ายของการแจกแจงแบบปกตินั้นเล็กลงและเล็กลง ฉันใช้สิ่งนี้เพื่อคำนวณความเป็นไปได้ที่จะมีใครบางคนที่เร็วกว่า Usain Bolt โดยการเปรียบเทียบ Usain กับอันดับที่สองที่เร็วที่สุดอันดับที่ 3 และอื่น ๆ เมื่อต้องการทำสิ่งนี้ฉันพยายามคำนวณค่าที่มากที่สุดที่มีอยู่นอกเหนือจาก "Usain Bolt" โดยการหาอนุพันธ์ของ CDF ของการแจกแจงแบบปกติเทียบกับyyyยกให้เป็นnnn th (โดยที่nnnมีค่าประมาณ 7,000,000,000 หรือจำนวน ตัวอย่างน้อยกว่า "สูงสุด" - ตรรกะที่อยู่เบื้องหลังนี้อธิบายไว้ในหน้าปัญหารถถังเยอรมันวิกิพีเดียซึ่งสรุปการกระจายตัวที่แตกต่างกัน) เช่น: ∫∞0yfYN(y)dy=λn∫∞0y[12[1+erf(y−μσ2√)]]n−112πσ2√e−(y−μ)22σ2dy∫0∞yfYN(y)dy=λn∫0∞y[12[1+erf⁡(y−μσ2)]]n−112πσ2e−(y−μ)22σ2dy\int_{0}^{\infty}y f_{Y_N} (y)dy = \lambda n \int_{0}^{\infty} y …

1
การ์ดเกม: ถ้าฉันจั่วไพ่สี่ใบโดยสุ่มและคุณจั่วไพ่หกใบความน่าจะเป็นที่ไพ่สูงสุดของฉันสูงกว่าแต้มสูงสุดของคุณคืออะไร?
ตามที่ระบุไว้ในชื่อกล่าวว่าถ้าฉันสุ่มไพ่ 4 ใบและคุณดึงไพ่ 6 ใบจากเด็คเดียวกันความน่าจะเป็นที่การ์ดสูงสุดของฉันชนะไพ่สูงสุดของคุณคืออะไร การเปลี่ยนแปลงนี้จะเกิดขึ้นได้อย่างไรหากเราดึงออกมาจากเด็คที่แตกต่างกัน ขอบคุณ!

2
มูลค่าที่คาดหวังของความสัมพันธ์ปลอม
เราวาดตัวอย่างแต่ละขนาดอิสระจากปกติการจัดจำหน่ายn ( μ , σ 2 )NNNnnn(μ,σ2)(μ,σ2)(\mu,\sigma^2) จากตัวอย่างเราเลือก 2 ตัวอย่างที่มีความสัมพันธ์แบบเพียร์สันสูงสุด (แบบสัมบูรณ์) กับแต่ละอื่น ๆNNN ค่าที่คาดหวังของความสัมพันธ์นี้คืออะไร? ขอบคุณ [PS นี่ไม่ใช่การบ้าน]

1
ค่าที่คาดหวังของอัตราส่วนสูงสุดของตัวแปรปกติ n iid
สมมติว่าX1, . . . , XnX1,...,XnX_1,...,X_nจะ IID จากยังไม่มีข้อความ( μ , σ2)ยังไม่มีข้อความ(μ,σ2)N(\mu,\sigma^2)และให้หมายถึง 'TH องค์ประกอบที่เล็กจากX_1,เราจะสามารถผูกอัตราส่วนสูงสุดไว้กับอัตราส่วนระหว่างสององค์ประกอบที่ต่อเนื่องในอย่างไร นั่นคือคุณจะคำนวณส่วนบนได้อย่างไร:X( i )X(ผม)X_{(i)}ผมผมiX1, . . . , XnX1,...,XnX_1,...,X_nX( i )X(ผม)X_{(i)} E[ สูงสุดฉัน= 1 , . . , n - 1( X( i + 1 )X( i )) ]E[สูงสุดผม=1,...,n-1(X(ผม+1)X(ผม))]E\left[\max\limits_{i=1,...,n-1}\left(\frac{X_{(i+1)}}{X_{(i)}}\right)\right] วรรณกรรมที่ฉันสามารถค้นหาได้นั้นมุ่งเน้นไปที่อัตราส่วนระหว่างตัวแปรสุ่มสองตัวซึ่งส่งผลให้มีการแจกแจงอัตราส่วนซึ่ง pdf สำหรับการแจกแจงปกติที่ไม่ได้รับการแจกแจงสองตัวจะได้รับที่นี่: https://en.wikipedia.org/wiki/ Ratio_distribution ในขณะนี้สิ่งนี้จะช่วยให้ฉันสามารถอัตราส่วนอัตราส่วนเฉลี่ยที่คาดหวังของตัวแปรฉันไม่สามารถดูวิธีการทั่วไปแนวคิดนี้เพื่อค้นหาอัตราส่วนสูงสุดที่คาดหวังของตัวแปรnnnnnnn

3
กำลังคำนวณการแจกแจงจากค่าต่ำสุดค่าเฉลี่ยและค่าสูงสุด
สมมติว่าฉันมีชุดข้อมูลขั้นต่ำค่าเฉลี่ยและสูงสุดของชุดข้อมูลพูด 10, 20 และ 25 มีวิธีการ: สร้างการกระจายจากข้อมูลเหล่านี้และ รู้ว่าร้อยละของประชากรที่น่าจะอยู่เหนือหรือต่ำกว่าค่าเฉลี่ย แก้ไข: ตามคำแนะนำของ Glen สมมติว่าเรามีขนาดตัวอย่าง 200

2
อะไรคือผลลัพธ์ที่ทรงพลังที่สุดเกี่ยวกับ iid Gaussians สูงสุด? ใช้มากที่สุดในการฝึก?
รับ iid, พิจารณาตัวแปรสุ่มX1,…,Xn,…∼N(0,1)X1,…,Xn,…∼N(0,1)X_1, \ldots, X_n, \ldots \sim \mathscr{N}(0,1) Zn: =สูงสุด1 ≤ ฉัน≤ nXผม.Zn=สูงสุด1≤ผม≤nXผม. Z_n := \max_{1 \le i \le n} X_i\,. คำถาม:ผลลัพธ์ที่ "สำคัญ" ที่สุดเกี่ยวกับตัวแปรสุ่มเหล่านี้คืออะไร เพื่อชี้แจง "ความสำคัญ" ซึ่งผลลัพธ์ใดที่มีผลลัพธ์เช่นอื่น ๆ มากที่สุดซึ่งเป็นผลลัพธ์เชิงตรรกะ? ผลลัพธ์ใดที่ใช้บ่อยที่สุดในทางปฏิบัติ โดยเฉพาะอย่างยิ่งดูเหมือนว่าจะเป็นชาวบ้านมีความรู้ในทางสถิติ (ทางทฤษฎี) ว่านั้น "โดยทั่วไปเหมือนกับ" \ sqrt {2 \ log n}อย่างน้อยที่สุด (ดูคำถามที่เกี่ยวข้องนี้)ZnZnZ_n2 บันทึกn-----√2เข้าสู่ระบบ⁡n\sqrt{2 \log n} อย่างไรก็ตามมีผลลัพธ์ที่เกี่ยวข้องมากมายในประเภทนี้และดูเหมือนว่าเป็นกรณีที่ส่วนใหญ่ไม่เท่ากันหรือบ่งบอกถึงกันและกัน ตัวอย่างเช่น* * * ** * …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.