คำถามติดแท็ก multinomial

การกระจายความน่าจะเป็นแบบหลายตัวแปรที่ไม่ต่อเนื่องใช้เพื่ออธิบายผลลัพธ์ของการทดลองแบบสุ่มโดยที่แต่ละผลลัพธ์ถูกจัดอยู่ในหมวดหมู่หนึ่งหมวด nk

3
ฉันจะได้อะไรถ้าฉันพิจารณาผลลัพธ์เป็นลำดับแทนที่จะเป็นหมวดหมู่?
มีวิธีการที่แตกต่างกันสำหรับการทำนายของตัวแปรลำดับและตัวแปรเด็ดขาด สิ่งที่ฉันไม่เข้าใจคือความแตกต่างนี้สำคัญอย่างไร มีตัวอย่างง่าย ๆ ที่สามารถบอกได้ชัดเจนว่าเกิดอะไรขึ้นถ้าฉันสั่งออเดอร์? ภายใต้สถานการณ์ใดมันไม่สำคัญ? ตัวอย่างเช่นหากตัวแปรอิสระทุกหมวดหมู่ / ลำดับก็จะมีความแตกต่าง? คำถามที่เกี่ยวข้องนี้มุ่งเน้นไปที่ประเภทของตัวแปรอิสระ ที่นี่ฉันถามเกี่ยวกับตัวแปรผลลัพธ์ แก้ไข: ฉันเห็นจุดที่ใช้โครงสร้างคำสั่งซื้อเพื่อลดจำนวนพารามิเตอร์โมเดล แต่ฉันก็ยังไม่มั่นใจจริงๆ นี่คือตัวอย่าง (นำมาจากบทนำสู่การถดถอยโลจิสติกที่ได้รับคำสั่งซึ่งเท่าที่ฉันสามารถเห็นการถดถอยโลจิสติกอันดับไม่ดีกว่าการถดถอยโลจิสติกพหุนาม library(nnet) library(MASS) gradapply <- read.csv(url("http://www.ats.ucla.edu/stat/r/dae/ologit.csv"), colClasses=c("factor", "factor", "factor", "numeric")) ordered_result <- function() { train_rows <- sample(nrow(gradapply), round(nrow(gradapply)*0.9)) train_data <- gradapply[train_rows,] test_data <- gradapply[setdiff(1:nrow(gradapply), train_rows),] m <- polr(apply~pared+gpa, data=train_data) pred <- predict(m, test_data) return(sum(pred==test_data$apply)) } …

2
glmnet: วิธีทำให้ความรู้สึกของการกำหนดพารามิเตอร์แบบหลายส่วน?
ปัญหาต่อไปนี้: ฉันต้องการทำนายตัวแปรการตอบสนองอย่างเด็ดขาดด้วยตัวแปรเด็ดขาดหนึ่งตัว (หรือมากกว่า) โดยใช้ glmnet () อย่างไรก็ตามฉันไม่สามารถรับรู้ถึงผลลัพธ์ที่ glmnet มอบให้ฉันได้ ตกลงก่อนอื่นเรามาสร้างตัวแปรเด็ดขาดสองตัวที่เกี่ยวข้องกัน: สร้างข้อมูล p <- 2 #number variables mu <- rep(0,p) sigma <- matrix(rep(0,p^2), ncol=p) sigma[1,2] <- .8 #some relationship .. diag(sigma) <- 1 sigma <- pmax(sigma, t(sigma)) n <- 100 set.seed(1) library(MASS) dat <- mvrnorm(n, mu, sigma) #discretize k <- 3 …

6
ทำนายค่าหลังจากเรียกใช้ฟังก์ชัน mlogit ใน R
นี่คือสิ่งที่ฉันต้องการทำ แต่ดูเหมือนจะไม่มีpredictวิธีสำหรับ mlogit ความคิดใด ๆ library(mlogit) data("Fishing", package = "mlogit") Fish <- mlogit.data(Fishing, varying = c(2:9), shape = "wide", choice = "mode") Fish_fit<-Fish[-1,] Fish_test<-Fish[1,] m <- mlogit(mode ~price+ catch | income, data = Fish_fit) predict(m,newdata=Fish_test)

2
การทดสอบแบบฟิชเชอร์มีการกระจายแบบใด
ในงานของฉันฉันได้เห็นการทดสอบที่แม่นยำของฟิชเชอร์หลายครั้งและฉันสงสัยว่ามันเหมาะกับข้อมูลของฉันมากแค่ไหน เมื่อดูที่หลายแหล่งฉันเข้าใจวิธีคำนวณสถิติ แต่ไม่เคยเห็นคำอธิบายที่ชัดเจนและเป็นทางการของสมมติฐานว่าง ใครสามารถช่วยอธิบายหรือแนะนำฉันให้อธิบายอย่างเป็นทางการเกี่ยวกับการแจกแจงที่สันนิษฐานได้? จะขอบคุณสำหรับคำอธิบายในแง่ของค่าในตารางฉุกเฉิน

1
ตัวอย่างการทดสอบไคสองกำลังสอง
คำถามนี้มาจากหนังสือ Asymptotic Statistics, pg. ของ Van Van Vaart 253 # 3: สมมติว่าและเวกเตอร์พหุนามอิสระที่มีพารามิเตอร์และb_k) ภายใต้สมมติฐานว่างที่แสดงให้เห็นว่าXmXm\mathbf{X}_mYnYn\mathbf{Y}_n(m,a1,…,ak)(m,a1,…,ak)(m,a_1,\ldots,a_k)(n,b1,…,bk)(n,b1,…,bk)(n,b_1,\ldots,b_k)ai=biai=bia_i=b_i ∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i∑i=1k(Xm,i−mc^i)2mc^i+∑i=1k(Yn,i−nc^i)2nc^i\sum_{i=1}^k \dfrac{(X_{m,i} - m\hat{c}_i)^2}{m\hat{c}_i} + \sum_{i=1}^k \dfrac{(Y_{n,i} - n\hat{c}_i)^2}{n\hat{c}_i}มีการจัดจำหน่าย ที่n)χ2k−1χk−12\chi^2_{k-1}c^i=(Xm,i+Yn,i)/(m+n)c^i=(Xm,i+Yn,i)/(m+n)\hat{c}_i = (X_{m,i} + Y_{n,i})/(m+n) ฉันต้องการความช่วยเหลือในการเริ่มต้น กลยุทธ์ที่นี่คืออะไร? ฉันสามารถรวมการเรียกทั้งสองเข้าด้วยกันเป็น: ∑i=1k(mYn,i−nXm,i)2mn(m+n)c^i∑i=1k(mYn,i−nXm,i)2mn(m+n)c^i\sum_{i=1}^k \dfrac{(mY_{n,i} - nX_{m,i})^2}{mn(m+n)\hat{c}_i} แต่งานนี้เคยชินกับ CLT เพราะการรวมกันถ่วงน้ำหนักของและy_nไม่แน่ใจว่านี่เป็นเส้นทางที่ถูกต้องหรือไม่ ข้อเสนอแนะใด ๆXmXmX_mYnYnY_n แก้ไข: ถ้ามันค่อนข้างง่ายเพราะเราได้รับm=nm=nm=n mYn−nXmmn(m+n)−−−−−−−−−√=Yn−Xm(m+n)−−−−−−−√mYn−nXmmn(m+n)=Yn−Xm(m+n)\begin{align*} \dfrac{mY_{n} - nX_{m}}{\sqrt{mn(m+n)}} &= \dfrac{Y_{n} - X_{m}}{\sqrt{(m+n)}} \end{align*} …

2
ผลรวมของสัมประสิทธิ์การกระจายแบบพหุนาม
\newcommand{\P}{\mathbb{P}}ฉันกำลังจะตายอย่างยุติธรรม เมื่อใดก็ตามที่ฉันได้รับ 1, 2 หรือ 3 ฉันจะเขียน '1' เมื่อใดก็ตามที่ฉันได้ 4 ฉันเขียน '2'; เมื่อใดก็ตามที่ฉันได้ 5 หรือ 6 ฉันจะเขียน '3' ให้NNNเป็นจำนวนพ่นฉันต้องการสำหรับผลิตภัณฑ์ของตัวเลขทั้งหมดที่ผมเขียนลงไปเป็น≥100000≥100000\geq 100000100000 ฉันต้องการคำนวณ (หรือโดยประมาณ) P(N≥25)P(N≥25)\P(N\geq 25)และการประมาณสามารถให้เป็นฟังก์ชันของการแจกแจงแบบปกติ ครั้งแรกผมรู้ว่าP(N≥11)=1P(N≥11)=1\P(N\geq 11) = 1เพราะlog3100.000≈10.48log3⁡100.000≈10.48\log_3 100.000 \approx 10.4810.48 ทีนี้ลองaaa , bbbและcccเป็นจำนวนครั้งที่ผมเขียน 1, 2 และ 3 ตามลำดับ แล้ว: P(a,b,c∣n)=⎧⎩⎨⎪⎪(na,b,c)(12)a(16)b(13)c0 if a+b+c=n otherwiseP(a,b,c∣n)={(na,b,c)(12)a(16)b(13)c if a+b+c=n0 otherwise\P(a,b,c\mid n) = \begin{cases}\displaystyle\binom …

2
การถดถอยโลจิสติกหลายครั้งเทียบกับการถดถอยหลายระดับ
มันเป็นไปได้ไหมที่จะทำการถดถอยโลจิสติกแบบไบนารีหลาย ๆ แบบแทนที่จะทำการถดถอยแบบหลายส่วน? จากคำถามนี้: การถดถอยโลจิสติก Multinomial เทียบกับการถดถอยโลจิสติกไบนารีหนึ่งส่วนที่เหลือฉันเห็นว่าการถดถอย Multinomial อาจมีข้อผิดพลาดมาตรฐานที่ต่ำกว่า อย่างไรก็ตามแพคเกจที่ฉันต้องการใช้ยังไม่ได้รับการสรุปในการถดถอยหลายระดับ ( ncvreg: http://cran.r-project.org/web/packages/ncvreg/ncvreg.pdf ) และดังนั้นฉันสงสัยว่าฉันสามารถทำได้ การถดถอยโลจิสติกไบนารีหลายรายการแทน

1
สัจพจน์ของ Luce ทางเลือกคำถามเกี่ยวกับความน่าจะเป็นแบบมีเงื่อนไข [ปิด]
ปิด คำถามนี้ต้องการรายละเอียดหรือความคมชัด ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ เพิ่มรายละเอียดและชี้แจงปัญหาโดยแก้ไขโพสต์นี้ ปิดให้บริการใน2 ปีที่ผ่านมา ฉันอ่านLuce (1959) จากนั้นฉันก็พบคำสั่งนี้: เมื่อคนเลือกระหว่างทางเลือกบ่อยครั้งที่การตอบสนองของพวกเขาดูเหมือนจะถูกควบคุมโดยความน่าจะเป็นซึ่งถูกกำหนดไว้ในชุดตัวเลือก แต่ทฤษฎีความน่าจะเป็นทั่วไปที่มีนิยามมาตรฐานของความน่าจะเป็นแบบมีเงื่อนไขนั้นดูเหมือนจะไม่เป็นสิ่งที่ต้องการ ตัวอย่างแสดงให้เห็นถึงความยากลำบาก เมื่อตัดสินใจว่าจะเดินทางจากบ้านไปยังเมืองอื่นตัวเลือกของคุณอาจเป็นเครื่องบิน (a) รถบัส (b) หรือรถยนต์ (c) ให้ A, B, C แสดงถึงสภาวะที่ไม่แน่นอนของธรรมชาติที่เกี่ยวข้องกับรูปแบบของการเดินทาง โปรดทราบว่าหากมีคนเลือกความไม่แน่นอนทั้งหมดของ A และ B อยู่เนื่องจากเครื่องบินบินและรถเมล์วิ่งไม่ว่าคุณจะอยู่บนเครื่องบินหรือไม่ก็ตาม อย่างไรก็ตามหากคุณเลือก a หรือ b ดังนั้นรถของคุณจะยังคงอยู่ในโรงรถและชุด C จะถูกเปลี่ยนอย่างรุนแรงเมื่อรถขับเคลื่อน สัจพจน์ตัวเลือกของบทที่ 1 ได้รับการแนะนำเป็นความพยายามครั้งแรกในการสร้างทฤษฎีความน่าจะเป็นแบบเลือกได้โดยผ่านสมมติฐานตัวอย่างพื้นที่คงที่ที่เป็นสากล แหล่งที่มา: http://www.scholarpedia.org/article/Luce's_choice_axiom สำหรับผมน่าจะเป็นตัวชี้วัดที่มีการกำหนดไว้กับแฝดพื้นที่ตัวอย่างเป็นพีชคณิตซิกมาFและในที่สุดก็เป็นมาตรการPΩΩ\OmegaFF\mathcal{F}PPP ด้วยความเคารพต่อตัวอย่างที่กล่าวมาแล้วสิ่งที่ดูเหมือนจะเป็นปัญหาถ้าฉันกำหนด: Ω={bus,car,airplane}Ω={bus,car,airplane}\Omega = \{ \text{bus}, \text{car}, \text{airplane} \} …

3
Multinomial-Dirichlet model ที่มีการแจกแจง hyperprior ในพารามิเตอร์ความเข้มข้น
ฉันจะพยายามอธิบายปัญหาในมือโดยทั่วไปที่สุด ฉันกำลังสร้างแบบจำลองการสังเกตเป็นการกระจายอย่างมีนัยสำคัญกับพารามิเตอร์ความน่าจะเป็นเวกเตอร์ทีต้า จากนั้นผมถือว่า theta พารามิเตอร์เวกเตอร์ต่อไปนี้ก่อน Dirichletกระจายกับพารามิเตอร์\α1, α2, … , αkα1,α2,…,αk\alpha_1,\alpha_2,\ldots,\alpha_k เป็นไปได้หรือไม่ที่จะกำหนดให้มีการแจกแจงเหนือพารามิเตอร์ ? มันจะต้องเป็นการกระจายหลายตัวแปรเช่นการแจกแจงแบบแบ่งหมวดหมู่และแบบดิริชเล็ตหรือไม่? ดูเหมือนว่าอัลฟาจะเป็นบวกเสมอดังนั้นแกมม่าไฮเพอร์ไพน์จึงควรทำงานα1,α2, … ,αkα1,α2,…,αk\alpha_1,\alpha_2,\ldots,\alpha_k ไม่แน่ใจว่ามีใครลองปรับรุ่น overparametrized (อาจจะ) แต่ดูเหมือนว่าสมเหตุสมผลสำหรับฉันที่จะคิดว่าอัลฟ่าไม่ควรได้รับการแก้ไข แต่มาจากการกระจายแกมม่า โปรดพยายามให้ข้อมูลอ้างอิงบางอย่างแก่ฉัน, ให้ข้อมูลเชิงลึกเกี่ยวกับวิธีที่ฉันสามารถลองวิธีการดังกล่าวในทางปฏิบัติ


2
การถดถอยโลจิสติกสำหรับมัลติคลาส
ฉันได้แบบจำลองสำหรับการถดถอยโลจิสติกสำหรับมัลติคลาสที่กำหนดโดย P(Y=j|X(i))=exp(θTjX(i))1 +∑km =1exp(θTม.X( i ))P(Y=J|X(ผม))=ประสบการณ์⁡(θJTX(ผม))1+Σม.=1kประสบการณ์⁡(θม.TX(ผม)) P(Y=j|X^{(i)}) = \frac{\exp(\theta_j^TX^{(i)})}{1+ \sum_{m=1}^{k}\exp(\theta_m^T X^{(i)})} โดยที่ k คือจำนวนคลาส theta คือพารามิเตอร์ที่จะประมาณ j คือคลาส jth Xi คือข้อมูลการฝึกอบรม ดีสิ่งหนึ่งที่ฉันไม่ได้เป็นวิธีการที่ได้มาเป็นส่วนหนึ่งหาร ปกติรูปแบบ ฉันหมายความว่ามันทำให้ความน่าจะเป็นอยู่ระหว่าง 0 ถึง 11 + ∑m = 1kประสบการณ์( θTม.X( i ))1+Σม.=1kประสบการณ์⁡(θม.TX(ผม)) 1+ \sum_{m=1}^{k}\exp(\theta_m^T X^{(i)}) ฉันหมายถึงฉันเคยชินกับการถดถอยโลจิสติก P( Y= 1 | X( i )) = 1 / ( 1 …


4
การทดสอบเพื่อเปรียบเทียบองค์ประกอบชุมชนคืออะไร
หวังว่าคำถาม newbie นี้เป็นคำถามที่เหมาะสมสำหรับเว็บไซต์นี้: สมมติว่าฉันต้องการเปรียบเทียบองค์ประกอบของชุมชนนิเวศวิทยาที่สองไซต์ A, B. ฉันรู้ว่าทั้งสามไซต์มีสุนัขแมววัวและนกดังนั้นฉันจึงลองชิมความอุดมสมบูรณ์ของพวกเขาในแต่ละไซต์ (ฉันไม่มี " คาดว่า "ความอุดมสมบูรณ์ของสัตว์แต่ละตัวในแต่ละไซต์) ถ้าฉันนับให้พูดว่าสัตว์แต่ละตัวห้าตัวในแต่ละไซต์ A และ B นั้น "คล้ายกัน" มาก แต่ถ้าฉันเจอสุนัข 100 ตัวแมว 5 ตัววัว 2 ตัวและนก 3 ตัวที่ไซต์ A. สุนัข 5 ตัวแมว 3 ตัววัว 75 ตัวและนก 2 ตัวที่ไซต์ B จากนั้นฉันจะบอกว่าไซต์ A และ B นั้นแตกต่างกัน แม้ว่าจะมีองค์ประกอบสปีชีส์เดียวกันแน่นอน (ฉันอ่านดัชนีโซเรนเซนและเบรย์ - เคอร์ติส แต่ดูเหมือนว่าพวกเขาจะพิจารณาว่ามี / ไม่มีสุนัขแมว …

4
การกระจายแบบไม่แสดงอาการของมัลติโนเมียล
ฉันกำลังมองหาการ จำกัด การกระจายตัวของการกระจายตัวแบบมัลติโนเมียมากกว่าผลลัพธ์ IE กระจายดังต่อไปนี้ limn→∞n−12Xnlimn→∞n−12Xn\lim_{n\to \infty} n^{-\frac{1}{2}} \mathbf{X_n} โดยที่เป็นตัวแปรสุ่มค่าเวกเตอร์ที่มีความหนาแน่นf n ( x )สำหรับxเช่นนั้น∑ ฉันx ฉัน = n , x ฉัน ∈ Z , x ฉัน ≥ 0และ 0 สำหรับxอื่น ๆ ทั้งหมดโดยที่XnXn\mathbf{X_n}fn(x)fn(x)f_n(\mathbf{x})xx\mathbf{x}∑ixi=n∑ixi=n\sum_i x_i=nxi∈Z,xi≥0xi∈Z,xi≥0x_i\in \mathbb{Z}, x_i\ge 0xx\mathbf{x} fn(x)=n!∏i=1dpxiixi!fn(x)=n!∏i=1dpixixi!f_{n}(\mathbf{x})=n!\prod_{i=1}^d\frac{p_i^{x_i}}{x_i!} ฉันพบหนึ่งรูปแบบใน "ทฤษฎีทั้งหมด" ของ Larry Wasserman 14.6 หน้า 237แต่สำหรับการ จำกัด การกระจายมันให้ Normal กับเมทริกซ์ความแปรปรวนร่วมเอกพจน์ดังนั้นฉันไม่แน่ใจว่าจะทำให้มาตรฐานเป็นปกติได้อย่างไร คุณสามารถฉายเวกเตอร์สุ่มลงในช่องว่างมิติ …

2
วิธีตัวอย่างการแจกแจงแบบหลายส่วนที่ถูกตัดทอน?
ฉันต้องการอัลกอริทึมในการสุ่มตัวอย่างการกระจายหลายส่วนแบบตัดปลาย นั่นคือ, x⃗ ~1Zพีx11...พีxkkx1! ...xk!x→∼1Zp1x1…pkxkx1!…xk!\vec x \sim \frac{1}{Z} \frac{p_1^{x_1} \dots p_k^{x_k}}{x_1!\dots x_k!} ที่เป็นค่าคงที่ฟื้นฟู\ vec xมีkส่วนประกอบบวกและ\ รวม x_i n ฉันเพียงพิจารณาค่าของ\ vec {x}ในช่วง\ vec เป็น \ le \ vec x \ le \ vec ขZZZx⃗ x→\vec xkkkΣxผม= n∑xi=n\sum x_i = nx⃗ x→\vec{x}a⃗ ≤x⃗ ≤ข⃗ a→≤x→≤ข→\vec a \le \vec x \le \vec b …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.