คำถามติดแท็ก latent-variable

ตัวแปรแฝงหมายถึงตัวแปรที่ไม่สามารถสังเกตได้โดยตรง ตัวแปรเหล่านี้ถูกกำหนดในรูปแบบของตัวแปรที่สังเกตได้ ในแง่แคบ "ตัวแปรแฝง" ถูกมองว่าเป็นสิ่งที่สร้างตัวแปรที่สังเกตได้ในกระบวนการสร้างข้อมูลโดยนัย เรียกอีกอย่างว่าตัวแปรที่ซ่อนอยู่หรือซุ่มซ่อน

5
LDA กับ word2vec
ฉันพยายามที่จะเข้าใจความคล้ายคลึงกันระหว่างLatent Dirichlet Allocationและword2vecสำหรับการคำนวณความคล้ายคลึงกันของคำ ดังที่ฉันเข้าใจ LDA จับคู่คำกับเวกเตอร์ของความน่าจะเป็นของหัวข้อแฝงในขณะที่ word2vec จับคู่คำกับเวกเตอร์ของจำนวนจริง (เกี่ยวข้องกับการสลายตัวตามตัวอักษรเอกพจน์ของข้อมูลร่วมกันแบบพอยต์ดูO. Levy, Y. Goldberg) ตามตัวประกอบเมทริกซ์โดยนัย " ; ดูเพิ่มเติมที่word2vec ทำงานอย่างไร? ) ฉันสนใจทั้งในด้านความสัมพันธ์ทางทฤษฎี (สามารถพิจารณาได้ว่าเป็นลักษณะทั่วไปหรือการเปลี่ยนแปลงอื่น ๆ ) และในทางปฏิบัติ (เมื่อใช้อย่างใดอย่างหนึ่ง แต่ไม่ใช่แบบอื่น) ที่เกี่ยวข้อง: อะไรคือวิธีมาตรฐานในการคำนวณระยะห่างระหว่างเอกสาร - DataScience.SE

3
การวิเคราะห์ระดับแฝงกับการวิเคราะห์กลุ่ม - ความแตกต่างในการอนุมาน?
การอนุมานที่แตกต่างกันสามารถทำอะไรได้จากการวิเคราะห์ระดับแฝง (LCA) กับการวิเคราะห์คลัสเตอร์ มันถูกต้องหรือไม่ที่ LCA ถือว่าตัวแปรแฝงแฝงที่ก่อให้เกิดคลาสในขณะที่การวิเคราะห์กลุ่มเป็นคำอธิบายเชิงประจักษ์ของคุณลักษณะที่สัมพันธ์กันจากอัลกอริทึมการจัดกลุ่ม? ดูเหมือนว่าในสังคมศาสตร์ LCA ได้รับความนิยมและได้รับการพิจารณาว่าเป็นระบบที่เหนือกว่าเนื่องจากมีการทดสอบความสำคัญแบบไคสแควร์อย่างเป็นทางการซึ่งการวิเคราะห์กลุ่มไม่ได้ มันจะเป็นการดีถ้าตัวอย่างสามารถเสนอในรูปแบบของ "LCA จะเหมาะสมกับสิ่งนี้ (แต่ไม่ใช่การวิเคราะห์คลัสเตอร์) และการวิเคราะห์กลุ่มจะเหมาะสมสำหรับสิ่งนี้ (แต่ไม่ใช่การวิเคราะห์ระดับที่ซ่อนเร้น) ขอบคุณ! ไบรอัน

1
การตีความตัวแปรแฝงของตัวแบบเชิงเส้นทั่วไป (GLM)
เวอร์ชั่นสั้น: เรารู้ว่าการถดถอยโลจิสติกและการถดถอยแบบ probit สามารถตีความได้ว่าเกี่ยวข้องกับตัวแปรแฝงอย่างต่อเนื่องที่ได้รับการแยกตามเกณฑ์คงที่บางส่วนก่อนที่จะสังเกต การตีความตัวแปรแฝงที่คล้ายกันมีให้สำหรับการพูดการถดถอยของปัวซองหรือไม่ วิธีการเกี่ยวกับการถดถอยแบบทวินาม (เช่น logit หรือ probit) เมื่อมีผลลัพธ์ที่ไม่ต่อเนื่องกันมากกว่าสองรายการ ในระดับทั่วไปส่วนใหญ่มีวิธีการตีความ GLM ใด ๆ ในแง่ของตัวแปรแฝงหรือไม่? รุ่นยาว: วิธีมาตรฐานในการสร้างแรงจูงใจให้กับโมเดล probit สำหรับผลลัพธ์ไบนารี (เช่นจาก Wikipedia ) มีดังต่อไปนี้ เรามีไม่มีใครสังเกต / แฝงผลตัวแปรที่มีการกระจายตามปกติเงื่อนไขในการทำนายXตัวแปรแฝงนี้อยู่ภายใต้กระบวนการ thresholding เพื่อให้ผลที่ไม่ต่อเนื่องเราจริงสังเกตคือถ้า ,ถ้า<\ สิ่งนี้นำไปสู่ความน่าจะเป็นของให้เพื่อให้อยู่ในรูปแบบของ CDF ปกติพร้อมค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐานฟังก์ชันของ thresholdและความชันของการถดถอยของบนX U = 1 Y ≥ γ U = 0 Y < γ U = 1 X …

5
เริ่มต้นอย่างไรกับการประยุกต์ใช้ทฤษฎีการตอบกลับข้อสอบและซอฟต์แวร์ที่จะใช้?
บริบท ฉันได้อ่านเกี่ยวกับทฤษฎีการตอบสนองของรายการและฉันคิดว่ามันน่าหลงใหล ฉันเชื่อว่าฉันเข้าใจพื้นฐาน แต่ฉันก็ยังสงสัยว่าจะใช้เทคนิคทางสถิติที่เกี่ยวข้องกับพื้นที่นั้นได้อย่างไร ด้านล่างเป็นสองบทความที่คล้ายกับพื้นที่ที่ฉันต้องการใช้ ITR ใน: http://www.jstor.org/stable/4640738?seq=7 http://www.ncbi.nlm.nih.gov/pubmed/21744971 อย่างที่สองคือสิ่งที่ฉันอยากจะขยายออกไป ณ เวลานี้ ฉันดาวน์โหลดโปรแกรมฟรีชื่อ jMetrik และดูเหมือนว่าจะใช้งานได้ดี ฉันคิดว่ามันอาจจะพื้นฐานเกินไปที่ IRT จะไป แต่ฉันไม่แน่ใจ ฉันรู้ว่าวิธีที่ "ดีที่สุด" น่าจะเกี่ยวข้องกับการเรียนรู้ R อย่างไรก็ตามฉันไม่รู้ว่าฉันสามารถใช้เวลาในการจัดการกับช่วงโค้งการเรียนรู้นั้นได้หรือไม่ โปรดทราบว่าเรามีเงินทุนสำหรับการซื้อซอฟต์แวร์ แต่จากสิ่งที่ฉันเห็นดูเหมือนจะไม่มีโปรแกรม IRT ที่ยอดเยี่ยม คำถาม คุณคิดอย่างไรกับประสิทธิภาพของ jMetrik คุณจะแนะนำให้ฉันใช้ IRT ต่อไปได้อย่างไร โปรแกรมที่ดีที่สุดสำหรับการสมัคร IRT คืออะไร? คุณใช้ IRT เป็นประจำหรือไม่? ถ้าเป็นเช่นนั้นได้อย่างไร

3
จะเลือกจำนวนปัจจัยแฝงที่เหมาะสมที่สุดในการแยกตัวประกอบเมทริกซ์ที่ไม่เป็นลบได้อย่างไร
ได้รับเมทริกซ์ , ไม่ใช่เชิงลบเมทริกซ์ตัวประกอบ (NMF) พบว่าทั้งสองเมทริกซ์ที่ไม่ใช่เชิงลบและ ( คือทุกองค์ประกอบ ) เพื่อเป็นตัวแทนของเมทริกซ์ที่สลายตัวเมื่อ:Vm×nVm×n\mathbf V^{m \times n}Wm×kWm×k\mathbf W^{m \times k}Hk×nHk×n\mathbf H^{k \times n}≥0≥0\ge 0 V≈WH,V≈WH,\mathbf V \approx \mathbf W\mathbf H, ตัวอย่างเช่นโดยการกำหนดว่าไม่ใช่ - ลบและลดข้อผิดพลาดในการสร้างใหม่WW\mathbf WHH\mathbf H∥V−WH∥2.‖V−WH‖2.\|\mathbf V-\mathbf W\mathbf H\|^2. มีวิธีปฏิบัติทั่วไปในการประมาณค่าkkkใน NMF หรือไม่ ตัวอย่างเช่นจะใช้การตรวจสอบความถูกต้องไขว้เพื่อจุดประสงค์นั้นได้อย่างไร

1
พารามิเตอร์เทียบกับตัวแปรแฝง
ฉันเคยถามเรื่องนี้มาก่อนและพยายามดิ้นรนกับการระบุสิ่งที่ทำให้พารามิเตอร์โมเดลและสิ่งที่ทำให้มันเป็นตัวแปรแฝง ดังนั้นเมื่อดูที่หัวข้อต่างๆในหัวข้อนี้ในเว็บไซต์นี้ความแตกต่างหลัก ๆ น่าจะเป็น: ตัวแปรแฝงไม่ได้ถูกสังเกต แต่มีการแจกแจงความน่าจะเป็นที่เกี่ยวข้องกับมันเนื่องจากมันเป็นตัวแปรและพารามิเตอร์ก็ไม่ได้ถูกสังเกตและไม่มีการแจกแจงที่เกี่ยวข้องกับพวกมันซึ่งฉันเข้าใจว่ามันเป็นค่าคงที่และมีค่าคงที่ หา. นอกจากนี้เราสามารถใส่ค่าพารามิเตอร์ให้กับตัวแทนเพื่อแสดงถึงความไม่แน่นอนของเราเกี่ยวกับพารามิเตอร์เหล่านี้แม้ว่าจะมีค่าจริงเพียงค่าเดียวที่เกี่ยวข้องกับพวกเขาหรืออย่างน้อยนั่นคือสิ่งที่เราคิด ฉันหวังว่าฉันถูกต้องจนถึงตอนนี้? ตอนนี้ฉันได้ดูตัวอย่างนี้สำหรับการถดถอยเชิงเส้นแบบเบย์แบบถ่วงน้ำหนักจากวารสารและพยายามดิ้นรนจริงๆที่จะเข้าใจว่าอะไรคือพารามิเตอร์และตัวแปรคืออะไร: yi=βTxi+ϵyiyi=βTxi+ϵyi y_i = \beta^T x_i + \epsilon_{y_i} ที่นี่และyถูกสังเกต แต่yเท่านั้นที่ถือว่าเป็นตัวแปรเช่นมีการกระจายที่เกี่ยวข้องกับมันxxxyyyyyy ตอนนี้สมมติฐานการสร้างแบบจำลองคือ: y∼N(βTxi,σ2/wi)y∼N(βTxi,σ2/wi) y \sim N(\beta^Tx_i, \sigma^2/w_i) ดังนั้นความแปรปรวนของจึงถูกถ่วงน้ำหนักyyy นอกจากนี้ยังมีการแจกแจงก่อนหน้าในและwซึ่งเป็นการแจกแจงแบบปกติและแกมมาตามลำดับ ββ\betawww ดังนั้นโอกาสในการบันทึกอย่างสมบูรณ์จะได้รับจาก: logp(y,w,β|x)=ΣlogP(yi|w,β,xi)+logP(β)+ΣlogP(wi)log⁡p(y,w,β|x)=Σlog⁡P(yi|w,β,xi)+log⁡P(β)+Σlog⁡P(wi) \log p(y, w, \beta |x) = \Sigma \log P(y_i|w, \beta, x_i) + \log P(\beta) + \Sigma \log P(w_i) ตอนนี้ฉันเข้าใจแล้วทั้งและwคือพารามิเตอร์ของแบบจำลอง อย่างไรก็ตามในเอกสารพวกเขาอ้างถึงพวกเขาเป็นตัวแปรแฝง …

2
จะลดจำนวนรายการโดยใช้การวิเคราะห์ปัจจัยความสอดคล้องภายในและทฤษฎีการตอบสนองข้อต่อได้อย่างไร?
ฉันกำลังอยู่ระหว่างการพัฒนาแบบสอบถามและฉันจะใช้หมายเลขที่กำหนดเองในตัวอย่างนี้เพื่ออธิบาย สำหรับบริบทฉันกำลังพัฒนาแบบสอบถามทางจิตวิทยาที่มีวัตถุประสงค์เพื่อประเมินรูปแบบความคิดที่ระบุโดยทั่วไปในบุคคลที่มีความวิตกกังวล รายการอาจมีลักษณะ "ฉันต้องตรวจสอบเตาอบซ้ำ ๆ เพราะฉันไม่แน่ใจว่าปิดแล้ว " ฉันมีคำถาม 20 ข้อ (Likert 5 จุด) ซึ่งอาจประกอบด้วยหนึ่งหรือสองปัจจัย (โปรดทราบว่าในความเป็นจริงฉันมีคำถาม 200 คำถามซึ่งประกอบด้วย 10 เกล็ดและแต่ละสเกลอาจประกอบด้วยสองปัจจัย) ฉันยินดีที่จะลบรายการครึ่งหนึ่งทิ้งคำถาม 10 ข้อโดยหนึ่งในสองปัจจัย ฉันคุ้นเคยกับการวิเคราะห์ปัจจัยเชิงสำรวจ (EFA) ความสอดคล้องภายใน (อัลฟาของครอนบาค) และเส้นโค้งลักษณะของรายการในทฤษฎีการตอบสนองข้อ (IRT) ฉันสามารถดูว่าฉันจะใช้วิธีการใดวิธีการหนึ่งต่อไปนี้เพื่อกำหนดว่ารายการใด "แย่ลง" ในระดับใด ๆ ฉันขอขอบคุณที่แต่ละวิธียังตอบคำถามที่แตกต่างกันถึงแม้ว่าพวกเขาอาจนำไปสู่ผลลัพธ์ที่คล้ายกันและฉันไม่แน่ใจว่า "คำถาม" อะไรสำคัญที่สุด ก่อนที่เราจะเริ่มให้แน่ใจว่าฉันรู้ว่าฉันกำลังทำอะไรกับแต่ละวิธีเหล่านี้เป็นรายบุคคล เมื่อใช้ EFA ฉันจะระบุจำนวนปัจจัยและลบรายการที่โหลดน้อยที่สุด (ให้พูด <.30) กับปัจจัยที่เกี่ยวข้องหรือโหลดข้ามอย่างมีนัยสำคัญในหลาย ๆ ปัจจัย โดยใช้ความสอดคล้องภายในฉันจะลบรายการที่มี "อัลฟาถ้ารายการถูกลบ" ที่แย่กว่านั้น ฉันสามารถทำได้โดยสมมติหนึ่งปัจจัยในระดับของฉันหรือทำหลังจาก EFA เริ่มต้นเพื่อระบุจำนวนของปัจจัยและเรียกใช้อัลฟาของฉันสำหรับแต่ละปัจจัย …

1
อะไรคือความแตกต่างระหว่าง VAE และ Stochastic Backpropagation สำหรับ Deep Generative Model?
อะไรคือความแตกต่างระหว่างการเข้ารหัสอัตโนมัติ Bay Variation BayesและStochastic Backpropagation สำหรับ Deep Generative Model ? การอนุมานในทั้งสองวิธีนำไปสู่ผลลัพธ์เดียวกันหรือไม่ ฉันไม่ได้ตระหนักถึงการเปรียบเทียบที่ชัดเจนระหว่างทั้งสองวิธีแม้จะมีผู้เขียนทั้งสองกลุ่มอ้างอิงซึ่งกันและกัน

1
อะไรคือความแตกต่างระหว่างปัจจัย MIMIC และคอมโพสิตที่มีตัวบ่งชี้ (SEM)
ในการสร้างแบบจำลองสมการโครงสร้างที่มีตัวแปรแฝง (SEM), การสร้างแบบจำลองทั่วไปคือ "ตัวบ่งชี้หลาย, หลายสาเหตุ" (MIMIC) ที่ตัวแปรแฝงเกิดจากตัวแปรบางอย่างและสะท้อนให้เห็นโดยคนอื่น นี่คือตัวอย่างง่ายๆ: โดยพื้นฐานแล้วf1เป็นผลการถดถอยสำหรับx1, x2และx3, และy1, y2และเป็นตัวชี้วัดการวัดสำหรับy3f1 หนึ่งยังสามารถกำหนดตัวแปรแฝงคอมโพสิตที่ตัวแปรแฝงโดยทั่วไปจำนวนการรวมกันน้ำหนักของตัวแปรองค์ประกอบ นี่คือคำถามของฉัน:มีความแตกต่างระหว่างการกำหนดf1เป็นผลการถดถอยและการกำหนดเป็นผลประกอบในแบบจำลอง MIMIC? การทดสอบโดยใช้lavaanซอฟต์แวร์Rแสดงให้เห็นว่าค่าสัมประสิทธิ์เหมือนกัน: library(lavaan) # load/prep data data <- read.table("http://www.statmodel.com/usersguide/chap5/ex5.8.dat") names(data) <- c(paste("y", 1:6, sep=""), paste("x", 1:3, sep="")) # model 1 - canonical mimic model (using the '~' regression operator) model1 <- ' f1 =~ y1 + …

1
คุณใช้อัลกอริธึม EM ในการคำนวณ MLEs สำหรับสูตรตัวแปรแฝงของโมเดลปัวซองที่มีค่าศูนย์ได้อย่างไร
แบบจำลองการถดถอยปัวซงแบบ zero zero ถูกกำหนดไว้สำหรับตัวอย่างโดย และจะถือว่าพารามิเตอร์และไปY i = { 0 ด้วยความน่าจะเป็นp i + ( 1 - p i ) e - λ i k ด้วยความน่าจะเป็น( 1 - p i ) e - λ ฉัน λ k i / k ! λ = ( λ 1 , … , λ n ) …

2
จะคำนวณช่วงความเชื่อมั่นของสัมประสิทธิ์การถดถอยใน PLS ได้อย่างไร?
แบบจำลองพื้นฐานของPLSคือ matrixและ vectorกำหนดสัมพันธ์กับ ที่คือเวลาแฝงเมทริกซ์และเป็นคำที่มีเสียงรบกวน (sssumingอยู่กึ่งกลาง)X n y X = T P ′ + E , y = T q ′ + f , T n × k E , f X , yn × mn×mn \times mXXXnnnYyyX=TP′+E,X=TP′+E,X = T P' + E, y=Tq′+f,y=Tq′+f,y = T q' + f,TTTn×kn×kn \times kE,fE,fE, …

2
EM ปัญหาการปฏิบัติอัลกอริทึม
นี่เป็นปัญหาการปฏิบัติสำหรับการสอบกลางภาค ปัญหาคือตัวอย่างอัลกอริทึม EM ฉันกำลังมีปัญหากับส่วน (f) ฉันแสดงรายการชิ้นส่วน (a) - (e) เพื่อความสมบูรณ์และในกรณีที่ฉันทำผิดพลาดก่อนหน้านี้ ให้เป็นอิสระตัวแปรสุ่มชี้แจงที่มีอัตราการ\น่าเสียดายที่ไม่มีการตรวจสอบค่าแท้จริงและเราจะสังเกตว่าค่าอยู่ในช่วงเวลาที่กำหนดหรือไม่ ให้ ,และ สำหรับ n ข้อมูลที่สังเกตประกอบด้วย{3j})X1,…,XnX1,…,XnX_1,\ldots,X_nθθ\thetaXXXXXXG1j=1{Xj&lt;1}G1j=1{Xj&lt;1}G_{1j} = \mathbb{1}\left\{X_j < 1\right\}G2j=1{1&lt;Xj&lt;2}G2j=1{1&lt;Xj&lt;2}G_{2j} = \mathbb{1}\left\{1< X_j<2\right\}G3j=1{Xj&gt;2}G3j=1{Xj&gt;2}G_{3j} = \mathbb{1}\left\{X_j > 2\right\}j=1,…,nj=1,…,nj=1,\ldots,n(G1j,G2j,G3j)(G1j,G2j,G3j)(G_{1j},G_{2j},G_{3j}) (a) ให้โอกาสในการสังเกตข้อมูล: L(θ|G)=∏j=1nPr{Xj&lt;1}G1jPr{1&lt;Xj&lt;2}G2jPr{Xj&gt;2}G3j=∏j=1n(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3jL(θ|G)=∏j=1nPr{Xj&lt;1}G1jPr{1&lt;Xj&lt;2}G2jPr{Xj&gt;2}G3j=∏j=1n(1−e−θ)G1j(e−θ−e−2θ)G2j(e−2θ)G3j\begin{align*} L(\theta | G) &= \prod_{j=1}^n \text{Pr}\left\{X_j < 1\right\}^{G_{1j}}\text{Pr}\left\{12\right\}^{G_{3j}}\\ &= \prod_{j=1}^n \left(1-e^{-\theta}\right)^{G_{1j}}\left(e^{-\theta}-e^{-2\theta}\right)^{G_{2j}}\left(e^{-2\theta}\right)^{G_{3j}} \end{align*} (b) ให้โอกาสในการเก็บข้อมูลอย่างสมบูรณ์ L(θ|X,G)=∏j=1n(θe−θxj)G1j(θe−θxj)G2j(θe−θxj)G3jL(θ|X,G)=∏j=1n(θe−θxj)G1j(θe−θxj)G2j(θe−θxj)G3j\begin{align*} L(\theta | X,G) &= \prod_{j=1}^n …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.