คำถามติดแท็ก graphical-model

เรียกอีกอย่างว่า Probabilistic Graphical Model ใช้สำหรับแบบจำลองทางสถิติที่แสดงผ่านกราฟเชิงสาเหตุหรือไม่ (Nb, "กราฟ" เช่นเดียวกับในทฤษฎีกราฟ * ไม่ใช่ * ในรูปหรือพล็อต)

3
ตัวอย่าง: การถดถอย LASSO โดยใช้ glmnet สำหรับผลลัพธ์ไบนารี
ฉันเริ่มตะลุยกับการใช้งานglmnetกับการถดถอยแบบ LASSOซึ่งผลลัพธ์ของความสนใจของฉันนั้นเป็นแบบขั้วคู่ ฉันได้สร้างกรอบข้อมูลจำลองขนาดเล็กด้านล่าง: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 


2
การตีความค่าส่วนที่เหลือเทียบกับค่าพล็อตที่ติดตั้งเพื่อตรวจสอบสมมติฐานของโมเดลเชิงเส้น
พิจารณารูปต่อไปนี้จากรุ่นเชิงเส้นของ Faraway ด้วย R (2005, p. 59) พล็อตแรกนั้นดูเหมือนว่าบ่งบอกว่าส่วนที่เหลือและค่าติดตั้งนั้นไม่ได้มีความสัมพันธ์กันเนื่องจากพวกมันควรอยู่ในโมเดลเชิงเส้น homoscedastic ที่มีข้อผิดพลาดกระจายตามปกติ ดังนั้นพล็อตที่สองและสามซึ่งดูเหมือนจะบ่งบอกถึงการพึ่งพาระหว่างค่าตกค้างและค่าติดตั้งแนะนำรูปแบบที่แตกต่างกัน แต่ทำไมพล็อตที่สองถึงแนะนำเช่น Faraway บันทึกเป็นโมเดลเชิงเส้นตรงแบบเฮเทอโรเซดีติกในขณะที่พล็อตที่สามแนะนำโมเดลที่ไม่ใช่เชิงเส้น? พล็อตที่สองดูเหมือนว่าจะแสดงให้เห็นว่าค่าสัมบูรณ์ของส่วนที่เหลือมีความสัมพันธ์เชิงบวกอย่างมากกับค่าติดตั้งในขณะที่ไม่มีแนวโน้มดังกล่าวปรากฏชัดในพล็อตที่สาม ดังนั้นหากเป็นกรณีที่การพูดเชิงทฤษฎีในแบบจำลองเชิงเส้นตรงแบบ heteroscedastic ที่มีข้อผิดพลาดกระจายทั่วไป Cor(e,y^)=⎡⎣⎢⎢1⋮1⋯⋱⋯1⋮1⎤⎦⎥⎥Cor(e,y^)=[1⋯1⋮⋱⋮1⋯1] \mbox{Cor}\left(\mathbf{e},\hat{\mathbf{y}}\right) = \left[\begin{array}{ccc}1 & \cdots & 1 \\ \vdots & \ddots & \vdots \\ 1 & \cdots & 1\end{array}\right] (ที่นิพจน์ทางซ้ายคือเมทริกซ์ความแปรปรวนร่วม - ความแปรปรวนร่วมระหว่างค่าตกค้างและค่าติดตั้ง) สิ่งนี้จะอธิบายว่าทำไมแปลงที่สองและสามเห็นด้วยกับการตีความของ Faraway แต่เป็นกรณีนี้หรือไม่ ถ้าไม่เช่นนั้นการตีความของ Faraway เกี่ยวกับแผนการแปลงที่สองและสามจะเป็นธรรมได้อย่างไร นอกจากนี้ทำไมพล็อตที่สามจำเป็นต้องระบุว่าไม่ใช่เชิงเส้น? เป็นไปได้หรือไม่ว่ามันเป็นแบบเส้นตรง แต่ความผิดพลาดนั้นไม่ได้กระจายตามปกติหรืออย่างอื่นที่พวกมันกระจายแบบปกติ …

3
เครือข่ายนิวรัลโมเดลแบบกราฟิกเครือข่ายแบบเบย์คืออะไรความสัมพันธ์ระหว่างแบบลำดับชั้น
พวกเขาทั้งหมดดูเหมือนจะเป็นตัวแทนของตัวแปรสุ่มโดยโหนดและ (ใน) การพึ่งพาผ่านขอบ (อาจกำกับ) ฉันสนใจในมุมมองแบบเบย์

4
ทฤษฎีกราฟในรูปแบบกราฟิกอยู่ที่ไหน
การแนะนำตัวแบบกราฟิกอธิบายว่า "... การแต่งงานระหว่างทฤษฎีกราฟและทฤษฎีความน่าจะเป็น" ฉันได้ทฤษฎีส่วนความน่าจะเป็น แต่ฉันมีปัญหาในการทำความเข้าใจว่าทฤษฎีกราฟตรงกับอะไรความเข้าใจเชิงลึกจากทฤษฎีกราฟได้ช่วยให้เราเข้าใจการกระจายความน่าจะเป็นและการตัดสินใจภายใต้ความไม่แน่นอนมากขึ้น ฉันกำลังมองหาตัวอย่างที่เป็นรูปธรรมนอกเหนือจากการใช้คำศัพท์ทางทฤษฎีกราฟที่ชัดเจนใน PGM เช่นการจำแนก PGM เป็น "ต้นไม้" หรือ "bipartite" หรือ "undirected" เป็นต้น

2
ขั้นตอนต่อไปหลังจาก“ การใช้เหตุผลแบบเบย์และการเรียนรู้ของเครื่อง”
ขณะนี้ฉันกำลังผ่าน "การใช้เหตุผลแบบเบย์และการเรียนรู้ของเครื่อง" โดย David Barber และเป็นหนังสือที่เขียนได้ดีและมีส่วนร่วมในการเรียนรู้พื้นฐาน ดังนั้นคำถามกับคนที่ทำสิ่งนี้ไปแล้ว หนังสือชุดต่อไปที่ฉันควรผ่านหลังจากที่ฉันมีความเชี่ยวชาญที่เหมาะสมกับแนวคิดส่วนใหญ่ใน Barber คืออะไร?

1
เมื่อใดที่เขตข้อมูลสุ่มของ Markov
ในตำราเรียนของพวกเขารุ่นกราฟิกครอบครัวเอกและแปรผันอนุมาน , เอ็มจอร์แดนและเอ็มเวนไรท์หารือเกี่ยวกับการเชื่อมต่อระหว่างครอบครัวเอกและมาร์คอฟทุ่งสุ่ม (ไม่มีทิศทางรูปแบบกราฟิก) ฉันพยายามเข้าใจความสัมพันธ์ที่ดีขึ้นระหว่างพวกเขาด้วยคำถามต่อไปนี้: MRF ทุกคนเป็นสมาชิกของครอบครัวผู้ชี้แจงหรือไม่ สมาชิกทุกคนในตระกูลเอ็กซ์โปเนนเชียลสามารถแสดงตนเป็น MRF ได้หรือไม่? หาก MRFs ครอบครัวชี้แจงสิ่งที่เป็นตัวอย่างที่ดีของการกระจายของประเภทหนึ่งไม่ ncluded ในอื่น ๆ ?≠≠\neq จากสิ่งที่ฉันเข้าใจในตำราเรียนของพวกเขา (บทที่ 3) จอร์แดนและเวนไรท์นำเสนอข้อโต้แย้งต่อไป: บอกว่าเรามี AA เกลา X ตัวแปรสุ่มที่ตามบางส่วนกระจายและวาดnสังเกต IID X 1 , ... X nและเราต้องการที่จะระบุPพีพีpnnnX1, … XnX1,...XnX^1, \ldots X^nพีพีp เราคำนวณความคาดหวังเชิงประจักษ์ของฟังก์ชั่นบางอย่างφαφα\phi_\alpha% สำหรับทุกอัลฟ่า∈ฉันμ^α= 1nΣni = 1φα( Xผม) ,μ^α=1nΣผม=1nφα(Xผม),\hat{\mu}_\alpha= \frac{1}{n}\sum^n_{i=1}\phi_\alpha(X^i), อัลฟ่า∈ ฉันα∈ผม\alpha \in \mathcal{I} ที่แต่ละในบางชุดฉันทำดัชนีฟังก์ชั่นϕ …


3
ทำความเข้าใจกับทฤษฎีการแยก d ในเครือข่าย Bayesian ที่เป็นสาเหตุ
ฉันกำลังพยายามทำความเข้าใจกับตรรกะการแบ่งแยกในเครือข่าย Causal Bayesian ฉันรู้ว่าอัลกอริทึมทำงานอย่างไร แต่ฉันไม่เข้าใจว่าทำไม "การไหลของข้อมูล" ทำงานตามที่ระบุไว้ในอัลกอริทึม ตัวอย่างเช่นในกราฟด้านบนสมมติว่าเราได้รับ X เท่านั้นและไม่พบตัวแปรอื่น จากนั้นตามกฎของการแยก d การไหลของข้อมูลจาก X ถึง D: X อิทธิพลซึ่งเป็นX) ไม่เป็นไรเนื่องจาก A เป็นสาเหตุของ X และหากเราทราบเกี่ยวกับผลกระทบ X สิ่งนี้จะส่งผลต่อความเชื่อของเราเกี่ยวกับสาเหตุ A. ข้อมูลไหลP(A)≠P(A|X)P(A)≠P(A|X)P(A)\neq P(A|X) X มีอิทธิพลต่อ B ซึ่งเป็นX) ไม่เป็นไรเนื่องจากความรู้ของเราเกี่ยวกับ X เปลี่ยนแปลงไป A การเปลี่ยนแปลงที่ A สามารถส่งผลต่อความเชื่อของเราเกี่ยวกับสาเหตุ B เช่นกันP(B)≠P(B|X)P(B)≠P(B|X)P(B)\neq P(B|X) X มีอิทธิพลต่อ C ซึ่งเป็นX) ไม่เป็นไรเพราะเรารู้ว่า B นั้นลำเอียงโดยความรู้ของเราเกี่ยวกับผลกระทบทางอ้อม X …

2
พารามิเตอร์ที่ไม่มีตัวคั่นที่กำหนดใน Stan
ผมได้เริ่มต้นเพียงเพื่อเรียนรู้ที่จะใช้สแตนrstanและ นอกจากว่าฉันมักจะสับสนเกี่ยวกับวิธีการทำงานของ JAGS / BUGS ฉันคิดว่าคุณต้องกำหนดการแจกจ่ายก่อนหน้าบางชนิดสำหรับพารามิเตอร์ทุกตัวในโมเดลที่จะดึงมา ดูเหมือนว่าคุณไม่จำเป็นต้องทำสิ่งนี้ใน Stan ตามเอกสารประกอบของมัน นี่คือรูปแบบตัวอย่างที่พวกเขาให้ที่นี่ data { int<lower=0> J; // number of schools real y[J]; // estimated treatment effects real<lower=0> sigma[J]; // s.e. of effect estimates } parameters { real theta[J]; real mu; real<lower=0> tau; } model { theta ~ normal(mu, tau); y ~ normal(theta, …

4
มีแบบฝึกหัดใดบ้างเกี่ยวกับทฤษฎีความน่าจะเป็นแบบเบย์หรือแบบจำลองกราฟิกโดยใช้ตัวอย่าง?
ฉันเคยเห็นการอ้างอิงถึงการเรียนรู้ทฤษฎีความน่าจะเป็นแบบเบย์ใน R และฉันสงสัยว่ามีอะไรมากกว่านี้บางทีใน Python โดยเฉพาะ มุ่งสู่การเรียนรู้ทฤษฎีความน่าจะเป็นแบบเบย์การอนุมานการประมาณความน่าจะเป็นสูงสุดแบบจำลองกราฟิกและการเรียงลำดับ?

4
ขอบของกราฟไซโคลชี้นำเป็นตัวแทนของเวรกรรมหรือไม่?
ฉันกำลังเรียนแบบจำลองความน่าจะเป็นหนังสือสำหรับศึกษาด้วยตนเอง ขอบในกราฟไซเคิลกำกับ (DAG)แสดงถึงความสัมพันธ์เชิงสาเหตุหรือไม่? ถ้าฉันต้องการสร้างเครือข่ายแบบเบย์แต่ฉันไม่แน่ใจเกี่ยวกับทิศทางของลูกศรในนั้น ข้อมูลทั้งหมดจะบอกฉันว่าเป็นความสัมพันธ์ที่สังเกตไม่ใช่การเชื่อมโยงระหว่างกัน ฉันรู้ว่าฉันถามมากเกินไปเนื่องจากฉันแน่ใจว่าการติดตามบทจะช่วยแก้ไขปัญหาเหล่านี้ได้ แต่เป็นเพียงสิ่งที่ฉันไม่สามารถหยุดคิดได้

3
การสร้างแบบจำลองทางคณิตศาสตร์แบบเครือข่ายประสาทเทียมเป็นแบบกราฟิก
ฉันกำลังดิ้นรนเพื่อให้การเชื่อมต่อทางคณิตศาสตร์ระหว่างเครือข่ายประสาทและแบบจำลองกราฟิก ในแบบกราฟิกความคิดนั้นง่ายมาก: การแจกแจงความน่าจะเป็นเป็นตัวประกอบตามกลุ่มในกราฟโดยทั่วไปแล้วศักยภาพนั้นเป็นของตระกูลเอ็กซ์โพเนนเชียล มีเหตุผลที่เท่าเทียมกันสำหรับโครงข่ายประสาทเทียมหรือไม่? เราสามารถแสดงการแจกแจงความน่าจะเป็นเหนือหน่วย (ตัวแปร) ในเครื่อง จำกัด Boltzmann หรือซีเอ็นเอ็นเป็นฟังก์ชันของพลังงานหรือผลิตภัณฑ์พลังงานระหว่างหน่วยหรือไม่ นอกจากนี้การแจกแจงความน่าจะเป็นแบบจำลองโดย RBM หรือเครือข่ายความเชื่อลึก (เช่นกับ CNNs) ของตระกูลเอ็กซ์โปเนนเชียลหรือไม่? ผมหวังที่จะพบข้อความที่ formalizes การเชื่อมต่อระหว่างชนิดปัจจุบันนี้เครือข่ายประสาทและสถิติในลักษณะเดียวกับที่จอร์แดนและเวนไรท์ได้สำหรับรุ่นกราฟิกกับพวกเขารุ่นกราฟิกครอบครัวเอกและแปรผันอนุมาน ตัวชี้ใด ๆ จะดีมาก

1
คำจำกัดความของระบบ Bayesian แบบไดนามิกและความสัมพันธ์กับ HMM?
จากวิกิพีเดีย Dynamic Bayesian Network (DBN) เป็นเครือข่ายแบบเบย์ซึ่งเชื่อมโยงตัวแปรซึ่งกันและกันผ่านขั้นตอนเวลาที่อยู่ติดกัน นี้มักจะเรียกว่าสอง timeslice BN เพราะมันบอกว่าที่จุดใด ๆ ในเวลา T, ค่าของตัวแปรที่สามารถคำนวณได้จาก regressors ภายในและค่าก่อนทันที (เวลา T-1) DBN นั้นเป็นเรื่องปกติในหุ่นยนต์และได้แสดงศักยภาพสำหรับแอพพลิเคชั่นการขุดข้อมูลที่หลากหลาย ตัวอย่างเช่นพวกมันถูกใช้ในการรู้จำเสียง, ลำดับโปรตีนและชีวสารสนเทศศาสตร์ DBN ได้แสดงให้เห็นถึงการผลิตโซลูชั่นที่เทียบเท่ากับรุ่น Hidden Markov และตัวกรองคาลมาน ฉันสงสัยว่า "ค่าก่อนหน้าทันที (เวลา T-1)" หมายความว่าดัชนีเวลาใน DBN ไม่ต่อเนื่องหรือไม่ "ณ จุดใดก็ได้ในเวลา T ค่าของตัวแปรสามารถคำนวณได้จาก regressors ภายในและค่าก่อนหน้าทันที (เวลา T-1)" หมายความว่า DBN เป็นกระบวนการมาร์คอฟแบบไม่ต่อเนื่องหรือไม่? หากฉันเข้าใจอย่างถูกต้อง HMM ก็เป็นกระบวนการมาร์คอฟแบบแยกเวลาเช่นกันหากไม่สนใจเอาต์พุตจากสถานะในเวลาเดียวกัน ดังนั้นฉันสงสัยว่า HMM …

2
โมเดลกราฟิกและเครื่องจักร Boltzmann เกี่ยวข้องกับคณิตศาสตร์หรือไม่?
ในขณะที่ฉันได้ทำการเขียนโปรแกรมด้วยเครื่องจักร Boltzmann ในระดับฟิสิกส์จริง ๆ แล้วฉันไม่คุ้นเคยกับลักษณะทางทฤษฎีของพวกเขา ในทางตรงกันข้ามฉันรู้ว่าเป็นจำนวนเงินที่เจียมเนื้อเจียมตัวเกี่ยวกับทฤษฎีของแบบจำลองกราฟิก (ประมาณสองสามบทแรกของหนังสือเล่ม Lauritzen ของกราฟิกรุ่น ) คำถาม:มีความสัมพันธ์ที่มีความหมายระหว่างโมเดลกราฟิกและเครื่องจักร Boltzmann หรือไม่? เครื่อง Boltzmann เป็นรูปแบบกราฟิกหรือไม่? เห็นได้ชัดว่าเครื่อง Boltzmann เป็นโครงข่ายประสาทประเภทหนึ่ง ฉันเคยได้ยินว่าเครือข่ายประสาทบางส่วนเกี่ยวข้องกับคณิตศาสตร์ในรูปแบบกราฟิกและบางเครือข่ายนั้นไม่ใช่ คำถามที่เกี่ยวข้องกับ CrossValidated ที่ไม่ตอบคำถามของฉัน: คล้ายกับคำถามก่อนหน้านี้ที่ถูกถามมาก่อน: อะไรคือความสัมพันธ์ระหว่างโมเดลลำดับชั้นเครือข่ายประสาทเทียมโมเดลกราฟิกเครือข่ายแบบเบย์? แต่มีความเฉพาะเจาะจงมากขึ้น ยิ่งกว่านั้นคำตอบที่ได้รับการยอมรับสำหรับคำถามนั้นไม่ได้ทำให้ฉันสับสน - แม้ว่าโหนดในการแสดงกราฟิกมาตรฐานของโครงข่ายประสาทเทียมไม่ได้เป็นตัวแทนของตัวแปรแบบสุ่มซึ่งไม่ได้หมายความว่าไม่มีตัวแทนดังกล่าวอยู่จริง โดยเฉพาะฉันคิดว่าโหนดในการแสดงกราฟิกทั่วไปของห่วงโซ่มาร์คอฟเป็นตัวแทนของชุดของสถานะที่เป็นไปได้มากกว่าตัวแปรสุ่มแต่ก็สามารถสร้างกราฟที่แสดงความสัมพันธ์แบบพึ่งพาเงื่อนไขระหว่างXiXiX_iXiXiX_iซึ่งแสดงให้เห็นว่าห่วงโซ่มาร์คอฟทุกอันที่จริงแล้วเป็นสนามสุ่มของมาร์คอฟ คำตอบยังบอกอีกว่าเครือข่ายประสาท (สันนิษฐานรวมถึงเครื่อง Boltzmann) เป็น "พินิจพิเคราะห์" แต่ไม่ได้เข้าไปดูรายละเอียดเพิ่มเติมเพื่ออธิบายสิ่งที่อ้างว่าหมายถึงและคำถามที่ตามมาอย่างชัดเจน จ่าหน้า ในทำนองเดียวกันคำตอบที่ได้รับการยอมรับเชื่อมโยงไปยังเว็บไซต์ของ Kevin Murphy (ฉันอ่านวิทยานิพนธ์ปริญญาเอกของเขาเมื่อเรียนรู้เกี่ยวกับเครือข่าย Bayesian) แต่เว็บไซต์นี้พูดถึงเครือข่าย Bayesian เท่านั้นและไม่ได้กล่าวถึงเครือข่ายประสาทเลย - แตกต่าง. คำถามอื่น ๆ นี้อาจคล้ายกับของฉันมากที่สุด: …

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.