คำถามติดแท็ก independence

เหตุการณ์ (หรือตัวแปรสุ่ม) มีความเป็นอิสระเมื่อข้อมูลบางอย่างไม่บอกคุณเกี่ยวกับความน่าจะเป็นของการเกิด (/ การกระจาย) ของผู้อื่น โปรดอย่าใช้แท็กนี้สำหรับการใช้ตัวแปรอิสระ [ทำนาย] แทน

3
ความแปรปรวนร่วมเท่ากับศูนย์แสดงถึงความเป็นอิสระของตัวแปรสุ่มไบนารีหรือไม่?
ถ้าXXXและYYYเป็นตัวแปรสุ่มสองตัวที่สามารถรับสถานะที่เป็นไปได้สองสถานะเท่านั้นฉันจะแสดงว่าC o v ( X , Y ) = 0Cov(X,Y)=0Cov(X,Y) = 0แสดงถึงความเป็นอิสระได้อย่างไร สิ่งนี้ขัดแย้งกับสิ่งที่ฉันเรียนรู้ในวันที่C o v ( X , Y ) = 0Cov(X,Y)=0Cov(X,Y) = 0ไม่ได้หมายความถึงความเป็นอิสระ ... คำใบ้บอกว่าจะเริ่มต้นด้วย111และ000เป็นสถานะที่เป็นไปได้และสรุปจากที่นั่น และฉันสามารถทำสิ่งนั้นและแสดงE ( X Y ) = E ( X ) E ( Y )E(XY)=E(X)E(Y)E(XY) = E(X)E(Y)แต่สิ่งนี้ไม่ได้บ่งบอกถึงความเป็นอิสระ ??? งงว่าจะทำคณิตศาสตร์อย่างไรฉันเดา

3
สำหรับสัญชาตญาณตัวอย่างชีวิตจริงของตัวแปรสุ่มที่ไม่เกี่ยวข้อง แต่ขึ้นอยู่กับอะไร?
ในการอธิบายว่าทำไม uncorrelated ไม่ได้หมายความอิสระมีหลายตัวอย่างที่เกี่ยวข้องกับพวงของตัวแปรสุ่ม แต่พวกเขาทั้งหมดดูเหมือนนามธรรมดังนั้น: 1 2 3 4 คำตอบนี้ดูเหมือนจะสมเหตุสมผล การตีความของฉัน: ตัวแปรสุ่มและสแควร์ของมันอาจไม่เกี่ยวข้องกัน (เนื่องจากเห็นได้ชัดว่าขาดความสัมพันธ์เป็นสิ่งที่ต้องการความเป็นอิสระเชิงเส้น) แต่พวกเขาก็ขึ้นอยู่อย่างชัดเจน ผมคิดว่าตัวอย่างจะว่า (มาตรฐาน?) ความสูงและความสูงอาจจะไม่มีความ แต่ขึ้นอยู่ แต่ผมไม่เห็นว่าทำไมทุกคนต้องการจะเปรียบเทียบความสูงและความสูง 222^222^2 เพื่อจุดประสงค์ในการให้สัญชาตญาณแก่ผู้เริ่มต้นในทฤษฎีความน่าจะเป็นเบื้องต้นหรือวัตถุประสงค์ที่คล้ายคลึงกันตัวอย่างชีวิตจริงของตัวแปรสุ่มที่ไม่เกี่ยวข้อง แต่ขึ้นอยู่กับอะไร?

3
ระเบิดอยู่ที่ไหน: จะประเมินความน่าจะเป็นอย่างไร, ผลรวมแถวและคอลัมน์ที่ได้รับ?
คำถามนี้ได้รับแรงบันดาลใจจากมินิเกมจาก Pokemon Soulsilver: ลองนึกภาพมี 15 ระเบิดซ่อนอยู่ในพื้นที่ 5x6 นี้ (แก้ไข: สูงสุด 1 ระเบิด / เซลล์): ทีนี้คุณจะประเมินความน่าจะเป็นในการหาลูกระเบิดในสนามที่ระบุโดยรวมของแถว / คอลัมน์อย่างไร หากคุณดูที่คอลัมน์ 5 (จำนวนระเบิดทั้งหมด = 5) คุณอาจคิดว่า: ภายในคอลัมน์นี้โอกาสที่จะพบระเบิดในแถวที่ 2 นั้นเพิ่มเป็นสองเท่าของโอกาสที่จะพบหนึ่งในแถวที่ 1 สมมติฐาน (ผิด) นี้ของสัดส่วนโดยตรงซึ่งโดยทั่วไปสามารถอธิบายได้ว่าเป็นการวาดมาตรฐานการดำเนินการทดสอบอิสระ (เช่นใน Chi-Square) ในบริบทที่ไม่ถูกต้องจะนำไปสู่การประมาณดังต่อไปนี้: อย่างที่คุณเห็นสัดส่วนโดยตรงจะนำไปสู่การประมาณความน่าจะเป็นมากกว่า 100% และก่อนหน้านั้นจะผิด ดังนั้นฉันจึงทำการจำลองการคำนวณของพีชคณิตที่เป็นไปได้ทั้งหมดซึ่งนำไปสู่ ​​276 ความเป็นไปได้ที่ไม่ซ้ำกันของการวางระเบิด 15 ครั้ง (ผลรวมของแถวและคอลัมน์ที่กำหนด) นี่คือค่าเฉลี่ยของโซลูชัน 276 รายการ: นี่เป็นวิธีแก้ไขที่ถูกต้อง แต่เนื่องจากงานคำนวณเลขชี้กำลังฉันต้องการค้นหาวิธีการประมาณค่า คำถามของฉันคือตอนนี้: มีวิธีการทางสถิติที่จัดตั้งขึ้นเพื่อประเมินสิ่งนี้หรือไม่? ฉันสงสัยว่านี่เป็นปัญหาที่ทราบแล้วมันถูกเรียกอย่างไรและหากมีเอกสาร …

1
การอนุมานไม่ถูกต้องเมื่อการสังเกตไม่เป็นอิสระ
ฉันเรียนรู้ในสถิติเบื้องต้นว่าด้วยโมเดลเชิงเส้นทั่วไปเพื่อให้การอนุมานมีเหตุผลการสังเกตต้องเป็นอิสระ เมื่อการรวมกลุ่มเกิดขึ้นความเป็นอิสระอาจไม่ได้นำไปสู่การอนุมานที่ไม่ถูกต้องอีกต่อไปหากไม่นับรวม วิธีหนึ่งในการทำบัญชีสำหรับการทำคลัสเตอร์ดังกล่าวคือการใช้ตัวแบบผสม ฉันต้องการค้นหาชุดข้อมูลตัวอย่างจำลองหรือไม่ซึ่งแสดงให้เห็นอย่างชัดเจน ฉันพยายามใช้หนึ่งในชุดข้อมูลตัวอย่างบนไซต์ UCLA สำหรับการวิเคราะห์ข้อมูลคลัสเตอร์ > require(foreign) > require(lme4) > dt <- read.dta("http://www.ats.ucla.edu/stat/stata/seminars/svy_stata_intro/srs.dta") > m1 <- lm(api00~growth+emer+yr_rnd, data=dt) > summary(m1) Coefficients: Estimate Std. Error t value Pr(>|t|) (Intercept) 740.3981 11.5522 64.092 <2e-16 *** growth -0.1027 0.2112 -0.486 0.6271 emer -5.4449 0.5395 -10.092 <2e-16 *** yr_rnd -51.0757 19.9136 -2.565 …

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

1
เงื่อนไขที่จำเป็นและเพียงพอในการร่วม MGF เพื่อความเป็นอิสระ
สมมติว่าฉันมีร่วมฟังก์ชั่นช่วงเวลาที่สร้างสำหรับการจัดจำหน่ายร่วมกับ CDFy) คือทั้งที่จำเป็นและเพียงพอเงื่อนไขในการเป็นอิสระของและ ? ฉันตรวจสอบหนังสือสองเล่มซึ่งกล่าวถึงความจำเป็นเท่านั้น:F X , Y ( x , y ) M X , Y ( s , t ) = M X , Y ( s , 0 ) ⋅ M X , Y ( 0 , t )MX,Y(s,t)MX,Y(s,t)M_{X,Y}(s,t)FX,Y(x,y)FX,Y(x,y)F_{X,Y}(x,y)MX, วาย( s , t ) = MX, วาย( …

1
การแจกแจงแบบใดที่ไม่สัมพันธ์กันแสดงถึงความเป็นอิสระ?
การเตือนความทรงจำที่มีเกียรติในสถิติคือ "ความสัมพันธ์ไม่ได้หมายถึงความเป็นอิสระ" โดยปกติการแจ้งเตือนนี้จะเสริมด้วยคำสั่งที่ผ่อนคลายทางจิตวิทยา (และถูกต้องทางวิทยาศาสตร์) "เมื่อ แต่อย่างไรก็ตามทั้งสองตัวแปรมีการกระจายตามปกติร่วมกันแล้ว uncorrelatedness หมายถึงความเป็นอิสระ" ฉันสามารถเพิ่มจำนวนข้อยกเว้นที่มีความสุขจากหนึ่งเป็นสอง: เมื่อตัวแปรสองตัวถูกแจกจ่ายโดยBernoulliจากนั้นอีกครั้งความไม่สัมพันธ์กันหมายถึงความเป็นอิสระ ถ้าและเป็นสอง Bermoulli rv's,ซึ่งเรามีและคล้ายคลึงกับความแปรปรวนร่วมของพวกมันคือXXXYYYX∼ B ( qx) ,Y∼ B ( qY)X~B(Qx),Y~B(QY)X \sim B(q_x),\; Y \sim B(q_y)P( X= 1 ) = E( X) = qxP(X=1)=E(X)=QxP(X=1) = E(X) = q_xYYY Cov( X, วาย) = E( XY) - E( X) E( Y) = ∑SXYp …

4
ใครสามารถอธิบายได้ว่าการพึ่งพาและความแปรปรวนเป็นศูนย์ได้อย่างไร
ใครบางคนสามารถอธิบายได้อย่างที่ Greg ทำ แต่ในรายละเอียดมากขึ้นตัวแปรสุ่มสามารถขึ้นอยู่กับได้อย่างไร แต่ไม่มีความแปรปรวนร่วมเป็นศูนย์? เกร็กโปสเตอร์ที่นี่ให้ตัวอย่างโดยใช้วงกลมที่นี่ ใครสามารถอธิบายกระบวนการนี้อย่างละเอียดมากขึ้นโดยใช้ลำดับขั้นตอนที่แสดงขั้นตอนหลายขั้นตอนได้หรือไม่? นอกจากนี้หากคุณทราบตัวอย่างจากจิตวิทยาโปรดอธิบายด้วยแนวคิดนี้พร้อมตัวอย่างที่เกี่ยวข้อง โปรดแม่นยำและต่อเนื่องในคำอธิบายของคุณและระบุสิ่งที่อาจเกิดขึ้น

1
การเลือกคุณสมบัติแบบใดที่สามารถใช้ทดสอบไคสแควร์ได้
ที่นี่ฉันถามเกี่ยวกับสิ่งที่คนอื่นทำกันโดยทั่วไปเพื่อใช้การทดสอบไคสแควร์สำหรับการเลือกคุณสมบัติ WRT ในการเรียนรู้แบบมีผู้สอน หากฉันเข้าใจอย่างถูกต้องพวกเขาจะทดสอบความเป็นอิสระระหว่างแต่ละคุณลักษณะและผลลัพธ์และเปรียบเทียบค่า p ระหว่างการทดสอบสำหรับแต่ละคุณลักษณะหรือไม่ ในhttp://en.wikipedia.org/wiki/Pearson%27s_chi-squared_test , การทดสอบไคสแควร์ของเพียร์สันเป็นการทดสอบทางสถิติที่ใช้กับชุดของข้อมูลที่เป็นหมวดหมู่เพื่อประเมินว่ามีความเป็นไปได้ที่ความแตกต่างที่สังเกตได้ระหว่างเซตเกิดขึ้นโดยบังเอิญ ... การทดสอบความเป็นอิสระประเมินว่าการสังเกตแบบจับคู่กับตัวแปรสองตัวที่แสดงในตารางฉุกเฉินหรือไม่นั้นเป็นอิสระจากกัน (เช่นการตอบแบบสำรวจจากคนต่างชาติเพื่อดูว่าสัญชาติของคนนั้นเกี่ยวข้องกับการตอบสนองหรือไม่) ดังนั้นตัวแปรทั้งสองที่ต้องทดสอบความเป็นอิสระโดยการทดสอบจะต้องจัดหมวดหมู่หรือไม่ต่อเนื่อง (อนุญาตให้สั่งนอกเหนือจากหมวดหมู่) แต่ไม่ต่อเนื่องกัน? จากhttp://scikit-learn.org/stable/modules/feature_selection.htmlพวกเขา ดำเนินการทดสอบχ2χ2\chi^2กับชุดข้อมูล irisเพื่อดึงเฉพาะคุณสมบัติที่ดีที่สุดสองอย่าง ในชุดข้อมูล irisคุณลักษณะทั้งหมดเป็นตัวเลขและต่อเนื่องมูลค่าและผลลัพธ์คือเลเบลคลาส (หมวดหมู่) การทดสอบความเป็นอิสระของไคสแควร์นำไปใช้กับคุณลักษณะต่อเนื่องได้อย่างไร ในการใช้การทดสอบความเป็นอิสระของไคสแควร์กับชุดข้อมูลเราต้องแปลงฟีเจอร์ต่อเนื่องเป็นฟีเจอร์ที่แยกออกจากกันโดยเริ่มจากการทำ binning (เช่นการแยกโดเมนแรกต่อเนื่องของฟีเจอร์ออกเป็นถังขยะแล้วเปลี่ยนฟีเจอร์นั้น ๆ )? เหตุการณ์ที่เกิดขึ้นในถังขยะหลายรูปแบบนั้นมีคุณลักษณะหลายอย่าง (เกิดขึ้นหรือไม่เกิดขึ้นในแต่ละถังขยะ) ดังนั้นการทดสอบความเป็นอิสระของไคสแควร์จึงสามารถใช้ได้กับพวกมันใช่ไหม? โดยวิธีการที่ฉันเดาเราสามารถใช้การทดสอบความเป็นอิสระของไคสแควร์กับคุณสมบัติและผลลัพธ์ของชนิดใด ๆถูกต้อง? สำหรับส่วนผลลัพธ์เราสามารถเลือกฟีเจอร์สำหรับการจัดหมวดหมู่ไม่เพียง แต่สำหรับการถดถอยโดยการทดสอบความเป็นอิสระของไคสแควร์โดยการสรุปผลลัพธ์อย่างต่อเนื่องใช่มั้ย เว็บไซต์เรียนรู้ scikitยังกล่าวว่า คำนวณสถิติไคสแควร์ระหว่างคุณลักษณะที่ไม่เป็นลบและคลาส คะแนนนี้สามารถใช้เพื่อเลือกคุณสมบัติ n_features ที่มีค่าสูงสุดสำหรับสถิติทดสอบไคสแควร์จาก X ซึ่งต้องมีเฉพาะคุณสมบัติที่ไม่เป็นลบเช่น booleans หรือความถี่ (เช่นจำนวนคำในการจำแนกเอกสาร) เทียบกับ ชั้นเรียน ทำไมการทดสอบจึงต้องการคุณสมบัติที่ไม่จำเป็น หากคุณสมบัติไม่มีสัญญาณ แต่มีการจัดหมวดหมู่หรือไม่ต่อเนื่องการทดสอบยังสามารถใช้กับมันได้หรือไม่? …

1
ความแปรปรวนของผลตอบแทนประจำปีขึ้นอยู่กับความแปรปรวนของผลตอบแทนรายเดือน
ฉันพยายามที่จะเข้าใจความแตกต่างทั้งหมด / ข้อผิดพลาดมาตรฐานของชุดเวลาของผลตอบแทนทางการเงินและฉันคิดว่าฉันติดอยู่ ฉันมีชุดข้อมูลการส่งคืนสินค้ารายเดือน (เรียกว่า ) ซึ่งคาดว่ามีค่า 1.00795 และผลต่าง 0.000228 (std. dev คือ 0.01512) ฉันพยายามคำนวณกรณีเลวร้ายที่สุดของผลตอบแทนรายปี (สมมุติว่ามูลค่าที่คาดหวังลบด้วยข้อผิดพลาดมาตรฐานสองเท่า) วิธีไหนเป็นวิธีที่ดีที่สุดที่จะทำ? ก . คำนวณเป็นเดือนเดียว ( ) แล้วคูณด้วยตัวมันเอง 12 ครั้ง (= 0.7630 ) ข . สมมติว่าเดือนมีความเป็นอิสระกำหนด 12 ครั้งพบว่าเป็นค่าที่คาดหวังXXX μX−2⋅σX=0.977μX−2⋅σX=0.977\mu_X-2\cdot \sigma_X=0.977 Y=X⋅X⋅...⋅XY=X⋅X⋅...⋅XY=X\cdot X\cdot ...\cdot XE[Y]=(E[X])12E[Y]=(E[X])12E[Y]=(E[X])^{12}) และความแปรปรวน{12} สำหรับการพัฒนามาตรฐานในกรณีนี้คือ 0.0572 และค่าที่คาดหวังลบสองมาตรฐาน. dev เป็น0.9853 . ซี . คูณมาตรฐานรายเดือน. dev …

1
R / mgcv: เพราะเหตุใดผลิตภัณฑ์ te () และ ti () เทนเซอร์จึงให้พื้นผิวที่แตกต่างกัน
mgcvแพคเกจสำหรับการRมีสองฟังก์ชั่นสำหรับการปฏิสัมพันธ์กระชับเมตริกซ์ผลิตภัณฑ์: และte() ti()ฉันเข้าใจการแบ่งขั้นพื้นฐานของการใช้แรงงานระหว่างคนทั้งสอง (ปรับให้เหมาะสมกับการทำงานแบบไม่เป็นเชิงเส้นเปรียบเทียบกับการย่อยสลายการโต้ตอบนี้เป็นผลกระทบหลักและการโต้ตอบ) สิ่งที่ฉันไม่เข้าใจคือสาเหตุte(x1, x2)และti(x1) + ti(x2) + ti(x1, x2)อาจให้ผลลัพธ์ที่แตกต่าง (เล็กน้อย) MWE (ดัดแปลงมาจาก?ti): require(mgcv) test1 <- function(x,z,sx=0.3,sz=0.4) { x <- x*20 (pi**sx*sz)*(1.2*exp(-(x-0.2)^2/sx^2-(z-0.3)^2/sz^2)+ 0.8*exp(-(x-0.7)^2/sx^2-(z-0.8)^2/sz^2)) } n <- 500 x <- runif(n)/20;z <- runif(n); xs <- seq(0,1,length=30)/20;zs <- seq(0,1,length=30) pr <- data.frame(x=rep(xs,30),z=rep(zs,rep(30,30))) truth <- matrix(test1(pr$x,pr$z),30,30) f <- test1(x,z) y <- f …
11 r  gam  mgcv  conditional-probability  mixed-model  references  bayesian  estimation  conditional-probability  machine-learning  optimization  gradient-descent  r  hypothesis-testing  wilcoxon-mann-whitney  time-series  bayesian  inference  change-point  time-series  anova  repeated-measures  statistical-significance  bayesian  contingency-tables  regression  prediction  quantiles  classification  auc  k-means  scikit-learn  regression  spatial  circular-statistics  t-test  effect-size  cohens-d  r  cross-validation  feature-selection  caret  machine-learning  modeling  python  optimization  frequentist  correlation  sample-size  normalization  group-differences  heteroscedasticity  independence  generalized-least-squares  lme4-nlme  references  mcmc  metropolis-hastings  optimization  r  logistic  feature-selection  separation  clustering  k-means  normal-distribution  gaussian-mixture  kullback-leibler  java  spark-mllib  data-visualization  categorical-data  barplot  hypothesis-testing  statistical-significance  chi-squared  type-i-and-ii-errors  pca  scikit-learn  conditional-expectation  statistical-significance  meta-analysis  intuition  r  time-series  multivariate-analysis  garch  machine-learning  classification  data-mining  missing-data  cart  regression  cross-validation  matrix-decomposition  categorical-data  repeated-measures  chi-squared  assumptions  contingency-tables  prediction  binary-data  trend  test-for-trend  matrix-inverse  anova  categorical-data  regression-coefficients  standard-error  r  distributions  exponential  interarrival-time  copula  log-likelihood  time-series  forecasting  prediction-interval  mean  standard-error  meta-analysis  meta-regression  network-meta-analysis  systematic-review  normal-distribution  multiple-regression  generalized-linear-model  poisson-distribution  poisson-regression  r  sas  cohens-kappa 

2
Multivariate Central Limit Theorem (CLT) มีไว้เมื่อตัวแปรมีการพึ่งพาอาศัยกันอย่างสมบูรณ์แบบหรือไม่?
ชื่อสรุปคำถามของฉัน แต่เพื่อความชัดเจนลองพิจารณาตัวอย่างง่ายๆดังต่อไปนี้ ให้ , i = 1, ... , n กำหนด: \ start {สมการ} S_n = \ frac {1} {n} \ sum_ {i = 1} ^ n X_i \ end {สมการ} และ \ start {สมการ} T_n = \ frac {1} {n} \ sum_ {i = 1} ^ n (X_i ^ …


2
การทดสอบความเป็นอิสระเทียบกับการทดสอบความเป็นเนื้อเดียวกัน
ฉันกำลังสอนหลักสูตรสถิติขั้นพื้นฐานและวันนี้ฉันจะครอบคลุมการทดสอบความเป็นอิสระของไคสแควร์สำหรับสองประเภทและการทดสอบความเป็นเนื้อเดียวกัน สถานการณ์ทั้งสองนี้แตกต่างกันตามแนวคิด แต่สามารถใช้สถิติการทดสอบและการกระจายแบบเดียวกันได้ ในการทดสอบความเป็นเนื้อเดียวกันผลรวมส่วนล่างสำหรับหนึ่งในหมวดหมู่จะถือว่าเป็นส่วนหนึ่งของการออกแบบ - เป็นตัวแทนของจำนวนวิชาที่เลือกสำหรับแต่ละกลุ่มการทดลอง แต่เนื่องจากการทดสอบไคสแควร์หมุนรอบการปรับสภาพบนยอดรวมทั้งหมดจึงไม่มีผลทางคณิตศาสตร์ที่จะแยกความแตกต่างระหว่างการทดสอบความเป็นเนื้อเดียวกันและการทดสอบความเป็นอิสระด้วยข้อมูลเด็ดขาดอย่างน้อยก็ไม่มีเมื่อใช้การทดสอบนี้ คำถามของฉันมีดังต่อไปนี้: มีโรงเรียนแห่งใดที่มีความคิดทางสถิติหรือวิธีการทางสถิติที่จะให้ผลการวิเคราะห์ที่แตกต่างกันขึ้นอยู่กับว่าเรากำลังทดสอบความเป็นอิสระ (โดยที่ margin ทั้งหมดเป็นตัวแปรสุ่ม) หรือทดสอบความเป็นเนื้อเดียวกัน กำหนดโดยการออกแบบ)? ในกรณีที่ต่อเนื่องบอกว่าเราสังเกตในเรื่องเดียวกันและทดสอบความเป็นอิสระหรือสังเกตในประชากรที่แตกต่างกันและทดสอบว่าพวกเขามาจากการกระจายตัวเดียวกันวิธีการที่แตกต่างกัน การวิเคราะห์ vs t-test) เกิดอะไรขึ้นถ้าข้อมูลหมวดหมู่มาจากตัวแปรที่ต่อเนื่องแบบแยกส่วน การทดสอบความเป็นอิสระและความเป็นเนื้อเดียวกันควรแยกไม่ออกหรือไม่?( X, วาย)(X,Y)(X,Y)(X1,X2)(X1,X2)(X_1, X_2)

1
R ตัวแปรเชิงเส้นถดถอยหมวดหมู่ "ซ่อน" ค่า
นี่เป็นเพียงตัวอย่างที่ฉันเจอหลายครั้งดังนั้นฉันจึงไม่มีข้อมูลตัวอย่าง ใช้แบบจำลองการถดถอยเชิงเส้นใน R: a.lm = lm(Y ~ x1 + x2) x1เป็นตัวแปรต่อเนื่อง x2เป็นหมวดหมู่และมีสามค่าเช่น "ต่ำ", "ปานกลาง" และ "สูง" อย่างไรก็ตามเอาต์พุตที่กำหนดโดย R จะเป็นดังนี้: summary(a.lm) Estimate Std. Error t value Pr(>|t|) (Intercept) 0.521 0.20 1.446 0.19 x1 -0.61 0.11 1.451 0.17 x2Low -0.78 0.22 -2.34 0.005 x2Medium -0.56 0.45 -2.34 0.005 ฉันเข้าใจว่า R แนะนำการเข้ารหัสแบบหลอกบางอย่างเกี่ยวกับปัจจัยดังกล่าว ( …
10 r  regression  categorical-data  regression-coefficients  categorical-encoding  machine-learning  random-forest  anova  spss  r  self-study  bootstrap  monte-carlo  r  multiple-regression  partitioning  neural-networks  normalization  machine-learning  svm  kernel-trick  self-study  survival  cox-model  repeated-measures  survey  likert  correlation  variance  sampling  meta-analysis  anova  independence  sample  assumptions  bayesian  covariance  r  regression  time-series  mathematical-statistics  graphical-model  machine-learning  linear-model  kernel-trick  linear-algebra  self-study  moments  function  correlation  spss  probability  confidence-interval  sampling  mean  population  r  generalized-linear-model  prediction  offset  data-visualization  clustering  sas  cart  binning  sas  logistic  causality  regression  self-study  standard-error  r  distributions  r  regression  time-series  multiple-regression  python  chi-squared  independence  sample  clustering  data-mining  rapidminer  probability  stochastic-processes  clustering  binary-data  dimensionality-reduction  svd  correspondence-analysis  data-visualization  excel  c#  hypothesis-testing  econometrics  survey  rating  composite  regression  least-squares  mcmc  markov-process  kullback-leibler  convergence  predictive-models  r  regression  anova  confidence-interval  survival  cox-model  hazard  normal-distribution  autoregressive  mixed-model  r  mixed-model  sas  hypothesis-testing  mediation  interaction 

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.