คำถามติดแท็ก independence

เหตุการณ์ (หรือตัวแปรสุ่ม) มีความเป็นอิสระเมื่อข้อมูลบางอย่างไม่บอกคุณเกี่ยวกับความน่าจะเป็นของการเกิด (/ การกระจาย) ของผู้อื่น โปรดอย่าใช้แท็กนี้สำหรับการใช้ตัวแปรอิสระ [ทำนาย] แทน

2
ความแปรปรวนร่วมในภาษาธรรมดาคืออะไร?
ความแปรปรวนในภาษาธรรมดาคืออะไรและวิธีการที่จะเชื่อมโยงกับเงื่อนไขการพึ่งพาอาศัยกัน , ความสัมพันธ์และโครงสร้างความแปรปรวนความแปรปรวนที่เกี่ยวกับการออกแบบซ้ำมาตรการ?

3
ตัวอย่าง: การถดถอย LASSO โดยใช้ glmnet สำหรับผลลัพธ์ไบนารี
ฉันเริ่มตะลุยกับการใช้งานglmnetกับการถดถอยแบบ LASSOซึ่งผลลัพธ์ของความสนใจของฉันนั้นเป็นแบบขั้วคู่ ฉันได้สร้างกรอบข้อมูลจำลองขนาดเล็กด้านล่าง: age <- c(4, 8, 7, 12, 6, 9, 10, 14, 7) gender <- c(1, 0, 1, 1, 1, 0, 1, 0, 0) bmi_p <- c(0.86, 0.45, 0.99, 0.84, 0.85, 0.67, 0.91, 0.29, 0.88) m_edu <- c(0, 1, 1, 2, 2, 3, 2, 0, 1) p_edu <- c(0, …
77 r  self-study  lasso  regression  interpretation  anova  statistical-significance  survey  conditional-probability  independence  naive-bayes  graphical-model  r  time-series  forecasting  arima  r  forecasting  exponential-smoothing  bootstrap  outliers  r  regression  poisson-distribution  zero-inflation  genetic-algorithms  machine-learning  feature-selection  cart  categorical-data  interpretation  descriptive-statistics  variance  multivariate-analysis  covariance-matrix  r  data-visualization  generalized-linear-model  binomial  proportion  pca  matlab  svd  time-series  correlation  spss  arima  chi-squared  curve-fitting  text-mining  zipf  probability  categorical-data  distance  group-differences  bhattacharyya  regression  variance  mean  data-visualization  variance  clustering  r  standard-error  association-measure  somers-d  normal-distribution  integral  numerical-integration  bayesian  clustering  python  pymc  nonparametric-bayes  machine-learning  svm  kernel-trick  hyperparameter  poisson-distribution  mean  continuous-data  univariate  missing-data  dag  python  likelihood  dirichlet-distribution  r  anova  hypothesis-testing  statistical-significance  p-value  rating  data-imputation  censoring  threshold 

8
สร้างตัวแปรสุ่มที่มีความสัมพันธ์ที่กำหนดไว้กับตัวแปรที่มีอยู่
สำหรับการศึกษาการจำลองฉันต้องสร้างตัวแปรสุ่มที่แสดง prefined (ประชากร) ความสัมพันธ์กับตัวแปรที่มีอยู่YYYY ฉันดูในRแพ็คเกจcopulaและCDVineสามารถสร้างการแจกแจงหลายตัวแปรแบบสุ่มด้วยโครงสร้างการพึ่งพาที่กำหนด อย่างไรก็ตามเป็นไปไม่ได้ที่จะแก้ไขหนึ่งในตัวแปรที่เป็นผลลัพธ์ของตัวแปรที่มีอยู่ ความคิดและลิงก์ไปยังฟังก์ชั่นที่มีอยู่นั้นได้รับการชื่นชม! สรุป: คำตอบที่ถูกต้องสองคำขึ้นมาพร้อมกับโซลูชันที่แตกต่าง: R สคริปต์โดย Caracal ซึ่งจะคำนวณตัวแปรสุ่มกับที่แน่นอน (ตัวอย่าง) ความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า R ฟังก์ชั่นฉันพบตัวเองซึ่งจะคำนวณตัวแปรสุ่มที่มีการกำหนดประชากรความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า [@ttnphns 'นอกจากนี้: ฉันใช้เสรีภาพในการขยายชื่อคำถามจากกรณีตัวแปรคงที่เดียวเป็นจำนวนคงที่ของตัวแปรคงที่; เช่นวิธีการสร้างตัวแปรที่มีคอร์เรชั่นที่กำหนดไว้ล่วงหน้าพร้อมกับตัวแปรคงที่บางตัวที่มีอยู่]

13
10 หัวในแถวจะเพิ่มโอกาสในการโยนต่อไปหรือไม่?
ฉันถือว่าสิ่งต่อไปนี้เป็นจริง: สมมติว่าเป็นเหรียญที่ยุติธรรมการได้รับ 10 หัวติดต่อกันในขณะที่การโยนเหรียญไม่เพิ่มโอกาสในการโยนเหรียญถัดไปเป็นหางไม่ว่าจะมีความน่าจะเป็นและ / หรือศัพท์แสงทางสถิติจำนวนเท่าใด (แก้ตัวการเล่น) สมมติว่าเป็นอย่างนั้นคำถามของฉันคือ: ฉันจะโน้มน้าวให้คนที่เป็นอย่างนั้นได้อย่างไร พวกเขาฉลาดและมีการศึกษา แต่ดูเหมือนตั้งใจว่าจะไม่พิจารณาว่าฉันอาจจะถูก (โต้แย้ง)

4
ความแปรปรวนและความเป็นอิสระ?
ฉันอ่านจากตำราเรียนว่าไม่รับประกันว่า X และ Y จะเป็นอิสระ แต่ถ้าพวกเขาเป็นอิสระความแปรปรวนร่วมของพวกเขาจะต้องเป็น 0 ฉันไม่สามารถนึกถึงตัวอย่างที่เหมาะสมได้ มีคนให้หรือไม่cov(X,Y)=0cov(X,Y)=0\text{cov}(X,Y)=0

6
ฉันจะทดสอบได้อย่างไรว่าตัวแปรต่อเนื่องสองตัวนั้นมีความเป็นอิสระ
สมมติว่าฉันมีตัวอย่างจากการจัดจำหน่ายร่วมกันของและYฉันจะทดสอบสมมติฐานที่และเป็นอิสระได้อย่างไร( Xn, วายn) , n = 1 .. N(Xn,Yn),n=1..N(X_n,Y_n), n=1..NY X YXXXYYYXXXYYY ไม่มีข้อสมมติฐานใด ๆ เกี่ยวกับการแจกแจงแบบร่วมหรือส่วนเพิ่มของและ (อย่างน้อยที่สุดของมาตรฐานร่วมทั้งหมดเนื่องจากในกรณีนั้นความเป็นอิสระนั้นเหมือนกับความสัมพันธ์เป็น )Y 0XXXYYY000 ไม่มีการสันนิษฐานเกี่ยวกับลักษณะของความสัมพันธ์ที่เป็นไปได้ระหว่างและ ; มันอาจไม่ใช่แบบเชิงเส้นดังนั้นตัวแปรจะไม่สัมพันธ์กัน ( ) แต่ขึ้นอยู่กับการมีส่วนร่วมสูง ( )YXXXYYYr = 0r=0r=0ผม= HI=HI=H ฉันเห็นสองแนวทาง: ถังทั้งสองตัวแปรและใช้ฟิชเชอร์การทดสอบที่แน่นอนหรือG-ทดสอบ Pro: ใช้การทดสอบทางสถิติที่มีชื่อเสียง คอนดิชั่น: ขึ้นอยู่กับการ binning ประเมินการพึ่งพาของและ : (นี้เป็นสำหรับอิสระและและเมื่อพวกเขาสมบูรณ์ตรวจสอบแต่ละอื่น ๆ )Y I ( X ; Y )XXXYYYI(X;Y)H(X,Y)I(X;Y)H(X,Y)\frac{I(X;Y)}{H(X,Y)}XY1000XXXYYY111 Pro: สร้างตัวเลขที่มีความหมายทางทฤษฎีที่ชัดเจน คอนดิชั่น: …

1
ความแปรปรวนของผลผลิตของตัวแปรสุ่มหลายตัว
เรารู้คำตอบสำหรับตัวแปรอิสระสองตัว: Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2Var(XY)=E(X2Y2)−(E(XY))2=Var(X)Var(Y)+Var(X)(E(Y))2+Var(Y)(E(X))2 {\rm Var}(XY) = E(X^2Y^2) − (E(XY))^2={\rm Var}(X){\rm Var}(Y)+{\rm Var}(X)(E(Y))^2+{\rm Var}(Y)(E(X))^2 อย่างไรก็ตามหากเราใช้ผลิตภัณฑ์มากกว่าสองตัวแปรคำตอบจะเป็นอะไรในแง่ของความแปรปรวนและค่าที่คาดหวังของตัวแปรแต่ละตัวVar(X1X2⋯Xn)Var(X1X2⋯Xn){\rm Var}(X_1X_2 \cdots X_n)

10
โอกาสของคุณที่จะตายในอุบัติเหตุเครื่องบินตกลดลงหรือไม่ถ้าคุณบินตรง?
เมื่อเร็ว ๆ นี้ฉันไม่เห็นด้วยกับเพื่อนเกี่ยวกับการลดโอกาสในการเสียชีวิตบนเครื่องบินเนื่องจากการชน นี่เป็นคำถามเกี่ยวกับสถิติเบื้องต้น เขาบอกว่าเขาชอบที่จะบินตรงไปยังจุดหมายปลายทางเพราะมันลดโอกาสที่เขาจะเสียชีวิตในอุบัติเหตุเครื่องบินตก ตรรกะของเขาคือถ้าความน่าจะเป็นของการชนของสายการบินเชิงพาณิชย์คือ 1 ใน 10,000 การบินบนเครื่องบินสองลำเพื่อไปยังจุดหมายปลายทางของคุณจะเพิ่มโอกาสการเสียชีวิตเป็นสองเท่า ประเด็นของฉันคือทุกครั้งที่หนึ่งบินบนเครื่องบินมันไม่ได้เพิ่มโอกาสที่เขาจะตายในอุบัติเหตุเครื่องบินตกในอนาคต นั่นคือแต่ละเที่ยวบินเครื่องบินเป็นอิสระ ไม่ว่าจะมีใครบินบนเครื่องบิน 100 ลำในปีนั้นหรือเพียงแค่ 1 ลำนักบินทั้งสองยังคงมีโอกาส 1 ใน 10,000 ที่จะเสียชีวิตในอุบัติเหตุเครื่องบินตกในเที่ยวบินถัดไปของพวกเขา จุดอื่นที่ฉันทำ: บอกว่าปลายทางของคุณอยู่ห่างออกไป 4 ชั่วโมง หากคุณบินตรงคุณจะอยู่ในอากาศเสี่ยงต่อการตกหล่นเป็นเวลา 4 ชั่วโมง ตอนนี้สมมติว่าคุณใช้ 4 เที่ยวบินต่อเนื่องกันแต่ละเที่ยวบินยาวประมาณหนึ่งชั่วโมง ในสถานการณ์นี้คุณจะยังคงอยู่ในอากาศเป็นเวลาประมาณ 4 ชั่วโมง ดังนั้นไม่ว่าคุณจะใช้เที่ยวบินตรงหรือประหยัดเงินและต่อเที่ยวบินที่เชื่อมต่อกันจำนวนเวลาที่คุณใช้ในการเสี่ยงจะเท่ากัน ประเด็นสุดท้ายของฉันคือเที่ยวบินที่สั้นลงมีอัตราการล่มที่ต่ำลง ฉันเพิ่งดึงอันนั้นออกไป ฉันได้ทำการวิจัยเป็นศูนย์แล้วและมีศูนย์ข้อมูลสำรอง แต่ดูเหมือนว่ามีเหตุผล ใครอยู่ด้านขวาและทำไม มีมากมายที่นี่

4
ทำไมความสัมพันธ์แบบศูนย์ไม่จำเป็นต้องหมายความถึงความเป็นอิสระ
หากตัวแปรสองตัวมีค่าสหสัมพันธ์ 0 เหตุใดจึงไม่จำเป็นต้องเป็นอิสระ ตัวแปรที่สัมพันธ์กันเป็นศูนย์ไม่มีอิสระภายใต้สถานการณ์พิเศษหรือไม่? หากเป็นไปได้ฉันกำลังมองหาคำอธิบายที่เข้าใจง่ายไม่ใช่คำศัพท์ทางเทคนิคขั้นสูง

3
ความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุหรือไม่?
ตัวแปรสุ่มสองตัวคือ A และ B มีความเป็นอิสระทางสถิติ นั่นหมายความว่าใน DAG ของกระบวนการ:และแน่นอน(A) แต่นั่นก็หมายความว่าไม่มีประตูหน้าจาก B ถึง A?(A⊥⊥B)(A⊥⊥B)(A {\perp\!\!\!\perp} B)P(A|B)=P(A)P(A|B)=P(A)P(A|B)=P(A) เพราะเราก็ควรจะได้รับ(A) ดังนั้นหากเป็นเช่นนั้นความเป็นอิสระทางสถิติหมายถึงการขาดสาเหตุโดยอัตโนมัติหรือไม่?P(A|do(B))=P(A)P(A|do(B))=P(A)P(A|do(B))=P(A)

3
ถ้า X และ Y ไม่ได้มีความสัมพันธ์กัน X X 2 และ Y จะไม่เกี่ยวข้องกันหรือไม่
หากตัวแปรสุ่มสองตัวคือและที่ไม่เกี่ยวข้องกันเราจะรู้ได้อย่างไรว่าและไม่ได้เกี่ยวข้องกัน สมมติฐานของฉันคือใช่Y X 2 YXXXYYYX2X2X^2YYY X,YX,YX, Y uncorrelated หมายถึงหรือE[XY]=E[X]E[Y]E[XY]=E[X]E[Y]E[XY]=E[X]E[Y] E[XY]=∫xyfX(x)fY(y)dxdy=∫xfX(x)dx∫yfY(y)dy=E[X]E[Y]E[XY]=∫xyfX(x)fY(y)dxdy=∫xfX(x)dx∫yfY(y)dy=E[X]E[Y] E[XY]=\int xy f_X(x)f_Y(y)dxdy=\int xf_X(x)dx\int yf_Y(y)dy=E[X]E[Y] นั่นหมายถึงสิ่งต่อไปนี้ด้วยหรือไม่ E[X2Y]=∫x2yfX(x)fY(y)dxdy=∫x2fX(x)dx∫yfY(y)dy=E[X2]E[Y]E[X2Y]=∫x2yfX(x)fY(y)dxdy=∫x2fX(x)dx∫yfY(y)dy=E[X2]E[Y] E[X^2Y]=\int x^2y f_X(x)f_Y(y)dxdy=\int x^2f_X(x)dx\int yf_Y(y)dy=E[X^2]E[Y]

3
“ การสังเกตอย่างอิสระ” หมายความว่าอะไร
ฉันพยายามที่จะเข้าใจว่าสมมติฐานของการสังเกตอิสระหมายถึง คำจำกัดความบางประการคือ: "สองเหตุการณ์ไม่ขึ้นต่อกันหาก " ( พจนานุกรมศัพท์ทางสถิติ )P(a∩b)=P(a)∗P(b)P(a∩b)=P(a)∗P(b)P(a \cap b) = P(a) * P(b) "การเกิดเหตุการณ์หนึ่งจะไม่เปลี่ยนความน่าจะเป็นสำหรับเหตุการณ์อื่น" ( Wikipedia ) "การสุ่มตัวอย่างจากการสังเกตหนึ่งครั้งไม่ส่งผลต่อการเลือกการสังเกตครั้งที่สอง" ( David M. Lane ) ตัวอย่างของการสังเกตที่ขึ้นอยู่กับที่มักได้รับคือนักเรียนซ้อนกันภายในครูดังต่อไปนี้ สมมติว่าครูมีอิทธิพลต่อนักเรียน แต่นักเรียนไม่ได้มีอิทธิพลซึ่งกันและกัน ดังนั้นคำจำกัดความเหล่านี้ละเมิดข้อมูลเหล่านี้อย่างไร การสุ่มตัวอย่าง [เกรด = 7] สำหรับ [นักเรียน = 1] ไม่ส่งผลกระทบต่อการแจกแจงความน่าจะเป็นสำหรับเกรดที่จะถูกสุ่มตัวอย่างต่อไป (หรือเป็นอย่างนั้นและถ้าเป็นเช่นนั้นการสังเกต 1 จะทำนายอะไรเกี่ยวกับการสังเกตครั้งต่อไป) ทำไมการสังเกตจึงเป็นอิสระถ้าฉันวัดได้ gender แทนที่จะเป็น teacher_id? พวกเขาไม่ส่งผลกระทบต่อการสังเกตในลักษณะเดียวกันหรือไม่ teacher_id student_id grade 1 1 7 …

7
ตัวอย่างง่าย ๆ ของ uncorrelated แต่ไม่ใช่อิสระและ
นักเรียนที่ทำงานหนัก ๆ ทุกคนเป็นตัวอย่างของ "นักเรียนทุกคนขี้เกียจ" อะไรคือตัวอย่างของตัวอย่างง่ายๆที่ว่า "ถ้าตัวแปรสุ่มและไม่ได้มีความสัมพันธ์กันแล้วพวกมันมีความเป็นอิสระ"?YXXXYYY

3
ความสัมพันธ์ระหว่างมุมฉากความสัมพันธ์และความเป็นอิสระคืออะไร?
ฉันได้อ่านบทความที่บอกว่าเมื่อใช้การเปรียบเทียบความแตกต่างที่วางแผนไว้เพื่อค้นหาวิธีการที่แตกต่างกันในการวิเคราะห์ความแปรปรวนทางเดียวคอนดิชั่นเนอร์ควรเป็นมุมฉากเพื่อไม่ให้สัมพันธ์กันและป้องกันข้อผิดพลาดประเภทที่ 1 ฉันไม่เข้าใจว่าทำไมฉากมุมฉากถึงไม่เกี่ยวข้องกันไม่ว่าในกรณีใด ๆ ฉันไม่สามารถหาคำอธิบายที่เข้าใจง่าย / เข้าใจง่ายดังนั้นฉันจึงพยายามเข้าใจบทความ / คำตอบ https://www.psych.umn.edu/faculty/waller/classes/FA2010/Readings/rodgers.pdf มุมฉากมีความหมายอย่างไรในบริบทของสถิติ แต่สำหรับฉันพวกเขาขัดแย้งกัน คนแรกบอกว่าถ้าสองตัวแปร uncorrelated และ / หรือ orthogonal แล้วพวกเขาก็เป็นอิสระเป็นเส้นตรง แต่ความจริงที่ว่าพวกเขาเป็นอิสระเชิงเส้นตรงไม่ได้หมายความว่าพวกเขาจะไม่เกี่ยวข้องกันและ / หรือ orthogonal ตอนนี้ในลิงค์ที่สองมีคำตอบว่าสิ่งที่รัฐเช่น "orthogonal หมายถึง uncorrelated" และ "ถ้า X และ Y เป็นอิสระแล้วพวกเขาจะ Orthogonal แต่การสนทนาไม่เป็นความจริง" ความคิดเห็นที่น่าสนใจอีกข้อหนึ่งในการเชื่อมโยงครั้งที่สองที่สัมประสิทธิ์สหสัมพันธ์ระหว่างตัวแปรสองตัวเท่ากับโคไซน์ของมุมระหว่างเวกเตอร์สองตัวที่สอดคล้องกับตัวแปรเหล่านี้ซึ่งบอกว่าเวกเตอร์มุมฉากทั้งสองนั้นไม่เกี่ยวข้องกันอย่างสมบูรณ์ การเรียกร้อง) ดังนั้นความสัมพันธ์ที่แท้จริงระหว่างอิสรภาพมุมฉากและสหสัมพันธ์คืออะไร บางทีฉันอาจจะพลาดอะไรบางอย่าง แต่ฉันไม่สามารถหาได้ว่ามันคืออะไร

4
หน้าที่ของตัวแปรสุ่มอิสระ
การอ้างว่าฟังก์ชันของตัวแปรสุ่มอิสระนั้นเป็นอิสระหรือไม่จริงหรือ ฉันเห็นว่าผลลัพธ์มักจะใช้โดยนัยในการพิสูจน์บางอย่างเช่นในการพิสูจน์ความเป็นอิสระระหว่างค่าเฉลี่ยตัวอย่างและความแปรปรวนตัวอย่างของการแจกแจงแบบปกติ แต่ฉันไม่สามารถหาเหตุผลได้ ดูเหมือนว่าผู้เขียนบางคนใช้มันตามที่กำหนด แต่ฉันไม่แน่ใจว่าเป็นเช่นนี้เสมอ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.