คำถามติดแท็ก correlation

การวัดระดับความสัมพันธ์เชิงเส้นระหว่างตัวแปรหนึ่งตัว

2
เหตุใดความสัมพันธ์ของเพียร์สันถึงอันดับที่ถูกต้องแม้จะมีการสันนิษฐานทั่วไป
ฉันกำลังอ่านข้อสมมติฐานสำหรับสหสัมพันธ์ของเพียร์สัน ข้อสันนิษฐานที่สำคัญสำหรับการทดสอบทีตามมาดูเหมือนว่าตัวแปรทั้งสองมาจากการแจกแจงแบบปกติ หากพวกเขาไม่ทำเช่นนั้นการใช้มาตรการทางเลือกเช่น Rho Spearman จะได้รับการสนับสนุน ความสัมพันธ์ของสเปียร์แมนคำนวณได้จากความสัมพันธ์ของเพียร์สันโดยใช้อันดับ X และ Y แทน X และ Y เท่านั้นใช่ไหม? คำถามของฉันคือ: หากตัวแปรอินพุตเข้าสู่ความสัมพันธ์แบบเพียร์สันจำเป็นต้องกระจายตามปกติทำไมการคำนวณความสัมพันธ์สเปียร์แมนจึงใช้ได้แม้ว่าตัวแปรอินพุตจะถูกจัดอันดับ อันดับของฉันไม่ได้มาจากการแจกแจงแบบปกติ ... คำอธิบายเดียวที่ฉันเกิดขึ้นจนถึงตอนนี้ก็คือความสำคัญของ Rho นั้นอาจถูกทดสอบแตกต่างจากของ Pearson t-test correlation (ในวิธีที่ไม่ต้องใช้กฎเกณฑ์) แต่จนถึงตอนนี้ฉันไม่พบสูตร อย่างไรก็ตามเมื่อฉันวิ่งไปสองสามตัวอย่างค่า p สำหรับ rho และสำหรับ t-test ของ Pearson correlation ของอันดับตรงกันเสมอประหยัดสำหรับตัวเลขสองสามตัวสุดท้าย สำหรับฉันนี่ดูเหมือนจะไม่เหมือนขั้นตอนที่แตกต่าง คำอธิบายและความคิดใด ๆ ที่คุณอาจได้รับการชื่นชม!

1
ค่าสัมประสิทธิ์สหสัมพันธ์สำหรับข้อมูลที่ได้รับคำสั่ง: Kendall's Tau กับ Polychoric กับ Spearman's rho
ดูเหมือนว่าสำหรับการจัดการกับวัดได้รับคำสั่งนักวิจัยมักจะจัดการกับความสัมพันธ์ Polychoric (ตัวอย่างเช่นสำหรับการสร้างเมทริกซ์ก่อนที่จะทำการวิเคราะห์ปัจจัย) ทำไมต้องเป็นเช่นนั้น ค่าสัมประสิทธิ์สหสัมพันธ์อันดับเคนดัลล์เอกภาพและค่าสัมประสิทธิ์สหสัมพันธ์ของสเปียร์แมนเหมาะสำหรับข้อมูลที่ได้รับคำสั่ง คะแนน 'โปร' และ 'ตรงกันข้าม' สำหรับค่าสัมประสิทธิ์สหสัมพันธ์เหล่านี้ยินดีต้อนรับ

2
ความสัมพันธ์ระหว่างหมวดหมู่ระหว่างตัวแปรระบุแน่ชัด
ฉันมีชุดข้อมูลที่มีตัวแปรระบุหมวดหมู่สองชุด ฉันต้องการทราบว่า (และวิธี) ฉันสามารถระบุความสัมพันธ์ที่เป็นไปได้ระหว่างหมวดหมู่จากตัวแปรทั้งสองนี้หรือไม่ กล่าวอีกนัยหนึ่งไม่ว่าตัวอย่างเช่นผลลัพธ์ของหมวดหมู่ ผมii ในตัวแปร 1 แสดงความสัมพันธ์ที่ดีกับหมวดหมู่เฉพาะ Jjj ในตัวแปร 2 เนื่องจากฉันมีสองตัวแปรที่มี 5 หมวดหมู่การวิเคราะห์สหสัมพันธ์ทั้งหมดสำหรับหมวดหมู่ทั้งหมดจะลดลงถึง 25 ผลลัพธ์ (อย่างน้อยถ้ามันทำงานตามที่ฉันหวัง / คาดหวังว่ามันจะทำงาน) ฉันได้พยายามกำหนดปัญหาให้เป็นคำถามที่เป็นรูปธรรม: คำถามที่ 1: สมมติว่าฉันโอนตัวแปรเด็ดขาดเป็นตัวแปรดัมมี่ 5 ตัวต่อค่า (หมวดหมู่) ขั้นตอนเดียวกันนี้ฉันใช้สำหรับตัวแปรที่สองเช่นกัน จากนั้นฉันต้องการหาความสัมพันธ์ระหว่าง dummy 1.i และ 2.i (ตัวอย่าง) มันถูกต้องทางสถิติหรือไม่ที่ฉันจะดำเนินการตามขั้นตอนนี้ด้วยวิธีการของสัมประสิทธิ์สหสัมพันธ์สามัญ? สัมประสิทธิ์สหสัมพันธ์ที่เกิดจากขั้นตอนนี้ให้ข้อมูลเชิงลึกที่เหมาะสมในความสัมพันธ์ระหว่างตัวแปรจำลองทั้งสองหรือไม่? คำถามที่ 2: หากกระบวนการที่อธิบายไว้ในคำถามที่หนึ่งเป็นกระบวนการที่ถูกต้องมีวิธีดำเนินการวิเคราะห์นี้สำหรับทุกหมวดหมู่ของ 2 (หรืออาจมากกว่า) ตัวแปรระบุหมวดหมู่ทั้งหมดในครั้งเดียวหรือไม่? โปรแกรมที่ฉันใช้คือ SPSS (20)

1
สัมประสิทธิ์สหสัมพันธ์ระหว่างสองอาร์เรย์ของคะแนน 2 มิติ
ฉันมีอาร์เรย์ 2 จุดสองจุดและฉันจำเป็นต้องประเมินความสัมพันธ์ของพวกเขา ฉันควรใช้สูตรอะไร ตัวอย่างของอาร์เรย์: X: ( ( 1 , 5 ) , ( 2 , 5 ) , ( 1 , 7 ) , ( 4 , 1 ) ) ,X:((1,5),(2,5),(1,7),(4,1)),X: ((1,5),(2,5),(1,7),(4,1)), Y: ( ( 3 , 4 ) , ( 1 , 6 ) , ( 4 , …

2
ทำไมปริมาณความแปรปรวนอธิบายโดยคอมพิวเตอร์เครื่องที่ 1 ของฉันจึงใกล้เคียงกับค่าสหสัมพันธ์แบบคู่เฉลี่ย?
อะไรคือความสัมพันธ์ระหว่างองค์ประกอบหลักแรกและความสัมพันธ์เฉลี่ยในเมทริกซ์ความสัมพันธ์ ตัวอย่างเช่นในแอปพลิเคชันเชิงประจักษ์ฉันสังเกตว่าความสัมพันธ์โดยเฉลี่ยเกือบจะเหมือนกับอัตราส่วนของความแปรปรวนขององค์ประกอบหลักตัวแรก (ค่าเริ่มต้นแรก) ต่อความแปรปรวนทั้งหมด (ผลรวมของค่าลักษณะเฉพาะทั้งหมด) มีความสัมพันธ์ทางคณิตศาสตร์หรือไม่? ด้านล่างคือแผนภูมิของผลลัพธ์เชิงประจักษ์ โดยที่ correlation คือค่าสหสัมพันธ์โดยเฉลี่ยระหว่างองค์ประกอบดัชนีหุ้น DAX ที่คำนวณได้จากการคำนวณในช่วงเวลา 15 วันและความแปรปรวนที่อธิบายคือส่วนแบ่งความแปรปรวนที่อธิบายโดยองค์ประกอบหลักตัวแรกที่คำนวณด้วยหน้าต่างกลิ้ง 15 วัน สิ่งนี้สามารถอธิบายได้ด้วยตัวแบบปัจจัยความเสี่ยงทั่วไปเช่น CAPM หรือไม่?

3
การแก้ไข Bonferroni ด้วยความสัมพันธ์ของ Pearson และการถดถอยเชิงเส้น
ฉันกำลังใช้งานสถิติใน 5 IVs (5 ลักษณะบุคลิกภาพ, การพาหิรวัฒน์, ความสอดคล้อง, ความมีสติ, ความมั่นคงทางอารมณ์, การเปิดกว้าง) กับ 3 DVs ทัศนคติต่อ PCT, ทัศนคติต่อ CBT, ทัศนคติต่อ PCT เทียบกับ CBT ฉันยังเพิ่มอายุและเพศเพื่อดูว่ามีเอฟเฟกต์อะไรอีกบ้าง ฉันกำลังทดสอบเพื่อดูว่าลักษณะบุคลิกภาพสามารถทำนายทัศนคติของ DV ได้หรือไม่ ฉันเริ่มใช้เพียร์สันสหสัมพันธ์สำหรับตัวแปรทั้งหมด (45 การทดสอบ) การค้นพบที่สำคัญคือการพาหิรวัฒน์สัมพันธ์กับทัศนคติของ PCT ที่ p = 0.05 แต่เมื่อฉันทำการทดสอบ 45 ครั้งฉันได้ทำการแก้ไข Bonferroni ที่ alpha = 0.05 / 45 = 0.001 ดังนั้นการค้นพบนี้จึงไม่มีนัยสำคัญ จากนั้นฉันก็ทำการถดถอยเชิงเส้นอย่างง่าย ๆ ในตัวแปรทั้งหมดอีกครั้งการพาหิรวัฒน์อีกครั้งสำคัญกับทัศนคติต่อ …

2
ความสัมพันธ์ที่สำคัญในแต่ละกลุ่ม แต่ไม่สำคัญกว่าทั้งหมด?
สมมติว่าเราทดสอบความสัมพันธ์เพียร์สันระหว่างตัวแปรและอยู่ในกลุ่มและBเป็นไปได้ไหมที่ความสัมพันธ์จะมีนัยสำคัญในแต่ละและแต่ไม่สำคัญเมื่อรวมข้อมูลจากทั้งสองกลุ่มเข้าด้วยกัน? ในกรณีนี้คุณช่วยกรุณาอธิบายให้ฟังหน่อยได้ไหมxxxyyyAAABBB(x,y)(x,y)(x,y)AAABBB

2
พารามิเตอร์การบูตแบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับรุ่นผสม
ตัดต่อไปนี้จะนำมาจากบทความนี้ ฉันเป็นมือใหม่ในการบู๊ตสแตรปและพยายามที่จะใช้การบู๊ตสแปปปิ้งแบบกึ่งพารามิเตอร์แบบกึ่งพารามิเตอร์และแบบไม่มีพารามิเตอร์สำหรับแบบจำลองเชิงเส้นผสมกับR bootแพ็คเกจ รหัส R นี่คือRรหัสของฉัน: library(SASmixed) library(lme4) library(boot) fm1Cult <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=Cultivation) fixef(fm1Cult) boot.fn <- function(data, indices){ data <- data[indices, ] mod <- lmer(drywt ~ Inoc + Cult + (1|Block) + (1|Cult), data=data) fixef(mod) } set.seed(12345) Out <- boot(data=Cultivation, statistic=boot.fn, R=99) …
9 r  mixed-model  bootstrap  central-limit-theorem  stable-distribution  time-series  hypothesis-testing  markov-process  r  correlation  categorical-data  association-measure  meta-analysis  r  anova  confidence-interval  lm  r  bayesian  multilevel-analysis  logit  regression  logistic  least-squares  eda  regression  notation  distributions  random-variable  expected-value  distributions  markov-process  hidden-markov-model  r  variance  group-differences  microarray  r  descriptive-statistics  machine-learning  references  r  regression  r  categorical-data  random-forest  data-transformation  data-visualization  interactive-visualization  binomial  beta-distribution  time-series  forecasting  logistic  arima  beta-regression  r  time-series  seasonality  large-data  unevenly-spaced-time-series  correlation  statistical-significance  normalization  population  group-differences  demography 

1
วิธีการวัดความไม่แน่นอนเชิงสถิติ
ฉันค่อนข้างใหม่กับสถิติและเข้าใจว่าคำถามของฉันอาจผิดไปอย่างสิ้นเชิง ฉันกำลังทดสอบอัลกอริทึมของตัวเองกับที่อื่น ในขณะที่ผลลัพธ์ไม่เหมือนกันฉันต้องการแสดงให้เห็นว่าความแตกต่างนั้น "ไม่มีนัยสำคัญทางสถิติ" ฉันจะหาจำนวนนี้เพื่อทำให้ประเด็นของฉันได้อย่างไร

1
จะวัดความสัมพันธ์ระหว่างตัวแปรเด็ดขาดอย่างไร [ซ้ำ]
คำถามนี้มีคำตอบอยู่ที่นี่แล้ว : ความสัมพันธ์ระหว่างตัวแปรเด็ดขาด (1 คำตอบ) ปิดให้บริการใน6 เดือนที่ผ่านมา ฉันรู้ว่าเราสามารถใช้ Spearman rho เพื่อวัดความสัมพันธ์ระหว่างตัวแปรตัวเลข แต่จะวัดความสัมพันธ์ระหว่างตัวแปรเด็ดขาดได้อย่างไร

3
ความสัมพันธ์ระหว่างเมทริกซ์ใน R
ฉันมีปัญหาในการใช้งานcor()และcor.test()ฟังก์ชั่น ฉันมีเมทริกซ์สองตัว (เฉพาะค่าตัวเลขและจำนวนแถวและคอลัมน์เดียวกัน) และฉันต้องการให้มีจำนวนสหสัมพันธ์และค่า p ที่สอดคล้องกัน เมื่อฉันใช้cor(matrix1, matrix2)ฉันได้รับค่าสัมประสิทธิ์สหสัมพันธ์สำหรับเซลล์ทั้งหมด ฉันแค่ต้องการตัวเลขเดียวเป็นผลมาจากคร นอกจากนี้เมื่อฉันcor.test(matrix1, matrix2)ฉันได้รับข้อผิดพลาดต่อไปนี้ Error in cor.test.default(matrix1, matrix2) : 'x' must be a numeric vector ฉันจะรับค่า p สำหรับเมทริกซ์ได้อย่างไร คุณพบตารางง่ายๆที่ฉันต้องการเชื่อมโยงที่นี่: http://dl.dropbox.com/u/3288659/table_exp1_offline_MEANS.csv http://dl.dropbox.com/u/3288659/table_exp2_offline_MEANS.csv
9 r  correlation 

3
การมีความสัมพันธ์ก่อนหรือหลังการเปลี่ยนแปลงของตัวแปร
มีหลักการทั่วไปหรือไม่ว่าควรจะคำนวณความสัมพันธ์ของเพียร์สันสำหรับตัวแปรสุ่มสองตัว X และ Y ก่อนที่จะทำการแปลงท่อนหรือไม่? มีขั้นตอนการทดสอบที่เหมาะสมกว่าหรือไม่ พวกมันให้ผลเหมือนกัน แต่มีค่าต่างกันเนื่องจากการแปลงไฟล์เป็นแบบไม่เป็นเชิงเส้น มันขึ้นอยู่กับว่า X หรือ Y ใกล้เคียงกับมาตรฐานหลังจากบันทึกหรือไม่? ถ้าเป็นเช่นนั้นทำไมมันถึงสำคัญ? และนั่นหมายความว่าเราควรทำการทดสอบ normality บน X และ Y กับ log (X) และ log (Y) และขึ้นอยู่กับการตัดสินใจว่า pearson (x, y) เหมาะสมกว่า pearson (log (x), log (หรือไม่) y))?

5
ฉันจะทำอะไรได้นอกจากความสัมพันธ์ของเพียร์สัน?
ในขณะที่ตรวจสอบเพื่อดูว่ามีตัวแปรสองตัวที่มีความสัมพันธ์กันหรือไม่ฉันสังเกตว่าการใช้ความสัมพันธ์แบบเพียร์สันให้ผลเป็นตัวเลขต่ำสุดเพียง 0.1 ซึ่งบ่งชี้ว่าไม่มีความสัมพันธ์กัน มีสิ่งใดที่ฉันสามารถทำได้เพื่อเสริมสร้างการเรียกร้องนี้? ชุดข้อมูล (ชุดย่อยเนื่องจากข้อ จำกัด การโพสต์) ฉันกำลังดูอยู่นี้: 6162.178176 0.049820046 4675.14432 0.145022261 5969.056896 0.47210138 5357.506176 0.052263122 33.796224 16.45154204 6162.178176 0.064262991 6725.448576 0.419005508 3247.656192 0.867394771 5357.506176 0.052263122 3612.97728 0.091337414 6162.178176 0.053065652 867.436416 0.129116092 556.833024 1.01107509 1517.611392 168.1484478 1517.611392 35.11570899 4675.14432 0.053902079 4182.685056 0.070289777 2808.30528 0.071929502 5969.056896 0.47193385 3247.656192 0.896646636 4387.071744 …

2
การถดถอยประเภทใดที่จะใช้โดยพิจารณาหนึ่งตัวแปรที่มีขอบเขตสูงสุด?
ฉันไม่แน่ใจว่าวิธีการใดที่ใช้ในการสร้างแบบจำลองความสัมพันธ์ระหว่างตัวแปรสองตัว (และ ) ในการทดลองที่อธิบายไว้ดังต่อไปนี้:xxxYyy มี 3 ตัวแปร ได้แก่ : ,และy ที่xฉันเมตรxaimx_{aim}xxxYyy ค่าของถูกตั้งค่าเมื่อใช้งานการทดสอบ อย่างไรก็ตามและอาจไม่เท่ากันเสมอไปxฉันเมตรxaimx_{aim}xxxxaimxaimx_{aim} สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันระหว่างถึงประมาณ 0.9xaimxaimx_{aim}xxx สัมประสิทธิ์สหสัมพันธ์ของเพียร์สันระหว่างและน้อยกว่ามาก: ประมาณ 0.5xxxyyy yyyมีค่าสูงสุดที่เป็นไปได้ ( ) ซึ่งไม่สามารถเกินได้ymaxymaxy_{max} แต่ละจุดข้อมูลที่จะได้รับหลังจากการตั้งค่าและการอ่านและy ที่xaimxaimx_{aim}xxxyyy แม้ว่าค่าสัมประสิทธิ์สหสัมพันธ์ของเพียร์สันระหว่างและไม่ดีดูเหมือนว่ามีแนวโน้มที่จะเพิ่มขึ้นด้วยxxxxyyyyyyxxx หลังจากทำการวิเคราะห์เชิงเส้นอย่างง่ายของและ (และแปลงหลังเป็นเพื่อที่จะแสดงบนกราฟเดียวกันเช่นเช่น) ทั้งความชัน เป็นบวก แต่ความลาดชันของเป็นมากกว่าที่ฉy=f(x)y=f(x)y=f(x)x=g(y)x=g(y)x=g(y)g−1g−1g^{-1}fffg−1g−1g^{-1}fff มันสมเหตุสมผลไหมที่จะพูดว่าหรือ ? (จะถึงก่อนหน้าในกรณีที่สอง)xmax=f−1(ymax)xmax=f−1(ymax)x_{max} = f^{-1}(y_{max})xmax=g(ymax)xmax=g(ymax)x_{max} = g(y_{max})xmaxxmaxx_{max} เมื่อพิจารณาว่าถูกผูกไว้ด้วยสิ่งใดที่สามารถพูดได้เกี่ยวกับค่าสูงสุดที่เป็นไปได้ของที่สามารถเข้าถึงได้yyyymaxymaxy_{max}xxx เท่าที่ฉันเข้าใจมันทำให้รู้สึกถึงการถดถอยเชิงเส้นของรูปแบบเมื่อเป็นตัวแปรอิสระและเป็นตัวแปรตาม อย่างไรก็ตามในบริบทนี้ฉันไม่แน่ใจว่ามันสมเหตุสมผลหรือไม่ที่จะพิจารณาว่าเป็นอิสระและขึ้นอยู่กับy=f(x)y=f(x)y=f(x)xxxyyyxxxyyy การถดถอยกำลังสองน้อยที่สุดจะเหมาะสมกว่าหรือไม่ มีวิธีอื่นในการพิจารณาว่าค่าใดของสามารถเข้าถึงได้ (และโอกาสใดที่)xmaxxmaxx_{max} (หากเป็นกรณีนี้และดูเหมือนจะไม่เป็นไปตามการแจกแจงแบบปกติเนื่องจากมีความพยายามมากขึ้นในการพยายามเข้าถึงค่าที่สูงกว่าของ )xxxyyyxxx

2
การทดสอบความสำคัญของความสัมพันธ์สามรายการขึ้นไปโดยใช้การแปลงของฟิชเชอร์
หลังจากที่โพสต์ก่อนหน้านี้เท่าที่ฉันสามารถเข้าใจได้ถ้าฉันมีสามค่าสัมประสิทธิ์สหสัมพันธ์ฉันจะต้องทดสอบพวกเขาเป็นคู่เพื่อดูว่ามีความแตกต่างอย่างมีนัยสำคัญในหมู่พวกเขา ซึ่งหมายความว่าฉันจะต้องใช้การแปลง Fishers เพื่อหาคะแนน z ของ r แล้วตามด้วยค่า p ของ z (ซึ่งเครื่องคิดเลขที่แนะนำในโพสต์ก่อนหน้าทำขอบคุณ) แล้วตรวจสอบว่าค่า p สูงหรือต่ำกว่า ค่าอัลฟาของฉัน (0.05) สำหรับแต่ละคู่ เช่นถ้าอายุ 21 ถึง 30 ปีคือกลุ่มอายุ 1, 31 ถึง 40 ปีคือกลุ่มอายุ 2 และ 41 ถึง 50 ปีคือกลุ่มอายุ 2, การเปรียบเทียบความสัมพันธ์ระหว่างพฤติกรรมการช็อปปิ้งและการลดน้ำหนักของฉันจะเป็นอย่างไร: กลุ่ม 1 กับกลุ่ม 2 กลุ่ม 1 กับกลุ่ม 3 กลุ่ม 2 กับกลุ่ม 3 แทนที่จะทำการคำนวณสามแบบแยกกันมีวิธีการคำนวณเหล่านี้ทั้งหมดในขั้นตอนเดียวหรือไม่?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.