คำถามติดแท็ก spss

SPSS เป็นชุดซอฟต์แวร์เชิงสถิติ ใช้แท็กนี้สำหรับคำถามในหัวข้อใด ๆ ที่ (a) เกี่ยวข้องกับ SPSS ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวังและ (b) ไม่เพียงเกี่ยวกับวิธีการใช้ SPSS

2
วิธีการคำนวณคะแนนปัจจัยและเมทริกซ์ "สัมประสิทธิ์คะแนน" ในการวิเคราะห์ PCA หรือปัจจัยคืออะไร
ตามความเข้าใจของฉันใน PCA ตามสหสัมพันธ์เราได้รับการโหลด (= องค์ประกอบหลักในตัวอย่างนี้) ซึ่งไม่ได้มีอะไรนอกจากความสัมพันธ์ระหว่างตัวแปรและปัจจัย ตอนนี้เมื่อฉันต้องการสร้างคะแนนตัวประกอบใน SPSS ฉันสามารถรับคะแนนตัวประกอบของผู้ตอบแต่ละคนสำหรับแต่ละปัจจัยได้โดยตรง ฉันยังสังเกตเห็นว่าถ้าฉันคูณ " เมทริกซ์สัมประสิทธิ์คะแนนองค์ประกอบ " (ที่ผลิตโดย SPSS) ด้วยตัวแปรดั้งเดิมมาตรฐานฉันจะได้รับคะแนนปัจจัยเดียวกับที่ได้รับจาก SPSS ใครช่วยกรุณาช่วยฉันเข้าใจว่า "เมทริกซ์สัมประสิทธิ์คะแนนองค์ประกอบ" หรือ "เมทริกซ์สัมประสิทธิ์คะแนนปัจจัย" - ซึ่งฉันสามารถคำนวณปัจจัยหรือคะแนนองค์ประกอบ - คำนวณได้อย่างไร วิธีการที่แตกต่างกันของคะแนนปัจจัยการคำนวณแตกต่างกันในเมทริกซ์นี้อย่างไร

4
ค่าที่ถูกต้องสำหรับความแม่นยำและการเรียกคืนในกรณีขอบคืออะไร?
ความแม่นยำหมายถึง: p = true positives / (true positives + false positives) มันถูกต้องหรือไม่ที่ในฐานะtrue positivesและfalse positivesวิธีที่ 0 ความแม่นยำเข้าใกล้ 1? คำถามเดียวกันสำหรับการเรียกคืน: r = true positives / (true positives + false negatives) ขณะนี้ฉันกำลังใช้การทดสอบทางสถิติที่ฉันต้องการคำนวณค่าเหล่านี้และบางครั้งมันก็เกิดขึ้นที่ตัวส่วนเป็น 0 และฉันสงสัยว่าจะคืนค่าใดให้กับกรณีนี้ PS: ขอโทษแท็กที่ไม่เหมาะสมผมอยากจะใช้recall, precisionและlimitแต่ฉันไม่สามารถสร้างแท็กใหม่ ๆ
20 precision-recall  data-visualization  logarithm  references  r  networks  data-visualization  standard-deviation  probability  binomial  negative-binomial  r  categorical-data  aggregation  plyr  survival  python  regression  r  t-test  bayesian  logistic  data-transformation  confidence-interval  t-test  interpretation  distributions  data-visualization  pca  genetics  r  finance  maximum  probability  standard-deviation  probability  r  information-theory  references  computational-statistics  computing  references  engineering-statistics  t-test  hypothesis-testing  independence  definition  r  censoring  negative-binomial  poisson-distribution  variance  mixed-model  correlation  intraclass-correlation  aggregation  interpretation  effect-size  hypothesis-testing  goodness-of-fit  normality-assumption  small-sample  distributions  regression  normality-assumption  t-test  anova  confidence-interval  z-statistic  finance  hypothesis-testing  mean  model-selection  information-geometry  bayesian  frequentist  terminology  type-i-and-ii-errors  cross-validation  smoothing  splines  data-transformation  normality-assumption  variance-stabilizing  r  spss  stata  python  correlation  logistic  logit  link-function  regression  predictor  pca  factor-analysis  r  bayesian  maximum-likelihood  mcmc  conditional-probability  statistical-significance  chi-squared  proportion  estimation  error  shrinkage  application  steins-phenomenon 

4
การแสดงการตอบสนอง Likert โดยใช้ R หรือ SPSS
ฉันมีผู้ตอบแบบสอบถาม 82 คนใน 2 กลุ่ม (43 คนในกลุ่ม A และ 39 คนในกลุ่ม B) ที่ทำแบบสอบถาม 65 Likert แต่ละคำถามมีตั้งแต่ 1 - 5 (เห็นด้วยอย่างยิ่ง - ไม่เห็นด้วยอย่างยิ่ง) ฉันจึงมี dataframe ที่มี 66 คอลัมน์ (1 สำหรับแต่ละคำถาม + 1 หมายถึงการจัดสรรกลุ่ม) และ 82 แถว (1 สำหรับผู้ตอบแต่ละคน) การใช้ R หรือ SPSS ทำให้ทุกคนรู้วิธีที่ดีในการแสดงข้อมูลนี้ ฉันต้องการสิ่งนี้: (จากJason Bryer ) แต่ฉันไม่สามารถรับส่วนเริ่มต้นของรหัสในการทำงาน หรือฉันพบตัวอย่างที่ดีของวิธีการแสดงภาพข้อมูล Likert จากโพสต์ที่ผ่านการตรวจสอบความถูกต้องก่อนหน้า: …

3
การแจกจ่ายของฉันเป็นเรื่องปกติ การทดสอบ Kolmogorov-Smirnov ไม่เห็นด้วย
ฉันมีปัญหากับค่าปกติของข้อมูลบางอย่างที่ฉันมี: ฉันได้ทำการทดสอบ Kolmogorov ซึ่งบอกว่ามันไม่ปกติกับ p = .0000 ฉันไม่เข้าใจ: ความเบ้ของการกระจายของฉัน = -. 497 และ kurtosis = -0,024 นี่คือพล็อตเรื่องการกระจายตัวของฉันซึ่งดูธรรมดามาก ... (ฉันมีสามคะแนนและแต่ละคะแนนนี้ไม่ปกติกับค่า p ที่สำคัญสำหรับการทดสอบ Kolmogorov ... ฉันไม่เข้าใจจริงๆ)

3
การทำนายความแปรปรวนของข้อมูล heteroscedastic
ฉันพยายามทำการถดถอยกับข้อมูลแบบเฮเทอโรเซสติกซึ่งฉันพยายามทำนายความแปรปรวนข้อผิดพลาดรวมถึงค่าเฉลี่ยในแง่ของตัวแบบเชิงเส้น บางสิ่งเช่นนี้ y(x,t)ξ(x,t)y¯(x,t)σ(x,t)=y¯(x,t)+ξ(x,t),∼N(0,σ(x,t)),=y0+ax+bt,=σ0+cx+dt.y(x,t)=y¯(x,t)+ξ(x,t),ξ(x,t)∼N(0,σ(x,t)),y¯(x,t)=y0+ax+bt,σ(x,t)=σ0+cx+dt.\begin{align}\\ y\left(x,t\right) &= \bar{y}\left(x,t\right)+\xi\left(x,t\right),\\ \xi\left(x,t\right) &\sim N\left(0,\sigma\left(x,t\right)\right),\\ \bar{y}\left(x,t\right) &= y_{0}+ax+bt,\\ \sigma\left(x,t\right) &= \sigma_{0}+cx+dt. \end{align} ในคำพูดของข้อมูลที่ประกอบด้วยวัดซ้ำของที่ค่าต่างๆของxและเสื้อ ฉันถือว่าการวัดเหล่านี้ประกอบด้วยค่า "จริง" หมายถึงค่าˉ y ( x , t )ซึ่งเป็นฟังก์ชันเชิงเส้นของxและtพร้อมกับเสียงเกาส์แบบเติมadd ( x , t )ซึ่งค่าเบี่ยงเบนมาตรฐาน (หรือความแปรปรวนฉันไม่ได้ ตัดสินใจ) นอกจากนี้ยังขึ้นอยู่กับเส้นตรงกับx ,เสื้อ (ฉันอาจอนุญาตการพึ่งพาที่ซับซ้อนมากขึ้นในxและy(x,t)y(x,t)y(x,t)xxxttty¯(x,t)y¯(x,t)\bar{y}(x,t)xxxtttξ(x,t)ξ(x,t)\xi(x,t)x,tx,เสื้อx,txxx - ไม่มีแรงกระตุ้นเชิงทฤษฎีที่แข็งแกร่งสำหรับรูปแบบเชิงเส้น - แต่ฉันไม่อยากจะเข้าใจสิ่งต่าง ๆ ในตอนนี้)ttt ฉันรู้ว่าคำค้นหาที่นี่คือ "heteroscedasticity" แต่ทั้งหมดที่ฉันสามารถค้นหาได้คือการอภิปรายเกี่ยวกับวิธีการลด / ลบคำศัพท์เพื่อทำนายดีขึ้นแต่ไม่มีอะไรในแง่ของการพยายามทำนายσในแง่ของ ตัวแปรอิสระ. ฉันต้องการประมาณy 0 …

5
การตีความความแตกต่างระหว่าง R และ SPSS ด้วยการวิเคราะห์ปัจจัยเชิงสำรวจ
ฉันเป็นนักศึกษาระดับบัณฑิตศึกษาสาขาวิทยาศาสตร์คอมพิวเตอร์ ฉันทำการวิเคราะห์ปัจจัยเชิงสำรวจสำหรับโครงการวิจัย เพื่อนร่วมงานของฉัน (ที่เป็นผู้นำโครงการ) ใช้ SPSS ในขณะที่ฉันต้องการใช้ R สิ่งนี้ไม่สำคัญจนกว่าเราจะค้นพบความแตกต่างที่สำคัญระหว่างสองแพ็คเกจทางสถิติ เราใช้แกนแฟคตอริ่งระหว่างการแยก (โปรดทราบว่าฉันตระหนักดีถึงความแตกต่างระหว่าง PCA และการวิเคราะห์ปัจจัยและเราไม่ได้ใช้ PCAอย่างน้อยก็ไม่ได้ตั้งใจ) จากสิ่งที่ฉันได้อ่านสิ่งนี้ควรสอดคล้องกับวิธี "แกนหลัก" ใน R และ "แกนตัวประกอบแฟคตอริ่งหลัก" หรือ "สแควร์สแควร์น้อยที่สุด" ใน SPSSตามเอกสาร R เราจะใช้วิธีการเอียงหมุน (เฉพาะPromax ) เพราะเราคาดว่าปัจจัยที่มีความสัมพันธ์และมีการตีความเมทริกซ์รูปแบบ การรันสองโพรซีเดอร์ใน R และ SPSS มีความแตกต่างที่สำคัญ เมทริกซ์รูปแบบให้การโหลดที่แตกต่างกัน แม้ว่าสิ่งนี้จะให้ปัจจัยเดียวกันกับความสัมพันธ์ของตัวแปรมากขึ้นหรือน้อยลง แต่ก็มีความแตกต่างระหว่างการโหลดที่สอดคล้องกันถึง 0.15 ซึ่งดูเหมือนจะมากกว่าที่คาดไว้โดยการใช้วิธีการสกัดและการหมุนแบบโปรแม็กซ์ที่แตกต่างกัน อย่างไรก็ตามนั่นไม่ใช่ความแตกต่างที่น่าตกใจที่สุด ความแปรปรวนสะสมที่อธิบายโดยปัจจัยอยู่ที่ประมาณ 40% ในผลลัพธ์ SPSS และ 31% ในผลลัพธ์ R นี่เป็นความแตกต่างอย่างมากและทำให้เพื่อนร่วมงานของฉันต้องการใช้ SPSS …

5
การถดถอยแบบลอจิสติกและการสุ่มตัวอย่าง
ฉันเหมาะสมการถดถอยโลจิสติกแบบขั้นตอนในชุดของข้อมูลใน SPSS ในขั้นตอนนี้ฉันปรับโมเดลของฉันเป็นชุดย่อยแบบสุ่มที่มีค่าประมาณ 60% ของกลุ่มตัวอย่างทั้งหมดมีประมาณ 330 ราย สิ่งที่ฉันคิดว่าน่าสนใจคือทุกครั้งที่ฉันสุ่มตัวอย่างข้อมูลของฉันอีกครั้งฉันจะได้รับตัวแปรที่แตกต่างกันออกมาในรูปแบบสุดท้าย มีผู้ทำนายไม่กี่คนที่ปรากฏตัวในรุ่นสุดท้ายเสมอ คำถามของฉันคือสิ่งนี้ วิธีที่ดีที่สุดในการจัดการกับสิ่งนี้คืออะไร? ฉันหวังว่าจะเห็นการรวมกันของตัวแปรทำนาย แต่นั่นไม่ใช่กรณี บางรุ่นมีความรู้สึกที่เข้าใจง่ายกว่ามากจากมุมมองด้านปฏิบัติการ (และจะอธิบายได้ง่ายกว่ากับผู้มีอำนาจตัดสินใจ) และคนอื่น ๆ ก็พอดีกับข้อมูลที่ดีกว่าเล็กน้อย ในระยะสั้นเนื่องจากมีการสับเปลี่ยนตัวแปรคุณจะแนะนำให้จัดการกับสถานการณ์ของฉันได้อย่างไร ขอบคุณมากล่วงหน้า

5
การใส่หลายครั้งสำหรับค่าที่หายไป
ฉันต้องการใช้การใส่ข้อมูลเพื่อแทนที่ค่าที่หายไปในชุดข้อมูลของฉันภายใต้ข้อ จำกัด บางประการ ตัวอย่างเช่นผมต้องการตัวแปรที่ประเมินx1จะมีค่ามากกว่าหรือเท่ากับผลรวมของสองตัวแปรอื่น ๆ ของฉันพูดและx2 x3ฉันยังต้องการที่x3จะได้รับการกล่าวหาโดยทั้ง0หรือ>= 14และฉันต้องการที่x2จะได้รับการกล่าวหาโดยทั้งหรือ0>= 16 ฉันพยายามกำหนดข้อ จำกัด เหล่านี้ใน SPSS สำหรับการใส่หลายครั้ง แต่ใน SPSS ฉันสามารถกำหนดค่าสูงสุดและต่ำสุดได้เท่านั้น มีวิธีใดที่จะกำหนดข้อ จำกัด เพิ่มเติมใน SPSS หรือคุณรู้แพ็คเกจ R ที่จะให้ฉันกำหนดข้อ จำกัด ดังกล่าวสำหรับการใส่ค่าที่หายไป? ข้อมูลของฉันเป็นดังนี้: x1 =c(21, 50, 31, 15, 36, 82, 14, 14, 19, 18, 16, 36, 583, NA,NA,NA, 50, 52, 26, 24) x2 = c(0, NA, …

1
เกณฑ์สำหรับการเลือกโมเดล“ ดีที่สุด” ในโมเดลมาร์คอฟที่ซ่อนอยู่
ฉันมีชุดข้อมูลอนุกรมเวลาที่ฉันพยายามจัดวางแบบซ่อนมาร์คอฟ (HMM) เพื่อประเมินจำนวนสถานะแฝงในข้อมูล รหัสหลอกของฉันสำหรับทำสิ่งนี้มีดังต่อไปนี้: for( i in 2 : max_number_of_states ){ ... calculate HMM with i states ... optimal_number_of_states = "model with smallest BIC" ... } ตอนนี้ในรูปแบบการถดถอยปกติ BIC มีแนวโน้มที่จะชอบรูปแบบที่น่าสังเวชมากที่สุด แต่ในกรณีของ HMM ฉันไม่แน่ใจว่ามันคือสิ่งที่ทำ มีใครบ้างที่ทราบว่าเกณฑ์ BIC ของ HMM ประเภทใดมีแนวโน้มเป็นจริง? ฉันยังสามารถได้รับ AIC และค่าความน่าจะเป็นเช่นกัน เนื่องจากฉันพยายามที่จะอนุมานจำนวนจริงของรัฐเป็นหนึ่งในเกณฑ์เหล่านี้ "ดีกว่า" เพื่ออื่น ๆ สำหรับวัตถุประสงค์นี้หรือไม่

3
ฉันสามารถใช้การถดถอยแบบหลายครั้งได้หรือไม่เมื่อฉันมีตัวทำนายที่เป็นหมวดหมู่และแบบต่อเนื่องผสมกัน?
ดูเหมือนว่าคุณสามารถใช้การเข้ารหัสสำหรับตัวแปรเด็ดขาดหนึ่งตัว แต่ฉันมีตัวแปรเด็ดขาดสองตัวและตัวแปรทำนายต่อเนื่องหนึ่งตัว ฉันสามารถใช้การถดถอยแบบหลายครั้งใน SPSS ได้หรือไม่และอย่างไร? ขอบคุณ!

5
การจำแนกประเภทที่ดีกว่าของค่าเริ่มต้นในการถดถอยโลจิสติก
การเปิดเผยแบบเต็ม: นี่คือการบ้าน ฉันได้รวมลิงก์ไปยังชุดข้อมูล ( http://www.bertelsen.ca/R/logistic-regression.sav ) เป้าหมายของฉันคือการเพิ่มการคาดการณ์ของผู้ชำระหนี้ในชุดข้อมูลนี้ ทุกรุ่นที่ฉันคิดมานั้นคาดการณ์> 90% ของผู้ไม่ defaulters แต่ <40% ของผู้ defaulters ทำให้ประสิทธิภาพการจำแนกโดยรวมประมาณ 80% ดังนั้นฉันสงสัยว่ามีผลกระทบระหว่างการโต้ตอบตัวแปรหรือไม่ ภายในการถดถอยแบบโลจิสติกส์นอกเหนือจากการทดสอบชุดค่าผสมที่เป็นไปได้แต่ละวิธีมีวิธีการระบุผลกระทบที่อาจเกิดขึ้นจากการโต้ตอบ หรืออีกวิธีหนึ่งในการเพิ่มประสิทธิภาพของการจำแนกประเภทของ defaulters ฉันติดอยู่คำแนะนำใด ๆ จะเป็นประโยชน์ในการเลือกคำ R-code หรือไวยากรณ์ SPSS ของคุณ ตัวแปรหลักของฉันอยู่ในฮิสโทแกรมและสแกตเตอร์ล็อตต่อไปนี้ (ยกเว้นตัวแปร dichotomous) คำอธิบายของตัวแปรหลัก: age: Age in years employ: Years with current employer address: Years at current address income: Household income in …
12 r  logistic  spss  self-study 

2
ฉันควรรายงานผลลัพธ์ที่ไม่สำคัญหรือไม่
ฉันใช้การทดสอบ Kruskal Wallis และสำหรับบางคำถามค่า p ไม่สำคัญ ฉันจะรายงานสิ่งนี้ในลักษณะเดียวกับที่เป็นสาระสำคัญโดยระบุ df สถิติการทดสอบและค่า p หรือไม่ ดังนั้นมันจะเป็นแบบนี้การทดสอบ Kruskal Wallis ได้ดำเนินการ แต่ผลลัพธ์ไม่พบว่ามีนัยสำคัญ H (3) = 2.119, p> 0.05 (หรือฉันจะระบุค่า p ที่แน่นอนที่นี่ (.548))

1
การแสดงข้อมูลลำดับ - หมายถึงค่ามัธยฐานและค่าเฉลี่ยอันดับ
ฉันมีข้อมูลลำดับที่ไม่ได้กระจายตามปกติดังนั้นฉันตัดสินใจทำการทดสอบแบบไม่อิงพารามิเตอร์โดยใช้ Mann-Whitney U Test ฉันกำลังดูความแตกต่างระหว่างกลุ่มสำหรับเจ็ดคะแนน - คะแนนเหล่านี้เป็น 0, 1, 2 หรือ 3 สำหรับแต่ละวิชา ฉันมีช่วงเวลาที่ยากลำบากในการหาวิธีแสดงข้อมูลของฉัน! ถ้าฉันนำเสนอข้อมูลโดยใช้ค่ามัธยฐาน (และค่า IQR ของค่ามัธยฐาน) ก็ไม่ชัดเจนเลยว่าความแตกต่างนั้นเป็นเพราะส่วนใหญ่ค่าเฉลี่ยของสื่อกลางอยู่ที่ 0 หรือ 1 ดังนั้นแม้จะทดสอบ Mann-Whitney U แสดงความแตกต่างอย่างมีนัยสำคัญ ตารางดูไม่น่าสนใจ ฉันยังสามารถนำเสนอข้อมูลโดยใช้วิธีการ มีเอกสารทางวิทยาศาสตร์บางฉบับที่บอกว่าคุณสามารถใช้วิธีการที่มีข้อมูลลำดับ แต่คุณไม่สามารถตั้งสมมติฐานประเภทเดียวกันเกี่ยวกับความแตกต่างระหว่างคะแนน (เช่นความแตกต่างระหว่าง 0 และ 1 ไม่เหมือนกับระหว่าง 1 และ 2) การใช้หมายถึงจะเป็นการโต้เถียงเล็กน้อยแม้ว่าตัวเลขในตารางจะบอกเล่าเรื่องราวได้ดีเมื่อฉันใช้ ตัวเลือกที่สามคือการใช้อันดับเฉลี่ยที่ SPSS มอบให้ฉันในผลลัพธ์ของ Mann-Whitney อันดับเฉลี่ยคือสิ่งที่มีการเปรียบเทียบระหว่างกลุ่มดังนั้นบางทีฉันควรใช้เหล่านั้น ปัญหาเดียวที่ฉันมีคือค่าเฉลี่ยไม่ได้หมายถึงอะไรจริง ๆ ที่เกี่ยวกับข้อมูลจริง (เช่นฉันไม่เห็นว่าวิชาอยู่ใกล้กับ 3 ในขณะที่การควบคุมอยู่ใกล้กับ …

2
วิธีรับค่า p-pooled จากการทดสอบที่ทำในชุดข้อมูลหลายชุด
เมื่อใช้ Amelia ใน R ฉันได้รับชุดข้อมูลหลายชุด หลังจากนั้นฉันทำการทดสอบซ้ำใน SPSS ตอนนี้ฉันต้องการรวมผลการทดสอบ ฉันรู้ว่าฉันสามารถใช้กฎของ Rubin (ดำเนินการผ่านแพ็คเกจการใส่หลาย ๆ แบบใน R) เพื่อรวมหมายถึงและข้อผิดพลาดมาตรฐาน แต่ฉันจะรวมค่า p ได้อย่างไร เป็นไปได้ไหม? มีฟังก์ชั่นใน R ที่จะทำเช่นนั้น? ขอบคุณล่วงหน้า.

2
ฉันจะค้นหาการวัดความสัมพันธ์ระหว่างตัวแปรสองรายการได้อย่างไร
มีการสำรวจเมื่อผู้คนเลือกสิ่งที่พวกเขาใช้ยิ้มเพื่อเป็นตัวแทนและเข้าสู่ประเทศต้นกำเนิด ฉันเขียนข้อความตอบกลับไปเป็นตัวเลขแล้ว การวิเคราะห์รูปแบบใดที่ควรใช้ (โดยเฉพาะอย่างยิ่งใน SPSS) เพื่อตรวจสอบระดับความสัมพันธ์ระหว่างสิ่งที่ผู้คนมาจากและการเป็นตัวแทนที่พวกเขาเลือก?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.