คำถามติดแท็ก sas

SAS เป็นโปรแกรมสำเร็จรูปทางสถิติ ใช้แท็กนี้สำหรับคำถามในหัวข้อที่ (a) เกี่ยวข้องกับ SAS ไม่ว่าจะเป็นส่วนสำคัญของคำถามหรือคำตอบที่คาดหวัง & (b) ไม่ใช่แค่เกี่ยวกับวิธีใช้ SAS


8
สร้างตัวแปรสุ่มที่มีความสัมพันธ์ที่กำหนดไว้กับตัวแปรที่มีอยู่
สำหรับการศึกษาการจำลองฉันต้องสร้างตัวแปรสุ่มที่แสดง prefined (ประชากร) ความสัมพันธ์กับตัวแปรที่มีอยู่YYYY ฉันดูในRแพ็คเกจcopulaและCDVineสามารถสร้างการแจกแจงหลายตัวแปรแบบสุ่มด้วยโครงสร้างการพึ่งพาที่กำหนด อย่างไรก็ตามเป็นไปไม่ได้ที่จะแก้ไขหนึ่งในตัวแปรที่เป็นผลลัพธ์ของตัวแปรที่มีอยู่ ความคิดและลิงก์ไปยังฟังก์ชั่นที่มีอยู่นั้นได้รับการชื่นชม! สรุป: คำตอบที่ถูกต้องสองคำขึ้นมาพร้อมกับโซลูชันที่แตกต่าง: R สคริปต์โดย Caracal ซึ่งจะคำนวณตัวแปรสุ่มกับที่แน่นอน (ตัวอย่าง) ความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า R ฟังก์ชั่นฉันพบตัวเองซึ่งจะคำนวณตัวแปรสุ่มที่มีการกำหนดประชากรความสัมพันธ์กับตัวแปรที่กำหนดไว้ล่วงหน้า [@ttnphns 'นอกจากนี้: ฉันใช้เสรีภาพในการขยายชื่อคำถามจากกรณีตัวแปรคงที่เดียวเป็นจำนวนคงที่ของตัวแปรคงที่; เช่นวิธีการสร้างตัวแปรที่มีคอร์เรชั่นที่กำหนดไว้ล่วงหน้าพร้อมกับตัวแปรคงที่บางตัวที่มีอยู่]

3
การแปลความหมายของตัวทำนายการแปลงสภาพบันทึกและ / หรือการตอบสนอง
ฉันสงสัยว่ามันจะสร้างความแตกต่างในการตีความไม่ว่าจะเป็นเพียงขึ้นอยู่กับทั้งขึ้นอยู่กับและเป็นอิสระหรือตัวแปรอิสระเท่านั้นที่ถูกเปลี่ยนเข้าสู่ระบบ พิจารณากรณีของ log(DV) = Intercept + B1*IV + Error ฉันสามารถตีความ IV เป็นเปอร์เซ็นต์เพิ่มขึ้น แต่จะเปลี่ยนแปลงได้อย่างไรเมื่อฉันมี log(DV) = Intercept + B1*log(IV) + Error หรือเมื่อฉันมี DV = Intercept + B1*log(IV) + Error ?
46 regression  data-transformation  interpretation  regression-coefficients  logarithm  r  dataset  stata  hypothesis-testing  contingency-tables  hypothesis-testing  statistical-significance  standard-deviation  unbiased-estimator  t-distribution  r  functional-data-analysis  maximum-likelihood  bootstrap  regression  change-point  regression  sas  hypothesis-testing  bayesian  randomness  predictive-models  nonparametric  terminology  parametric  correlation  effect-size  loess  mean  pdf  quantile-function  bioinformatics  regression  terminology  r-squared  pdf  maximum  multivariate-analysis  references  data-visualization  r  pca  r  mixed-model  lme4-nlme  distributions  probability  bayesian  prior  anova  chi-squared  binomial  generalized-linear-model  anova  repeated-measures  t-test  post-hoc  clustering  variance  probability  hypothesis-testing  references  binomial  profile-likelihood  self-study  excel  data-transformation  skewness  distributions  statistical-significance  econometrics  spatial  r  regression  anova  spss  linear-model 

6
ตัวเลือกการวิเคราะห์ข้อมูลนอกหลัก
ฉันใช้ SAS อย่างมืออาชีพมาเกือบ 5 ปีแล้ว ฉันติดตั้งไว้ในแล็ปท็อปของฉันและต้องวิเคราะห์ชุดข้อมูลด้วยตัวแปร 1,000-2,000 ชุดและการสังเกตนับแสนครั้ง ฉันกำลังมองหาทางเลือกอื่นสำหรับ SAS ที่ให้ฉันทำการวิเคราะห์ในชุดข้อมูลขนาดใกล้เคียงกัน ฉันอยากรู้ว่าคนอื่นใช้อะไรในสถานการณ์เช่นนี้ นี่ไม่ใช่ "ข้อมูลขนาดใหญ่" ในลักษณะที่ใช้ในปัจจุบัน หรือชุดข้อมูลของฉันมีขนาดเล็กพอที่จะเก็บไว้ในหน่วยความจำ ฉันต้องการโซลูชันที่สามารถใช้อัลกอริทึมกับข้อมูลที่เก็บไว้ในฮาร์ดไดรฟ์ นี่คือสิ่งที่ฉันได้ตรวจสอบเพื่อประโยชน์: R - BigMemory สามารถสร้างเมทริกซ์ที่เก็บไว้นอกหน่วยความจำได้ แต่องค์ประกอบจะต้องเป็นโหมดเดียวกัน ฉันทำงานกับข้อมูลที่เกือบ 50/50 แยกระหว่างตัวละครและตัวเลข แพ็คเกจ FF เข้าใกล้สิ่งที่ฉันต้องการ แต่ฉันไม่เข้าใจเลยว่าขั้นตอนใดบ้างที่เข้ากันได้ ฉันคิดว่าการสนับสนุนค่อนข้าง จำกัด Pandas - ฉันตื่นเต้นมากเกี่ยวกับทางเลือก Pythonic กับ R อย่างไรก็ตามมันก็ต้องเก็บข้อมูลทั้งหมดไว้ในหน่วยความจำด้วย Revolution R - อันนี้แสดงค่อนข้างสัญญา ฉันมีสำเนาบนคอมพิวเตอร์ที่บ้านของฉัน (ฟรีหากคุณสมัคร Kaggle) และยังไม่ได้ทดสอบว่าเป็นทางเลือกที่ทำงานได้กับ SAS ความคิดเห็นเกี่ยวกับ Revolution …
18 r  sas  large-data 


3
แหล่งข้อมูลสำหรับผู้ใช้ R ที่ต้องเรียนรู้ SAS
ฉันใช้อาร์ทุกวัน ฉันคิดว่าในแง่ของ data.frames, ตระกูล Apply () ของฟังก์ชัน, การเขียนโปรแกรมเชิงวัตถุ, vectorization, และ ggplot2 geoms / aesthetics ฉันเพิ่งเริ่มทำงานให้กับองค์กรที่ใช้ SAS เป็นหลัก ฉันรู้ว่ามีหนังสือเกี่ยวกับการเรียนรู้ R สำหรับผู้ใช้ SASแต่แหล่งข้อมูลที่ดีสำหรับผู้ใช้ R ที่ไม่เคยใช้ SAS คืออะไร
18 r  sas 

5
ไลบรารี Java แบบโอเพนซอร์สสำหรับสถิติในระดับที่เสนอโดยหลักสูตรสถิติบัณฑิต
ฉันกำลังเรียนหลักสูตรบัณฑิตศึกษาในสถิติประยุกต์ที่ใช้ตำราเรียนต่อไปนี้ (เพื่อให้คุณรู้สึกถึงระดับของเนื้อหาที่ถูกครอบคลุม): แนวคิดและวิธีการทางสถิติโดย GK Bhattacharyya และ RA Johnson ศาสตราจารย์ต้องการให้เราใช้ SAS สำหรับการบ้าน คำถามของฉันคือ: มีห้องสมุด Java (IES) ที่สามารถใช้แทน SAS สำหรับปัญหาที่มักจะเห็นในชั้นเรียนดังกล่าว ขณะนี้ฉันกำลังพยายามทำกับApache Math Commonsและแม้ว่าฉันจะประทับใจกับห้องสมุด (มันใช้งานง่ายและเข้าใจง่าย) ดูเหมือนจะขาดสิ่งง่าย ๆ เช่นความสามารถในการวาดฮิสโทแกรม (คิดถึงการรวมเข้ากับไลบรารีแผนภูมิ ) ฉันดูที่ Colt แต่ความสนใจเริ่มแรกของฉันก็ลดลงอย่างรวดเร็ว จะขอบคุณอินพุตใด ๆ - และฉันได้ดูคำถามที่คล้ายกันใน Stackoverflow แต่ไม่พบสิ่งใดที่น่าสนใจ หมายเหตุ: ฉันรู้ว่าไลบรารี R, SciPy และ Octave และ java ที่โทรไปหาพวกเขา - ฉันกำลังมองหาไลบรารีดั้งเดิมของ Java หรือชุดของไลบรารีที่สามารถให้คุณสมบัติที่ฉันกำลังมองหาอยู่ด้วยกัน หมายเหตุ: …
15 r  sas  java 

1
ผลลัพธ์ที่ขัดแย้งกันของผลรวมกำลังสองของ Type III ใน ANOVA ใน SAS และ R
ผมวิเคราะห์ข้อมูลจากการทดลองปัจจัยที่ไม่สมดุลทั้งที่มีและSAS Rทั้งสองSASและRให้ผลรวมของสี่เหลี่ยมจัตุรัสประเภท I ที่คล้ายกัน แต่ผลรวมสี่เหลี่ยมจัตุรัส Type III ของพวกเขานั้นแตกต่างกัน ด้านล่างนี้SASและRรหัสและผลลัพธ์ DATA ASD; INPUT Y T B; DATALINES; 20 1 1 25 1 2 26 1 2 22 1 3 25 1 3 25 1 3 26 2 1 27 2 1 22 2 2 31 2 3 ; PROC GLM DATA=ASD; …
15 r  anova  sas  sums-of-squares 

2
ช่วงความเชื่อมั่นรอบค่าที่ทำนายจากโมเดลเอฟเฟกต์ผสมหมายถึงอะไร
ฉันกำลังดูหน้านี้และสังเกตเห็นวิธีการสำหรับช่วงความเชื่อมั่นสำหรับ lme และ lmer ใน R สำหรับผู้ที่ไม่ทราบว่า R เป็นฟังก์ชั่นสำหรับสร้างเอฟเฟกต์ผสมหรือโมเดลหลายระดับ หากฉันมีผลกระทบคงที่ในบางสิ่งบางอย่างเช่นการวัดซ้ำออกแบบช่วงเวลาความมั่นใจรอบค่าที่ทำนาย (คล้ายกับค่าเฉลี่ย) หมายถึงอะไร ฉันสามารถเข้าใจได้ว่าสำหรับเอฟเฟกต์คุณสามารถมีช่วงความเชื่อมั่นที่สมเหตุสมผล แต่สำหรับฉันแล้วช่วงความเชื่อมั่นของค่าเฉลี่ยที่คาดการณ์ไว้ในแบบนี้ดูเหมือนจะเป็นไปไม่ได้ มันอาจมีขนาดใหญ่มากที่จะยอมรับความจริงที่ว่าตัวแปรสุ่มมีส่วนทำให้เกิดความไม่แน่นอนในการประมาณค่า แต่ในกรณีนี้มันจะไม่เป็นประโยชน์เลยในแง่ที่เปรียบเทียบระหว่างค่าต่างๆ หรือ, ฉันขาดอะไรบางอย่างที่นี่หรือการวิเคราะห์สถานการณ์ของฉันถูกต้องหรือไม่ ... [และอาจเป็นเหตุผลว่าทำไมมันไม่ถูกนำไปใช้ใน lmer (แต่ง่ายที่จะได้รับใน SAS) :)]

2
สูตรสำหรับความสัมพันธ์อัตโนมัติใน R กับ Excel
ฉันพยายามหาวิธีที่ R คำนวณความสัมพันธ์ระหว่าง lag-k (เห็นได้ชัดว่าเป็นสูตรเดียวกับที่ใช้โดย Minitab และ SAS) เพื่อให้ฉันสามารถเปรียบเทียบกับการใช้ฟังก์ชัน CORREL ของ Excel ที่ใช้กับซีรี่ส์และรุ่น k-lagged R และ Excel (ใช้ CORREL) ให้ค่าความสัมพันธ์อัตโนมัติที่แตกต่างกันเล็กน้อย ฉันสนใจที่จะทราบด้วยว่าการคำนวณหนึ่งนั้นถูกต้องมากกว่าอีกไหม
13 r  sas  autocorrelation  excel 

2
เหตุใด SAS PROC GLIMMIX จึงให้ความชันแบบสุ่มที่แตกต่างกันมากกว่า glmer (lme4) สำหรับ binomial glmm
ฉันเป็นผู้ใช้ที่คุ้นเคยกับ R มากขึ้นและพยายามประเมินความลาดแบบสุ่ม (ค่าสัมประสิทธิ์การเลือก) ประมาณ 35 คนตลอด 5 ปีสำหรับตัวแปรที่อยู่อาศัยสี่ตัว ตัวแปรการตอบสนองคือที่อยู่อาศัย "ที่ใช้" (1) หรือ "พร้อมใช้งาน" (0) ที่อยู่อาศัย ("ใช้" ด้านล่าง) ฉันใช้คอมพิวเตอร์ Windows 64 บิต ในรุ่น R 3.1.0 ฉันใช้ข้อมูลและการแสดงออกด้านล่าง PS, TH, RS และ HW เป็นเอฟเฟกต์คงที่ (มาตรฐานระยะทางที่วัดได้กับประเภทที่อยู่อาศัย) lme4 V 1.1-7 str(dat) 'data.frame': 359756 obs. of 7 variables: $ use : num 1 1 1 …

3
ทดสอบสัมประสิทธิ์การถดถอยโลจิสติกโดยใช้
เรื่องย่อ:มีทฤษฎีทางสถิติใดบ้างที่สนับสนุนการใช้การแจกแจงแบบ (มีองศาอิสระตามส่วนเบี่ยงเบนส่วนที่เหลือ) สำหรับการทดสอบสัมประสิทธิ์การถดถอยโลจิสติกมากกว่าการแจกแจงแบบปกติมาตรฐานหรือไม่?ttt บางเวลาที่ผ่านมาฉันค้นพบว่าเมื่อปรับโมเดลการถดถอยโลจิสติกใน SAS PROC GLIMMIX ภายใต้การตั้งค่าเริ่มต้นสัมประสิทธิ์การถดถอยโลจิสติกจะถูกทดสอบโดยใช้การแจกแจงแบบแทนการแจกแจงแบบปกติมาตรฐาน 1นั่นคือ GLIMMIX รายงานคอลัมน์ที่มีอัตราส่วนβ 1 / √ttt11^1 (ซึ่งผมจะเรียกZในส่วนที่เหลือของคำถามนี้) แต่ยังมีรายงานว่า "องศาความเป็นอิสระ" คอลัมน์เช่นเดียวกับP-value ขึ้นอยู่กับสมมติฐานทีจัดจำหน่ายสำหรับZกับองศาอิสระ ขึ้นอยู่กับการเบี่ยงเบนที่เหลือ - นั่นคือองศาอิสระ = จำนวนการสังเกตทั้งหมดลบด้วยจำนวนพารามิเตอร์ ที่ด้านล่างของคำถามนี้ฉันให้รหัสและผลลัพธ์ใน R และ SAS สำหรับการสาธิตและการเปรียบเทียบ 2β^1/var(β^1)−−−−−−√β^1/var(β^1)\hat{\beta}_1/\sqrt{\text{var}(\hat{\beta}_1)}zzzppptttzzz22^2 สิ่งนี้ทำให้ฉันสับสนเนื่องจากฉันคิดว่าสำหรับโมเดลเชิงเส้นแบบทั่วไปเช่นการถดถอยโลจิสติกไม่มีทฤษฎีทางสถิติที่จะสนับสนุนการใช้ -distribution ในกรณีนี้ แต่ฉันคิดว่าสิ่งที่เรารู้เกี่ยวกับกรณีนี้คือttt คือ "ปกติ" กระจายโดยปกติ;zzz การประมาณนี้อาจไม่ดีสำหรับตัวอย่างขนาดเล็ก อย่างไรก็ตามมันไม่สามารถสันนิษฐานได้ว่ามีการแจกแจงแบบtเราสามารถสมมติในกรณีของการถดถอยปกติzzzttt zzzttttttttt zzzttt ttt โดยทั่วไปมีการสนับสนุนจริง ๆ สำหรับสิ่งที่ GLIMMIX กำลังทำที่นี่นอกเหนือจากสัญชาตญาณที่อาจสมเหตุสมผลโดยทั่วไปหรือไม่ รหัส R: summary(glm(y …

1
ความแตกต่างระหว่าง PROC Mixed และ lme / lmer ใน R - degree of freedom
หมายเหตุ: คำถามนี้เป็นคำถามใหม่เนื่องจากต้องลบคำถามก่อนหน้านี้ด้วยเหตุผลทางกฎหมาย ในขณะที่เปรียบเทียบ PROC MIXED จาก SAS กับฟังก์ชันlmeจากnlmeแพ็คเกจใน R ฉันพบความแตกต่างที่ค่อนข้างสับสน โดยเฉพาะอย่างยิ่งองศาอิสระในการทดสอบที่แตกต่างกันระหว่างPROC MIXEDและlmeและฉันสงสัยว่าทำไม เริ่มจากชุดข้อมูลต่อไปนี้ (รหัส R ระบุด้านล่าง): ind: ปัจจัยบ่งชี้บุคคลที่จะทำการวัด fac: อวัยวะที่ใช้ทำการวัด trt: ปัจจัยบ่งชี้การรักษา y: ตัวแปรตอบสนองต่อเนื่องบางอย่าง ความคิดคือการสร้างแบบจำลองง่ายๆดังต่อไปนี้: y ~ trt + (ind): indเป็นปัจจัยสุ่ม y ~ trt + (fac(ind)): facซ้อนกันindเป็นปัจจัยสุ่ม โปรดทราบว่ารุ่นสุดท้ายที่ควรทำให้เกิดเอกเป็นมีเพียง 1 ค่าของyสำหรับการรวมกันของทุกและindfac แบบจำลองแรก ใน SAS ฉันสร้างโมเดลต่อไปนี้: PROC MIXED data=Data; CLASS ind fac …
12 r  mixed-model  sas  degrees-of-freedom  pdf  unbiased-estimator  distance-functions  functional-data-analysis  hellinger  time-series  outliers  c++  relative-risk  absolute-risk  rare-events  regression  t-test  multiple-regression  survival  teaching  multiple-regression  regression  self-study  t-distribution  machine-learning  recommender-system  self-study  binomial  standard-deviation  data-visualization  r  predictive-models  pearson-r  spearman-rho  r  regression  modeling  r  categorical-data  data-visualization  ggplot2  many-categories  machine-learning  cross-validation  weka  microarray  variance  sampling  monte-carlo  regression  cross-validation  model-selection  feature-selection  elastic-net  distance-functions  information-theory  r  regression  mixed-model  random-effects-model  fixed-effects-model  dataset  data-mining 

1
วิธีใดดีที่สุดในการวิเคราะห์อภิมานเครือข่าย
ขณะนี้มีวิธีการต่าง ๆ ในการทำการวิเคราะห์อภิมานเครือข่ายหรือเปรียบเทียบการรักษาแบบผสม รายการที่ใช้บ่อยที่สุดและเข้าถึงได้อาจเป็นสิ่งต่อไปนี้: ในกรอบ Bayesian : วิธีการปฏิสัมพันธ์ออกแบบโดยการรักษาใน WinBUGS (เช่นJackson et al ); การสร้างแบบจำลอง Bayesian แบบแขนตามลำดับชั้นใน WinBUGS (เช่นZhao et al ); การแยกแบบลำดับขั้น (เช่นการแยกโหนด) การสร้างแบบจำลองแบบเบย์โดยใช้ WinBUGS หรือผ่านgemtcและrjagsใน R (เช่นDias et alหรือvan Valkenhoef et al ); การประมาณ Laplace ซ้อนกัน (INLA) ใน WinBUGS (เช่นSauter et al ); ในกรอบบ่อย : การวิเคราะห์ความแปรปรวนแบบแฟคทอเรียลใน SAS (เช่นPiepho ); …

3
การใช้คอมพิวเตอร์จำลองเพื่อเข้าใจแนวคิดทางสถิติในระดับบัณฑิตศึกษา
สวัสดีฉันกำลังเรียนหลักสูตรบัณฑิตศึกษาในสถิติและเราได้ครอบคลุมสถิติการทดสอบและแนวคิดอื่น ๆ อย่างไรก็ตามฉันมักจะสามารถใช้สูตรและพัฒนาสัญชาตญาณเกี่ยวกับวิธีการทำงาน แต่ฉันมักจะรู้สึกว่าถ้าฉันสำรองการศึกษาของฉันด้วยการทดลองจำลองฉันจะพัฒนาสัญชาตญาณเป็นปัญหาที่มือ . ดังนั้นฉันจึงคิดว่าจะเขียนแบบจำลองง่าย ๆ เพื่อให้เข้าใจแนวคิดบางอย่างที่เราพูดถึงในชั้นเรียนได้ดีขึ้น ตอนนี้ฉันสามารถใช้พูด Java เพื่อ: สร้างประชากรสุ่มโดยมีค่าเฉลี่ยและส่วนเบี่ยงเบนมาตรฐาน จากนั้นนำตัวอย่างเล็ก ๆ และลองพยายามคำนวณข้อผิดพลาด Type-I และ Type-II เชิงประจักษ์ ตอนนี้คำถามที่ฉันมีคือ: นี่เป็นวิธีที่ถูกต้องตามกฎหมายในการพัฒนาสัญชาตญาณหรือไม่? มีซอฟต์แวร์ให้ทำเช่นนี้SASหรือRไม่? นี่เป็นวินัยในสถิติที่เกี่ยวข้องกับการเขียนโปรแกรมเช่น: สถิติการทดลองหรือไม่, สถิติการคำนวณ? จำลอง?

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.