คำถามติดแท็ก statsmodels

2
นุ่น / Statsmodel / Scikit เรียนรู้
Pandas, Statsmodels และ Scikit เรียนรู้การใช้งานที่แตกต่างกันของการเรียนรู้ด้วยเครื่องจักร / การดำเนินการทางสถิติหรือเป็นส่วนเสริมเหล่านี้หรือไม่? ข้อใดต่อไปนี้มีฟังก์ชันการทำงานที่ครอบคลุมที่สุด สิ่งใดที่ได้รับการพัฒนาและ / หรือสนับสนุนอย่างแข็งขัน ฉันต้องใช้การถดถอยโลจิสติก ข้อเสนอแนะใดที่ฉันควรใช้กับสิ่งเหล่านี้?

2
การถดถอยโลจิสติก: Scikit Learn vs Statsmodels
ฉันพยายามที่จะเข้าใจว่าทำไมผลลัพธ์จากการถดถอยโลจิสติกส์ของห้องสมุดทั้งสองนี้จึงให้ผลลัพธ์ที่แตกต่างกัน ฉันใช้ชุดข้อมูลจาก UCLA Idre กวดวิชาทำนายadmitบนพื้นฐานgre, และgpa ถูกใช้เป็นตัวแปรเด็ดขาดดังนั้นจึงถูกแปลงเป็นตัวแปรดัมมีการดร็อป คอลัมน์ดักจะถูกเพิ่มด้วยrankrankrank_1 df = pd.read_csv("https://stats.idre.ucla.edu/stat/data/binary.csv") y, X = dmatrices('admit ~ gre + gpa + C(rank)', df, return_type = 'dataframe') X.head() > Intercept C(rank)[T.2] C(rank)[T.3] C(rank)[T.4] gre gpa 0 1 0 1 0 380 3.61 1 1 0 1 0 660 3.67 2 1 0 …

3
วิเคราะห์แปลง ACF และ PACF
ฉันต้องการดูว่าฉันอยู่ในเส้นทางที่ถูกต้องในการวิเคราะห์แปลง ACF และ PACF ของฉันหรือไม่: พื้นหลัง: (Reff: Philip Hans Franses, 1998) ในฐานะที่เป็นทั้ง ACF และ PACF แสดงค่าที่สำคัญฉันคิดว่ารูปแบบ ARMA จะตอบสนองความต้องการของฉัน ACF สามารถใช้ในการประเมิน MA-part, เช่น q-value, PACF สามารถใช้ในการประมาณ AR-part, เช่น p-value ในการประเมินรูปแบบการสั่งซื้อฉันดูที่ a.) ว่าค่า ACF นั้นออกมาตายเพียงพอหรือไม่ b.) ไม่ว่า ACF จะส่งสัญญาณการทำงานเกินกำหนดและ c.) หรือไม่ว่า ACF และ PACF แสดงยอดที่สำคัญและตีความได้อย่างง่ายดาย ACF และ PACF อาจแนะนำไม่เพียงรุ่นเดียว แต่หลายรุ่นที่ฉันต้องเลือกหลังจากพิจารณาเครื่องมือวินิจฉัยอื่น ๆ โดยที่ในใจฉันจะไปข้างหน้าและบอกว่าแบบจำลองที่ชัดเจนที่สุดน่าจะเป็น …

3
ความแตกต่างระหว่าง statsmodel OLS และ scikit การถดถอยเชิงเส้น
ฉันมีคำถามเกี่ยวกับวิธีการที่แตกต่างกันสองวิธีจากห้องสมุดที่แตกต่างกันซึ่งดูเหมือนจะทำงานเดียวกัน ฉันกำลังพยายามสร้างแบบจำลองการถดถอยเชิงเส้น นี่คือรหัสที่ฉันใช้ห้องสมุด statsmodel กับ OLS: X_train, X_test, y_train, y_test = cross_validation.train_test_split(x, y, test_size=0.3, random_state=1) x_train = sm.add_constant(X_train) model = sm.OLS(y_train, x_train) results = model.fit() print "GFT + Wiki / GT R-squared", results.rsquared เอกสารนี้พิมพ์GFT + Wiki / GT R-squared 0.981434611923 และอันที่สองคือ scikit Learn library วิธีการโมเดลเชิงเส้น: model = LinearRegression() model.fit(X_train, y_train) …

1
การถดถอยโลจิสติกอันดับใน Python
ฉันต้องการเรียกใช้การถดถอยแบบลอจิสติกอันดับใน Python สำหรับตัวแปรตอบกลับที่มีสามระดับและมีปัจจัยที่อธิบายน้อย statsmodelsแพคเกจสนับสนุน logit ไบนารีและ logit พหุนาม (MNLogit) รุ่น แต่ไม่ได้รับคำสั่ง logit เนื่องจากคณิตศาสตร์พื้นฐานไม่แตกต่างกันฉันจึงสงสัยว่ามันสามารถนำไปใช้งานได้อย่างง่ายดายโดยใช้สิ่งเหล่านี้หรือไม่ (อีกทางหนึ่งคือแพ็คเกจ Python อื่น ๆ ที่ใช้งานได้)

1
เหตุใดการพยากรณ์โมเดล ARMA จึงดำเนินการโดยตัวกรองคาลมาน
อะไรคือข้อดีของการแสดงแบบจำลอง ARMA เป็นแบบจำลองพื้นที่รัฐและการพยากรณ์โดยใช้ตัวกรองคาลมาน วิธีการนี้เป็นตัวอย่างที่ใช้ในการใช้งาน SARIMAX ของ python-statsmodels: https://github.com/statsmodels/statsmodels/tree/master/statsmodels/tsa/statespace
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.