เรียกใช้การถดถอย OLS ด้วย Pandas Data Frame
ฉันมีpandasกรอบข้อมูลและต้องการทำนายค่าของคอลัมน์ A จากค่าในคอลัมน์ B และ C นี่คือตัวอย่างของเล่น: import pandas as pd df = pd.DataFrame({"A": [10,20,30,40,50], "B": [20, 30, 10, 40, 50], "C": [32, 234, 23, 23, 42523]}) ตามหลักการแล้วฉันจะมีบางอย่างที่คล้ายกันols(A ~ B + C, data = df)แต่เมื่อฉันดูตัวอย่างจากไลบรารีอัลกอริทึมscikit-learnดูเหมือนว่าจะฟีดข้อมูลไปยังโมเดลด้วยรายการแถวแทนที่จะเป็นคอลัมน์ สิ่งนี้ทำให้ฉันต้องฟอร์แมตข้อมูลใหม่เป็นรายการภายในลิสต์ซึ่งดูเหมือนจะเอาชนะจุดประสงค์ของการใช้แพนด้าตั้งแต่แรก วิธีใดที่เป็นวิธี pythonic ที่สุดในการเรียกใช้การถดถอย OLS (หรืออัลกอริธึมการเรียนรู้ของเครื่องโดยทั่วไป) กับข้อมูลในกรอบข้อมูลแพนด้า