คำถามติดแท็ก pandas

2
นุ่น / Statsmodel / Scikit เรียนรู้
Pandas, Statsmodels และ Scikit เรียนรู้การใช้งานที่แตกต่างกันของการเรียนรู้ด้วยเครื่องจักร / การดำเนินการทางสถิติหรือเป็นส่วนเสริมเหล่านี้หรือไม่? ข้อใดต่อไปนี้มีฟังก์ชันการทำงานที่ครอบคลุมที่สุด สิ่งใดที่ได้รับการพัฒนาและ / หรือสนับสนุนอย่างแข็งขัน ฉันต้องใช้การถดถอยโลจิสติก ข้อเสนอแนะใดที่ฉันควรใช้กับสิ่งเหล่านี้?

1
การใช้ iloc เพื่อตั้งค่า [ปิด]
ปิด. คำถามนี้เป็นคำถามปิดหัวข้อ ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้เป็นไปตามหัวข้อสำหรับการตรวจสอบข้าม ปิดให้บริการใน2 ปีที่ผ่านมา บรรทัดนี้ส่งกลับ 4 แถวแรกใน dataframe combinedสำหรับfeature_a combined.iloc[0:4]["feature_a"] ตามที่คาดไว้บรรทัดถัดไปนี้จะส่งคืนแถวที่ 2, 4 และ 16 ใน dataframe สำหรับคอลัมน์feature_a: combined.iloc[[1,3,15]]["feature_a"] บรรทัดนี้กำหนด 4 แถวแรกใน dataframe สำหรับการfeature_a77 combined.iloc[0:4]["feature_a"] = 77 บรรทัดนี้ทำอะไรบางอย่าง การคำนวณบางอย่างเกิดขึ้นเนื่องจากใช้เวลานานขึ้นเมื่อใช้กับรายการที่ยาวขึ้น combined.iloc[[1,3,15]]["feature_a"] = 88 แถวที่ 2, 4 และ 16 ไม่ได้ถูกตั้งค่าเป็น88เมื่อตรวจสอบกับสิ่งนี้: combined.iloc[[1,3,15]]["feature_a"] ฉันจะตั้งค่ารายการแถวของคอลัมน์ในคอลัมน์ใด ๆ ให้เป็นค่าโดยไม่ต้องมีการเข้ารหัสขนาดใหญ่ได้อย่างไร สถานการณ์นี้ดูเหมือนว่าควรตรงไปตรงมาและเป็นเรื่องธรรมดา
13 python  pandas 

5
ฉันจะตีความแผนการกระจายนี้ได้อย่างไร
ฉันมีพล็อตกระจายที่มีขนาดตัวอย่างซึ่งเท่ากับจำนวนคนบนแกน x และเงินเดือนมัธยฐานบนแกน y ฉันพยายามหาว่าขนาดกลุ่มตัวอย่างมีผลต่อเงินเดือนเฉลี่ยหรือไม่ นี่คือพล็อต: ฉันจะตีความพล็อตนี้ได้อย่างไร

1
กราฟแสดงความสัมพันธ์อัตโนมัติ (หมีแพนด้า) คืออะไร
ฉันเป็นผู้เริ่มต้นและฉันพยายามที่จะเข้าใจสิ่งที่กราฟแสดงความสัมพันธ์อัตโนมัติ ฉันได้อ่านคำอธิบายต่าง ๆ จากแหล่งข้อมูลต่าง ๆ เช่นหน้านี้หรือหน้า Wikipedia ที่เกี่ยวข้องซึ่งฉันไม่ได้อ้างถึงที่นี่ ฉันมีรหัสง่ายๆนี้ที่ฉันมีวันที่ในดัชนีของฉันสำหรับปีและค่าจะเพิ่มขึ้นจาก 0 ถึง 365 สำหรับแต่ละดัชนี .. ( 1984-01-01:0, 1984-01-02:1 ... 1984-12-31:365) import numpy as np import pandas as pd from pandas.plotting import autocorrelation_plot import matplotlib.pyplot as plt dr = pd.date_range(start='1984-01-01', end='1984-12-31') df = pd.DataFrame(np.arange(len(dr)), index=dr, columns=["Values"]) autocorrelation_plot(df) plt.show() กราฟที่พิมพ์จะอยู่ที่ใด ฉันสามารถเข้าใจและดูว่าทำไมกราฟเริ่มต้น1.00ตั้งแต่: Autocorrelation ที่มี …

1
วิธีการคำนวณข้อมูลร่วมกัน?
ฉันสับสนเล็กน้อย บางคนสามารถอธิบายให้ฉันทราบถึงวิธีการคำนวณข้อมูลร่วมกันระหว่างคำสองคำที่ยึดตามเมทริกซ์เอกสารระยะที่เกิดขึ้นกับคำศัพท์ไบนารีเป็นน้ำหนักได้หรือไม่ Document1Document2Document3′Why′111′How′101′When′111′Where′100′Why′′How′′When′′Where′Document11111Document21010Document31110 \begin{matrix} & 'Why' & 'How' & 'When' & 'Where' \\ Document1 & 1 & 1 & 1 & 1 \\ Document2 & 1 & 0 & 1 & 0 \\ Document3 & 1 & 1 & 1 & 0 \end{matrix} I(X;Y)=∑y∈Y∑x∈Xp(x,y)log(p(x,y)p(x)p(y))I(X;Y)=∑y∈Y∑x∈Xp(x,y)log⁡(p(x,y)p(x)p(y))I(X;Y)= \sum_{y \in Y} \sum_{x \in X} …
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.