คำถามติดแท็ก neuraxle

20
การเข้ารหัสเลเบลในหลายคอลัมน์ใน scikit-Learn
ฉันกำลังพยายามใช้ scikit-Learn LabelEncoderเพื่อเข้ารหัส pandas DataFrameของสตริงฉลาก เนื่องจาก dataframe มีหลายคอลัมน์ (50+) ฉันต้องการหลีกเลี่ยงการสร้างLabelEncoderวัตถุสำหรับแต่ละคอลัมน์ ฉันต้องการมีLabelEncoderวัตถุขนาดใหญ่เพียงชิ้นเดียวที่ทำงานในคอลัมน์ข้อมูลทั้งหมดของฉัน การขว้างทั้งหมดDataFrameเป็นLabelEncoderข้อผิดพลาดด้านล่าง โปรดจำไว้ว่าฉันกำลังใช้ข้อมูลจำลองที่นี่ ในความเป็นจริงฉันกำลังจัดการกับข้อมูลของสตริงที่มีป้ายกำกับประมาณ 50 คอลัมน์ดังนั้นต้องการโซลูชันที่ไม่อ้างอิงคอลัมน์ใด ๆ ตามชื่อ import pandas from sklearn import preprocessing df = pandas.DataFrame({ 'pets': ['cat', 'dog', 'cat', 'monkey', 'dog', 'dog'], 'owner': ['Champ', 'Ron', 'Brick', 'Champ', 'Veronica', 'Ron'], 'location': ['San_Diego', 'New_York', 'New_York', 'San_Diego', 'San_Diego', 'New_York'] }) le …

3
Python - sklearn.pipeline.Pipeline คืออะไร?
ฉันคิดไม่ออกว่ามันsklearn.pipeline.Pipelineทำงานอย่างไร มีคำอธิบายที่ไม่กี่คนในที่มีเอกสาร ตัวอย่างเช่นพวกเขาหมายถึงอะไร: ท่อส่งของการแปลงด้วยตัวประมาณค่าสุดท้าย เพื่อให้คำถามของฉันชัดเจนขึ้นมีstepsอะไรบ้าง? พวกเขาทำงานอย่างไร? แก้ไข ขอบคุณสำหรับคำตอบที่ทำให้คำถามของฉันชัดเจนขึ้น: เมื่อฉันเรียกไปป์ไลน์และผ่านเป็นขั้นตอนหม้อแปลงสองตัวและตัวประมาณหนึ่งตัวเช่น: pipln = Pipeline([("trsfm1",transformer_1), ("trsfm2",transformer_2), ("estmtr",estimator)]) จะเกิดอะไรขึ้นเมื่อฉันเรียกสิ่งนี้ pipln.fit() OR pipln.fit_transform() ฉันคิดไม่ออกว่าตัวประมาณจะเป็นหม้อแปลงได้อย่างไรและจะติดตั้งหม้อแปลงได้อย่างไร
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.