คุณสร้าง dict ที่ซ้อนกันใน Python ได้อย่างไร


149

ฉันมีไฟล์ CSV 2 ไฟล์: 'ข้อมูล' และ 'การทำแผนที่':

  • ไฟล์ 'แมป' มี 4 คอลัมน์: Device_Name, GDN, และDevice_Type Device_OSคอลัมน์ทั้งสี่นั้นบรรจุอยู่
  • ไฟล์ 'ข้อมูล' มีคอลัมน์เดียวกันนี้โดยที่มีDevice_Nameคอลัมน์อยู่และอีกสามคอลัมน์ว่างเปล่า
  • ฉันต้องการรหัสหลามของฉันที่จะเปิดไฟล์ทั้งสองและสำหรับแต่ละDevice_Nameในแฟ้มข้อมูลแผนที่ของมันGDN, Device_TypeและDevice_OSคุ้มค่าจากไฟล์แมป

ฉันรู้วิธีใช้ dict เมื่อมีเพียง 2 คอลัมน์เท่านั้น (จำเป็นต้องมีการแมป 1) แต่ฉันไม่ทราบวิธีการทำสิ่งนี้ให้สำเร็จเมื่อ 3 คอลัมน์จำเป็นต้องแมป

ต่อไปนี้เป็นรหัสที่ใช้ซึ่งฉันพยายามทำแผนที่ให้สำเร็จDevice_Type:

x = dict([])
with open("Pricing Mapping_2013-04-22.csv", "rb") as in_file1:
    file_map = csv.reader(in_file1, delimiter=',')
    for row in file_map:
       typemap = [row[0],row[2]]
       x.append(typemap)

with open("Pricing_Updated_Cleaned.csv", "rb") as in_file2, open("Data Scraper_GDN.csv", "wb") as out_file:
    writer = csv.writer(out_file, delimiter=',')
    for row in csv.reader(in_file2, delimiter=','):
         try:
              row[27] = x[row[11]]
         except KeyError:
              row[27] = ""
         writer.writerow(row)

มันกลับAttribute Errorมา

หลังจากการค้นคว้าบางอย่างฉันคิดว่าฉันต้องสร้าง dict ที่ซ้อนกัน แต่ฉันไม่รู้ว่าจะทำอย่างไร


Device_Nameคอลัมน์เป็นกุญแจสำคัญในทั้งสองไฟล์ในคีย์นี้ฉันต้องการแมป Device_OS, GDN & Device_Type ค่าจากไฟล์การแมปไปยังไฟล์ข้อมูล
atams

คุณต้องการที่จะทำอะไรบางอย่างเช่นrow[27] = x[row[11]]["Device_OS"]?
Janne Karila


สิ่งนี้ไม่จำเป็นต้องมีคำสั่งซ้อนกันอยู่เสมอ คุณสามารถใช้หมีแพนด้า read_csv ให้Device_Nameดัชนีแล้วคุณสามารถโดยตรงjoinทั้งสอง dataframes Device_Nameในดัชนีของพวกเขา
smci

คำตอบ:


307

Dict ที่ซ้อนกันเป็นพจนานุกรมภายในพจนานุกรม สิ่งที่ง่ายมาก

>>> d = {}
>>> d['dict1'] = {}
>>> d['dict1']['innerkey'] = 'value'
>>> d
{'dict1': {'innerkey': 'value'}}

คุณยังสามารถใช้defaultdictจากcollectionsแพ็คเกจเพื่ออำนวยความสะดวกในการสร้างพจนานุกรมที่ซ้อนกัน

>>> import collections
>>> d = collections.defaultdict(dict)
>>> d['dict1']['innerkey'] = 'value'
>>> d  # currently a defaultdict type
defaultdict(<type 'dict'>, {'dict1': {'innerkey': 'value'}})
>>> dict(d)  # but is exactly like a normal dictionary.
{'dict1': {'innerkey': 'value'}}

คุณสามารถเติมสิ่งที่ต้องการได้

ฉันจะแนะนำในสิ่งที่รหัสของคุณเช่นต่อไปนี้:

d = {}  # can use defaultdict(dict) instead

for row in file_map:
    # derive row key from something 
    # when using defaultdict, we can skip the next step creating a dictionary on row_key
    d[row_key] = {} 
    for idx, col in enumerate(row):
        d[row_key][idx] = col

ตามความคิดเห็นของคุณ:

อาจจะเป็นรหัสข้างต้นทำให้เกิดคำถามสับสน ปัญหาของฉันสั้น: ฉันมี 2 ไฟล์ a.csv b.csv, a.csv มี 4 คอลัมน์ ijkl, b.csv ยังมีคอลัมน์เหล่านี้ ฉันเป็นคอลัมน์สำคัญสำหรับ csvs เหล่านี้ ' คอลัมน์ jkl ว่างใน a.csv แต่มีประชากรอยู่ใน b.csv ฉันต้องการแมปค่าของคอลัมน์ jk l โดยใช้ 'i` เป็นคอลัมน์สำคัญจาก b.csv ไปยังไฟล์ a.csv

คำแนะนำของฉันจะเป็นแบบนี้ (โดยไม่ใช้ defaultdict):

a_file = "path/to/a.csv"
b_file = "path/to/b.csv"

# read from file a.csv
with open(a_file) as f:
    # skip headers
    f.next()
    # get first colum as keys
    keys = (line.split(',')[0] for line in f) 

# create empty dictionary:
d = {}

# read from file b.csv
with open(b_file) as f:
    # gather headers except first key header
    headers = f.next().split(',')[1:]
    # iterate lines
    for line in f:
        # gather the colums
        cols = line.strip().split(',')
        # check to make sure this key should be mapped.
        if cols[0] not in keys:
            continue
        # add key to dict
        d[cols[0]] = dict(
            # inner keys are the header names, values are columns
            (headers[idx], v) for idx, v in enumerate(cols[1:]))

โปรดทราบว่าที่สำหรับการแยกไฟล์ CSV ที่มีโมดูล CSV


อาจจะเป็นรหัสข้างต้นทำให้เกิดคำถามสับสน ปัญหาของฉันสั้น: ฉันมี 2 ไฟล์a.csv b.csv, a.csvมี 4 คอลัมน์i j k l, b.csvนอกจากนี้ยังมีคอลัมน์เหล่านี้ iเป็นคอลัมน์สำคัญสำหรับ csvs เหล่านี้j k lคอลัมน์ว่างเปล่าในแต่ประชากรในa.csv b.csvฉันต้องการแมปค่าของj k lคอลัมน์โดยใช้ 'i` เป็นคอลัมน์สำคัญจาก b.csv ไปยังไฟล์ a.csv
atams

64

อัปเดต : สำหรับความยาวตามอำเภอใจของพจนานุกรมที่ซ้อนกันให้ไปที่คำตอบนี้

ใช้ฟังก์ชัน defaultdict จากคอลเลกชัน

ประสิทธิภาพสูง: "ถ้าคีย์ไม่ได้อยู่ใน dict" มีราคาแพงมากเมื่อชุดข้อมูลมีขนาดใหญ่

การบำรุงรักษาต่ำ: ทำให้โค้ดอ่านง่ายขึ้นและสามารถขยายได้ง่าย

from collections import defaultdict

target_dict = defaultdict(dict)
target_dict[key1][key2] = val

3
from collections import defaultdict target_dict = defaultdict(dict) target_dict['1']['2']ให้ฉันtarget_dict['1']['2'] KeyError: '2'
haccks

1
คุณต้องกำหนดค่าก่อนรับ
Junchen

24

สำหรับระดับความซ้อนกันโดยพลการ:

In [2]: def nested_dict():
   ...:     return collections.defaultdict(nested_dict)
   ...:

In [3]: a = nested_dict()

In [4]: a
Out[4]: defaultdict(<function __main__.nested_dict>, {})

In [5]: a['a']['b']['c'] = 1

In [6]: a
Out[6]:
defaultdict(<function __main__.nested_dict>,
            {'a': defaultdict(<function __main__.nested_dict>,
                         {'b': defaultdict(<function __main__.nested_dict>,
                                      {'c': 1})})})

2
สิ่งที่คำตอบข้างต้นทำกับฟังก์ชั่นสองบรรทัดคุณสามารถทำได้ด้วยแลมบ์ดาแบบบรรทัดเดียวเช่นเดียวกับในคำตอบนี้
คิวเมนตัส

3

เป็นสิ่งสำคัญที่ต้องจำไว้เมื่อใช้ defaultdict และโมดูล dict ที่ซ้อนกันที่คล้ายกันเช่นการnested_dictค้นหาคีย์ที่ไม่มีอยู่อาจสร้างรายการคีย์ใหม่โดยไม่ได้ตั้งใจและทำให้เกิดความเสียหายได้มาก

นี่คือตัวอย่าง Python3 พร้อมnested_dictโมดูล:

import nested_dict as nd
nest = nd.nested_dict()
nest['outer1']['inner1'] = 'v11'
nest['outer1']['inner2'] = 'v12'
print('original nested dict: \n', nest)
try:
    nest['outer1']['wrong_key1']
except KeyError as e:
    print('exception missing key', e)
print('nested dict after lookup with missing key.  no exception raised:\n', nest)

# Instead, convert back to normal dict...
nest_d = nest.to_dict(nest)
try:
    print('converted to normal dict. Trying to lookup Wrong_key2')
    nest_d['outer1']['wrong_key2']
except KeyError as e:
    print('exception missing key', e)
else:
    print(' no exception raised:\n')

# ...or use dict.keys to check if key in nested dict
print('checking with dict.keys')
print(list(nest['outer1'].keys()))
if 'wrong_key3' in list(nest.keys()):

    print('found wrong_key3')
else:
    print(' did not find wrong_key3')

ผลลัพธ์คือ:

original nested dict:   {"outer1": {"inner2": "v12", "inner1": "v11"}}

nested dict after lookup with missing key.  no exception raised:  
{"outer1": {"wrong_key1": {}, "inner2": "v12", "inner1": "v11"}} 

converted to normal dict. 
Trying to lookup Wrong_key2 

exception missing key 'wrong_key2' 

checking with dict.keys 

['wrong_key1', 'inner2', 'inner1']  
did not find wrong_key3
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.