พจนานุกรมและค่าเริ่มต้น


213

สมมติว่าconnectionDetailsเป็นพจนานุกรม Python สิ่งที่ดีที่สุดสง่างามที่สุด "ไพ ธ อน" ที่สุดของวิธีการสร้างรหัสใหม่เช่นนี้?

if "host" in connectionDetails:
    host = connectionDetails["host"]
else:
    host = someDefaultValue

คำตอบ:


311

แบบนี้:

host = connectionDetails.get('host', someDefaultValue)

40
โปรดทราบว่าอาร์กิวเมนต์ที่สองคือค่าไม่ใช่คีย์
Marcin

7
+1 สำหรับการอ่าน แต่if/elseเร็วกว่ามาก นั่นอาจจะมีหรือไม่มีบทบาทก็ได้
ทิม Pietzcker

7
@Tim คุณสามารถให้การอ้างอิงว่าทำไมif/elseเร็วขึ้น?
nishantjr

2
@Tim: ฉันสันนิษฐานว่าหนึ่งในข้อดีของการใช้ภาษาระดับสูงคือล่ามจะสามารถ 'เห็น' ในฟังก์ชั่นและเพิ่มประสิทธิภาพมัน - ที่ผู้ใช้จะไม่ต้องจัดการกับการเพิ่มประสิทธิภาพขนาดเล็กมาก . นั่นไม่ใช่สิ่งที่ต้องการรวบรวม JIT สำหรับ?
nishantjr

3
@nishantjr: Python (อย่างน้อย CPython, ตัวแปรที่พบบ่อยที่สุด) ไม่มีการรวบรวม JIT PyPy อาจแก้ปัญหานี้ได้เร็วขึ้น แต่ฉันไม่ได้ทำการติดตั้งเนื่องจาก Python มาตรฐานนั้นเร็วพอสำหรับจุดประสงค์ของฉัน โดยทั่วไปแล้วมันไม่น่าจะมีความสำคัญในชีวิตจริง - ถ้าคุณต้องการทำตัวเลขที่สำคัญยิ่งในเวลาวิกฤติ Python อาจไม่ใช่ภาษาที่เลือก ...
Tim Pietzcker

99

คุณยังสามารถใช้สิ่งที่defaultdictคล้ายกัน:

from collections import defaultdict
a = defaultdict(lambda: "default", key="some_value")
a["blabla"] => "default"
a["key"] => "some_value"

คุณสามารถผ่านฟังก์ชั่นสามัญใด ๆ แทนแลมบ์ดา:

from collections import defaultdict
def a():
  return 4

b = defaultdict(a, key="some_value")
b['absent'] => 4
b['key'] => "some_value"

7
ฉันมาที่นี่เพื่อรับปัญหาที่แตกต่างจากคำถามของ OP และวิธีแก้ปัญหาของคุณก็แก้ไขได้
0xc0de

ฉันจะ +1 แต่น่าเสียดายที่มันไม่เหมาะกับgetวิธีการที่คล้ายกัน
0xc0de

คำตอบนี้มีประโยชน์สำหรับฉันในการตรวจสอบการเพิ่มในพจนานุกรมรวมถึงปุ่มเริ่มต้น การติดตั้งใช้งานของฉันนานเกินไปที่จะอธิบายในคำตอบ StackOverflow ดังนั้นฉันจึงเขียนถึงที่นี่ persagen.com/2020/03/05/…
Victoria Stuart

24

ในขณะที่.get()เป็นสำนวนที่ดีมันช้ากว่าif/else(และช้ากว่าtry/exceptถ้าการมีอยู่ของคีย์ในพจนานุกรมสามารถคาดได้เกือบตลอดเวลา):

>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="try:\n a=d[1]\nexcept KeyError:\n a=10")
0.07691968797894333
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="try:\n a=d[2]\nexcept KeyError:\n a=10")
0.4583777282275605
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="a=d.get(1, 10)")
0.17784020746671558
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="a=d.get(2, 10)")
0.17952161730158878
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="if 1 in d:\n a=d[1]\nelse:\n a=10")
0.10071221458065338
>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}", 
... stmt="if 2 in d:\n a=d[2]\nelse:\n a=10")
0.06966537335119938

3
ฉันยังไม่เห็นสาเหตุที่ if/thenจะเร็วขึ้น ทั้งสองกรณีต้องมีการค้นหาพจนานุกรมและถ้าภาวนาของget()คือเพื่อให้ได้ช้าสิ่งที่บัญชีอื่นใดสำหรับการชะลอตัว?
Jens

1
@Jens: การเรียกใช้ฟังก์ชันมีราคาแพง
ทิม Pietzcker

1
ซึ่งไม่ควรเป็นเรื่องใหญ่ในพจนานุกรมที่มีประชากรมากใช่ไหม ความหมายของการเรียกใช้ฟังก์ชันจะไม่สำคัญหากการค้นหาจริงมีราคาแพง มันอาจเป็นเรื่องสำคัญในตัวอย่างของเล่นเท่านั้น
AturSams

2
@zehelvion: การค้นหาพจนานุกรมO(1)ไม่คำนึงถึงขนาดของพจนานุกรมดังนั้นค่าใช้จ่ายในการเรียกใช้ฟังก์ชันจึงมีความเกี่ยวข้อง
ทิม Pietzcker

35
มันเป็นเรื่องแปลกหากค่าใช้จ่ายในการโทรฟังก์ชั่นจะทำให้คุณตัดสินใจใช้ get ใช้สิ่งที่สมาชิกในทีมของคุณสามารถอ่านได้ดีที่สุด
Jochen Bedersdorfer

19

สำหรับค่าเริ่มต้นที่แตกต่างกันลองนี้:

connectionDetails = { "host": "www.example.com" }
defaults = { "host": "127.0.0.1", "port": 8080 }

completeDetails = {}
completeDetails.update(defaults)
completeDetails.update(connectionDetails)
completeDetails["host"]  # ==> "www.example.com"
completeDetails["port"]  # ==> 8080

3
นี่เป็นวิธีแก้ปัญหาที่ดี แต่มีข้อผิดพลาด ผลลัพธ์ที่ไม่คาดคิดอาจส่งผลถ้า connectionDetails มาพร้อมกับNoneหรือ emptyString เป็นหนึ่งในค่าในคู่ของคีย์ - ค่า defaultsพจนานุกรมอาจจะมีหนึ่งในค่าของคอมพ์ไม่ได้ตั้งใจออก (ดูstackoverflow.com/questions/6354436 )
dreftymac

9

มีวิธีในพจนานุกรมภาษาไพ ธ อนที่จะทำสิ่งนี้: dict.setdefault

connectionDetails.setdefault('host',someDefaultValue)
host = connectionDetails['host']

อย่างไรก็ตามวิธีนี้ตั้งค่าconnectionDetails['host']เป็นsomeDefaultValueถ้าhostไม่ได้กำหนดคีย์ไว้ซึ่งแตกต่างจากคำถามที่ถาม


1
โปรดทราบว่าsetdefault()ส่งคืนค่าดังนั้นจึงสามารถใช้งานได้เช่นกัน: host = connectionDetails.setdefault('host', someDefaultValue). เพียงแค่ระวังว่ามันจะตั้งconnectionDetails['host']เป็นค่าเริ่มต้นหากคีย์ไม่ได้มีมาก่อน
ash108

7

(นี่คือคำตอบที่ล่าช้า)

อีกทางเลือกหนึ่งคือคลาสย่อยdictคลาสและใช้__missing__()วิธีการเช่นนี้:

class ConnectionDetails(dict):
    def __missing__(self, key):
        if key == 'host':
            return "localhost"
        raise KeyError(key)

ตัวอย่าง:

>>> connection_details = ConnectionDetails(port=80)

>>> connection_details['host']
'localhost'

>>> connection_details['port']
80

>>> connection_details['password']
Traceback (most recent call last):
  File "python", line 1, in <module>
  File "python", line 6, in __missing__
KeyError: 'password'

4

การทดสอบความสงสัยของ @Tim Pietzcker เกี่ยวกับสถานการณ์ใน PyPy (5.2.0-alpha0) สำหรับ Python 3.3.5 ฉันพบว่าทั้งจริง.get()และif/ / elseทำงานคล้ายกัน ที่จริงแล้วดูเหมือนว่าในกรณี if / else จะมีการค้นหาเพียงครั้งเดียวหากเงื่อนไขและการมอบหมายเกี่ยวข้องกับคีย์เดียวกัน (เปรียบเทียบกับกรณีสุดท้ายที่มีการค้นหาสองครั้ง)

>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="try:\n a=d[1]\nexcept KeyError:\n a=10")
0.011889292989508249
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="try:\n a=d[2]\nexcept KeyError:\n a=10")
0.07310474599944428
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="a=d.get(1, 10)")
0.010391917996457778
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="a=d.get(2, 10)")
0.009348208011942916
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="if 1 in d:\n a=d[1]\nelse:\n a=10")
0.011475925013655797
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="if 2 in d:\n a=d[2]\nelse:\n a=10")
0.009605801998986863
>>>> timeit.timeit(setup="d={1:2, 3:4, 5:6, 7:8, 9:0}",
.... stmt="if 2 in d:\n a=d[2]\nelse:\n a=d[1]")
0.017342638995614834

1

คุณสามารถใช้ฟังก์ชั่น lamba สำหรับสิ่งนี้เป็นหนึ่งซับ สร้างวัตถุใหม่ connectionDetails2ที่เข้าถึงได้เหมือนฟังก์ชั่น ...

connectionDetails2 = lambda k: connectionDetails[k] if k in connectionDetails.keys() else "DEFAULT"

ตอนนี้ใช้

connectionDetails2(k)

แทน

connectionDetails[k]

ซึ่งส่งคืนค่าพจนานุกรมหากkอยู่ในคีย์มิฉะนั้นจะส่งคืน"DEFAULT"


ฉัน upvoting คุณ แต่ปัญหาในการแก้ปัญหาของคุณคือ dicts ทำงานร่วมกับ [] แต่ lambdas ทำงานร่วมกับ ()
yukashima huksay
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.