ฉันจะนับค่าที่ไม่ซ้ำกันภายในรายการได้อย่างไร


127

ดังนั้นฉันจึงพยายามสร้างโปรแกรมนี้ที่จะขอให้ผู้ใช้ป้อนข้อมูลและเก็บค่าในอาร์เรย์ / รายการ
จากนั้นเมื่อป้อนบรรทัดว่างระบบจะแจ้งให้ผู้ใช้ทราบว่าค่าเหล่านั้นไม่ซ้ำกันกี่ค่า
ฉันกำลังสร้างสิ่งนี้ด้วยเหตุผลในชีวิตจริงไม่ใช่เป็นปัญหา

enter: happy
enter: rofl
enter: happy
enter: mpg8
enter: Cpp
enter: Cpp
enter:
There are 4 unique words!

รหัสของฉันมีดังนี้:

# ask for input
ipta = raw_input("Word: ")

# create list 
uniquewords = [] 
counter = 0
uniquewords.append(ipta)

a = 0   # loop thingy
# while loop to ask for input and append in list
while ipta: 
  ipta = raw_input("Word: ")
  new_words.append(input1)
  counter = counter + 1

for p in uniquewords:

.. และนั่นคือทั้งหมดที่ฉันได้รับจนถึงตอนนี้
ฉันไม่แน่ใจว่าจะนับจำนวนคำที่ไม่ซ้ำกันในรายการได้อย่างไร?
หากมีใครสามารถโพสต์วิธีแก้ปัญหาเพื่อให้ฉันได้เรียนรู้จากมันหรืออย่างน้อยก็แสดงให้ฉันเห็นว่ามันจะดีแค่ไหนขอบคุณ!


4
คุณช่วยแก้ไขการเยื้องในตัวอย่างโค้ดของคุณได้ไหมมันสำคัญใน Python!
codebox

1
คุณได้ลบรหัสของคุณแทนที่จะแก้ไขเพื่อให้อ่านได้! การมีรหัสจะช่วยได้มาก ...
hcarver

1
@codebox ขอโทษจะทำตอนนี้
Joel Aqu

คำตอบ:


246

นอกจากนี้ใช้collection.Counterเพื่อ refactor รหัสของคุณ:

from collections import Counter

words = ['a', 'b', 'c', 'a']

Counter(words).keys() # equals to list(set(words))
Counter(words).values() # counts the elements' frequency

เอาท์พุท:

['a', 'c', 'b']
[2, 1, 1]

47
ไม่ใช่คำตอบสำหรับคำถามของ Joel แต่เป็นสิ่งที่ฉันกำลังมองหาขอบคุณ!
Huw Walters

สมบูรณ์ และตาวัว ขอบคุณ @Vidul
Parag Tyagi

Counter(words).values()เป็นสิ่งที่ดี เราถือว่าการนับอยู่ในลำดับของการปรากฏตัวครั้งแรกของรายการคำ? ฉันหมายความว่าฉันสมมติว่าการนับจะทำให้เรานับ a แล้ว b ตามด้วย c แล้วก็ d ...
Monica Heddneck

3
สังเกตว่าคุณต้องการแสดงสิ่งนี้เป็นคำสั่งอย่างที่count_dict = {'a': 2, 'b': 1, 'c': 1}คุณทำได้หรือไม่count_dict = dict(Counter(words).items())
ปีเตอร์

220

คุณสามารถใช้ชุดเพื่อลบรายการที่ซ้ำกันจากนั้นใช้ฟังก์ชันlenเพื่อนับองค์ประกอบในชุด:

len(set(new_words))


16

ใช้ชุด :

words = ['a', 'b', 'c', 'a']
unique_words = set(words)             # == set(['a', 'b', 'c'])
unique_word_count = len(unique_words) # == 3

ด้วยสิ่งนี้วิธีแก้ปัญหาของคุณอาจทำได้ง่ายเพียง:

words = []
ipta = raw_input("Word: ")

while ipta:
  words.append(ipta)
  ipta = raw_input("Word: ")

unique_word_count = len(set(words))

print "There are %d unique words!" % unique_word_count

6
aa="XXYYYSBAA"
bb=dict(zip(list(aa),[list(aa).count(i) for i in list(aa)]))
print(bb)
# output:
# {'X': 2, 'Y': 3, 'S': 1, 'B': 1, 'A': 2}

1
โปรดอธิบายว่าสิ่งนี้แตกต่างจากคำตอบอื่น ๆ อย่างไร
Akaisteph7

4

สำหรับ ndarray มีวิธีการ numpy ที่เรียกว่าunique :

np.unique(array_name)

ตัวอย่าง:

>>> np.unique([1, 1, 2, 2, 3, 3])
array([1, 2, 3])
>>> a = np.array([[1, 1], [2, 3]])
>>> np.unique(a)
array([1, 2, 3])

สำหรับซีรี่ส์มีการเรียกใช้ฟังก์ชันvalue_counts () :

Series_name.value_counts()


1

แม้ว่าชุดจะเป็นวิธีที่ง่ายที่สุด แต่คุณยังสามารถใช้คำสั่งและใช้some_dict.has(key)เพื่อเติมข้อมูลในพจนานุกรมด้วยคีย์และค่าที่ไม่ซ้ำกันเท่านั้น

สมมติว่าคุณได้words[]ป้อนข้อมูลจากผู้ใช้แล้วให้สร้างคำสั่งจับคู่คำที่ไม่ซ้ำกันในรายการกับตัวเลข:

word_map = {}
i = 1
for j in range(len(words)):
    if not word_map.has_key(words[j]):
        word_map[words[j]] = i
        i += 1                                                             
num_unique_words = len(new_map) # or num_unique_words = i, however you prefer

1

วิธีอื่นโดยใช้หมีแพนด้า

import pandas as pd

LIST = ["a","a","c","a","a","v","d"]
counts,values = pd.Series(LIST).value_counts().values, pd.Series(LIST).value_counts().index
df_results = pd.DataFrame(list(zip(values,counts)),columns=["value","count"])

จากนั้นคุณสามารถส่งออกผลลัพธ์ในรูปแบบใดก็ได้ที่คุณต้องการ


1

เกี่ยวกับ:

import pandas as pd
#List with all words
words=[]

#Code for adding words
words.append('test')


#When Input equals blank:
pd.Series(words).nunique()

ส่งคืนจำนวนค่าที่ไม่ซ้ำกันในรายการ


ยินดีต้อนรับสู่ StackOverflow! ดูเหมือนว่าโซลูชันนี้จะใช้pandasกรอบ จะเป็นการดีกว่าที่จะพูดถึงคำตอบนี้เนื่องจากอาจไม่ชัดเจนสำหรับผู้ใช้รายอื่น
Sergey Shubin

0

สิ่งต่อไปนี้ควรใช้งานได้ ฟังก์ชันแลมบ์ดาจะกรองคำที่ซ้ำกัน

inputs=[]
input = raw_input("Word: ").strip()
while input:
    inputs.append(input)
    input = raw_input("Word: ").strip()
uniques=reduce(lambda x,y: ((y in x) and x) or x+[y], inputs, [])
print 'There are', len(uniques), 'unique words'

0

ฉันจะใช้ชุดตัวเอง แต่นี่เป็นอีกวิธีหนึ่ง:

uniquewords = []
while True:
    ipta = raw_input("Word: ")
    if ipta == "":
        break
    if not ipta in uniquewords:
        uniquewords.append(ipta)
print "There are", len(uniquewords), "unique words!"

0
ipta = raw_input("Word: ") ## asks for input
words = [] ## creates list

while ipta: ## while loop to ask for input and append in list
  words.append(ipta)
  ipta = raw_input("Word: ")
  words.append(ipta)
#Create a set, sets do not have repeats
unique_words = set(words)

print "There are " +  str(len(unique_words)) + " unique words!"
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.