การคำนวณค่าเฉลี่ยเลขคณิต (หนึ่งประเภทเฉลี่ย) ใน Python

267

มีวิธีการในตัวหรือไลบรารีมาตรฐานใน Python เพื่อคำนวณค่าเฉลี่ยเลขคณิต (ค่าเฉลี่ยหนึ่งประเภท) ของรายการตัวเลขหรือไม่?

ค่าเฉลี่ยไม่ชัดเจน - โหมดและค่ามัธยฐานเป็นค่าเฉลี่ยที่ใช้กันทั่วไป

— jtlz2

โหมดและค่ามัธยฐานเป็นมาตรการอื่น ๆ ของแนวโน้มกลาง พวกเขาไม่ใช่ค่าเฉลี่ย โหมดนี้เป็นค่าทั่วไปที่สุดที่เห็นในชุดข้อมูลและไม่จำเป็นต้องซ้ำกัน ค่ามัธยฐานคือค่าที่แสดงถึงศูนย์กลางของจุดข้อมูล ดังที่คำถามบ่งบอกว่ามีค่าเฉลี่ยอยู่สองสามประเภท แต่ทั้งหมดนั้นแตกต่างจากการคำนวณค่ามัธยฐานและโหมด purplemath.com/modules/meanmode.htm

— Jarom

@Jarom ลิงก์นั้นไม่เห็นด้วยกับคุณ: 'ค่าเฉลี่ยค่ามัธยฐานและโหมดเป็น "ค่าเฉลี่ย" สามชนิด

— Marcelo Cantos

284

ฉันไม่รู้อะไรเลยในห้องสมุดมาตรฐาน อย่างไรก็ตามคุณสามารถใช้สิ่งต่อไปนี้:

def mean(numbers):
    return float(sum(numbers)) / max(len(numbers), 1)

>>> mean([1,2,3,4])
2.5
>>> mean([])
0.0

ใน numpy numpy.mean()มี

— NPE
แหล่งที่มา

20

สิ่งที่เหมือนกันคือจะต้องพิจารณาว่าค่าเฉลี่ยของการ[]มีที่ซึ่งสามารถทำได้โดย0 float(sum(l))/max(len(l),1)

— yo '12

8

PEP 8 กล่าวว่าเป็นชื่อตัวแปรที่ไม่ดีเพราะมันดูมากเช่นl 1นอกจากนี้ผมจะใช้มากกว่าif l if len(l) > 0ดูที่นี่

— zondo

1

ทำไมเจ้าจึงเรียกว่าmax?

— 1 -_-

3

ดูคำถามข้างต้น: เพื่อหลีกเลี่ยงการหารด้วยศูนย์ (สำหรับ [])

— Simon Fakir

5

รายการที่ว่างเปล่าไม่มีค่าเฉลี่ย โปรดอย่าทำเป็นว่าพวกเขาทำ

— Marcelo Cantos

193

NumPy มีค่าnumpy.meanซึ่งเป็นค่าเฉลี่ยเลขคณิต การใช้งานง่ายเหมือนนี้:

>>> import numpy
>>> a = [1, 2, 4]
>>> numpy.mean(a)
2.3333333333333335

— เบนท์
แหล่งที่มา

6

numpy เป็นฝันร้ายที่จะติดตั้งใน virtualenv คุณควรพิจารณาว่าจะไม่ใช้ lib นี้จริงๆ

— vcarel

46

@vcarel: "numpy เป็นฝันร้ายที่จะติดตั้งใน virtualenv" ฉันไม่แน่ใจว่าทำไมคุณพูดอย่างนี้ มันเคยเป็นอย่างนั้น แต่สำหรับปีที่แล้วหรือมากกว่านั้นมันง่ายมาก

6

ฉันต้องสองความคิดเห็นนี้ ปัจจุบันฉันใช้ numpy ใน virtualenv ใน OSX และไม่มีปัญหาแน่นอน (กำลังใช้ CPython 3.5)

— Juan Carlos Coto

4

ด้วยระบบการรวมอย่างต่อเนื่องเช่น Travis CI การติดตั้ง numpy ใช้เวลาเพิ่มหลายนาที หากการสร้างที่รวดเร็วและเบามีค่าสำหรับคุณและคุณต้องการเพียงค่าเฉลี่ยเท่านั้นให้พิจารณา

— Akseli Palén

2

@ AkseliPalén สภาพแวดล้อมเสมือนบนเทรวิส CI สามารถใช้ numpy ที่ติดตั้งผ่าน apt-get ใช้แพคเกจเว็บไซต์ระบบ สิ่งนี้อาจเร็วพอที่จะใช้แม้ว่าจะต้องการเพียงค่าเฉลี่ยเท่านั้น

— Bengt

184

การใช้statistics.mean:

import statistics
print(statistics.mean([1,2,4])) # 2.3333333333333335

มีให้ตั้งแต่ Python 3.4 สำหรับ 3.1-3.3 ผู้ใช้รุ่นเก่าของโมดูลที่มีอยู่ใน PyPI statsภายใต้ชื่อ การเปลี่ยนแปลงเพียงเพื่อstatisticsstats

— kirbyfan64sos
แหล่งที่มา

2

โปรดทราบว่าสิ่งนี้ช้ามากเมื่อเปรียบเทียบกับโซลูชันอื่น เปรียบเทียบtimeit("numpy.mean(vec)), timeit("sum(vec)/len(vec)")และtimeit("statistics.mean(vec)")- หลังเป็นช้ากว่าคนอื่นโดยปัจจัยใหญ่ (> 100 ในบางกรณีในเครื่องคอมพิวเตอร์ของฉัน) ปรากฏขึ้นนี้น่าจะเกิดจากการดำเนินงานได้อย่างแม่นยำโดยเฉพาะอย่างยิ่งของsumผู้ประกอบการในการstatisticsดูPEPและรหัส ไม่แน่ใจว่าเกี่ยวกับเหตุผลสำหรับความแตกต่างของผลการดำเนินงานที่มีขนาดใหญ่ระหว่างstatistics._sumและnumpy.sumแม้ว่า

— jhin

10

@jhin นี้เป็นเพราะstatistics.meanพยายามที่จะเป็นที่ถูกต้อง [1e50, 1, -1e50] * 1000มันจะคำนวณได้อย่างถูกต้องเฉลี่ยของ

— Antti Haapala

1

statistics.meanจะยอมรับการแสดงออกของค่ากำเนิดซึ่งโซลูชั่นทั้งหมดที่ใช้len()สำหรับตัวหารจะสำลัก

— PaulMcG

54

คุณไม่จำเป็นต้องมีแม้แต่ numpy หรือ scipy ...

>>> a = [1, 2, 3, 4, 5, 6]
>>> print(sum(a) / len(a))
3

— Mumon
แหล่งที่มา

24

จากนั้นค่าเฉลี่ย ([2,3]) จะให้ 2. ระวังด้วยการลอย ควรใช้ float (sum (l)) / len (l) ยังดีกว่าโปรดใช้ความระมัดระวังในการตรวจสอบว่ารายการว่างเปล่าหรือไม่

— jesusiniesta

14

@jesusiniesta ยกเว้นใน python3 โดยที่การหารทำในสิ่งที่ตั้งใจทำ: หาร

— yota

11

และใน Python 2.2+ ถ้าคุณfrom __future__ import divisionอยู่ด้านบนสุดของโปรแกรม

— spiffytech

แล้วเรื่องจำนวนมากและมากเกินล่ะ?

— obayhan

เกี่ยวกับa = list()อะไร โค้ดที่เสนอให้ผลลัพธ์ZeroDivisionErrorเป็น

— Ioannis Filippidis

8

ใช้ scipy:

import scipy;
a=[1,2,4];
print(scipy.mean(a));

— Elendurwen
แหล่งที่มา

37

scipy.stats.mean เลิกใช้แล้ว โปรดอัปเดตรหัสของคุณเพื่อใช้ numpy.mean

— Bengt

7

แทนที่จะหล่อลอยคุณสามารถทำตาม

def mean(nums):
    return sum(nums, 0.0) / len(nums)

หรือใช้แลมบ์ดา

mean = lambda nums: sum(nums, 0.0) / len(nums)

อัพเดต: 2019-12-15

Python 3.8 เพิ่มฟังก์ชันfmeanไปยังโมดูลสถิติ ซึ่งเร็วกว่าและให้ผลตอบแทนลอยเสมอ

แปลงข้อมูลเป็นแบบลอยตัวและคำนวณค่าเฉลี่ยเลขคณิต

สิ่งนี้จะทำงานได้เร็วกว่าฟังก์ชั่น mean () และมันจะคืนค่าทศนิยม ข้อมูลอาจเป็นลำดับหรือทำซ้ำได้ หากชุดข้อมูลอินพุตว่างให้เพิ่ม StatisticsError

fmean ([3.5, 4.0, 5.25])

4.25

ใหม่ในเวอร์ชัน 3.8

— วลาดเบซเดน
แหล่งที่มา

2

from statistics import mean
avarage=mean(your_list)

ตัวอย่างเช่น

from statistics import mean

my_list=[5,2,3,2]
avarage=mean(my_list)
print(avarage)

และผลลัพธ์คือ

3.0

— ฟาริบอร์นาจาฟี
แหล่งที่มา

1

def avg(l):
    """uses floating-point division."""
    return sum(l) / float(len(l))

ตัวอย่าง:

l1 = [3,5,14,2,5,36,4,3]
l2 = [0,0,0]

print(avg(l1)) # 9.0
print(avg(l2)) # 0.0

— jasonleonhard
แหล่งที่มา

1

def list_mean(nums):
    sumof = 0
    num_of = len(nums)
    mean = 0
    for i in nums:
        sumof += i
    mean = sumof / num_of
    return float(mean)

— Muhoza อีฟว์
แหล่งที่มา

0

ฉันควรavgจะละเว้นจาก builtins / stdlib เสมอเพราะมันง่ายเหมือน

sum(L)/len(L) # L is some list

และคำเตือนใด ๆ ที่จะได้รับการแก้ไขในรหัสโทรสำหรับการใช้งานในท้องถิ่นอยู่แล้ว

คำเตือนที่น่าสังเกต:

non-float result: ใน python2, 9/4 คือ 2. เพื่อแก้ไข, ใช้float(sum(L))/len(L)หรือfrom __future__ import division
หารด้วยศูนย์: รายการอาจว่างเปล่า เพื่อแก้ไข:
```
if not L:
    raise WhateverYouWantError("foo")
avg = float(sum(L))/len(L)
```

— n611x007
แหล่งที่มา

0

statistics.meanคำตอบที่เหมาะสมสำหรับคำถามของคุณคือการใช้งาน แต่เพื่อความสนุกนี่คือรุ่นของค่าเฉลี่ยที่ไม่ได้ใช้len()ฟังก์ชั่นดังนั้นจึงstatistics.meanสามารถนำไปใช้กับเครื่องกำเนิดไฟฟ้าได้ (เช่น) ซึ่งไม่รองรับlen():

from functools import reduce
from operator import truediv
def ave(seq):
    return truediv(*reduce(lambda a, b: (a[0] + b[1], b[0]), 
                           enumerate(seq, start=1), 
                           (0, 0)))

— PaulMcG
แหล่งที่มา

-2

คนอื่นโพสต์คำตอบที่ดีมากแล้ว แต่บางคนอาจยังมองหาวิธีคลาสสิกในการหาค่าเฉลี่ย (เฉลี่ย) ดังนั้นที่นี่ฉันโพสต์สิ่งนี้ (รหัสทดสอบใน Python 3.6):

def meanmanual(listt):

mean = 0
lsum = 0
lenoflist = len(listt)

for i in listt:
    lsum += i

mean = lsum / lenoflist
return float(mean)

a = [1, 2, 3, 4, 5, 6]
meanmanual(a)

Answer: 3.5

— Hashmatullah Noorzai
แหล่งที่มา