การคำนวณค่าเฉลี่ยเลขคณิต (หนึ่งประเภทเฉลี่ย) ใน Python


267

มีวิธีการในตัวหรือไลบรารีมาตรฐานใน Python เพื่อคำนวณค่าเฉลี่ยเลขคณิต (ค่าเฉลี่ยหนึ่งประเภท) ของรายการตัวเลขหรือไม่?


ค่าเฉลี่ยไม่ชัดเจน - โหมดและค่ามัธยฐานเป็นค่าเฉลี่ยที่ใช้กันทั่วไป
jtlz2

โหมดและค่ามัธยฐานเป็นมาตรการอื่น ๆ ของแนวโน้มกลาง พวกเขาไม่ใช่ค่าเฉลี่ย โหมดนี้เป็นค่าทั่วไปที่สุดที่เห็นในชุดข้อมูลและไม่จำเป็นต้องซ้ำกัน ค่ามัธยฐานคือค่าที่แสดงถึงศูนย์กลางของจุดข้อมูล ดังที่คำถามบ่งบอกว่ามีค่าเฉลี่ยอยู่สองสามประเภท แต่ทั้งหมดนั้นแตกต่างจากการคำนวณค่ามัธยฐานและโหมด purplemath.com/modules/meanmode.htm
Jarom

@Jarom ลิงก์นั้นไม่เห็นด้วยกับคุณ: 'ค่าเฉลี่ยค่ามัธยฐานและโหมดเป็น "ค่าเฉลี่ย" สามชนิด
Marcelo Cantos

คำตอบ:


284

ฉันไม่รู้อะไรเลยในห้องสมุดมาตรฐาน อย่างไรก็ตามคุณสามารถใช้สิ่งต่อไปนี้:

def mean(numbers):
    return float(sum(numbers)) / max(len(numbers), 1)

>>> mean([1,2,3,4])
2.5
>>> mean([])
0.0

ใน numpy numpy.mean()มี


20
สิ่งที่เหมือนกันคือจะต้องพิจารณาว่าค่าเฉลี่ยของการ[]มีที่ซึ่งสามารถทำได้โดย0 float(sum(l))/max(len(l),1)
yo '12

8
PEP 8 กล่าวว่าเป็นชื่อตัวแปรที่ไม่ดีเพราะมันดูมากเช่นl 1นอกจากนี้ผมจะใช้มากกว่าif l if len(l) > 0ดูที่นี่
zondo

1
ทำไมเจ้าจึงเรียกว่าmax?
1 -_-

3
ดูคำถามข้างต้น: เพื่อหลีกเลี่ยงการหารด้วยศูนย์ (สำหรับ [])
Simon Fakir

5
รายการที่ว่างเปล่าไม่มีค่าเฉลี่ย โปรดอย่าทำเป็นว่าพวกเขาทำ
Marcelo Cantos

193

NumPy มีค่าnumpy.meanซึ่งเป็นค่าเฉลี่ยเลขคณิต การใช้งานง่ายเหมือนนี้:

>>> import numpy
>>> a = [1, 2, 4]
>>> numpy.mean(a)
2.3333333333333335

6
numpy เป็นฝันร้ายที่จะติดตั้งใน virtualenv คุณควรพิจารณาว่าจะไม่ใช้ lib นี้จริงๆ
vcarel

46
@vcarel: "numpy เป็นฝันร้ายที่จะติดตั้งใน virtualenv" ฉันไม่แน่ใจว่าทำไมคุณพูดอย่างนี้ มันเคยเป็นอย่างนั้น แต่สำหรับปีที่แล้วหรือมากกว่านั้นมันง่ายมาก

6
ฉันต้องสองความคิดเห็นนี้ ปัจจุบันฉันใช้ numpy ใน virtualenv ใน OSX และไม่มีปัญหาแน่นอน (กำลังใช้ CPython 3.5)
Juan Carlos Coto

4
ด้วยระบบการรวมอย่างต่อเนื่องเช่น Travis CI การติดตั้ง numpy ใช้เวลาเพิ่มหลายนาที หากการสร้างที่รวดเร็วและเบามีค่าสำหรับคุณและคุณต้องการเพียงค่าเฉลี่ยเท่านั้นให้พิจารณา
Akseli Palén

2
@ AkseliPalén สภาพแวดล้อมเสมือนบนเทรวิส CI สามารถใช้ numpy ที่ติดตั้งผ่าน apt-get ใช้แพคเกจเว็บไซต์ระบบ สิ่งนี้อาจเร็วพอที่จะใช้แม้ว่าจะต้องการเพียงค่าเฉลี่ยเท่านั้น
Bengt

184

การใช้statistics.mean:

import statistics
print(statistics.mean([1,2,4])) # 2.3333333333333335

มีให้ตั้งแต่ Python 3.4 สำหรับ 3.1-3.3 ผู้ใช้รุ่นเก่าของโมดูลที่มีอยู่ใน PyPI statsภายใต้ชื่อ การเปลี่ยนแปลงเพียงเพื่อstatisticsstats


2
โปรดทราบว่าสิ่งนี้ช้ามากเมื่อเปรียบเทียบกับโซลูชันอื่น เปรียบเทียบtimeit("numpy.mean(vec)), timeit("sum(vec)/len(vec)")และtimeit("statistics.mean(vec)")- หลังเป็นช้ากว่าคนอื่นโดยปัจจัยใหญ่ (> 100 ในบางกรณีในเครื่องคอมพิวเตอร์ของฉัน) ปรากฏขึ้นนี้น่าจะเกิดจากการดำเนินงานได้อย่างแม่นยำโดยเฉพาะอย่างยิ่งของsumผู้ประกอบการในการstatisticsดูPEPและรหัส ไม่แน่ใจว่าเกี่ยวกับเหตุผลสำหรับความแตกต่างของผลการดำเนินงานที่มีขนาดใหญ่ระหว่างstatistics._sumและnumpy.sumแม้ว่า
jhin

10
@jhin นี้เป็นเพราะstatistics.meanพยายามที่จะเป็นที่ถูกต้อง [1e50, 1, -1e50] * 1000มันจะคำนวณได้อย่างถูกต้องเฉลี่ยของ
Antti Haapala

1
statistics.meanจะยอมรับการแสดงออกของค่ากำเนิดซึ่งโซลูชั่นทั้งหมดที่ใช้len()สำหรับตัวหารจะสำลัก
PaulMcG

54

คุณไม่จำเป็นต้องมีแม้แต่ numpy หรือ scipy ...

>>> a = [1, 2, 3, 4, 5, 6]
>>> print(sum(a) / len(a))
3

24
จากนั้นค่าเฉลี่ย ([2,3]) จะให้ 2. ระวังด้วยการลอย ควรใช้ float (sum (l)) / len (l) ยังดีกว่าโปรดใช้ความระมัดระวังในการตรวจสอบว่ารายการว่างเปล่าหรือไม่
jesusiniesta

14
@jesusiniesta ยกเว้นใน python3 โดยที่การหารทำในสิ่งที่ตั้งใจทำ: หาร
yota

11
และใน Python 2.2+ ถ้าคุณfrom __future__ import divisionอยู่ด้านบนสุดของโปรแกรม
spiffytech

แล้วเรื่องจำนวนมากและมากเกินล่ะ?
obayhan

เกี่ยวกับa = list()อะไร โค้ดที่เสนอให้ผลลัพธ์ZeroDivisionErrorเป็น
Ioannis Filippidis


7

แทนที่จะหล่อลอยคุณสามารถทำตาม

def mean(nums):
    return sum(nums, 0.0) / len(nums)

หรือใช้แลมบ์ดา

mean = lambda nums: sum(nums, 0.0) / len(nums)

อัพเดต: 2019-12-15

Python 3.8 เพิ่มฟังก์ชันfmeanไปยังโมดูลสถิติ ซึ่งเร็วกว่าและให้ผลตอบแทนลอยเสมอ

แปลงข้อมูลเป็นแบบลอยตัวและคำนวณค่าเฉลี่ยเลขคณิต

สิ่งนี้จะทำงานได้เร็วกว่าฟังก์ชั่น mean () และมันจะคืนค่าทศนิยม ข้อมูลอาจเป็นลำดับหรือทำซ้ำได้ หากชุดข้อมูลอินพุตว่างให้เพิ่ม StatisticsError

fmean ([3.5, 4.0, 5.25])

4.25

ใหม่ในเวอร์ชัน 3.8



1
def avg(l):
    """uses floating-point division."""
    return sum(l) / float(len(l))

ตัวอย่าง:

l1 = [3,5,14,2,5,36,4,3]
l2 = [0,0,0]

print(avg(l1)) # 9.0
print(avg(l2)) # 0.0


0

ฉันควรavgจะละเว้นจาก builtins / stdlib เสมอเพราะมันง่ายเหมือน

sum(L)/len(L) # L is some list

และคำเตือนใด ๆ ที่จะได้รับการแก้ไขในรหัสโทรสำหรับการใช้งานในท้องถิ่นอยู่แล้ว

คำเตือนที่น่าสังเกต:

  1. non-float result: ใน python2, 9/4 คือ 2. เพื่อแก้ไข, ใช้float(sum(L))/len(L)หรือfrom __future__ import division

  2. หารด้วยศูนย์: รายการอาจว่างเปล่า เพื่อแก้ไข:

    if not L:
        raise WhateverYouWantError("foo")
    avg = float(sum(L))/len(L)

0

statistics.meanคำตอบที่เหมาะสมสำหรับคำถามของคุณคือการใช้งาน แต่เพื่อความสนุกนี่คือรุ่นของค่าเฉลี่ยที่ไม่ได้ใช้len()ฟังก์ชั่นดังนั้นจึงstatistics.meanสามารถนำไปใช้กับเครื่องกำเนิดไฟฟ้าได้ (เช่น) ซึ่งไม่รองรับlen():

from functools import reduce
from operator import truediv
def ave(seq):
    return truediv(*reduce(lambda a, b: (a[0] + b[1], b[0]), 
                           enumerate(seq, start=1), 
                           (0, 0)))

-2

คนอื่นโพสต์คำตอบที่ดีมากแล้ว แต่บางคนอาจยังมองหาวิธีคลาสสิกในการหาค่าเฉลี่ย (เฉลี่ย) ดังนั้นที่นี่ฉันโพสต์สิ่งนี้ (รหัสทดสอบใน Python 3.6):

def meanmanual(listt):

mean = 0
lsum = 0
lenoflist = len(listt)

for i in listt:
    lsum += i

mean = lsum / lenoflist
return float(mean)

a = [1, 2, 3, 4, 5, 6]
meanmanual(a)

Answer: 3.5
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.