ฉันจะแปลงภาพ RGB เป็นสีเทาใน Python ได้อย่างไร


205

ฉันพยายามที่จะใช้matplotlibในการอ่านในภาพ RGB และแปลงเป็นสีเทา

ใน matlab ฉันใช้สิ่งนี้:

img = rgb2gray(imread('image.png'));

ในแบบฝึกหัด matplotlibพวกเขาไม่ได้ครอบคลุม พวกเขาอ่านในภาพ

import matplotlib.image as mpimg
img = mpimg.imread('image.png')

แล้วพวกเขาก็แบ่งอาร์เรย์ แต่นั่นไม่ใช่สิ่งเดียวกันกับการแปลง RGB เป็นสีเทาจากสิ่งที่ฉันเข้าใจ

lum_img = img[:,:,0]

ฉันคิดว่ามันยากที่จะเชื่อว่า numpy หรือ matplotlib ไม่มีฟังก์ชั่นการแปลงจาก rgb เป็นสีเทา นี่ไม่ใช่การดำเนินการทั่วไปในการประมวลผลรูปภาพใช่หรือไม่

ฉันเขียนฟังก์ชั่นที่ง่ายมากที่ทำงานกับภาพที่นำเข้ามาใช้imreadใน 5 นาที มันไม่มีประสิทธิภาพอย่างน่ากลัว แต่นั่นเป็นเหตุผลว่าทำไมฉันจึงหวังว่าจะมีการติดตั้งแบบมืออาชีพในตัว

เซบาสเตียนได้ปรับปรุงการทำงานของฉัน แต่ฉันยังคงหวังว่าจะหาตัวในตัว

การใช้งานของ MATLAB (NTSC / PAL):

import numpy as np

def rgb2gray(rgb):

    r, g, b = rgb[:,:,0], rgb[:,:,1], rgb[:,:,2]
    gray = 0.2989 * r + 0.5870 * g + 0.1140 * b

    return gray

2
โปรดทราบว่าคุณสามารถเขียนสิ่งเดียวกับฟังก์ชั่น rgb2gray gray = np.mean(rgb, -1)ของคุณก็เป็น: อาจจะrgb[...,:3]มีถ้าเป็นจริง rgba
seberg

อืมgray = np.mean(rgb, -1)ทำงานได้ดี ขอบคุณ มีเหตุผลที่จะไม่ใช้สิ่งนี้หรือไม่? เหตุใดฉันจึงต้องใช้วิธีแก้ปัญหาในคำตอบด้านล่างแทน
waspinator

6
สีเทาวิกิพีเดียหน้ากล่าวว่าวิธีการของการแปลง RGB ระดับสีเทาที่ไม่ซ้ำกัน แต่ให้สูตรที่ใช้กันทั่วไปอยู่บนพื้นฐานของความสว่าง np.mean(rgb, -1)มันค่อนข้างแตกต่างกว่า
unutbu

2
ดังนั้นฉันเดาว่าฉันต้องการเวอร์ชั่นของ Matlab ? 0.2989 * R + 0.5870 * G + 0.1140 * B ฉันสมมติว่ามันเป็นวิธีมาตรฐานในการทำมัน
waspinator

คำตอบ:


303

ทำอย่างไรกับหมอน :

from PIL import Image
img = Image.open('image.png').convert('LA')
img.save('greyscale.png')

การใช้ matplotlib และสูตร

Y' = 0.2989 R + 0.5870 G + 0.1140 B 

คุณสามารถทำได้:

import numpy as np
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

def rgb2gray(rgb):
    return np.dot(rgb[...,:3], [0.2989, 0.5870, 0.1140])

img = mpimg.imread('image.png')     
gray = rgb2gray(img)    
plt.imshow(gray, cmap=plt.get_cmap('gray'), vmin=0, vmax=1)
plt.show()

3
ถ้าเขาต้องใช้matplotlibด้วยเหตุผลอื่นเขาควรจะสามารถใช้ builtin colorsys.rgb_to_yiq()เพื่อแปลงบวกชิ้นเพื่อรับช่องทาง luma
สิลาสเรย์

34
ทำไม.convert('LA')? ทำไมไม่.convert('gray')? ดูเหมือนคลุมเครือโดยไม่จำเป็น เอกสาร PILไม่ได้พูดถึงอะไรเกี่ยวกับ 'LA' สำหรับฟังก์ชั่นแปลง
waspinator

25
ใช้ PIL: cannot write mode LA as JPEGฉันต้องใช้โหมด L ไม่ใช่ LA
jsky

6
สิ่งนี้img = Image.open('image.png').convert('LA')จะต้องเป็นimg = Image.open('image.png').convert('L')
nviens

12
@BluePython: LAโหมดมีความส่องสว่าง (ความสว่าง) และอัลฟา หากคุณใช้LAโหมดจากนั้นgreyscale.pngจะเป็นภาพ RGBA พร้อมช่องอัลฟาที่image.pngเก็บรักษาไว้ หากคุณใช้Lโหมดจากนั้นgreyscale.pngจะเป็นภาพ RGB (ไม่มีตัวอักษร)
unutbu

69

นอกจากนี้คุณยังสามารถใช้scikit ภาพซึ่งมีฟังก์ชั่นบางอย่างเพื่อแปลงภาพในเช่นndarrayrgb2gray

from skimage import color
from skimage import io

img = color.rgb2gray(io.imread('image.png'))

หมายเหตุ : น้ำหนักที่ใช้ในการแปลงนี้ถูกปรับเทียบสำหรับฟอสเฟอร์ CRT ร่วมสมัย: Y = 0.2125 R + 0.7154 G + 0.0721 B

อีกวิธีหนึ่งคุณสามารถอ่านภาพในโทนสีเทาโดย:

from skimage import io
img = io.imread('image.png', as_gray=True)

เป็นเรื่องปกติหรือเปล่าที่ฉันได้รับ 0 <values ​​<1? ฉันควรคูณมันด้วย 255 เพื่อให้ได้ระดับสีเทาจริงหรือไม่?
Sam

รู้ว่าเป้าหมายของฉันคือการใช้คุณสมบัติ GLCM (greycoprops)
Sam

หมายเหตุสำหรับ io.imread: "as_grey" ถูกคัดค้านด้วย "as_gray" การใช้งานเดียวกันการสะกดแบบอเมริกัน :)
ฮาโลเจน

1
ฉันเชื่อว่านี่เป็นคำตอบสำหรับคำถามที่มีประโยชน์ที่สุดผลลัพธ์ของสิ่งนี้ยังเข้ากันได้กับ matplotlib และ numpy
Mert Beşiktepe

ฉันกำลังใช้วัตถุสี แต่ภาพของฉันค่อนข้างแดงตอนนี้ไม่ใช่สีเทา (ขาวดำ) ฉันต้องใช้cmapเป็นgray' then only the image is shown as gray in pyplot.imshow () `? ความคิดใด ๆ ฉันผิดตรงไหน
GadaaDhaariGeek

63

สามวิธีที่แนะนำได้รับการทดสอบความเร็วด้วย 1,000 ภาพ RGBA PNG (224 x 256 พิกเซล) ที่ทำงานด้วย Python 3.5 บน Ubuntu 16.04 LTS (Xeon E5 2670 พร้อม SSD)

เวลาทำงานเฉลี่ย

pil : 1.037 วินาที

scipy: 1.040 วินาที

sk : 2.120 วินาที

PIL และ SciPy ให้numpyอาร์เรย์เหมือนกัน(ตั้งแต่ 0 ถึง 255) SkImage ให้อาร์เรย์ตั้งแต่ 0 ถึง 1 นอกจากนี้สีจะถูกแปลงแตกต่างกันเล็กน้อยให้ดูตัวอย่างจากชุดข้อมูล CUB-200

SkImage: SkImage

PIL : PIL

SciPy : SciPy

Original: เป็นต้นฉบับ

Diff : ป้อนคำอธิบายรูปภาพที่นี่

รหัส

  1. ประสิทธิภาพ

    run_times = dict(sk=list(), pil=list(), scipy=list())
    for t in range(100):
        start_time = time.time()
        for i in range(1000):
            z = random.choice(filenames_png)
            img = skimage.color.rgb2gray(skimage.io.imread(z))
        run_times['sk'].append(time.time() - start_time)

    start_time = time.time()
    for i in range(1000):
        z = random.choice(filenames_png)
        img = np.array(Image.open(z).convert('L'))
    run_times['pil'].append(time.time() - start_time)
    
    start_time = time.time()
    for i in range(1000):
        z = random.choice(filenames_png)
        img = scipy.ndimage.imread(z, mode='L')
    run_times['scipy'].append(time.time() - start_time)
    

    for k, v in run_times.items(): print('{:5}: {:0.3f} seconds'.format(k, sum(v) / len(v)))

  2. เอาท์พุต
    z = 'Cardinal_0007_3025810472.jpg'
    img1 = skimage.color.rgb2gray(skimage.io.imread(z)) * 255
    IPython.display.display(PIL.Image.fromarray(img1).convert('RGB'))
    img2 = np.array(Image.open(z).convert('L'))
    IPython.display.display(PIL.Image.fromarray(img2))
    img3 = scipy.ndimage.imread(z, mode='L')
    IPython.display.display(PIL.Image.fromarray(img3))
  3. การเปรียบเทียบ
    img_diff = np.ndarray(shape=img1.shape, dtype='float32')
    img_diff.fill(128)
    img_diff += (img1 - img3)
    img_diff -= img_diff.min()
    img_diff *= (255/img_diff.max())
    IPython.display.display(PIL.Image.fromarray(img_diff).convert('RGB'))
  4. นำเข้า
    import skimage.color
    import skimage.io
    import random
    import time
    from PIL import Image
    import numpy as np
    import scipy.ndimage
    import IPython.display
  5. รุ่น
    skimage.version
    0.13.0
    scipy.version
    0.19.1
    np.version
    1.13.1

6
SciPy ของภาพ I / O เป็นตัวอักษร PIL / หมอนแบบต่างๆ ดังนั้นการทดสอบ SciPy คือการทดสอบ PIL / หมอนอีกครั้งอย่างมีประสิทธิภาพด้วยค่าใช้จ่ายเล็กน้อยที่แนะนำโดยฟังก์ชั่นห่อหุ้มของ SciPy มันจะได้รับมากมีประโยชน์มากขึ้นเพื่อทดแทน OpenCV (ซึ่งไม่ได้ใช้ประโยชน์ PIL / หมอนแบบต่างๆ) สำหรับ SciPy (ซึ่งไม่) อย่างไรก็ตามขอขอบคุณสำหรับการเปรียบเทียบโดยเฉพาะ! การชะลอตัวที่มองเห็นได้ซึ่งกำหนดโดย SciKit นั้นน่าทึ่ง ... และน่ากลัว
เซซิลแกงกะหรี่

@CecilCurry ขอบคุณสำหรับความคิดด้วย OpenCV! ฉันจะเพิ่มเมื่อฉันหาเวลาว่าง
แมกซีมีเลียนปีเตอร์

upvoted! ไม่ได้คำตอบที่ผมกำลังมองหา แต่ที่น่าสนใจมากกระนั้น :)
ไซริลเอ็น

29

คุณสามารถอ่านไฟล์รูปภาพเป็นสีเทาได้เสมอตั้งแต่ต้นโดยใช้imreadจาก OpenCV:

img = cv2.imread('messi5.jpg', 0)

นอกจากนี้ในกรณีที่คุณต้องการอ่านภาพเป็น RGB ให้ทำการประมวลผลแล้วแปลงเป็นระดับสีเทาที่คุณสามารถใช้cvtcolorจาก OpenCV:

gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

6
ftr ที่: ธง0 cv2.CV_LOAD_IMAGE_GRAYSCALE
dtk

24

วิธีที่เร็วและในปัจจุบันคือการใช้หมอนpip install Pillowที่ติดตั้งผ่านทาง

รหัสคือ:

from PIL import Image
img = Image.open('input_file.jpg').convert('L')
img.save('output_file.jpg')

3
โปรดทราบว่าหากคุณไม่ได้ผูกมัดวิธีการของคุณอย่างในตัวอย่างด้านบนให้convertส่งสำเนาที่แปลงแล้วของรูปภาพ
Matt

ไม่ทำงานสำหรับ PNG 32 บิตค่าจะถูกบีบให้ 255
Andrew Matuk

11

บทช่วยสอนกำลังโกงเพราะมันเริ่มต้นด้วยภาพ greyscale ที่เข้ารหัสใน RGB ดังนั้นพวกเขาจึงเพียงแค่ตัดช่องสีเดียวและทำให้มันเป็นสีเทา ขั้นตอนพื้นฐานที่คุณต้องทำคือเปลี่ยนจาก RGB colourspace เป็น colorpace ที่เข้ารหัสด้วยบางสิ่งที่ประมาณโมเดล luma / chroma เช่น YUV / YIQ หรือ HSL / HSV จากนั้นก็ผ่าช่อง luma เหมือนและใช้มันเป็น ภาพสีเทาของคุณ matplotlibไม่ปรากฏว่ามีกลไกในการแปลงเป็น YUV / YIQ แต่ให้คุณแปลงเป็น HSV ได้

ลองใช้matplotlib.colors.rgb_to_hsv(img)แล้วแบ่งค่าสุดท้าย (V) จากอาร์เรย์สำหรับโทนสีเทาของคุณ มันไม่ได้มากเช่นเดียวกับค่าลูมา matplotlibแต่มันหมายความว่าคุณสามารถทำมันได้ทั้งหมดใน

พื้นหลัง:

อีกทางหนึ่งคุณสามารถใช้ PIL หรือ builtin colorsys.rgb_to_yiq()เพื่อแปลงเป็น colorpace ด้วยค่า luma ที่แท้จริง คุณสามารถเข้าไปข้างในและพลิกตัวแปลงลูมาเท่านั้นของคุณเองได้


9

ใช้สูตรนี้

Y' = 0.299 R + 0.587 G + 0.114 B 

เราทำได้

import imageio
import numpy as np
import matplotlib.pyplot as plt

pic = imageio.imread('(image)')
gray = lambda rgb : np.dot(rgb[... , :3] , [0.299 , 0.587, 0.114]) 
gray = gray(pic)  
plt.imshow(gray, cmap = plt.get_cmap(name = 'gray'))

อย่างไรก็ตามGIMP ที่แปลงสีให้เป็นซอฟต์แวร์ภาพระดับสีเทามีสามอัลกอริทึมในการทำงาน


8

หากคุณใช้ NumPy / SciPy อยู่แล้วคุณก็สามารถใช้เช่นกัน:

scipy.ndimage.imread(file_name, mode='L')


5
ทั้งscipy.ndimage.imread()และscipy.misc.imread()ถูกคัดค้านอย่างเป็นทางการใน SciPy 1.0.0 และจะถูกลบอย่างถาวรใน SciPy 1.2.0 ในขณะที่เอกสารของ SciPy แนะนำให้imageio.imread()ใช้แทนสิ่งที่เหมาะสม API ของฟังก์ชั่นนี้คือกระดูกที่เปลือยเปล่าจนถึงจุดที่ไร้สาระ มันไม่รองรับการแปลงระดับสีเทาดังนั้นจึงยังไม่เหมาะสมสำหรับแอปพลิเคชันมากมายรวมถึงของเรา </sigh>
เซซิลแกงกะหรี่

5
@CecilCurry คุณจะแปลงภาพสีในระดับสีเทาโดยใช้ imageio ได้อย่างไร
0x90

5

คุณสามารถทำได้:

import numpy as np
import matplotlib.pyplot as plt
import matplotlib.image as mpimg

def rgb_to_gray(img):
        grayImage = np.zeros(img.shape)
        R = np.array(img[:, :, 0])
        G = np.array(img[:, :, 1])
        B = np.array(img[:, :, 2])

        R = (R *.299)
        G = (G *.587)
        B = (B *.114)

        Avg = (R+G+B)
        grayImage = img

        for i in range(3):
           grayImage[:,:,i] = Avg

        return grayImage       

image = mpimg.imread("your_image.png")   
grayImage = rgb_to_gray(image)  
plt.imshow(grayImage)
plt.show()

5

ใช้ img.Convert () รองรับ“ L”,“ RGB” และ“ CMYK” โหมด

import numpy as np
from PIL import Image

img = Image.open("IMG/center_2018_02_03_00_34_32_784.jpg")
img.convert('L')

print np.array(img)

เอาท์พุท:

[[135 123 134 ...,  30   3  14]
 [137 130 137 ...,   9  20  13]
 [170 177 183 ...,  14  10 250]
 ..., 
 [112  99  91 ...,  90  88  80]
 [ 95 103 111 ..., 102  85 103]
 [112  96  86 ..., 182 148 114]]

1
บรรทัดที่ 5 ควรเป็นimg = img.convert('L')อย่างไร
Allan Ruin

3

ฉันมาถึงคำถามนี้ผ่านทาง Google เพื่อค้นหาวิธีการแปลงภาพที่โหลดไปแล้วเป็นโทนสีเทา

นี่คือวิธีที่จะทำกับ SciPy:

import scipy.misc
import scipy.ndimage

# Load an example image
# Use scipy.ndimage.imread(file_name, mode='L') if you have your own
img = scipy.misc.face()

# Convert the image
R = img[:, :, 0]
G = img[:, :, 1]
B = img[:, :, 2]
img_gray = R * 299. / 1000 + G * 587. / 1000 + B * 114. / 1000

# Show the image
scipy.misc.imshow(img_gray)

1
ดี ฉันแค่ต้องการทราบวิธีแก้ปัญหาที่สั้นกว่านี้img_gray = numpy.average(img, weights=[0.299, 0.587, 0.114], axis=2)
Akavall

@Akavall ยินดีที่จะรู้ขอบคุณ! คุณรู้หรือไม่ว่าทางลัดของคุณเร็วขึ้น? ถ้าไม่ฉันจะเก็บของฉันเพราะมันง่ายกว่าที่จะเข้าใจ
Martin Thoma

ฉันไม่ได้เวลามันความรู้สึกของฉันnumpy.averageจะเร็วขึ้นเล็กน้อย แต่ไม่แตกต่างกันในทางปฏิบัติ โซลูชันของคุณชัดเจนและมีข้อมูลที่เกี่ยวข้องเกี่ยวกับ R, G, B ดังนั้นฉันจะเก็บไว้ ความคิดเห็นของฉันมีตัวเลือกเพิ่มเติมเพิ่มเติมไม่ใช่การแทนที่
Akavall

ทั้งscipy.ndimage.imread()และscipy.misc.imread()ถูกคัดค้านอย่างเป็นทางการใน SciPy 1.0.0 และจะถูกลบอย่างถาวรใน SciPy 1.2.0 คุณอาจต้องการใช้การสนับสนุนการแปลงสีเทาแบบหมอนในตัว (ala unutbu 's answer ) แทน
เซซิลแกงกะหรี่

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.