จะอ่านค่า RGB ของพิกเซลที่กำหนดใน Python ได้อย่างไร?


140

หากฉันเปิดภาพด้วยopen("image.jpg")ฉันจะรับค่า RGB ของพิกเซลโดยสมมติว่าฉันมีพิกัดของพิกเซลได้อย่างไร

จากนั้นฉันจะย้อนกลับของสิ่งนี้ได้อย่างไร เริ่มต้นด้วยกราฟิกว่างเปล่า 'เขียน' พิกเซลด้วยค่า RGB ที่แน่นอนหรือไม่

ฉันต้องการถ้าฉันไม่ต้องดาวน์โหลดไลบรารีเพิ่มเติมใด ๆ

คำตอบ:


213

อาจเป็นการดีที่สุดที่จะใช้Python Image Libraryเพื่อทำสิ่งนี้ซึ่งฉันกลัวว่าเป็นการดาวน์โหลดแยกต่างหาก

วิธีที่ง่ายที่สุดในการทำสิ่งที่คุณต้องการคือการใช้วิธีโหลด () บนวัตถุรูปภาพซึ่งส่งคืนวัตถุการเข้าถึงพิกเซลซึ่งคุณสามารถจัดการเหมือนอาเรย์:

from PIL import Image

im = Image.open('dead_parrot.jpg') # Can be many different formats.
pix = im.load()
print im.size  # Get the width and hight of the image for iterating over
print pix[x,y]  # Get the RGBA Value of the a pixel of an image
pix[x,y] = value  # Set the RGBA Value of the image (tuple)
im.save('alive_parrot.png')  # Save the modified pixels as .png

หรือดูที่ImageDrawซึ่งให้ API ที่สมบูรณ์ยิ่งขึ้นสำหรับการสร้างรูปภาพ


1
โชคดีที่การติดตั้ง PIL นั้นตรงไปตรงมามากใน Linux และ Windows (ไม่รู้เกี่ยวกับ Mac)
heltonbiker

6
@ArturSapek ฉันได้ติดตั้ง PIL pipซึ่งมันค่อนข้างง่าย
michaelliu

1
ฉันใช้สิ่งนี้กับ Mac ของฉัน (Pypi):easy_install --find-links http://www.pythonware.com/products/pil/ Imaging
Mazyod

15
สำหรับผู้อ่านในอนาคต: pip install pillowจะติดตั้ง PIL ได้สำเร็จและรวดเร็ว (อาจต้องใช้sudoหากไม่ได้อยู่ใน virtualenv)
Christopher Shroba

pillow.readthedocs.io/en/latest/…แสดงคำสั่ง bash ในขั้นตอนการติดตั้ง windows ไม่แน่ใจว่าจะดำเนินการต่อไปอย่างไร
Musixauce3000

31

การใช้Pillow (ซึ่งใช้ได้กับ Python 3.X และ Python 2.7+) คุณสามารถทำสิ่งต่อไปนี้:

from PIL import Image
im = Image.open('image.jpg', 'r')
width, height = im.size
pixel_values = list(im.getdata())

ตอนนี้คุณมีค่าพิกเซลทั้งหมด หากเป็น RGB หรือโหมดอื่นสามารถอ่านim.modeได้ จากนั้นคุณสามารถรับพิกเซลได้(x, y)โดย:

pixel_values[width*y+x]

หรือคุณสามารถใช้ Numpy และปรับรูปร่างอาร์เรย์ใหม่ได้:

>>> pixel_values = numpy.array(pixel_values).reshape((width, height, 3))
>>> x, y = 0, 1
>>> pixel_values[x][y]
[ 18  18  12]

โซลูชันที่สมบูรณ์และใช้งานง่ายคือ

# Third party modules
import numpy
from PIL import Image


def get_image(image_path):
    """Get a numpy array of an image so that one can access values[x][y]."""
    image = Image.open(image_path, "r")
    width, height = image.size
    pixel_values = list(image.getdata())
    if image.mode == "RGB":
        channels = 3
    elif image.mode == "L":
        channels = 1
    else:
        print("Unknown mode: %s" % image.mode)
        return None
    pixel_values = numpy.array(pixel_values).reshape((width, height, channels))
    return pixel_values


image = get_image("gradient.png")

print(image[0])
print(image.shape)

ควันทดสอบรหัส

คุณอาจไม่แน่ใจเกี่ยวกับลำดับความกว้าง / ความสูง / ช่อง ด้วยเหตุนี้ฉันจึงสร้างการไล่ระดับสีนี้:

ป้อนคำอธิบายรูปภาพที่นี่

รูปภาพมีความกว้าง 100px และความสูง 26px มันมีการไล่ระดับสีไปจาก#ffaa00(สีเหลือง) ถึง#ffffff(สีขาว) ผลลัพธ์คือ:

[[255 172   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 172   5]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   4]
 [255 172   5]
 [255 171   5]
 [255 171   5]
 [255 172   5]]
(100, 26, 3)

สิ่งที่ควรทราบ:

  • รูปร่างคือ (ความกว้างความสูงช่อง)
  • image[0]จึงแถวแรกมี 26 อเนกประสงค์ที่มีสีเดียวกัน

หมอนรองรับ python 2.7 บน macosx ในขณะที่ฉันพบ python 2.5 เท่านั้นที่รองรับ PIL ขอบคุณ!
Kangaroo.H

2
ระวังรายการ params 'reshape' ควรเป็น (ความสูงความกว้างช่อง) และสำหรับภาพ rgba คุณสามารถรวม image.mode = RGBA พร้อมช่อง = 4
gmarsi

เป็นจุดโดย @gmarsi จริงกับความกว้างและความสูง? เป็นจริงหรือไม่ว่าทั้งสองถูกต้อง? คุณจำเป็นต้องทราบว่าข้อมูลจะถูกส่งออกอย่างไรเพื่อที่คุณจะได้รู้ว่ารูปร่างของอาร์เรย์เอาต์พุตจะเป็นอย่างไรและข้อมูลพิกเซลพิกเซลของแถวและคอลัมน์ของรูปภาพนั้นเป็นอย่างไร
Kioshiki

@Kioshiki ฉันได้เพิ่มส่วน "การทดสอบควัน" ในคำตอบของฉันดังนั้นจึงง่ายที่จะบอก
Martin Thoma

24

PyPNG - ตัวถอดรหัส / ตัวเข้ารหัส PNG น้ำหนักเบา

แม้ว่าคำถามจะเป็นคำแนะนำที่ JPG แต่ฉันหวังว่าคำตอบของฉันจะเป็นประโยชน์กับบางคน

นี่คือวิธีการอ่านและเขียนพิกเซล PNG โดยใช้โมดูล PyPNG :

import png, array

point = (2, 10) # coordinates of pixel to be painted red

reader = png.Reader(filename='image.png')
w, h, pixels, metadata = reader.read_flat()
pixel_byte_width = 4 if metadata['alpha'] else 3
pixel_position = point[0] + point[1] * w
new_pixel_value = (255, 0, 0, 0) if metadata['alpha'] else (255, 0, 0)
pixels[
  pixel_position * pixel_byte_width :
  (pixel_position + 1) * pixel_byte_width] = array.array('B', new_pixel_value)

output = open('image-with-red-dot.png', 'wb')
writer = png.Writer(w, h, **metadata)
writer.write_array(output, pixels)
output.close()

PyPNG เป็นโมดูล Python เดียวที่มีความยาวน้อยกว่า 4,000 บรรทัดซึ่งรวมถึงการทดสอบและความคิดเห็น

PILเป็นห้องสมุดภาพที่ครอบคลุมมากขึ้น แต่มันก็หนักกว่ามาก


12

ดังที่ Dave Webb กล่าวว่า

นี่คือรหัสการทำงานของฉันที่พิมพ์สีพิกเซลจากภาพ:

import os, sys
import Image

im = Image.open("image.jpg")
x = 3
y = 4

pix = im.load()
print pix[x,y]

6
photo = Image.open('IN.jpg') #your image
photo = photo.convert('RGB')

width = photo.size[0] #define W and H
height = photo.size[1]

for y in range(0, height): #each pixel has coordinates
    row = ""
    for x in range(0, width):

        RGB = photo.getpixel((x,y))
        R,G,B = RGB  #now you can use the RGB value

3

การจัดการภาพเป็นเรื่องที่ซับซ้อนและจะดีที่สุดถ้าคุณทำใช้ห้องสมุด ฉันสามารถแนะนำgdmoduleซึ่งให้การเข้าถึงรูปแบบภาพที่หลากหลายจาก Python ได้อย่างง่ายดาย


ใครรู้ว่าทำไมสิ่งนี้จึงถูกลดระดับลง มีปัญหาเกี่ยวกับ libgd หรือบางสิ่งบางอย่างหรือไม่? (ฉันไม่เคยดูมัน แต่มันก็ดีเสมอที่รู้ว่ามีทางเลือกอื่นสำหรับ PiL)
Peter Hanley

3

มีบทความที่ดีจริงๆใน wiki.wxpython.org สิทธิเป็นทำงานกับภาพ บทความกล่าวถึงความเป็นไปได้ของการใช้ wxWidgets (wxImage), PIL หรือ PythonMagick โดยส่วนตัวฉันใช้ PIL และ wxWidgets และทั้งคู่ทำให้การปรับแต่งภาพทำได้ง่ายมาก


3

คุณสามารถใช้โมดูลกระดานโต้คลื่นของpygame โมดูลนี้มีอาร์เรย์พิกเซล 3 มิติที่ส่งคืนวิธีที่เรียกว่า pixels3d (พื้นผิว) ฉันได้แสดงการใช้งานด้านล่าง:

from pygame import surfarray, image, display
import pygame
import numpy #important to import

pygame.init()
image = image.load("myimagefile.jpg") #surface to render
resolution = (image.get_width(),image.get_height())
screen = display.set_mode(resolution) #create space for display
screen.blit(image, (0,0)) #superpose image on screen
display.flip()
surfarray.use_arraytype("numpy") #important!
screenpix = surfarray.pixels3d(image) #pixels in 3d array:
#[x][y][rgb]
for y in range(resolution[1]):
    for x in range(resolution[0]):
        for color in range(3):
            screenpix[x][y][color] += 128
            #reverting colors
screen.blit(surfarray.make_surface(screenpix), (0,0)) #superpose on screen
display.flip() #update display
while 1:
    print finished

ฉันหวังว่าจะเป็นประโยชน์ คำสุดท้าย: หน้าจอถูกล็อคตลอดอายุการใช้งานของ screenpix


2

ติดตั้ง PIL โดยใช้คำสั่ง "sudo apt-get install python-imaging" และเรียกใช้โปรแกรมต่อไปนี้ มันจะพิมพ์ค่า RGB ของภาพ หากภาพมีขนาดใหญ่ให้เปลี่ยนเส้นทางไปยังไฟล์โดยใช้ '>' เปิดไฟล์เพื่อดูค่า RGB

import PIL
import Image
FILENAME='fn.gif' #image can be in gif jpeg or png format 
im=Image.open(FILENAME).convert('RGB')
pix=im.load()
w=im.size[0]
h=im.size[1]
for i in range(w):
  for j in range(h):
    print pix[i,j]

2

คุณสามารถใช้โมดูล Tkinter ซึ่งเป็นอินเตอร์เฟส Python มาตรฐานกับชุดเครื่องมือ Tk GUI และคุณไม่จำเป็นต้องดาวน์โหลดเพิ่มเติม ดูhttps://docs.python.org/2/library/tkinter.html

(สำหรับ Python 3 Tkinter ถูกเปลี่ยนชื่อเป็น tkinter)

นี่คือวิธีการตั้งค่า RGB:

#from http://tkinter.unpythonic.net/wiki/PhotoImage
from Tkinter import *

root = Tk()

def pixel(image, pos, color):
    """Place pixel at pos=(x,y) on image, with color=(r,g,b)."""
    r,g,b = color
    x,y = pos
    image.put("#%02x%02x%02x" % (r,g,b), (y, x))

photo = PhotoImage(width=32, height=32)

pixel(photo, (16,16), (255,0,0))  # One lone pixel in the middle...

label = Label(root, image=photo)
label.grid()
root.mainloop()

และรับ RGB:

#from http://www.kosbie.net/cmu/spring-14/15-112/handouts/steganographyEncoder.py
def getRGB(image, x, y):
    value = image.get(x, y)
    return tuple(map(int, value.split(" ")))

2
from PIL import Image
def rgb_of_pixel(img_path, x, y):
    im = Image.open(img_path).convert('RGB')
    r, g, b = im.getpixel((x, y))
    a = (r, g, b)
    return a

1
ในขณะที่ข้อมูลโค้ดนี้อาจเป็นโซลูชันรวมถึงคำอธิบายช่วยปรับปรุงคุณภาพการโพสต์ของคุณ จำไว้ว่าคุณกำลังตอบคำถามสำหรับผู้อ่านในอนาคตและคนเหล่านั้นอาจไม่ทราบสาเหตุของการแนะนำรหัสของคุณ
Narendra Jadhav


1

หากคุณต้องการมีตัวเลขสามหลักในรูปแบบของรหัสสี RGB รหัสต่อไปนี้ควรทำเช่นนั้น

i = Image.open(path)
pixels = i.load() # this is not a list, nor is it list()'able
width, height = i.size

all_pixels = []
for x in range(width):
    for y in range(height):
        cpixel = pixels[x, y]
        all_pixels.append(cpixel)

สิ่งนี้อาจใช้ได้ผลสำหรับคุณ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.