มิติการกระโดดในการเรียนรู้ของเครื่อง

10

ปัญหาการกระโดดข้ามมิติในการเรียนรู้ของเครื่องคืออะไร (เกิดขึ้นในโครงข่ายประสาทเทียมและการจดจำภาพ) ฉันทำไปแล้ว แต่สิ่งที่ฉันได้รับคือข้อมูลทางฟิสิกส์ของการเสียรูปของวัสดุ มันจะเป็นประโยชน์กับฉันมากขึ้นถ้าบางคนอธิบายด้วยตัวอย่างที่เกี่ยวข้องกับการเรียนรู้ของเครื่อง ใครสามารถช่วยฉันด้วยสิ่งนี้หรือชี้ให้ฉันไปยังแหล่งข้อมูลที่สามารถ?

machine-learning image-recognition

— sdream
แหล่งที่มา

7

ยินดีต้อนรับสู่ DataScience.SE! ฉันไม่เคยได้ยินปัญหานี้เลยดังนั้นฉันจึงเงยหน้าขึ้นมอง อธิบายไว้ในสไลด์ที่สามของงานนำเสนอนี้โดย Geoff Hinton:

สิ่งต่าง ๆ ที่ทำให้ยากต่อการจดจำวัตถุ

•การเปลี่ยนแปลงในมุมมองทำให้เกิดการเปลี่ยนแปลงในภาพที่วิธีการเรียนรู้มาตรฐานไม่สามารถรับมือได้

- กระโดดข้อมูลระหว่างมิติข้อมูล (เช่นพิกเซล)

•ลองนึกภาพฐานข้อมูลทางการแพทย์ที่บางครั้งอายุของผู้ป่วยกระโดดไปที่ขนาดอินพุตซึ่งโดยปกติจะเป็นรหัสของน้ำหนัก!

- ในการใช้การเรียนรู้ของเครื่องเราต้องกำจัดมิติข้อมูลนี้ก่อน

กล่าวอีกนัยหนึ่งมันเป็นเรื่องเกี่ยวกับคุณลักษณะเชิงแนวคิดการโยกย้ายหรือกระโดดจากมิติข้อมูลคุณลักษณะหนึ่งไปยังอีกขณะที่ยังคงแสดงสิ่งเดียวกัน เราต้องการที่จะสามารถจับภาพหรือแยกสาระสำคัญของคุณลักษณะในขณะที่ไม่แปรเปลี่ยนไปที่มิติการป้อนข้อมูลมันถูกเข้ารหัสบน

— เอ็ม
แหล่งที่มา

ฉันเข้าใจว่าใน Computer Vision เราต้องการค่าคงที่สำหรับสถานที่ในภาพ แต่ฉันไม่ได้รับตัวอย่างอายุ

— Martin Thoma

ฉันคิดว่าอายุและน้ำหนักนั้นขึ้นอยู่กับ แต่ฉันไม่แน่ใจ มันไม่ใช่งานนำเสนอของฉัน! หรือบางทีพวกเขาหมายความว่าพวกเขาใช้คอลัมน์ผิดและเราต้องการตรวจสอบว่า

— เอ็ม

@sdream ฉันเพียงแค่แสดงความคิดเห็น; Emre ให้คำตอบ (แต่คุณน่าจะยอมรับได้) จุดที่มี CNNs นั้นไม่เพียง แต่คุณสมบัติหนึ่งจะเปลี่ยนเมื่อวัตถุอยู่ที่อื่น แต่รูปแบบที่สมบูรณ์นั้นอยู่ที่อินพุตอื่น

— Martin Thoma

@ เป็นสิ่งที่ฉันได้รับจากคำตอบของคุณคือไม่ว่าจะป้อนคุณสมบัติเฉพาะไปในทิศทางใดคุณสมบัติที่คุณสมบัติเฉพาะนี้เป็นสาเหตุควรเปลี่ยนเป็นมิติข้อมูลเข้าของคุณสมบัตินี้ ขอบคุณ! :) ยังคงรอคำตอบเฉพาะเพิ่มเติมมิฉะนั้นจะทำเครื่องหมายคำตอบของคุณเป็นคำตอบ

— sdream

3

ตัวอย่างอายุควรเน้นชุดข้อมูลที่ไม่มีมิติข้อมูล อายุและน้ำหนักไม่ "กระโดด" หรือสลับค่าสุ่มระหว่างตัวอย่าง - มันไม่สามารถใช้แทนกันได้และตัวอย่างก็แสดงให้เห็นว่าแปลกที่จะเป็น (และยากที่จะทำให้งานง่าย ๆ เช่นการถดถอยเชิงเส้น) ค่าพิกเซลในภาพ (และข้อมูลที่คล้ายกันในงานการประมวลผลสัญญาณจำนวนมาก) จะแลกเปลี่ยนหรือย้ายได้ง่ายเนื่องจากลักษณะของปัญหา

— Neil Slater

7

เท่าที่ฉันเข้าใจปัญหามีดังต่อไปนี้: ในการรับรู้ภาพอินพุตของเครือข่ายของคุณอาจเป็นพิกเซล (โทนสีเทาหรือเพียง 1 และ 0 สำหรับขาวดำ) หากคุณต้องการเช่นรับรู้หมายเลขที่เขียนด้วยลายมือมันเป็นเรื่องยากมากที่จะทำงานกับค่าเช่นเดียวกับที่คุณไม่เคยรู้ว่าหมายเลข (เช่นค่าสีดำ) จะเป็นอย่างไร

พิกเซล 140 ดำหรือ 142 ดำ? ในทั้งสองกรณีมันอาจเป็นสามอย่าง ในตัวอย่างอายุ / น้ำหนักอินพุตเหล่านี้มีการกำหนดอย่างดี คุณสมบัติที่ 2 คือน้ำหนัก คุณสมบัติ 3 คืออายุ "ส่วนข้อมูล" เหล่านี้ไม่ควร "กระโดด" ในชุดข้อมูลของคุณ

ดังนั้น: ในการฝึกภาพของคุณคุณจะต้องรู้จัก "threes" หรือ "cars" หรือ "houses" โดยไม่ขึ้นอยู่กับตำแหน่งในภาพเช่นค่าพิกเซลเช่น vector / feature / input อินพุตเช่นข้อมูลผู้ป่วย

คุณจะแก้ปัญหานี้ในการจดจำภาพได้อย่างไร คุณใช้เทคนิคเพิ่มเติมเช่น convolution

— D. Eggert
แหล่งที่มา

2

ฉันอ่านคำตอบก่อนหน้านี้และความคิดเห็นของ Neil Slater ไปยังโพสต์ของ Emre คัดลอกอีกครั้งด้านล่างกระทบเล็บ "การกระโดดมิติ" เป็นคำที่สร้างขึ้นโดยดร. ฮินตันแห่งการเรียนรู้ของผู้บุกเบิกด้านเครื่องจักรในบริบทของมุมมอง ในการอ้างอิงดร. ฮินตัน "โดยทั่วไปแล้วจินตนาการว่ามิติข้อมูลเข้านั้นสอดคล้องกับพิกเซลและหากวัตถุเคลื่อนที่ในโลกและคุณไม่ขยับสายตาไปตามนั้นข้อมูลเกี่ยวกับวัตถุจะเกิดขึ้นในพิกเซลที่แตกต่างกัน" อายุและน้ำหนักเป็นมิติการป้อนข้อมูลที่ไม่สับสนได้ง่าย ดร. ฮินตันใช้สิ่งนี้อย่างเห็นได้ชัดว่าไม่น่าจะมีมิติการกระโดดสถานการณ์ของอายุและน้ำหนักของผู้ป่วยหมายความว่าเราจะสามารถตรวจจับและแก้ไขข้อผิดพลาดระหว่างข้อมูลประเภทนี้ได้ (มันยากที่จะสังเกตว่าผู้ใหญ่ส่วนใหญ่อายุต่ำกว่า 100 ปี กว่า 100 ปอนด์) ปัญหาที่น่าจะเกิดขึ้นของการข้ามมิติซึ่งดร. ฮินตันกำลังกล่าวถึงคือพิกเซลอาจถูกแทนที่ได้เพราะเรามีจุดชมวิวที่แตกต่างกัน (เช่นวัตถุสามารถเคลื่อนที่ได้หรือมองจากมุมที่แตกต่าง) โครงข่ายประสาทเชิงเส้นจะไม่สามารถตรวจจับสิ่งนี้ได้ในขณะที่โครงข่ายประสาทเทียมแบบ Convolutional

"ตัวอย่างอายุควรจะเน้นชุดข้อมูลที่ไม่มีมิติ - กระโดดอายุและน้ำหนักไม่" กระโดด "หรือสลับค่าสุ่มระหว่างตัวอย่าง - พวกเขาจะไม่สามารถใช้แทนกันและตัวอย่างแสดงให้เห็นว่าแปลกที่จะ (และอย่างไร มันยากที่จะทำให้งานง่าย ๆ เช่นการถดถอยเชิงเส้น) ค่าพิกเซลในภาพ (และข้อมูลที่คล้ายกันในงานการประมวลผลสัญญาณจำนวนมาก) จะแลกเปลี่ยนหรือย้ายได้อย่างง่ายดายเนื่องจากลักษณะของปัญหา - Neil Slater 29 พฤษภาคม 16 เวลา 18:01 น. "

— ชวน
แหล่งที่มา

1

คำอธิบายตรงจากหลักสูตรของ Hinton เกี่ยวกับโครงข่ายประสาทเทียมสำหรับการเรียนรู้ของเครื่อง ...

"การกระโดดมิติเกิดขึ้นเมื่อเราสามารถนำข้อมูลที่มีอยู่ในมิติข้อมูลบางส่วนและย้ายสิ่งนี้ระหว่างมิติในขณะที่ไม่เปลี่ยนเป้าหมายตัวอย่างที่ยอมรับคือ ภาพของตัวเลขที่เขียนด้วยลายมือและแปลมันภายในภาพขนาดที่มี "หมึก" ตอนนี้แตกต่างกัน (ถูกย้ายไปยังมิติอื่น ๆ ) อย่างไรก็ตามฉลากที่เรากำหนดให้กับตัวเลขนั้นไม่ได้เปลี่ยนโปรดทราบว่านี่ไม่ใช่สิ่งที่ ที่เกิดขึ้นอย่างสม่ำเสมอในชุดข้อมูลนั่นคือเราอาจมีชุดข้อมูลที่มีสองหลักที่เขียนด้วยลายมือโดยที่หนึ่งเป็นรุ่นแปลของอื่น ๆ แต่สิ่งนี้ยังคงไม่เปลี่ยนป้ายที่สอดคล้องกันของตัวเลข "

— yottabytt
แหล่งที่มา

0

การหวังว่าจะเป็นเพียงปัญหาเกี่ยวกับส่วนของภาพหรือพิกเซลที่เคลื่อนไหวภายในมิติ (ส่วนใหญ่) และบางครั้งก็เป็นสลัวอื่น ๆ (เขตข้อมูลที่แตกต่างกัน) แต่เอาต์พุตยังคงเหมือนเดิม

ปัญหานี้เกี่ยวข้องกับความไม่แปรเปลี่ยนหรือความไม่เท่าเทียมและดูเหมือนว่าน้ำหนักและอายุตัวอย่างเป็นวิธีที่ง่ายในการระบุ สมมติว่าถ้าเราตระหนักถึงน้ำหนักและอายุการกระโดดนี้เราจะทำการเปลี่ยนแปลง algo และรับผลลัพธ์ที่ถูกต้องได้อย่างง่ายดาย แต่เช่นเดียวกับ data / data hopping การข้ามภาพก็เกิดขึ้นเช่นกันหากเราพิจารณา '4' และ '4' เลื่อนพิกเซลไปทางซ้ายหลาย ๆ ภาพเพื่อเป็นคลาสที่แตกต่างกันซึ่งมีเป้าหมายแตกต่างกัน

ด้วยความแปรปรวนของการแปลหรือความสมดุลที่ดีกว่าตัวกรองการเคลื่อนไหวหรือการกระโดดข้ามนี้ไม่ได้เป็นปัญหามากแม้ว่ามันจะเพิ่มความซับซ้อนและค่าใช้จ่ายในการทิ้งข้อมูลเช่นสถานที่

กรุณาแจ้งให้เราทราบหากคุณต้องการความชัดเจนมากขึ้นฉันจะพยายาม

— ปราดี KL
แหล่งที่มา