การทำความเข้าใจทฤษฎีอวกาศสเกล


10

ในทฤษฎีสเกล - สเกลพื้นที่สเกล - สเปซแทนสัญญาณ , (ในกรณีของภาพ ) จะได้รับเป็น: โดยที่เป็นเคอร์เนล gaussian ที่มีพารามิเตอร์และเป็น convolution โดยการเปลี่ยนพารามิเตอร์เราได้รับภาพที่ราบเรียบมากขึ้นหรือน้อยลง เนื่องจากการเป็นตัวแทน coarser ผลลัพธ์ (พารามิเตอร์ ) จะไม่มีวัตถุขนาดเล็กหรือเสียงรบกวนf(x),x=(x1,...,xd)d=2L(x,y;t)=g(x,y;t)f(x,y)g(x,y;t)ttt

ประเด็นหลักคือการหาวิธีการตรวจจับคุณสมบัติแบบไม่แปรปรวนใช่ไหม? ดังนั้นสำหรับบางภาพที่มีการลดขนาดคัดลอกคุณสมบัติเช่นจุดสำคัญจะถูกตรวจพบอย่างถูกต้องแม้ว่าขนาดจะแตกต่างกันโดยไม่ต้องค้นหาจุดรบกวนอื่น ๆ

  1. ในกระดาษพวกเขากำลังใช้อนุพันธ์ normalized \ อะไรคือความหมายของการใช้ normalized อนุพันธ์มันจะช่วยในการวัดขนาดแบบ invariancy ได้อย่างไร?γδξ,γnorm=tγ/2δxγ

  2. จากภาพนี้เราจะเห็นได้ว่าในตำแหน่งใกล้เคียงกันจุดสำคัญต่าง ๆ ที่พบ (ขนาดแตกต่างกัน) เป็นไปได้อย่างไร?

คุณสมบัติที่ตรวจพบ

หากคุณสามารถอธิบายอัลกอริทึมแบบทีละขั้นตอนของการตรวจจับคุณสมบัติแบบไม่แปรปรวนได้สิ่งนี้จะยอดเยี่ยมมาก เกิดอะไรขึ้นจริง สัญญาซื้อขายล่วงหน้าสามารถนำมาโดยหรือเสื้อหยดสามารถตรวจพบได้โดยการมาของโดยตัวแปร อนุพันธ์ของช่วยที่นี่ได้อย่างไร?x,ytL(x,y)t

กระดาษที่ฉันกำลังอ่านคือ: การตรวจจับคุณสมบัติพร้อมการเลือกระดับอัตโนมัติ

คำตอบ:


3
  1. มันจริงๆได้รับเป็นเวลานานตั้งแต่ฉันได้อ่านเอกสาร Lindeberg ดังนั้นโน้ตที่มีลักษณะแปลก ดังนั้นคำตอบแรกของฉันจึงผิด ไม่ใช่ระดับสเกล ดูเหมือนว่าจะเป็นพารามิเตอร์ของการเรียงลำดับบางอย่างที่สามารถปรับได้ มันเป็นความจริงที่คุณต้องคูณอนุพันธ์โดยอำนาจที่เหมาะสมของเสื้อตัวเองที่สอดคล้องกับระดับขนาดและอำนาจขึ้นอยู่กับคำสั่งของอนุพันธ์γtt

  2. คุณสามารถค้นหาประเด็นสำคัญได้หลายระดับในตำแหน่งเดียวกัน นั่นเป็นเพราะคุณมองหาจุดสูงสุดในพื้นที่เหนือเกล็ด นี่คือสัญชาตญาณลองนึกภาพใบหน้า ในระดับที่ดีคุณจะได้รับหยดที่สอดคล้องกับจมูก ในระดับหลักสูตรคุณจะได้รับหยดที่สอดคล้องกับใบหน้าทั้งหมด สอง blobs อยู่กึ่งกลางที่จุดเดียวกัน แต่มีตาชั่งที่แตกต่างกัน

  3. นี่คืออัลกอริทึมทั้งหมด:

    • ตัดสินใจเลือกคุณสมบัติของภาพที่คุณสนใจ (เช่น blobs, มุม, ขอบ)
    • กำหนด "ฟังก์ชันตัวตรวจจับ" ที่สอดคล้องกันในแง่ของอนุพันธ์เช่น Laplacian สำหรับ blobs
    • คำนวณอนุพันธ์ที่คุณต้องการสำหรับฟังก์ชั่นเครื่องตรวจจับของคุณในระดับต่างๆ
    • ทวีคูณการตอบสนองอนุพันธ์โดยโดยที่คือลำดับของอนุพันธ์เพื่อชดเชยการลดลงของขนาดtmγ/2m
    • คำนวณฟังก์ชั่นของเครื่องตรวจจับในพื้นที่ทั้งหมด
    • ค้นหาสูงสุดในท้องถิ่นของฟังก์ชั่นตรวจจับมากกว่าเสื้อx,y,t
    • นี่คือจุดสนใจหรือจุดสำคัญของคุณ

แก้ไข:

  1. Lindeberg พิสูจน์ในกระดาษว่าเป็นปัจจัยที่เหมาะสมสำหรับการทำให้อนุพันธ์ของอนุพันธ์เป็นปกติ ฉันไม่คิดว่าฉันจะทำซ้ำหลักฐานได้ที่นี่tγ/2
  2. คุณไม่ได้ใช้สัญญาซื้อขายล่วงหน้าที่เกี่ยวกับเสื้อคุณคำนวณอนุพันธ์เฉพาะเทียบกับและแต่คุณคำนวณมันในช่วงของสเกล วิธีหนึ่งที่จะคิดเกี่ยวกับเรื่องนี้คือคุณสร้างพื้นที่ขนาด Gaussian แรกด้วยซ้ำการเบลอภาพที่มีตัวกรอง Gaussian บางแปรปรวนทีจากนั้นคำนวณอนุพันธ์ที่เกี่ยวข้องกับและในแต่ละระดับสเกลx y t x ytxytxy
  3. คุณต้องการค้นหา maxima ท้องถิ่นมากกว่าเครื่องชั่งน้ำหนักเนื่องจากคุณอาจมีคุณสมบัติภาพที่มีขนาดแตกต่างกันในตำแหน่งเดียวกัน คิดว่าภาพของวงกลมศูนย์กลางเหมือนวัวตา มันจะให้การตอบสนองที่ดีของ Laplacian ในหลาย ๆ สเกล หรือคิดว่าภาพของดวงตามนุษย์จริงที่กรองโดย Laplacian ในระดับตาชั่ง คุณจะได้รับการตอบสนองสูงในระดับที่ดีสำหรับนักเรียนการตอบสนองสูงในระดับปานกลางสำหรับม่านตาและการตอบสนองสูงในระดับที่หยาบสำหรับทั้งตา

ประเด็นทั้งหมดคือคุณไม่ทราบว่าคุณลักษณะที่น่าสนใจอาจขยายไปก่อนเวลาใด ดังนั้นคุณดูที่ตาชั่งทั้งหมด


1. เราจะแสดงให้เห็นได้อย่างไรว่านั้นมีตัวคูณมากพอที่จะทำให้การตอบสนองต่ออนุพันธ์ได้รับการปรับให้เป็นมาตรฐานจริง? 2. ฉันคิดว่าการหาอนุพันธ์โดยใช้เพื่อค้นหาพารามิเตอร์เมื่อถึงค่าสูงสุด เพื่อที่จะหาสเกลที่ดีที่สุด ดังนั้นขณะที่คุณกำลังเขียนดูเหมือนว่าฉันต้องคำนวณอนุพันธ์โดยในช่วงที่เลือกทั้งหมด และด้วยเหตุนี้ฉันจะพบว่า (โดยการหาอนุพันธ์ด้วย ) คุณลักษณะต่างๆในระดับต่างๆ ขวา? t t t x , ytγ/2tttx,y
maximus

และตามที่คุณเขียนไว้ใน 3: ค้นหา maxima ท้องถิ่นของฟังก์ชันตัวตรวจจับมากกว่าทำไมเราต้องค้นหา maxima ท้องถิ่นโดย t คุณช่วยอธิบายรายละเอียดขั้นตอนนั้นได้ไหม ที่จริงแล้วอนุพันธ์ของถูกใช้ที่นี่ได้อย่างไร? tx,y,tt
maximus

@maximus โปรดดูการแก้ไขคำตอบ
Dima

@ maximus ฉันเข้าใจผิดมาก่อน แกมมาไม่ใช่ระดับสเกล ฉันได้แก้ไขคำตอบแล้ว
Dima
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.