คำถามติดแท็ก classification

เป็นระบบการจัดกลุ่มวัตถุการศึกษาหรือการสังเกตตามคุณสมบัติทั่วไป ปัญหาการจำแนกประเภทเป็นงานที่เป็นทางการซึ่งชุดของวัตถุ (เคส) แยกออกจากคลาส

5
คำอธิบายคุณลักษณะการปรับขนาดและการหมุน
คุณสามารถแสดงคำอธิบายคุณลักษณะของมาตราส่วนและตัวชี้การหมุนแบบคงที่เพื่อใช้ในการตรวจจับคุณสมบัติหรือไม่ แอปพลิเคชั่นนี้ใช้สำหรับตรวจจับรถยนต์และมนุษย์ในวิดีโอที่ถ่ายโดย UAV โดยใช้ตัวจําแนกหลายคลาส จนถึงตอนนี้ฉันได้ดู SIFT และ MSER (ซึ่งเลียนแบบค่าคงที่) ฉันยังดูที่ LESH, LESH ขึ้นอยู่กับแบบจำลองพลังงานในท้องที่ แต่คำนวณด้วยวิธีที่ไม่แปรเปลี่ยนแบบหมุนได้ฉันพยายามคิดหาวิธีที่จะใช้ประโยชน์จากพลังงานในท้องถิ่นเพื่อสร้างค่าคงที่แบบหมุนได้ คำอธิบายคุณลักษณะฉันอ่านที่นี่มีทางเลือกฟรีอะไรบ้างสำหรับ SIFT / SURF ที่สามารถใช้ในแอปพลิเคชันเชิงพาณิชย์ได้ ว่า "ถ้าคุณกำหนดทิศทางไปยังจุดสนใจและหมุนแผ่นภาพตามนั้นคุณจะได้ค่าความแปรปรวนแบบหมุนได้ฟรี" แต่ไม่รู้ว่าสิ่งนี้จะช่วยบรรเทาได้อย่างไรหรือฉันจะนำสิ่งนี้ไปใช้กับปัญหาของฉันได้อย่างไร ชื่นชมขอบคุณ

4
การแยกคุณลักษณะสำหรับการจำแนกเสียง
ฉันพยายามที่จะแยกคุณสมบัติออกจากไฟล์เสียงและจำแนกเสียงว่าเป็นของประเภทใดหมวดหนึ่ง (เช่น: เปลือกสุนัขเครื่องยนต์ยานพาหนะ ฯลฯ ) ฉันต้องการความชัดเจนในสิ่งต่อไปนี้: 1) สิ่งนี้เป็นไปได้หรือไม่? มีโปรแกรมที่สามารถรู้จำเสียงพูดและแยกแยะความแตกต่างระหว่างชนิดเปลือกสุนัข แต่เป็นไปได้หรือไม่ที่จะมีโปรแกรมที่สามารถรับตัวอย่างเสียงและเพียงแค่พูดว่าเป็นเสียงแบบใด (สมมติว่ามีฐานข้อมูลที่มีตัวอย่างเสียงจำนวนมากที่จะอ้างอิง) ตัวอย่างเสียงอินพุตอาจมีเสียงดังเล็กน้อย (อินพุตไมโครโฟน) 2) ฉันคิดว่าขั้นตอนแรกคือการแยกคุณสมบัติเสียง นี้บทความแสดงให้เห็นการแยก MFCCs และการให้อาหารพวกเขาไปยังขั้นตอนวิธีการเรียนรู้ของเครื่อง MFCC เพียงพอหรือไม่ มีคุณสมบัติอื่น ๆ ที่ใช้โดยทั่วไปสำหรับการจำแนกเสียงหรือไม่ ขอขอบคุณสำหรับเวลาของคุณ.

1
การจำแนกภาพโดยใช้คุณสมบัติ SIFT และ SVM
ฉันหวังว่าใครบางคนสามารถอธิบายวิธีการใช้ถุงรูปแบบคำในการจำแนกภาพโดยใช้คุณสมบัติ SIFT / SURF / ORB และเครื่องเวกเตอร์สนับสนุน ในขณะนี้ฉันสามารถคำนวณเวกเตอร์ฟีเจอร์ SIFT สำหรับรูปภาพและนำ SVM มาใช้อย่างไรก็ตามฉันพบว่ามันยากที่จะเข้าใจวรรณกรรมเกี่ยวกับวิธีใช้รูปแบบคำในกระเป๋าเพื่อ 'vector quantize' คุณสมบัติ SIFT และสร้างฮิสโตแกรมที่ให้ เวกเตอร์ขนาดคงที่สามารถใช้ในการฝึกอบรมและทดสอบ SVM ยินดีต้อนรับทุกลิงก์ไปยังบทเรียนหรือวรรณกรรมในหัวข้อ

2
ฉันจะดึงข้อมูลพื้นผิวโดยใช้ GLCM และจำแนกประเภทโดยใช้ตัวแยกประเภท SVM ได้อย่างไร
ฉันอยู่ในโครงการการแบ่งส่วนและจำแนกเนื้องอกของตับ ฉันใช้ Region Growing และ FCM สำหรับการแบ่งส่วนตับและเนื้องอกตามลำดับ จากนั้นฉันใช้เมทริกซ์ระดับสีเทาร่วมเกิดขึ้นสำหรับการแยกคุณลักษณะของพื้นผิว ฉันต้องใช้ Support Vector Machine เพื่อจัดหมวดหมู่ แต่ฉันไม่ทราบวิธีปรับเวกเตอร์คุณลักษณะให้เป็นมาตรฐานเพื่อที่ฉันจะสามารถให้มันเป็นอินพุตของ SVM ได้ มีใครบอกวิธีเขียนโปรแกรมใน Matlab ได้บ้าง ในโปรแกรม GLCM ฉันให้ภาพที่แบ่งกลุ่มเนื้องอกเป็นอินพุต ฉันถูกต้องหรือไม่ ถ้าเป็นเช่นนั้นฉันคิดว่าผลลัพธ์ของฉันก็จะถูกต้องด้วย การเข้ารหัส glcm ของฉันเท่าที่ฉันได้ลองคือ I = imread('fzliver3.jpg'); GLCM = graycomatrix(I,'Offset',[2 0;0 2]); stats = graycoprops(GLCM,'all') t1= struct2array(stats) I2 = imread('fzliver4.jpg'); GLCM2 = graycomatrix(I2,'Offset',[2 0;0 2]); stats2 = …

2
วิธีการใดที่ใช้สำหรับการแยกแยะความแตกต่างของเสียง (ดนตรี?)
ฉันพยายามค้นคว้าและหาวิธีที่ดีที่สุดในการโจมตีปัญหานี้ มันเลาะเลียบไปกับการประมวลผลเพลงการประมวลผลภาพและการประมวลผลสัญญาณและดังนั้นจึงมีวิธีมากมายในการดู ฉันต้องการสอบถามวิธีการที่ดีที่สุดในการเข้าหามันเนื่องจากสิ่งที่อาจดูซับซ้อนในโดเมน sig-proc บริสุทธิ์อาจเป็นเรื่องง่าย (และแก้ไขแล้ว) โดยผู้ที่ทำภาพหรือการประมวลผลเพลง อย่างไรก็ตามปัญหามีดังนี้: หากคุณยกโทษให้ฉันด้วยการวาดปัญหาเราจะเห็นสิ่งต่อไปนี้: f1f1f_1f4f4f_4 f1f1f_1 f1f1f_1 ปัญหาคือในทางใดที่ฉันจะแก้ไขปัญหานี้เช่นฉันสามารถเขียนลักษณนามที่สามารถแยกแยะระหว่างสัญญาณ -1 สัญญาณ 2 และสัญญาณ 3 นั่นคือถ้าคุณป้อนสัญญาณสัญญาณใดสัญญาณหนึ่งมันควรจะบอกได้ว่าสัญญาณนี้เป็นเช่นนั้น สิ่งที่ดีที่สุดของลักษณนามจะให้เมทริกซ์ความสับสนในแนวทแยง? บริบทเพิ่มเติมบางอย่างและสิ่งที่ฉันคิดเกี่ยวกับป่านนี้: อย่างที่ฉันพูดไปนี้เลาะเลียบทุ่งจำนวนมาก ฉันต้องการสอบถามเกี่ยวกับวิธีการที่อาจมีอยู่ก่อนที่ฉันจะนั่งลงและไปทำสงครามกับสิ่งนี้ ฉันไม่ต้องการประดิษฐ์ล้ออีกครั้งโดยไม่ได้ตั้งใจ นี่คือความคิดบางอย่างที่ฉันได้มองจากมุมมองที่แตกต่างกัน มุมมองการประมวลผลสัญญาณ: สิ่งหนึ่งที่ฉันได้ดูคือทำการวิเคราะห์ Cepstralและจากนั้นอาจใช้Gabor Bandwidthของ cepstrum ในการแยกแยะสัญญาณ -3 จากอีก 2 และจากนั้นวัดจุดสูงสุดสูงสุดของ cepstrum ในการแยกสัญญาณ - 1 จากสัญญาณ -2 นั่นเป็นโซลูชันการทำงานการประมวลผลสัญญาณปัจจุบันของฉัน จุดยืนของการประมวลผลภาพ: ที่นี่ฉันกำลังคิดอยู่เพราะในความเป็นจริงฉันสามารถสร้างภาพที่มีสเปคตรัมได้หรือเปล่า ฉันไม่คุ้นเคยอย่างใกล้ชิดกับส่วนนี้ แต่สิ่งที่เกี่ยวกับการทำ 'เส้น' ตรวจจับโดยใช้การแปลง Houghแล้วอย่างใด 'นับ' …

3
การจำแนกพื้นผิวด้วย DCT
มันจะทำงานได้อย่างไรในการจำแนกพื้นผิวของภาพโดยใช้คุณสมบัติจากการแปลงโคไซน์แบบแยก? Googling "การจำแนกพื้นผิว dct" จะพบรายงานทางวิชาการเพียงเรื่องเดียวในหัวข้อนี้โดยใช้เครือข่ายประสาท สำหรับแอปพลิเคชันของฉันฉันมีคลังข้อมูลขนาดใหญ่ของภาพซึ่งในภาพทั้งหมดเป็นพื้นผิวที่สอดคล้องกัน (เช่นภาพโคลสอัพของผ้าห่มเปลือกไม้ต้นไม้ทุ่งหญ้า ฯลฯ ) ได้รับแรงบันดาลใจจากการตอบคำถามก่อนหน้านี้ฉันกำลังพิจารณาแนวทางต่อไปนี้: แยกแต่ละภาพออกเป็นบล็อก NxN ของพิกเซล ใช้ DCT ของแต่ละบล็อก บีบ DCT แต่ละอันให้เป็นอาร์เรย์ 1xM และป้อนเข้ากับอัลกอริทึมการจัดกลุ่ม K-Means และรับฉลากคลัสเตอร์สำหรับ DCT แต่ละตัว คำนวณฮิสโตแกรมของการทำคลัสเตอร์ป้ายสำหรับแต่ละภาพโดยการนับแต่ละป้ายต่อภาพจาก # 3 ฝึกอบรมตัวจําแนก SVM โดยป้อนชุด [(ฮิสโตแกรม, ป้ายรูปภาพ) มันจะทำงานได้ดีแค่ไหน? ฉันใช้ระบบที่คล้ายกันโดยใช้คุณสมบัติที่แยกผ่านอัลกอริทึม SIFT / SURF แต่ฉันสามารถได้รับความแม่นยำประมาณ 60% เท่านั้น ฉันสามารถใช้ DCT ในวิธีอื่นในการจำแนกพื้นผิวได้อย่างไร?

2
ตัวชี้วัดที่ดีสำหรับการเปรียบเทียบแพทช์ภาพในเชิงคุณภาพ
ฉันพยายามที่จะ "จับคู่" แพทช์สี่เหลี่ยมเล็ก ๆ ในภาพ เมื่อดูอย่างรวดเร็วครั้งแรกดูเหมือนว่ามีเหตุผลที่จะทำการเปรียบเทียบรูปแบบระยะทางแบบยุคลิดของสองอาร์เรย์เพื่อรับค่า "ความคล้ายคลึงกัน" วิธีนี้ใช้งานได้ดีในหลายกรณี (ตัวแก้ไข "ที่ดีที่สุด" (ค่าต่ำสุด) ตามตัวชี้วัดนี้จะมีลักษณะคล้ายกับตัวแก้ไขแบบสอบถาม) อย่างไรก็ตามมีหลายกรณีที่ทำให้เกิดการแข่งขันที่แย่มาก ตัวอย่างเช่นใช้แพทช์คู่เหล่านี้: กำแพงอิฐสองแผ่นคะแนน 134 (นี่คือผลรวมของส่วนประกอบของความแตกต่างของพิกเซลแบบสัมบูรณ์เฉลี่ย): หนึ่งชิ้นของกำแพงอิฐ, หนึ่งหญ้าเต็มไปด้วยคะแนน 123! สำหรับมนุษย์ "ชัดเจน" หญ้าไม่ตรงกับอิฐ แต่ตัวชี้วัดนี้พูดเป็นอย่างอื่น ปัญหาอยู่ในรูปแบบสถิติท้องถิ่น ถ้าฉันใช้บางอย่างเช่นการเปรียบเทียบฮิสโตแกรมฉันจะสูญเสียข้อมูลเชิงพื้นที่ทั้งหมด - เช่นถ้าแพทช์เป็นหญ้าที่ด้านบนและอิฐที่ด้านล่างมันจะจับคู่กับแพทช์ที่มีหญ้าอยู่ด้านล่างและอิฐที่ด้านบน การแข่งขันอื่น "ผิดปกติอย่างเห็นได้ชัด") มีตัวชี้วัดที่ผสมผสานแนวคิดทั้งสองนี้เข้ากับค่าที่สมเหตุสมผลซึ่งจะประเมินว่า "คล้ายกัน" สำหรับคู่ที่ 1 ข้างต้น แต่ไม่เหมือนกันสำหรับตัวอย่างของแพทช์และกระจกแนวตั้งของฉันหรือไม่ ข้อเสนอแนะใด ๆ ที่ได้รับการชื่นชม!

3
เหตุใดจึงเปลี่ยนข้อมูลเป็นพื้นที่คุณลักษณะมิติสูงซึ่งคลาสใดที่แยกกันเป็นเส้นตรงนำไปสู่การ overfitting?
ฉันอ่านในหนังสือของฉัน (การจำแนกรูปแบบทางสถิติโดย Webb และ Wiley) ในส่วนเกี่ยวกับ SVM และข้อมูลที่ไม่สามารถแบ่งแยกได้แบบเส้นตรง: ในปัญหาที่เกิดขึ้นจริงในโลกแห่งความเป็นจริงหลายอย่างจะไม่มีขอบเขตเชิงเส้นคั่นระหว่างชั้นเรียนและปัญหาของการค้นหาไฮเปอร์เพลนแบบแยกที่ดีที่สุดนั้นไร้ความหมาย แม้ว่าเราจะต้องใช้เวกเตอร์ฟีเจอร์ที่ซับซ้อนเพื่อแปลงข้อมูลให้เป็นพื้นที่คุณลักษณะมิติสูงซึ่งคลาสแยกกันเป็นเส้นตรงซึ่งจะนำไปสู่การปรับข้อมูลให้เหมาะสมมากเกินไป .Φ ( x )Φ(x)\Phi(x) เหตุใดจึงเปลี่ยนข้อมูลเป็นพื้นที่คุณลักษณะมิติสูงซึ่งคลาสใดที่แยกกันเป็นเส้นตรงนำไปสู่การ overfitting และความสามารถในการวางหลักเกณฑ์ทั่วไปไม่ดี?

1
ฉันจะจำแนกสัญญาณที่วัดได้ที่ตำแหน่งต่าง ๆ โดยอัตโนมัติได้อย่างไร
ฉันมีไมโครโฟนที่วัดเสียงเมื่อเวลาผ่านไปในหลาย ๆ ตำแหน่งในอวกาศ เสียงที่ถูกบันทึกทั้งหมดมาจากตำแหน่งเดียวกันในอวกาศ แต่เนื่องจากเส้นทางที่แตกต่างจากจุดต้นทางไปยังไมโครโฟนแต่ละตัว สัญญาณจะถูกเปลี่ยน (เวลา) และผิดเพี้ยน ความรู้เบื้องต้นได้ถูกนำมาใช้เพื่อชดเชยเวลาที่ดีที่สุดเท่าที่จะทำได้ แต่ก็ยังมีการเปลี่ยนแปลงเวลาอยู่ในข้อมูล ยิ่งตำแหน่งการวัดใกล้เคียงกับสัญญาณมากเท่าไหร่ ฉันสนใจที่จะจำแนกยอดเขาโดยอัตโนมัติ ด้วยสิ่งนี้ฉันหมายความว่าฉันกำลังมองหาอัลกอริทึมที่ "มอง" ที่สัญญาณไมโครโฟนสองตัวในพล็อตด้านล่างและ "จดจำ" จากตำแหน่งและรูปคลื่นที่มีสองเสียงหลักและรายงานตำแหน่งเวลาของพวกเขา: sound 1: sample 17 upper plot, sample 19 lower plot, sound 2: sample 40 upper plot, sample 38 lower plot ในการทำเช่นนี้ฉันวางแผนที่จะทำการขยาย Chebyshev รอบจุดสูงสุดแต่ละจุดและใช้เวกเตอร์ของสัมประสิทธิ์ Chebyshev เป็นอินพุตไปยังอัลกอริธึมคลัสเตอร์ (k-mean?) ดังตัวอย่างต่อไปนี้เป็นส่วนหนึ่งของสัญญาณเวลาที่วัดที่ตำแหน่งใกล้เคียงสอง (สีน้ำเงิน) ประมาณ 5 ชุดโดย Chebyshev มากกว่า …

1
การแบ่งส่วนและติดตามยานพาหนะ
ฉันทำงานเกี่ยวกับโปรเจคมาระยะหนึ่งเพื่อตรวจจับและติดตามยานพาหนะในวิดีโอที่ถ่ายจาก UAV ในขณะนี้ฉันใช้ SVM ที่ได้รับการฝึกอบรมเกี่ยวกับการนำเสนอคุณสมบัติถุงของคุณลักษณะท้องถิ่นที่ดึงมาจากยานพาหนะและภาพพื้นหลัง จากนั้นฉันใช้วิธีตรวจจับหน้าต่างแบบเลื่อนเพื่อลองและ จำกัด ยานพาหนะในรูปภาพซึ่งฉันต้องการติดตาม ปัญหาคือวิธีการนี้ช้าและตัวตรวจจับของฉันไม่น่าเชื่อถือเท่าที่ฉันต้องการดังนั้นฉันจึงได้รับผลบวกที่ผิดพลาดเล็กน้อย ดังนั้นฉันจึงพิจารณาที่จะพยายามแบ่งส่วนรถยนต์จากพื้นหลังเพื่อค้นหาตำแหน่งโดยประมาณเพื่อลดพื้นที่การค้นหาก่อนที่จะใช้ตัวจําแนกของฉัน แต่ฉันไม่แน่ใจว่าจะไปเกี่ยวกับเรื่องนี้อย่างไรและหวังว่าจะมีคนช่วย นอกจากนี้ฉันได้อ่านเกี่ยวกับการแบ่งส่วนการเคลื่อนไหวด้วยเลเยอร์โดยใช้ออปติคัลโฟลว์เพื่อแบ่งเฟรมตามโมเดลโฟลว์ไม่มีใครมีประสบการณ์ใด ๆ กับวิธีการนี้ถ้าเป็นเช่นนั้นคุณสามารถให้อินพุตบางส่วนได้หรือไม่ ปัญหาของฉัน UPDATE : ฉันโพสต์คำถามนี้ไว้ใน stack overflow ด้วยและมีคำตอบที่ยอดเยี่ยมฉันได้ใช้ความคิดนี้ไปแล้วและมันก็ทำงานได้ดีมากและตอนนี้ฉันก็กำลังตรวจสอบการใช้ optical flow นอกเหนือจากเทคนิคนี้ ด้านล่างเป็นสองเฟรมจากวิดีโอตัวอย่าง กรอบ 0: กรอบ 5:

1
การจดจำข้อมูลที่ทำคลัสเตอร์เป็นรูปร่าง
ฉันกำลังทำงานในโครงการใน Python เพื่อตรวจจับและจำแนกเพลงนกบางเพลงและฉันพบว่าตัวเองอยู่ในตำแหน่งที่ฉันต้องการแปลงไฟล์คลื่นเป็นความถี่เทียบกับข้อมูลเวลา นี่ไม่ได้มีปัญหามากนัก แต่เพื่อให้สามารถจำแนกพยางค์ที่แตกต่างกันออกเป็นกลุ่มฉันต้องเขียนสิ่งที่จะตรวจจับเมื่อกลุ่มข้อมูลเป็นรูปร่างที่แน่นอน เพื่อให้คุณเห็นภาพว่าข้อมูลเป็นอย่างไรต่อไปนี้เป็นภาพที่แสดงข้อมูลเมื่อมีการพล็อต: ฉันต้องการวิธีที่จะทำให้แต่ละพยางค์ (แต่ละรูปร่างมีการแยกทั้งสองข้าง) และบันทึกไว้ในตัวแปรหรือไฟล์ของตัวเองเพื่อให้ฉันสามารถเรียกใช้ความสัมพันธ์เพียร์สันระหว่างพวกเขาโดยใช้ SciPy นอกจากนี้ฉันชอบ Python แต่ฉันเปิดให้มีการเข้ารหัสในภาษาอื่นถ้าคุณมีวิธีอื่นที่จะทำ ขอบคุณ!
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.