คำถามติดแท็ก computer-vision

2
วิธีการคำนวณ mAP สำหรับภารกิจตรวจจับสำหรับ PASCAL VOC Challenge?
วิธีการคำนวณ mAP (หมายถึงความแม่นยำเฉลี่ย) สำหรับภารกิจตรวจจับสำหรับผู้นำ Pascal VOC ได้อย่างไร http://host.robots.ox.ac.uk:8080/leaderboard/displaylb.php?challengeid=11&compid=4 มีการกล่าว - ที่หน้า 11 : http://homepages.inf.ed.ac.uk/ckiw/postscript/ijcv_voc09.pdf ความแม่นยำเฉลี่ย (AP) สำหรับความท้าทาย VOC2007 ความแม่นยำเฉลี่ยแบบสอดแทรก (Salton และ Mcgill 1986) ถูกใช้เพื่อประเมินทั้งการจำแนกและการตรวจจับ สำหรับงานและคลาสที่กำหนดเส้นโค้งความแม่นยำ / การเรียกคืนถูกคำนวณจากเอาต์พุตอันดับของวิธีการ การเรียกคืนถูกกำหนดให้เป็นสัดส่วนของตัวอย่างเชิงบวกทั้งหมดที่จัดอันดับอยู่เหนืออันดับที่กำหนด ความแม่นยำคือสัดส่วนของตัวอย่างทั้งหมดข้างต้นที่อยู่ในระดับบวก AP สรุปรูปร่างของเส้นโค้งความแม่นยำ / การเรียกคืนและถูกกำหนดเป็นความแม่นยำเฉลี่ยที่ชุดของสิบเอ็ดระดับการเรียกคืนที่เว้นระยะเท่ากัน AP = 1/11 ∑ r∈{0,0.1,...,1} pinterp(r) ความแม่นยำในการเรียกคืนแต่ละระดับ r ถูกสอดแทรกโดยการวัดความแม่นยำสูงสุดสำหรับวิธีที่การเรียกคืนที่สอดคล้องกันเกินกว่า r: pinterp(r) = max p(r˜)โดยที่ p (r˜) คือความแม่นยำที่วัดได้ที่การเรียกคืน …

4
อะไรคือความแตกต่างระหว่าง Inception v2 และ Inception v3?
บทความที่ลึกซึ้งยิ่งขึ้นเกี่ยวกับการโน้มน้าวใจอธิบายถึง GoogleNet ซึ่งมีโมดูลการลงทะเบียนดั้งเดิม: การเปลี่ยนเป็นการเริ่มต้น v2 คือพวกเขาแทนที่การ convolutions 5x5 โดยการ convolutions 3x3 ที่ต่อเนื่องกันสองครั้งและใช้การรวมกำไร: อะไรคือความแตกต่างระหว่าง Inception v2 และ Inception v3?

3
สัญกรณ์ mAP @ [. 5: .95] หมายถึงอะไร?
สำหรับการตรวจจับวิธีทั่วไปในการพิจารณาว่าข้อเสนอวัตถุหนึ่งถูกต้องหรือไม่คือIntersection over Union (IoU, IU) สิ่งนี้ใช้ชุดของออบเจกต์พิกเซลที่เสนอและชุดของออบเจ็กต์พิกเซลจริงและคำนวณ:BAAABBB ผมo คุณ( A , B ) = A ∩ BA ∪ Bผมโอยู(A,B)=A∩BA∪BIoU(A, B) = \frac{A \cap B}{A \cup B} โดยทั่วไป IoU> 0.5 หมายความว่ามันเป็นที่นิยมมิฉะนั้นจะเกิดความล้มเหลว สำหรับแต่ละชั้นเรียนหนึ่งสามารถคำนวณ True Positive ( ): ข้อเสนอถูกสร้างขึ้นสำหรับคลาสและจริง ๆ แล้วเป็นวัตถุของคลาสc cTP( c )TP(ค)TP(c)คคcคคc False Positive ( ): มีการทำข้อเสนอสำหรับคลาสแต่ไม่มีวัตถุของคลาสc cFP( c )FP(ค)FP(c)คคcคคc ความแม่นยำเฉลี่ยสำหรับคลาส :# …

3
ทำไม Convolutions จึงใช้เลขคี่เป็นตัวกรอง
ถ้าเราดูเอกสารที่ตีพิมพ์ 90-99% โดยใช้ CNN (ConvNet) ส่วนใหญ่ใช้ขนาดตัวกรองของตัวเลขคี่ : {1, 3, 5, 7} สำหรับการใช้งานมากที่สุด สถานการณ์นี้อาจนำไปสู่ปัญหาบางอย่าง: ด้วยขนาดตัวกรองเหล่านี้โดยปกติแล้วการดำเนินการสังวัตนาจะไม่สมบูรณ์แบบด้วยการเติม 2 (การเติมทั่วไป) และขอบบางส่วนของ input_field หายไปในกระบวนการ ... คำถามที่ 1:เหตุใดจึงใช้เพียง odd_numbers สำหรับขนาดตัวกรอง Convolutions คำถามที่ 2:จริง ๆ แล้วมันเป็นปัญหาที่จะละเว้นส่วนเล็ก ๆ ของ input_field ในระหว่างการโน้มน้าว? ทำไมต้องเป็นเช่นนั้น /

3
มีรูปแบบภาษาที่ดีนอกกรอบสำหรับงูใหญ่หรือไม่?
ฉันกำลังสร้างต้นแบบแอปพลิเคชันและฉันต้องการโมเดลภาษาเพื่อคำนวณความงุนงงในประโยคที่สร้างขึ้น มีรูปแบบภาษาที่ผ่านการฝึกอบรมในภาษาไพ ธ อนที่ฉันสามารถใช้ได้หรือไม่? บางสิ่งที่เรียบง่ายเช่น model = LanguageModel('en') p1 = model.perplexity('This is a well constructed sentence') p2 = model.perplexity('Bunny lamp robert junior pancake') assert p1 < p2 ฉันดูบางกรอบ แต่ไม่สามารถค้นหาสิ่งที่ฉันต้องการ ฉันรู้ว่าฉันสามารถใช้สิ่งที่ชอบ: from nltk.model.ngram import NgramModel lm = NgramModel(3, brown.words(categories='news')) สิ่งนี้ใช้การแจกแจงความน่าจะเป็นที่ดีใน Brown Corpus แต่ฉันกำลังมองหาโมเดลที่สร้างขึ้นอย่างดีในชุดข้อมูลขนาดใหญ่เช่นชุดข้อมูลคำ 1b สิ่งที่ฉันสามารถเชื่อถือได้จริง ๆ ผลลัพธ์สำหรับโดเมนทั่วไป (ไม่เพียงข่าว)
11 python  nlp  language-model  r  statistics  linear-regression  machine-learning  classification  random-forest  xgboost  python  sampling  data-mining  orange  predictive-modeling  recommender-system  statistics  dimensionality-reduction  pca  machine-learning  python  deep-learning  keras  reinforcement-learning  neural-network  image-classification  r  dplyr  deep-learning  keras  tensorflow  lstm  dropout  machine-learning  sampling  categorical-data  data-imputation  machine-learning  deep-learning  machine-learning-model  dropout  deep-network  pandas  data-cleaning  data-science-model  aggregation  python  neural-network  reinforcement-learning  policy-gradients  r  dataframe  dataset  statistics  prediction  forecasting  r  k-means  python  scikit-learn  labels  python  orange  cloud-computing  machine-learning  neural-network  deep-learning  rnn  recurrent-neural-net  logistic-regression  missing-data  deep-learning  autoencoder  apache-hadoop  time-series  data  preprocessing  classification  predictive-modeling  time-series  machine-learning  python  feature-selection  autoencoder  deep-learning  keras  tensorflow  lstm  word-embeddings  predictive-modeling  prediction  machine-learning-model  machine-learning  classification  binary  theory  machine-learning  neural-network  time-series  lstm  rnn  neural-network  deep-learning  keras  tensorflow  convnet  computer-vision 

2
อะไรคือความแตกต่างระหว่าง Dilated Convolution และ Deconvolution?
การปฏิบัติการสองอย่างนี้เป็นเรื่องธรรมดามากในการเรียนรู้อย่างลึกซึ้งในขณะนี้ ฉันอ่านเกี่ยวกับชั้น convolutional ที่ถูกทำให้พองในบทความนี้: WAVENET: รูปแบบทั่วไปสำหรับไฟล์เสียง RAW และ De-convolution อยู่ในบทความนี้: เครือข่าย Convolutional สำหรับการแบ่งส่วนแบบ Semantic ทั้งคู่ดูเหมือนจะยกตัวอย่างภาพ แต่ความแตกต่างคืออะไร?

5
การแบ่งส่วนภาพที่ไม่ได้รับอนุญาต
ฉันพยายามที่จะใช้อัลกอริทึมที่ให้ภาพกับวัตถุต่าง ๆ บนตารางระนาบที่ต้องการคือผลลัพธ์ของรูปแบบการแบ่งส่วนสำหรับแต่ละวัตถุ แตกต่างจากของ CNN จุดประสงค์ที่นี่คือการตรวจจับวัตถุในสภาพแวดล้อมที่ไม่คุ้นเคย อะไรคือแนวทางที่ดีที่สุดในการแก้ไขปัญหานี้? นอกจากนี้ยังมีตัวอย่างการนำไปใช้งานทางออนไลน์หรือไม่ แก้ไข: ฉันขอโทษคำถามอาจทำให้เข้าใจผิดเล็กน้อย สิ่งที่ฉันหมายถึงโดย "สภาพแวดล้อมที่ไม่คุ้นเคย" คืออัลกอริทึมอาจไม่เป็นที่รู้จัก อัลกอริทึมไม่จำเป็นต้องเข้าใจว่าวัตถุคืออะไร แต่ควรตรวจจับวัตถุเท่านั้น ฉันจะแก้ไขปัญหานี้ได้อย่างไร

2
ฉันจะตรวจสอบได้อย่างไรว่ามีการเปลี่ยนรูปถ่าย?
ฉันต้องการตรวจสอบไฟล์ JPG หากพวกเขาถูกปรับเปลี่ยนเนื้อหา สิ่งที่ฉันพิจารณาไม่ใช่รูปถ่าย: การปลูกพืช หมุน (Scaling) ความละเอียดของภาพ การเปลี่ยนแปลงอัตโนมัติอาจทำให้สมาร์ทโฟน สิ่งที่ฉันคิดว่าการถ่ายภาพ: การเพิ่มรูปภาพใหม่ที่ด้านบนของส่วนต่าง ๆ ของภาพเก่า การเปลี่ยนข้อความของส่วนหนึ่งของภาพ จะตรวจสอบสิ่งนี้โดยอัตโนมัติได้อย่างไร (และ: มีไลบรารีที่พร้อมใช้งานหรือไม่)

1
จำนวนพารามิเตอร์สำหรับเลเยอร์ convolution
ในบทความที่อ้างถึงอย่างสูงนี้ผู้เขียนให้คำอธิบายเกี่ยวกับจำนวนพารามิเตอร์น้ำหนัก ฉันไม่ชัดเจนว่าทำไมมันมีพารามิเตอร์ฉันคิดว่ามันควรจะเป็นเนื่องจากแต่ละช่องสัญญาณใช้ตัวกรองเดียวกันร่วมกันซึ่งมีพารามิเตอร์49C249C249C^249C49C49CCCC494949

2
มีการศึกษาใดที่ตรวจสอบการออกกลางคันเทียบกับการทำให้เป็นมาตรฐานอื่น ๆ ?
มีเอกสารใดที่ตีพิมพ์ซึ่งแสดงความแตกต่างของวิธีการทำให้เป็นมาตรฐานสำหรับเครือข่ายประสาทโดยเฉพาะอย่างยิ่งในโดเมนที่ต่างกัน (หรืออย่างน้อยชุดข้อมูลที่แตกต่างกัน) ฉันถามเพราะตอนนี้ฉันมีความรู้สึกว่าคนส่วนใหญ่ดูเหมือนจะใช้การออกกลางคันสำหรับการมองเห็นในคอมพิวเตอร์เป็นประจำ ฉันต้องการตรวจสอบว่ามีเหตุผล (ไม่) ที่จะใช้วิธีการทำให้เป็นมาตรฐานแบบต่างๆ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.