คำถามติดแท็ก uncertainty

แนวคิดกว้าง ๆ เกี่ยวกับการขาดความรู้โดยเฉพาะอย่างยิ่งการขาดหรือความไม่แม่นยำของข้อมูลเชิงปริมาณเกี่ยวกับกระบวนการหรือประชากรที่สนใจ

4
ข้อสันนิษฐานเกี่ยวกับการประมาณการ bootstrap ของความไม่แน่นอน
ฉันขอขอบคุณความมีประโยชน์ของ bootstrap ในการได้รับการประเมินความไม่แน่นอน แต่สิ่งหนึ่งที่รบกวนฉันอยู่เสมอเกี่ยวกับเรื่องนี้คือการกระจายตัวที่สอดคล้องกับการประมาณการเหล่านั้นคือการกระจายตัวที่กำหนดโดยกลุ่มตัวอย่าง โดยทั่วไปดูเหมือนว่าเป็นความคิดที่ดีที่จะเชื่อว่าความถี่ตัวอย่างของเรามีลักษณะเหมือนกับการแจกแจงพื้นฐานดังนั้นเหตุใดจึงเป็นที่ยอมรับกันโดยทั่วไปว่าการประเมินความไม่แน่นอนขึ้นอยู่กับการกระจายที่ความถี่ตัวอย่างกำหนดการแจกแจงต้นแบบ ในทางกลับกันสิ่งนี้อาจไม่เลว (อาจดีกว่า) กว่าสมมติฐานการกระจายอื่น ๆ ที่เรามักทำ แต่ฉันก็ยังต้องการที่จะเข้าใจเหตุผลที่ดีกว่า

4
ทำไม softmax เอาท์พุตจึงไม่ใช่สิ่งที่ไม่แน่นอนสำหรับการเรียนรู้แบบลึก?
ฉันได้ทำงานกับ Convolutional Neural Networks (CNNs) มาระยะหนึ่งแล้วซึ่งส่วนใหญ่เป็นข้อมูลภาพสำหรับเซกเมนต์เซกเมนต์ / เซกเมนต์อินสแตนซ์ ฉันมักจะเห็นภาพซอฟต์แม็กซ์ของเอาต์พุตเครือข่ายเป็น "แผนที่ความร้อน" เพื่อดูว่าการเปิดใช้งานพิกเซลต่อคลาสสำหรับระดับหนึ่งนั้นสูงเพียงใด ฉันตีความการเปิดใช้งานในระดับต่ำว่า "ไม่แน่นอน" / "ไม่มั่นใจ" และมีการเปิดใช้งานสูงตามการคาดการณ์ "มั่นใจ" / "มั่นใจ" โดยทั่วไปสิ่งนี้หมายถึงการตีความเอาต์พุต softmax (ค่าภายใน( 0 , 1 )(0,1)(0,1) ) เป็นความน่าจะเป็นหรือ (ไม่) การวัดความแน่นอนของโมเดล ( เช่นฉันตีความวัตถุ / พื้นที่ที่มีการเปิดใช้งานซอฟต์แม็กซ์ต่ำโดยเฉลี่ยอยู่ที่พิกเซลของมันยากสำหรับ CNN ในการตรวจจับดังนั้น CNN จึง "ไม่แน่ใจ" เกี่ยวกับการทำนายวัตถุชนิดนี้ ) ในการรับรู้ของฉันนี้มักจะทำงานและเพิ่มตัวอย่างเพิ่มเติมของพื้นที่ "ไม่แน่นอน" เพื่อผลลัพธ์การฝึกอบรมปรับปรุงผลลัพธ์เหล่านี้ อย่างไรก็ตามตอนนี้ฉันได้ยินมาค่อนข้างบ่อยจากหลาย ๆ ด้านที่การใช้ / การตีความเอาต์พุต softmax …

1
ฉันสามารถแปลงเมทริกซ์ความแปรปรวนร่วมเป็นความไม่แน่นอนของตัวแปรได้หรือไม่?
ฉันมีหน่วย GPS ที่ให้เอาต์พุตการวัดสัญญาณรบกวนผ่านเมทริกซ์ความแปรปรวนร่วม :ΣΣ\Sigma Σ=⎡⎣⎢σxxσyxσxzσxyσyyσyzσxzσyzσzz⎤⎦⎥Σ=[σxxσxyσxzσyxσyyσyzσxzσyzσzZ]\Sigma = \left[\begin{matrix} \sigma_{xx} & \sigma_{xy} & \sigma_{xz} \\ \sigma_{yx} & \sigma_{yy} & \sigma_{yz} \\ \sigma_{xz} & \sigma_{yz} & \sigma_{zz} \end{matrix}\right] (นอกจากนี้ยังมีมีส่วนร่วม แต่ขอไม่สนใจว่าเป็นครั้งที่สอง.)เสื้อเสื้อt สมมติว่าฉันต้องการบอกคนอื่นว่าความถูกต้องในแต่ละทิศทาง ( ) คือจำนวนหนึ่ง μ x , μ Y , μ Z กล่าวคือ GPS ของฉันอาจให้ฉันอ่านx = ˉ x ± μ xฯลฯ ความเข้าใจของฉันคือx,y, zx,Y,Zx,y,zμx, …

4
การประเมินความหนาแน่นของเคอร์เนลที่รวมความไม่แน่นอน
เมื่อแสดงข้อมูลมิติเดียวเป็นเรื่องปกติที่จะใช้เทคนิคการประมาณความหนาแน่นเคอร์เนลเพื่ออธิบายความกว้างของถังขยะที่เลือกอย่างไม่เหมาะสม เมื่อชุดข้อมูลหนึ่งมิติของฉันมีความไม่แน่นอนในการวัดมีวิธีมาตรฐานในการรวมข้อมูลนี้หรือไม่ ตัวอย่างเช่น (และให้อภัยฉันถ้าความเข้าใจของฉันไร้เดียงสา) KDE โน้มน้าวโปรไฟล์เกาส์เซียนด้วยฟังก์ชันเดลต้าของการสังเกต เคอร์เนล Gaussian นี้ใช้ร่วมกันระหว่างแต่ละตำแหน่ง แต่พารามิเตอร์Gaussianอาจมีการเปลี่ยนแปลงเพื่อให้ตรงกับความไม่แน่นอนของการวัด มีวิธีการมาตรฐานในการดำเนินการนี้หรือไม่? ฉันหวังว่าจะสะท้อนให้เห็นถึงคุณค่าที่ไม่แน่นอนกับเมล็ดที่กว้างσσ\sigma ฉันได้ใช้งานสิ่งนี้ใน Python แต่ฉันไม่รู้วิธีหรือฟังก์ชันมาตรฐานในการทำสิ่งนี้ มีปัญหาใด ๆ ในเทคนิคนี้หรือไม่? ฉันทราบว่ามันให้กราฟที่ดูแปลก ๆ ! ตัวอย่างเช่น ในกรณีนี้ค่าต่ำจะมีความไม่แน่นอนมากขึ้นดังนั้นจึงมีแนวโน้มที่จะให้เมล็ดแบนเรียบในขณะที่ KDE มีน้ำหนักเกินค่าต่ำ (และไม่แน่นอน)

3
วิธีที่ดีที่สุดในการสื่อสารความไม่แน่นอน?
ปัญหาใหญ่ในการสื่อสารผลของการคำนวณทางสถิติกับสื่อและสาธารณะคือวิธีที่เราสื่อสารความไม่แน่นอน แน่นอนว่าสื่อมวลชนส่วนใหญ่ดูเหมือนว่าจะเป็นตัวเลขที่ยากและรวดเร็วถึงแม้ว่าจะมีบางกรณีที่ค่อนข้างน้อย ดังนั้นในฐานะนักสถิติ (หรือนักวิทยาศาสตร์ที่อธิบายงานทางสถิติ) เราจะสื่อสารผลลัพธ์ของเราได้ดีที่สุดในขณะที่รักษาความไม่แน่นอนในการเจรจาต่อรอง ฉันรู้ว่านี่ไม่ใช่คำถามเชิงสถิติ แต่เป็นคำถามทางจิตวิทยาเกี่ยวกับสถิติ แต่เป็นสิ่งที่นักสถิติและนักวิทยาศาสตร์ส่วนใหญ่กังวล ฉันจินตนาการว่าคำตอบที่ดีอาจอ้างอิงการวิจัยทางจิตวิทยามากกว่าตำราสถิติ ... แก้ไข:ตามข้อเสนอแนะของผู้ใช้ 5668458 กรณีศึกษาอาจมีประโยชน์ที่นี่ หากเป็นไปได้โปรดเก็บคำตอบทั่วไปไว้ในพื้นที่อื่น โดยเฉพาะอย่างยิ่งในกรณีที่ฉันสนใจในการทำหน้าที่เป็นตัวอย่างที่ดี: การสื่อสารวิทยาศาสตร์ภูมิอากาศกับนักการเมืองและประชาชนทั่วไปผ่านสื่อมวลชน กล่าวอีกนัยหนึ่งในฐานะนักวิทยาศาสตร์เป็นหน้าที่ของคุณในการถ่ายทอดข้อมูลไปยังนักข่าวในลักษณะที่พวกเขามีความยากลำบากเล็กน้อยในการสื่อข้อมูลนั้นให้กับสาธารณชนได้อย่างถูกต้องนั่นคือความจริงแม้ว่าจะไม่จำเป็นต้องเป็นความจริงทั้งหมดก็ตาม มักจะไม่พอดีกับข่าวกัด ตัวอย่างทั่วไปโดยเฉพาะอย่างยิ่งบางอย่างอาจเป็นการสื่อสารของความไม่แน่นอนในการประมาณระดับของภาวะโลกร้อนในช่วงที่เหลือของศตวรรษหรือในโอกาสที่เพิ่มขึ้นของเหตุการณ์สภาพอากาศรุนแรงเฉพาะ (เช่นในการตอบสนองต่อ "เป็นพายุนี้เกิดจากการเปลี่ยนแปลงสภาพภูมิอากาศ "พิมพ์คำถาม)

1
การทดสอบที่แน่นอนของฟิชเชอร์และการกระจาย hypergeometric
ฉันต้องการที่จะเข้าใจการทดสอบที่แม่นยำของฟิชเชอร์มากขึ้นดังนั้นฉันจึงคิดค้นตัวอย่างของเล่นต่อไปนี้โดยที่ f และ m สอดคล้องกับเพศชายและเพศหญิงและ n และ y สอดคล้องกับ "การบริโภคโซดา" เช่นนี้: > soda_gender f m n 0 5 y 5 0 เห็นได้ชัดว่านี่คือการทำให้เข้าใจง่ายมาก แต่ฉันไม่ต้องการให้บริบทเข้ามาขวางทาง ที่นี่ฉันเพิ่งสันนิษฐานว่าผู้ชายไม่ดื่มโซดาและหญิงดื่มโซดาและต้องการดูว่าวิธีการทางสถิติมาถึงข้อสรุปเดียวกัน เมื่อฉันทำการทดสอบฟิชเชอร์ที่แน่นอนใน R ฉันจะได้ผลลัพธ์ต่อไปนี้: > fisher.test(soda_gender) Fisher's Exact Test for Count Data data: soda_gender p-value = 0.007937 alternative hypothesis: true odds ratio is not equal to 1 …

3
คำนวณความไม่แน่นอนของความชันการถดถอยเชิงเส้นตามความไม่แน่นอนของข้อมูล
วิธีการคำนวณความไม่แน่นอนของความชันการถดถอยเชิงเส้นตามความไม่แน่นอนของข้อมูล (อาจเป็นใน Excel / Mathematica) ตัวอย่าง: เรามีจุดข้อมูล (0,0), (1,2), (2,4), (3,6), (4,8), ... (8, 16) แต่ค่า y แต่ละค่ามี ความไม่แน่นอนของ 4. ฟังก์ชั่นส่วนใหญ่ที่ฉันพบจะคำนวณความไม่แน่นอนเป็น 0 เนื่องจากคะแนนตรงกับฟังก์ชัน y = 2x แต่ดังที่แสดงในภาพ y = x / 2 ตรงกับจุดเช่นกัน มันเป็นตัวอย่างที่พูดเกินจริง แต่ฉันหวังว่ามันจะแสดงสิ่งที่ฉันต้องการ แก้ไข: ถ้าฉันพยายามอธิบายให้มากขึ้นในขณะที่ทุกจุดในตัวอย่างมีค่าที่แน่นอนของ y เราทำท่าว่าเราไม่รู้ว่ามันจริงหรือไม่ ตัวอย่างเช่นจุดแรก (0,0) อาจเป็นจริง (0,6) หรือ (0, -6) หรืออะไรก็ตามที่อยู่ระหว่างนั้น ฉันถามว่ามีอัลกอริทึมในปัญหายอดนิยมใด ๆ ที่พิจารณาในบัญชีนี้หรือไม่ …

3
ความน่าเชื่อถือของโค้งที่เหมาะสมหรือไม่
ฉันต้องการประเมินความไม่แน่นอนหรือความน่าเชื่อถือของเส้นโค้งที่พอดี ฉันตั้งใจไม่ตั้งชื่อปริมาณทางคณิตศาสตร์ที่แม่นยำที่ฉันกำลังมองหาเนื่องจากฉันไม่รู้ว่ามันคืออะไร นี่ (พลังงาน) เป็นตัวแปรตาม (ตอบสนอง) และ (ปริมาณ) เป็นตัวแปรอิสระ ฉันต้องการหาเส้นโค้ง Energy-Volume,ของวัสดุบางอย่าง ดังนั้นฉันจึงคำนวณด้วยโปรแกรมคอมพิวเตอร์เคมีควอนตัมเพื่อรับพลังงานสำหรับปริมาตรตัวอย่าง (วงกลมสีเขียวในพล็อต)V E ( V )EEEVVVE(V)E(V)E(V) จากนั้นฉันติดตั้งตัวอย่างข้อมูลเหล่านี้ด้วยฟังก์ชัน Birch – Murnaghan : ซึ่งขึ้นอยู่กับ สี่พารามิเตอร์:ฉันยังสันนิษฐานว่านี่เป็นฟังก์ชั่นปรับแต่งที่ถูกต้องดังนั้นข้อผิดพลาดทั้งหมดจึงมาจากเสียงรบกวนของตัวอย่าง ในสิ่งต่อไปนี้ฟังก์ชั่นที่ติดตั้งจะได้รับการเขียนเป็นฟังก์ชั่นของVE 0 , V 0 , B 0 , B ' 0 ( E ) VE(E|V)=E0+9V0B016⎧⎩⎨[(V0V)23−1]3B′0+[(V0V)23−1]2[6−4(V0V)23]⎫⎭⎬,E(E|V)=E0+9V0B016{[(V0V)23−1]3B0′+[(V0V)23−1]2[6−4(V0V)23]}, \mathbb{E}(E|V) = E_0 + \frac{9V_0B_0}{16} \left\{ \left[\left(\frac{V_0}{V}\right)^\frac{2}{3}-1\right]^3B_0^\prime + \left[\left(\frac{V_0}{V}\right)^\frac{2}{3}-1\right]^2 \left[6-4\left(\frac{V_0}{V}\right)^\frac{2}{3}\right]\right\}\;, …

1
ระบบการลงคะแนนที่ใช้ความแม่นยำของผู้ลงคะแนนแต่ละคนและความไม่แน่นอนที่เกี่ยวข้อง
สมมติว่าเรามีคำถาม "ใช่ / ไม่ใช่" ที่เราต้องการทราบคำตอบ และมีคน N คน "โหวต" สำหรับคำตอบที่ถูกต้อง ผู้มีสิทธิเลือกตั้งทุกคนมีประวัติ - รายชื่อ 1 และ 0 แสดงว่าพวกเขาถูกหรือผิดเกี่ยวกับคำถามประเภทนี้ในอดีต หากเราถือว่าประวัติศาสตร์เป็นการกระจายแบบทวินามเราสามารถค้นหาประสิทธิภาพเฉลี่ยของผู้มีสิทธิเลือกตั้งในคำถามเช่นรูปแบบที่เปลี่ยนแปลง CI และตัวชี้วัดความเชื่อมั่นอื่น ๆ โดยทั่วไปคำถามของฉันคือ: วิธีการรวมข้อมูลความมั่นใจในระบบการลงคะแนนได้อย่างไร ตัวอย่างเช่นหากเราพิจารณาว่าหมายถึงประสิทธิภาพของผู้ลงคะแนนแต่ละคนเท่านั้นเราสามารถสร้างระบบการลงคะแนนแบบถ่วงน้ำหนักง่ายๆ: result=sign(∑v∈votersμv×(−1)1−vote)result=sign(∑v∈votersμv×(−1)1−vote)result = sign(\sum_{v \in voters}\mu_v \times (-1)^{1-vote}) นั่นคือเราสามารถรวมน้ำหนักของผู้ลงคะแนนคูณด้วย (สำหรับ "ใช่") หรือ (สำหรับ "ไม่") มันสมเหตุสมผลแล้ว: หากผู้ออกเสียงลงคะแนน 1 มีคำตอบที่ถูกต้องโดยเฉลี่ยเท่ากับและผู้ออกเสียงลงคะแนน 2 มีเพียง.มากกว่าอาจจะเป็นการลงคะแนนเสียงของบุคคลที่ 1 ที่มีความสำคัญมากกว่า ในทางกลับกันถ้าคนที่ 1 ตอบคำถามเพียง 10 ข้อและคนที่ …

4
ลักษณนามสำหรับฉลากระดับที่ไม่แน่นอน
สมมติว่าฉันมีชุดของอินสแตนซ์ที่เกี่ยวข้องกับป้ายชื่อคลาส ไม่สำคัญว่าจะติดป้ายกำกับอินสแตนซ์เหล่านี้อย่างไรแต่ความแน่นอนของการเป็นสมาชิกคลาสของพวกเขาคืออะไร แต่ละ instancs อยู่ในระดับเดียวเท่านั้น สมมติว่าฉันสามารถวัดความแน่นอนของการเป็นสมาชิกแต่ละคลาสด้วยแอตทริบิวต์ที่ระบุซึ่งมีค่าตั้งแต่ 1 ถึง 3 (แน่นอนมากถึงไม่แน่ใจตามลำดับ) มีตัวจําแนกบางประเภทที่คํานึงถึงความแน่นอนดังกล่าวหรือไม่และถ้าใช่มันมีอยู่ในชุดเครื่องมือ WEKA หรือไม่? ฉันคิดว่าสถานการณ์นี้เกิดขึ้นค่อนข้างบ่อยตัวอย่างเช่นเมื่ออินสแตนซ์ถูกจำแนกตามมนุษย์ซึ่งไม่แน่ใจว่าสมบูรณ์แบบเสมอไป ในกรณีของฉันฉันต้องจำแนกรูปภาพและบางครั้งรูปภาพอาจเป็นของมากกว่าหนึ่งคลาส หากสิ่งนี้เกิดขึ้นฉันให้ชั้นเรียนมีความไม่แน่นอนสูง แต่ยังคงจัดประเภทไว้ด้วยคลาสเดียวเท่านั้น หรือมีวิธีอื่นในการแก้ไขปัญหานี้โดยไม่มีตัวจําแนกพิเศษ? เช่นเดียวกับการจัดหมวดหมู่ "แน่นอน" สำหรับการฝึกอบรมเท่านั้น? ฉันกลัวว่าในกรณีนี้จะมีการจัดประเภทผิดพลาดมากกว่าเนื่องจากคดี "ชายแดน" ไม่ครอบคลุม

1
วิธีกราฟิกใดที่มีประโยชน์ในการแสดงภาพรวมว่ามีความไม่แน่นอนอย่างไร
ฉันมีชุดของระบบที่มีความไม่แน่นอนสะสมอยู่ภายใน สิ่งเหล่านี้ไม่ได้เติมแต่งอย่างหมดจดเสมอไป - บางครั้งก็เป็น ฉันประสบความสำเร็จในการใช้แผนภูมิแฟน ๆ แผนภูมิแท่งที่มีช่วงความมั่นใจและแผนการสำหรับการสื่อสารรายการเดียว แต่ฉันจะแสดงให้เห็นว่าความไม่แน่นอนสะสมและรวมกันอย่างไรในขณะที่ยังแสดงจุดข้อมูลที่มีความไม่แน่นอนอยู่ด้วย

2
การประมาณความไม่แน่นอนในปัญหาการอนุมานมิติสูงโดยไม่มีการสุ่มตัวอย่าง?
ฉันกำลังทำงานกับปัญหาการอนุมานมิติสูง (ประมาณพารามิเตอร์โมเดลปี 2000) ซึ่งเราสามารถทำการประมาณค่า MAP ได้อย่างมีประสิทธิภาพโดยการหาค่าสูงสุดของผู้บันทึกล็อกระดับโลกโดยใช้การเพิ่มประสิทธิภาพการไล่ระดับสีและอัลกอริทึมทางพันธุกรรม ฉันอยากจะประเมินความไม่แน่นอนเกี่ยวกับพารามิเตอร์ของแบบจำลองเพิ่มเติมนอกเหนือจากการค้นหาการประมาณค่า MAP เราสามารถคำนวณการไล่ระดับสีของ log-posterior ได้อย่างมีประสิทธิภาพเกี่ยวกับพารามิเตอร์ดังนั้นในระยะยาวเรามีเป้าหมายที่จะใช้ Hamiltonian MCMC ทำการสุ่มตัวอย่าง แต่ตอนนี้ฉันสนใจการประมาณการแบบไม่สุ่มตัวอย่าง วิธีเดียวที่ฉันรู้ก็คือการคำนวณค่าผกผันของ Hessian ในโหมดเพื่อประมาณหลังเป็นหลายตัวแปรปกติ แต่แม้มันจะดูเป็นไปไม่ได้สำหรับระบบขนาดใหญ่เช่นนี้เพราะแม้ว่าเราจะคำนวณ ∼4×106∼4×106\sim 4\times10^{6} องค์ประกอบของ Hessian ฉันแน่ใจว่าเราไม่พบสิ่งที่ตรงกันข้าม ใครช่วยแนะนำวิธีการแบบใดที่มักใช้ในกรณีเช่นนี้? ขอบคุณ! แก้ไข - ข้อมูลเพิ่มเติมเกี่ยวกับปัญหา ความเป็นมา นี้เป็นปัญหาผกผันที่เกี่ยวข้องกับการทดลองฟิสิกส์ขนาดใหญ่ เรามีตาข่ายสามเหลี่ยมสองมิติซึ่งอธิบายถึงเขตข้อมูลทางกายภาพบางส่วนและพารามิเตอร์แบบจำลองของเราคือค่าทางกายภาพของเขตข้อมูลเหล่านั้นในแต่ละจุดยอดของตาข่าย ตาข่ายมีประมาณ 650 จุดยอดและเราสร้างแบบจำลอง 3 เขตข้อมูลดังนั้นนั่นคือที่มาของพารามิเตอร์แบบจำลอง 2000 ของเรา ข้อมูลการทดลองของเรานั้นมาจากเครื่องมือที่ไม่ได้วัดเขตข้อมูลเหล่านี้โดยตรง แต่ปริมาณที่มีฟังก์ชั่นที่ไม่ใช่เชิงเส้นที่ซับซ้อนของเขตข้อมูล สำหรับเครื่องมือที่แตกต่างกันเรามีตัวแบบไปข้างหน้าซึ่งจะจับคู่พารามิเตอร์ของแบบจำลองกับการทำนายข้อมูลการทดลองและการเปรียบเทียบระหว่างการทำนายและการวัดทำให้เกิดความน่าจะเป็นบันทึก จากนั้นเราจะสรุปความเป็นไปได้ของการบันทึกจากเครื่องมือที่แตกต่างกันเหล่านี้และยังเพิ่มค่าบางอย่างก่อนบันทึกซึ่งใช้ข้อ จำกัด ทางกายภาพบางอย่างกับเขตข้อมูล ดังนั้นฉันจึงสงสัยว่า 'แบบจำลอง' นี้จัดอยู่ในหมวดหมู่อย่างเรียบร้อย - เราไม่มีทางเลือกว่าแบบจำลองคืออะไรมันถูกกำหนดโดยวิธีการใช้งานจริงของเครื่องมือที่รวบรวมข้อมูลการทดลองของเรา …

1
รูปแบบการเรียนรู้แบบลึกใดที่สามารถจำแนกหมวดหมู่ที่ไม่ได้เกิดร่วมกัน
ตัวอย่าง: ฉันมีประโยคในรายละเอียดงาน: "วิศวกรอาวุโสของ Java ในสหราชอาณาจักร" ฉันต้องการที่จะใช้รูปแบบการเรียนรู้ที่ลึกที่จะคาดการณ์ว่ามันเป็น 2 ประเภทและEnglish IT jobsถ้าฉันใช้รูปแบบการจำแนกแบบดั้งเดิมมันสามารถทำนายได้เพียง 1 ฉลากที่มีsoftmaxฟังก์ชั่นที่ชั้นสุดท้าย ดังนั้นฉันสามารถใช้โครงข่ายประสาทเทียม 2 แบบในการทำนาย "ใช่" / "ไม่" กับทั้งสองหมวดหมู่ แต่ถ้าเรามีหมวดหมู่มากขึ้นมันก็แพงเกินไป ดังนั้นเราจึงมีรูปแบบการเรียนรู้หรือการเรียนรู้ด้วยเครื่องเพื่อคาดการณ์ 2 หมวดหมู่ขึ้นไปพร้อมกันหรือไม่ "แก้ไข": ด้วย 3 ป้ายกำกับโดยวิธีดั้งเดิมมันจะถูกเข้ารหัสโดย [1,0,0] แต่ในกรณีของฉันมันจะถูกเข้ารหัสโดย [1,1,0] หรือ [1,1,1] ตัวอย่าง: หากเรามี 3 ป้ายกำกับและประโยคอาจเหมาะกับป้ายกำกับเหล่านี้ทั้งหมด ดังนั้นถ้าผลลัพธ์จากฟังก์ชัน softmax คือ [0.45, 0.35, 0.2] เราควรแบ่งมันออกเป็น 3 label หรือ 2 label หรืออาจเป็นหนึ่ง? ปัญหาหลักเมื่อเราทำคือ: …
9 machine-learning  deep-learning  natural-language  tensorflow  sampling  distance  non-independent  application  regression  machine-learning  logistic  mixed-model  control-group  crossover  r  multivariate-analysis  ecology  procrustes-analysis  vegan  regression  hypothesis-testing  interpretation  chi-squared  bootstrap  r  bioinformatics  bayesian  exponential  beta-distribution  bernoulli-distribution  conjugate-prior  distributions  bayesian  prior  beta-distribution  covariance  naive-bayes  smoothing  laplace-smoothing  distributions  data-visualization  regression  probit  penalized  estimation  unbiased-estimator  fisher-information  unbalanced-classes  bayesian  model-selection  aic  multiple-regression  cross-validation  regression-coefficients  nonlinear-regression  standardization  naive-bayes  trend  machine-learning  clustering  unsupervised-learning  wilcoxon-mann-whitney  z-score  econometrics  generalized-moments  method-of-moments  machine-learning  conv-neural-network  image-processing  ocr  machine-learning  neural-networks  conv-neural-network  tensorflow  r  logistic  scoring-rules  probability  self-study  pdf  cdf  classification  svm  resampling  forecasting  rms  volatility-forecasting  diebold-mariano  neural-networks  prediction-interval  uncertainty 

1
จะเปรียบเทียบเหตุการณ์ที่สังเกตได้กับเหตุการณ์ที่คาดหวังได้อย่างไร
สมมติว่าฉันมีตัวอย่างหนึ่งความถี่ของเหตุการณ์ที่เป็นไปได้ 4 เหตุการณ์: Event1 - 5 E2 - 1 E3 - 0 E4 - 12 และฉันมีโอกาสที่จะเกิดเหตุการณ์ที่คาดหวัง: p1 - 0.2 p2 - 0.1 p3 - 0.1 p4 - 0.6 ด้วยผลรวมของความถี่ที่สังเกตได้จากเหตุการณ์ทั้งสี่ของฉัน (18) ฉันสามารถคำนวณความถี่ที่คาดหวังของเหตุการณ์ได้ใช่ไหม expectedE1 - 18 * 0.2 = 3.6 expectedE2 - 18 * 0.1 = 1.8 expectedE1 - 18 * 0.1 …
9 r  statistical-significance  chi-squared  multivariate-analysis  exponential  joint-distribution  statistical-significance  self-study  standard-deviation  probability  normal-distribution  spss  interpretation  assumptions  cox-model  reporting  cox-model  statistical-significance  reliability  method-comparison  classification  boosting  ensemble  adaboost  confidence-interval  cross-validation  prediction  prediction-interval  regression  machine-learning  svm  regularization  regression  sampling  survey  probit  matlab  feature-selection  information-theory  mutual-information  time-series  forecasting  simulation  classification  boosting  ensemble  adaboost  normal-distribution  multivariate-analysis  covariance  gini  clustering  text-mining  distance-functions  information-retrieval  similarities  regression  logistic  stata  group-differences  r  anova  confidence-interval  repeated-measures  r  logistic  lme4-nlme  inference  fiducial  kalman-filter  classification  discriminant-analysis  linear-algebra  computing  statistical-significance  time-series  panel-data  missing-data  uncertainty  probability  multivariate-analysis  r  classification  spss  k-means  discriminant-analysis  poisson-distribution  average  r  random-forest  importance  probability  conditional-probability  distributions  standard-deviation  time-series  machine-learning  online  forecasting  r  pca  dataset  data-visualization  bayes  distributions  mathematical-statistics  degrees-of-freedom 
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.