การกระจายอัตราต่อรองเข้าสู่ระบบคืออะไร?


11

ฉันกำลังอ่านหนังสือเกี่ยวกับการเรียนรู้ของเครื่อง (Data Mining โดย Witten, et al., 2011) และพบกับข้อความนี้:

... ยิ่งไปกว่านั้นสามารถใช้การแจกแจงต่าง ๆ ได้ แม้ว่าการแจกแจงแบบปกติมักจะเป็นตัวเลือกที่ดีสำหรับคุณลักษณะตัวเลข แต่ก็ไม่เหมาะสำหรับคุณลักษณะที่มีค่าต่ำสุดที่กำหนดไว้ล่วงหน้า แต่ไม่มีข้อ จำกัด ด้านบน ในกรณีนี้การกระจาย "บันทึกปกติ" เหมาะสมกว่า แอ็ตทริบิวต์ตัวเลขที่ถูกล้อมรอบด้านบนและด้านล่างสามารถสร้างแบบจำลองโดยการกระจาย"ล็อก - ค่าต่อรอง"

ฉันไม่เคยได้ยินเรื่องการกระจายตัวนี้ ฉัน googled สำหรับ "การกระจายอัตราต่อรองแบบล็อกออน" แต่ไม่พบการจับคู่แบบตรงทั้งหมดที่เกี่ยวข้อง มีคนช่วยฉันได้ไหม การกระจายตัวนี้คืออะไรและทำไมมันถึงช่วยให้มีตัวเลขที่ถูกล้อมรอบด้านบนและด้านล่าง?

ป.ล. ฉันเป็นวิศวกรซอฟต์แวร์ไม่ใช่นักสถิติ

คำตอบ:


14

ทำไมมันถึงช่วยให้มีตัวเลขที่ถูก จำกัด ด้านบนและด้านล่าง?

กระจายกำหนดไว้ในคือสิ่งที่ทำให้มันเหมาะเป็นแบบจำลองสำหรับข้อมูลบน( 0 , 1 ) ฉันไม่คิดว่าข้อความมีความหมายอะไรมากกว่า "เป็นแบบจำลองสำหรับข้อมูลใน( 0 , 1 ) " (หรือมากกว่านั้นโดยทั่วไปใน( a , b ) )(0,1)(0,1)(0,1)(a,b)

การกระจายตัวนี้คืออะไร ... ?

คำว่า 'การกระจายอัตราต่อรองแบบล็อก' เป็นที่น่าเสียดายที่ไม่ได้มาตรฐานอย่างสมบูรณ์

ฉันจะพูดถึงความเป็นไปได้สำหรับสิ่งที่มันอาจหมายถึง เริ่มต้นด้วยการพิจารณาวิธีการสร้างการแจกแจงสำหรับค่าในช่วงหน่วย

วิธีทั่วไปในการสร้างแบบจำลองตัวแปรสุ่มต่อเนื่องใน( 0 , 1 )คือการแจกแจงแบบเบต้าและวิธีทั่วไปในการสร้างแบบจำลองสัดส่วนแบบไม่ต่อเนื่องใน[ 0 , 1 ]คือขนาดทวินาม ( P = X / nอย่างน้อยที่สุดเมื่อXคือการนับ)P(0,1)[0,1]P=X/nX

อีกทางเลือกหนึ่งในการใช้การแจกแจงแบบเบต้าคือการใช้ CDF ( ) ผกผันอย่างต่อเนื่องและใช้เพื่อแปลงค่าใน( 0 , 1 )ไปเป็นสายจริง (หรือแทบจะไม่ได้ครึ่งจริง) จากนั้นใช้ การแจกแจงที่เกี่ยวข้อง ( G ) ใด ๆเพื่อทำโมเดลค่าในช่วงที่ถูกแปลง สิ่งนี้ทำให้เกิดความเป็นไปได้มากมายเนื่องจากมีการแจกแจงแบบคู่ต่อเนื่องบนไลน์จริง ( F , G ) สำหรับการแปลงและโมเดลF1(0,1)GF,G

ตัวอย่างเช่นการแปลงค่าอัตราต่อรอง Y=เข้าสู่ระบบ(P1-P)Y

(μ,τ)Y(0,1)P=ประสบการณ์(Y)1+ประสบการณ์(Y)Pμ,τ

ป้อนคำอธิบายรูปภาพที่นี่

ดูที่การกล่าวถึงสั้น ๆ ในข้อความโดย Witten et al นี่อาจเป็นสิ่งที่ตั้งใจทำโดย "การกระจายอัตราต่อรองแบบล็อกออน" - แต่อาจหมายถึงสิ่งอื่นได้ง่าย

ความเป็นไปได้อีกอย่างก็คือว่าlogit-normalนั้นตั้งใจไว้

[1]FG(0,1)) ซึ่งพวกเขาดูเหมือนจะใช้ความพยายามอย่างมาก (มันดูเหมือนง่ายกว่าที่จะหลีกเลี่ยงโมเดลที่ไม่เหมาะสม แต่อาจเป็นเพียงฉัน)

YP

PY-

[2]

อย่างที่คุณเห็นมันไม่ใช่คำที่มีความหมายเดียว หากไม่มีข้อบ่งชี้ที่ชัดเจนจาก Witten หรือหนึ่งในผู้แต่งคนอื่นของหนังสือเล่มนี้เราก็ยังเหลือที่จะคาดเดาสิ่งที่ตั้งใจไว้

[1]: Noel van Erp & Pieter van Gelder, (2008),
"วิธีการตีความการแจกแจงเบต้าในกรณีที่มีการพังทลาย"
การประชุมเชิงปฏิบัติการนานาชาติครั้งที่ 6 , ดาร์มสตัดท์
ลิงค์ pdf

[2]: Yan Guo, (2009),
วิธีการใหม่ในการประเมินความสามารถของระบบ NDE Pod และความทนทาน,
วิทยานิพนธ์ส่งไปยังบัณฑิตวิทยาลัยของ Wayne State University, Detroit, Michigan


1
(+1) การค้นหาหนังสือทั้งเล่มระบุว่าไม่มีการชี้แจง บริบทแสดงให้เห็นว่า "การกระจายอัตราต่อรองล็อก" หมายถึงรูปแบบเฉพาะบางอย่างเช่นเดียวกับที่เสนอ "lognormal" ในประโยคก่อนหน้าเป็นการกระจายแบบสากลสำหรับค่าที่ไม่ใช่ค่าลบทั้งหมด (!)
whuber

1
@whuber ฉันเห็นด้วยกับลักษณะของคุณของสิ่งที่อยู่ในหนังสือ - ฉันไม่ได้ตั้งใจว่าความคิดเห็นของฉันที่เกี่ยวข้องกับการใช้คำในบริบทอื่น ๆ เพื่ออ้างถึงการกระจายตัวอย่างหมายความว่าเป็นเจตนาในหนังสือ แต่เป็น ข้อบ่งชี้ว่ามันเป็นคำที่มีความหมายหลายอย่าง ในตอนที่ถามผมแนะนำให้คนที่เรียนรู้เนื้อหานี้ (หลาย ๆ อย่าง) มาอ่านหนังสือมากกว่าหนึ่งเล่ม
Glen_b -Reinstate Monica

2

ฉันเป็นวิศวกรซอฟต์แวร์ (ไม่ใช่นักสถิติ) และฉันเพิ่งอ่านหนังสือชื่อ An Introduction to Statistics Learning ด้วยแอพพลิเคชั่นในอาร์

ฉันคิดว่าสิ่งที่คุณกำลังอ่านเกี่ยวกับคืออัตราต่อรองหรือ logit หน้า 132

http://www-bcf.usc.edu/~gareth/ISL/ISLR%20Fourth%20Printing.pdf

หนังสือที่ยอดเยี่ยม - ฉันอ่านมันจากหน้าปกไปหน้าปก หวังว่านี่จะช่วยได้


ขอบคุณสำหรับตัวชี้ สมมติว่าการกระจายอัตราต่อรองแบบเดียวกับ "การกระจายแบบลอจิสติก" ฉันค้นหาวิกิพีเดียหลัง ปรากฏว่า PDF ไม่มีขอบเขตที่ต่ำกว่าหรือสูงกว่า ดังนั้นฉันยังคงสงสัยว่าทำไมตำราเรียนที่ฉันยกมากล่าวในตอนแรกว่า "คุณลักษณะตัวเลขที่ล้อมรอบด้านบนและด้านล่างสามารถเป็นแบบจำลอง" ด้วยการแจกจ่ายนี้
stackoverflowuser2010

ฉันคิดว่ามันอาจจะพูดถึงผลลัพธ์ของฟังก์ชันที่ขอบเขตเป็น 0.0 (เป็นไปไม่ได้) ถึง 1.0 (แน่นอน) (ฉันอาจจะผิดอย่างสมบูรณ์ที่นี่)
JasonEdinburgh

เป็นไปได้ว่าโมเดลของคุณอาจสร้างผลลัพธ์เชิงบวกหรือเชิงลบขนาดใหญ่โดยพลการ สิ่งเหล่านี้อาจไม่สามารถตีความได้ในแง่ของช่วงที่มีขอบเขตเช่นความน่าจะเป็น แต่สามารถตีความได้ว่าเป็นอัตราต่อรองโดยใช้ฟังก์ชั่น logit และฟังก์ชันลอจิสติกผกผัน
เฮนรี่
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.