สร้างเสียงที่สม่ำเสมอจากลูกบอล p-norm (


11

ฉันพยายามเขียนฟังก์ชั่นที่สร้างเสียงที่กระจายอย่างสม่ำเสมอซึ่งมาจากลูก p-norm ของมิติ :n

||x||พีR

ผมพบว่าการแก้ปัญหาที่เป็นไปได้สำหรับวงการ ( ) ( http://mathworld.wolfram.com/DiskPointPicking.html ) แต่ฉันมีปัญหาในการขยายนี้สำหรับค่าที่แตกต่างกันของพีพี=2พี

ฉันได้ลองทำโดยเพียงแค่สุ่มตัวอย่างจากการแจกแจงแบบเดียวกันและวาดใหม่เมื่อไม่เป็นไปตามข้อ จำกัด ที่กำหนด อย่างไรก็ตามนอกจากจะเป็นวิธีการแก้ปัญหาที่น่าเกลียดมันยังกลายเป็นไปไม่ได้ที่คำนวณได้สำหรับมิติสูง


1
คำตอบสามารถพบได้ที่นี่สำหรับทรงกลมที่มีขนาด n โดยใช้ระยะทางแบบยุคลิด (p = 2) math.stackexchange.com/questions/87230/ ...... ฉันยังคงไม่แน่ใจว่าจะใช้สิ่งนี้อย่างไรกับ p-norms ที่แตกต่างกันฉันสามารถ เพียงแค่เปลี่ยนระยะทางแบบยุคลิดที่ใช้ในความสัมพันธ์ที่แตกต่างกันสำหรับระยะทาง?
Taeke de Haan

2
มีเอกสารจำนวนมาก แต่ส่วนใหญ่อยู่เบื้องหลัง paywall: link.springer.com/article/10.1007/s00184-011-0360-x หรือดู google.com/th
kjetil b halvorsen

3
"ชุดรูปแบบ" เกี่ยวกับเมตริกปริมาณใดบ้าง ท้ายที่สุดถ้าคุณใช้ ball ทำไมปริมาณยูคลิดจึงน่าสนใจ พี
whuber

@ คนที่ฉันไม่แน่ใจโดยสุจริตเนื่องจากนี่ไม่ได้ระบุไว้อย่างชัดเจนในการมอบหมาย แต่ฉันคาดหวังใน p-norm เนื่องจากการวัดอื่น ๆ ดูเหมือนว่าจะเป็นไปตามอำเภอใจในกรณีนี้
Taeke de Haan

1
ปัญหามาจากการมอบหมายการเรียนรู้ของเครื่อง "ปัญหาคือปัญหาการจำแนกประเภทสองระดับใน 204 มิติชุดฝึกอบรมขนาดเล็กที่มีข้อความขนาด 50 ตัวอย่างต่อชั้นข้อมูลที่ไม่มีป้ายกำกับให้ตัวอย่างเพิ่มเติม 20,000 ตัวอย่างอย่างไรก็ตามตัวอย่างเหล่านี้มีความเสียหายบางประเภท เฉพาะข้อมูลเพิ่มเติมที่เรามีเกี่ยวกับการคอร์รัปชั่นนี้คือมันเป็นเสียงเพิ่มเติมที่เหมือนกันและเสียงดังมาจากลูกบอล p-norm แบบคงที่ซึ่งทั้งpและรัศมีrไม่เป็นที่รู้จัก " ฉันต้องได้รับอัตราความผิดพลาดต่ำที่สุดในข้อมูลที่ไม่มีป้ายกำกับ ||x||prpR
Taeke de Haan

คำตอบ:


5

ฉันพบวิธีแก้ปัญหาแบบเต็มในกระดาษตามที่แนะนำโดย kjetil b halvorsen ( https://ieeexplore.ieee.org/stamp/stamp.jsp?arnumber=758215 ) ฉันมีปัญหาในการทำความเข้าใจเกี่ยวกับคณิตศาสตร์โดยสุจริต แต่อัลกอริทึมในที่สุดก็ค่อนข้างง่าย ถ้าเรามีขนาด , รัศมีrและ norm pกว่า:nRพี

1) สร้างสเกลาร์จริงแบบสุ่มอิสระε i = ˉ G ( 1 / p , p )โดยที่ˉ G ( μ , σ 2 )คือการแจกแจงแบบเกาส์ทั่วไป (มีอำนาจที่แตกต่างกันในe - | x | pแทน ของเพียงp = 2 )nεผม=G¯(1/พี,พี)G¯(μ,σ2)อี-|x|พีพี=2

2) สร้างเวกเตอร์ของส่วนประกอบs iε iโดยที่s iเป็นสัญญาณสุ่มอิสระxsผม* * * *εผมsผม

3) สร้างโดยที่wคือตัวแปรสุ่มที่กระจายอย่างสม่ำเสมอในช่วงเวลา [0, 1]Z=W1/nW

4) ผลตอบแทนY=RZx||x||พี


2
เพื่อความสมบูรณ์คุณสามารถบอกได้ว่าคืออะไรในคำตอบของคุณ? G
Stéphane Laurent

ได้รับการอัปเดตแล้ว
Taeke de Haan

2
G คือการแจกแจงแบบเกาส์ทั่วไป (ด้วยพลังที่แตกต่างกันในเลขชี้กำลังแทนที่จะเป็นแค่p = 2 ) สิ่งนี้จะทำให้การแจกแจงสำหรับเวกเตอร์xประกอบด้วยตัวแปรกระจายตัวแบบเกาส์อิสระทั่วไปหลายตัวx iซึ่งเป็นผลคูณของไฟล์ PDF เดียวขึ้นอยู่กับ p-norm f ( x ) e - | x | p pอี-|x|พีพี=2xxผม
(x)αอี-|x|พีพี
Sextus Empiricus

@MartijnWeterings ขอบคุณมากมันได้รับการปรับปรุงแล้ว
Taeke de Haan

ขอบคุณ สำหรับข้อมูลมีตัวอย่างของการกระจายนี้ในแพคเกจ R pgnorm
Stéphane Laurent

3

การใช้ตัวแปรหลายตัวแปรที่กระจายตัวแบบเอกพันธ์

Taeke มีลิงก์ไปยังบทความที่ข้อความด้านล่างทำให้เข้าใจได้ง่ายขึ้นโดยการอธิบายเฉพาะกรณี 2-norm และ 1-norm

2-norm x2R

ทิศทางตัวอย่าง

คุณสามารถใช้ผลลัพธ์นี้http://mathworld.wolfram.com/HyperspherePointPicking.html

ตัวแปรกระจายแบบเกาส์ตัวแปรหลายตัวแปร (พร้อมเมทริกซ์ความแปรปรวนร่วมเอกลักษณ์) ขึ้นอยู่กับระยะทางหรือผลรวมของกำลังสองX

(X1,X2,...,Xn)=Π1ผมn12πอี12xผม2=12πอี12Σ1ผมnxผม2

ดังนั้นกระจายอย่างสม่ำเสมอบนพื้นผิวของมิติ nXX2


ระยะตัวอย่าง

ในการทำให้สมบูรณ์คุณเพียงแค่ต้องสุ่มตัวอย่างระยะทางเพื่อเปลี่ยนการกระจายตัวแบบเอกพันธ์บนทรงกลมเป็นการกระจายแบบเอกพันธ์ในลูกบอล (ซึ่งมีความคล้ายคลึงกันมากขึ้นหรือน้อยลงตามตัวอย่างที่เชื่อมโยงของคุณสำหรับการเลือกจุดดิสก์)

หากคุณต้องการตัวอย่างเพียงเป็นเครื่องแบบกระจายแล้วคุณจะมีความหนาแน่นค่อนข้างสูงอยู่ใกล้กับศูนย์กลาง (เครื่องชั่งปริมาณเป็นR nดังนั้นส่วนRของจุดที่จะจบลงในปริมาณR nซึ่งเป็นความหนาแน่นมากขึ้นใกล้ จุดศูนย์กลางและจะไม่หมายถึงการกระจายแบบสม่ำเสมอ)RRnRRn

หากคุณใช้รูท -th ของตัวแปรที่สุ่มตัวอย่างจากการแจกแจงแบบเดียวกันคุณจะได้การแจกแจงแบบสม่ำเสมอn

1-norm x1R

ทิศทาง

ในกรณีนี้คุณสุ่มตัวอย่างจากการแจกแจงเลซแทนการแจกแจงแบบเกาส์และหารด้วย 1 นอร์ม The XXมีการกระจายอย่างสม่ำเสมอในทรงกลม n-1 มิติX|X|1

ฉันไม่มีข้อพิสูจน์ที่เป็นทางการเพียงแค่สัญชาตญาณ

(เนื่องจาก pdf มีความเป็นอิสระจากตำแหน่งคุณจะคาดหวังว่าพื้นที่ / ปริมาตรเล็ก ๆ ที่มี 1-norm เดียวกันจะมีความน่าจะเป็นแบบเดียวกันและเมื่อคุณยุบลงไปที่พื้นผิวหน่วยเดียวกันf ( x ) d A )(x)dV(x)dA

แต่การทดสอบด้วยแบบจำลองดูดี

การจำลองการหยิบค่า 20,000 ค่าการกระจายอย่างสม่ำเสมอ

library(rmutil)
x <- abs(rlaplace(20000))
y <- abs(rlaplace(20000))
z <- abs(rlaplace(20000))
rn <- abs(x)+abs(y)+abs(z)

xi <- (x/rn)
yi <- (y/rn)
zi <- (z/rn)
plot(sqrt(0.5)*(xi-yi),
     sqrt((0.5-0.5*(xi+yi))^2+zi^2),
     pc=21,bg=rgb(0,0,0,0.02), col=rgb(0,0,0,0),cex=1)

ระยะทาง

Rn

xพีR

(x)αอี|x|พีG()


1
พี

1
nRพีZ=W1/nWY=RZx||x||พี
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.