คำถามข้างต้นบอกว่ามันทั้งหมด โดยทั่วไปคำถามของฉันสำหรับฟังก์ชั่นการติดตั้งอุปกรณ์ทั่วไป (อาจซับซ้อนโดยพลการ) ซึ่งจะเป็นแบบไม่เชิงเส้นในพารามิเตอร์ที่ฉันพยายามที่จะประเมินหนึ่งจะเลือกค่าเริ่มต้นเพื่อเริ่มต้นพอดีได้อย่างไร ฉันพยายามที่จะทำกำลังสองน้อยที่สุดแบบไม่เชิงเส้น มีกลยุทธ์หรือวิธีการใดบ้าง? มีการศึกษาเรื่องนี้หรือไม่? การอ้างอิงใด ๆ มีอะไรอีกที่คาดเดาได้ยาก โดยเฉพาะตอนนี้หนึ่งในรูปแบบที่เหมาะสมที่ฉันทำงานด้วยคือแบบฟอร์มเกาส์บวกเชิงเส้นที่มีห้าพารามิเตอร์ที่ฉันพยายามประเมินเช่น
โดยที่ (ข้อมูล abscissa) และy = log 10 (จัดระเบียบข้อมูล) หมายความว่าในพื้นที่ล็อกบันทึกข้อมูลของฉันดูเหมือนเป็นเส้นตรงบวกกับชนที่ฉันประมาณโดยเกาส์เซียน ฉันไม่มีทฤษฎีไม่มีอะไรที่จะแนะนำฉันเกี่ยวกับวิธีการเริ่มต้นแบบไม่เชิงเส้นยกเว้นกราฟและลูกตาเช่นความลาดชันของเส้นและสิ่งที่เป็นศูนย์กลาง / ความกว้างของการชนคือ แต่ฉันมีมากกว่าร้อยแบบที่เหมาะกับการทำเช่นนั้นแทนที่จะใช้การสร้างกราฟและการคาดเดาฉันต้องการวิธีที่สามารถเป็นแบบอัตโนมัติได้
ฉันไม่พบการอ้างอิงใด ๆ ในห้องสมุดหรือออนไลน์ สิ่งเดียวที่ฉันคิดได้ก็คือเลือกค่าเริ่มต้นแบบสุ่ม MATLAB เสนอให้เลือกค่าแบบสุ่มจาก [0,1] การกระจายแบบสม่ำเสมอ ดังนั้นด้วยชุดข้อมูลแต่ละชุดฉันจึงรันการเริ่มต้นแบบสุ่มหนึ่งพันครั้งแล้วเลือกชุดที่มีค่าสูงสุดหรือไม่ ความคิดอื่น ๆ (ดีกว่า)?
ภาคผนวก # 1
ก่อนอื่นต่อไปนี้เป็นชุดข้อมูลที่เป็นภาพเพื่อแสดงให้คุณเห็นว่าฉันกำลังพูดถึงข้อมูลประเภทใด ฉันกำลังโพสต์ข้อมูลทั้งสองในรูปแบบดั้งเดิมโดยไม่มีการแปลงรูปแบบใด ๆ จากนั้นแสดงภาพในพื้นที่บันทึกล็อกเนื่องจากมันทำให้คุณสมบัติบางอย่างของข้อมูลชัดเจนขึ้นในขณะที่บิดเบือนผู้อื่น ฉันกำลังโพสต์ตัวอย่างข้อมูลที่ดีและไม่ดี
แต่ละพาเนลหกตัวในแต่ละรูปแสดงชุดข้อมูลสี่ชุดที่พล็อตด้วยกันคือสีแดงสีเขียวสีน้ำเงินและสีฟ้าและชุดข้อมูลแต่ละชุดมีจุดข้อมูล 20 จุด ฉันกำลังพยายามทำให้พอดีกับพวกเขาแต่ละคนด้วยเส้นตรงและ Gaussian เนื่องจากการกระแทกที่เห็นในข้อมูล
รูปแรกเป็นข้อมูลที่ดี รูปที่สองคือพล็อตการบันทึกข้อมูลที่ดีเหมือนกันจากรูปที่หนึ่ง รูปที่สามเป็นข้อมูลที่ไม่ดี รูปที่สี่คือพล็อตบันทึกการใช้งานของรูปที่สาม มีข้อมูลมากขึ้นเหล่านี้เป็นเพียงสองชุดย่อย ข้อมูลส่วนใหญ่ (ประมาณ 3/4) เป็นสิ่งที่ดีคล้ายกับข้อมูลที่ฉันแสดงให้เห็นที่นี่
ตอนนี้ความคิดเห็นโปรดอดทนกับฉันเพราะมันอาจจะนาน แต่ฉันคิดว่ารายละเอียดทั้งหมดนี้เป็นสิ่งที่จำเป็น ฉันจะพยายามรัดกุมที่สุดเท่าที่จะทำได้
ตอนแรกฉันคาดว่ากฎหมายพลังงานแบบง่าย (หมายถึงเส้นตรงในพื้นที่บันทึกการทำงาน) เมื่อฉันวางแผนทุกอย่างในพื้นที่ log-log ฉันเห็นการชนที่ไม่คาดคิดที่ 4.8 mHz ชนถูกตรวจสอบอย่างละเอียดและถูกค้นพบในผู้อื่นทำงานเช่นกันดังนั้นมันจึงไม่ใช่ว่าเราทำผิดพลาด มันมีอยู่จริงที่นั่นและงานที่ตีพิมพ์อื่น ๆ พูดถึงเรื่องนี้ด้วย ดังนั้นฉันจึงเพิ่มคำเกาส์ลงในรูปเชิงเส้นของฉัน โปรดทราบว่าแบบนี้จะต้องทำในพื้นที่บันทึกการเข้าสู่ระบบ (ด้วยคำถามทั้งสองของฉันรวมถึงคำถามนี้)
ตอนนี้หลังจากอ่านคำตอบของ Stumpy Joe Pete ไปยังคำถามอื่นของฉัน (ไม่เกี่ยวข้องกับข้อมูลเหล่านี้เลย) และอ่านสิ่งนี้และสิ่งนี้และการอ้างอิงในนั้น (สิ่งของโดย Clauset) ฉันรู้ว่าฉันไม่ควรใส่ log-log ช่องว่าง ดังนั้นตอนนี้ฉันต้องการที่จะทำทุกอย่างในพื้นที่ pre-transformed
คำถามที่ 1: การดูข้อมูลที่ดีฉันยังคงคิดว่าเส้นตรงบวกกับเกาส์ในพื้นที่แปลงก่อนยังคงเป็นรูปแบบที่ดี ฉันชอบที่จะได้ยินจากคนอื่น ๆ ที่มีประสบการณ์เกี่ยวกับข้อมูลมากกว่าที่พวกเขาคิด Gaussian + linear สมเหตุสมผลหรือไม่ ฉันควรทำเกาส์เซียนอย่างเดียวเหรอ? หรือรูปแบบที่แตกต่างอย่างสิ้นเชิง?
คำถามที่ 2: ไม่ว่าคำตอบสำหรับคำถามที่ 1 จะยังคงต้องการสี่เหลี่ยมจัตุรัสที่ไม่เป็นเส้นตรง (ส่วนใหญ่) ซึ่งยังคงต้องการความช่วยเหลือในการเริ่มต้น
ข้อมูลที่เราเห็นสองชุดเราชอบมากที่จะจับชนแรกที่ประมาณ 4-5 เมกะเฮิรตซ์ ดังนั้นฉันไม่ต้องการเพิ่มเงื่อนไข gaussian เพิ่มเติมและคำ gaussian ของเราควรเน้นที่การชนครั้งแรกซึ่งมักจะเป็นชนที่ใหญ่กว่า เราต้องการ "ความแม่นยำมากขึ้น" ระหว่าง 0.8mHz และประมาณ 5mHz เราไม่สนใจความถี่ที่สูงขึ้นมากเกินไป แต่ไม่ต้องการเพิกเฉยต่อมันอย่างสมบูรณ์ ดังนั้นการชั่งน้ำหนักบางอย่าง? หรือ B สามารถเริ่มต้นได้ประมาณ 4.8mHz เสมอ?
คำถามที่ 3: พวกคุณคิดอย่างไรในกรณีนี้? ข้อดี / ข้อเสียใด ๆ ? มีแนวคิดอื่นใดอีกหรือไม่ในการอนุมาน อีกครั้งเราจะสนใจเฉพาะความถี่ที่ต่ำกว่าดังนั้นคาดการณ์ระหว่าง 0 ถึง 1 เมกะเฮิรตซ์ ... บางครั้งความถี่ที่เล็กมาก ๆ ใกล้กับศูนย์ ฉันรู้ว่าโพสต์นี้ได้รับการบรรจุแล้ว ฉันถามคำถามนี้ที่นี่เพราะคำตอบอาจเกี่ยวข้อง แต่ถ้าคุณชอบฉันสามารถแยกคำถามนี้และถามอีกคนในภายหลัง
สุดท้ายนี้เป็นชุดข้อมูลตัวอย่างสองชุดเมื่อมีการร้องขอ
0.813010000000000 0.091178000000000 0.012728000000000
1.626000000000000 0.103120000000000 0.019204000000000
2.439000000000000 0.114060000000000 0.063494000000000
3.252000000000000 0.123130000000000 0.071107000000000
4.065000000000000 0.128540000000000 0.073293000000000
4.878000000000000 0.137040000000000 0.074329000000000
5.691100000000000 0.124660000000000 0.071992000000000
6.504099999999999 0.104480000000000 0.071463000000000
7.317100000000000 0.088040000000000 0.070336000000000
8.130099999999999 0.080532000000000 0.036453000000000
8.943100000000001 0.070902000000000 0.024649000000000
9.756100000000000 0.061444000000000 0.024397000000000
10.569000000000001 0.056583000000000 0.025222000000000
11.382000000000000 0.052836000000000 0.024576000000000
12.194999999999999 0.048727000000000 0.026598000000000
13.008000000000001 0.045870000000000 0.029321000000000
13.821000000000000 0.041454000000000 0.067300000000000
14.633999999999999 0.039596000000000 0.081800000000000
15.447000000000001 0.038365000000000 0.076443000000000
16.260000000000002 0.036425000000000 0.075912000000000
คอลัมน์แรกคือความถี่ในหน่วย mHz ซึ่งเหมือนกันในชุดข้อมูลทุกชุด คอลัมน์ที่สองคือชุดข้อมูลที่ดี (รูปที่ 1 และ 2, แผงข้อมูล 5, เครื่องหมายสีแดง) และคอลัมน์ที่สามเป็นชุดข้อมูลที่ไม่ดี (รูปภาพข้อมูลสามและสี่, แผง 5, เครื่องหมายสีแดง)
หวังว่านี่จะเพียงพอที่จะกระตุ้นให้เกิดการสนทนาที่กระจ่างแจ้งมากขึ้น ขอบคุณทุกคน