การถดถอยของดิสก์ยูนิตเริ่มต้นจากตัวอย่าง "เว้นระยะสม่ำเสมอ"


9

ฉันต้องแก้ปัญหาการถดถอยที่ซับซ้อนบนดิสก์ยูนิต คำถามดั้งเดิมดึงดูดความคิดเห็นที่น่าสนใจ แต่ไม่มีคำตอบที่น่าเสียดาย ในขณะเดียวกันฉันได้เรียนรู้เพิ่มเติมเกี่ยวกับปัญหานี้ดังนั้นฉันจะพยายามแยกปัญหาดั้งเดิมออกเป็นปัญหาย่อยและดูว่าฉันโชคดีขึ้นในครั้งนี้หรือไม่

ฉันมีเซ็นเซอร์อุณหภูมิ 40 ตัวอยู่ในวงแหวนแคบ ๆ ภายในดิสก์ยูนิตเป็นประจำ: ป้อนคำอธิบายรูปภาพที่นี่

เซ็นเซอร์เหล่านี้รับอุณหภูมิในเวลา อย่างไรก็ตามเนื่องจากความแปรปรวนของเวลามีขนาดเล็กกว่าการแปรผันของอวกาศเรามาทำให้ปัญหาง่ายขึ้นโดยไม่สนใจความแปรปรวนของเวลาและสมมติว่าเซ็นเซอร์แต่ละตัวให้เวลาฉันโดยเฉลี่ยเท่านั้น ซึ่งหมายความว่าฉันมี 40 ตัวอย่าง (หนึ่งตัวสำหรับเซ็นเซอร์แต่ละตัว) และฉันไม่มีตัวอย่างซ้ำ

ฉันต้องการสร้างพื้นผิวการถดถอยจากข้อมูลเซ็นเซอร์ การถดถอยมีสองเป้าหมาย:T=f(ρ,θ)+ϵ

  1. ฉันต้องการที่จะประเมินค่าเฉลี่ยรัศมีอุณหภูมิT_ด้วยการถดถอยเชิงเส้นฉันได้ประมาณพื้นผิวซึ่งเป็นพื้นผิวอุณหภูมิเฉลี่ยแล้วดังนั้นฉันจึงต้องรวมพื้นผิวของฉันกับใช่ไหม? ถ้าฉันใช้พหุนามเพื่อการถดถอยขั้นตอนนี้ควรเป็นเค้กชิ้นหนึ่งTmean=g1(ρ)+ϵθ
  2. ฉันต้องการที่จะประเมินโปรไฟล์อุณหภูมิรัศมีเช่นว่าในแต่ละตำแหน่งรัศมีPT95=g2(ρ)+ϵP(T(ρ)<T95(ρ))=.95

ด้วยสองเป้าหมายนี้ฉันควรใช้เทคนิคใดในการถดถอยของดิสก์ยูนิต แน่นอนกระบวนการแบบเกาส์มักใช้สำหรับการถดถอยเชิงพื้นที่ อย่างไรก็ตามคำจำกัดความของเคอร์เนลที่ดีสำหรับดิสก์ยูนิตนั้นไม่สำคัญดังนั้นฉันต้องการให้สิ่งต่าง ๆ เรียบง่ายและใช้พหุนามยกเว้นว่าคุณรู้สึกว่ามันเป็นกลยุทธ์ที่สูญเสียไป ฉันได้อ่านเกี่ยวกับพหุนาม Zernike ชื่อที่ประกอบด้วยหลาย Zernike ดูเหมือนจะเป็นที่เหมาะสมสำหรับการถดถอยมากกว่าดิสก์หน่วยเนื่องจากพวกเขากำลังอยู่ในระยะ\θ

เมื่อเลือกรุ่นแล้วฉันต้องเลือกขั้นตอนการประมาณค่า เนื่องจากนี่เป็นปัญหาการถดถอยเชิงพื้นที่จึงควรมีความสัมพันธ์ของข้อผิดพลาดในสถานที่ต่างกัน สแควร์สเตอร์ธรรมดาถือว่าข้อผิดพลาดที่ไม่เกี่ยวข้องดังนั้นฉันคิดว่าสแควร์สทั่วไปทั่วไปจะเหมาะสมกว่า GLS ดูเหมือนว่าเป็นเทคนิคทางสถิติที่ใช้กันทั่วไปเนื่องจากมีglsฟังก์ชั่นในการกระจาย R มาตรฐาน อย่างไรก็ตามฉันไม่เคยใช้ GLS และฉันมีข้อสงสัย ตัวอย่างเช่นฉันจะประเมินเมทริกซ์ความแปรปรวนร่วมได้อย่างไร ตัวอย่างจากการทำงานถึงแม้จะใช้เซ็นเซอร์เพียงไม่กี่เซ็นเซอร์ก็ถือว่ายอดเยี่ยม

ป.ล. ฉันเลือกใช้พหุนาม Zernike และ GLS เพราะฉันคิดว่ามันเป็นสิ่งที่สมเหตุสมผลที่จะทำที่นี่ อย่างไรก็ตามฉันไม่มีความเชี่ยวชาญและถ้าคุณรู้สึกว่าฉันกำลังไปในทิศทางที่ผิดรู้สึกฟรีที่จะใช้วิธีการที่แตกต่างอย่างสิ้นเชิง


บนรูปเครื่องยนต์แสดงว่ามีสมมาตรรัศมีที่สมบูรณ์แบบ แต่ตำแหน่งของแกนเกี่ยวข้องกับลักษณะทางกายภาพของเครื่องยนต์หรือไม่ ในกรณีที่สองตัวแปรจะมีเพียงความหมายที่เกี่ยวข้องกับเครื่องยนต์เฉพาะ θ
Yves

คำตอบ:


2

ผมคิดว่าคุณจะอยู่บนเส้นทางที่ถูกต้องในการคิดเกี่ยวกับบางสิ่งบางอย่างเช่นพหุนาม Zernike ดังที่ระบุไว้ในคำตอบโดย jwimberly เหล่านี้เป็นตัวอย่างของระบบฟังก์ชั่นพื้นฐานมุมฉากบนดิสก์ ผมไม่คุ้นเคยกับพหุนาม Zernike แต่หลายครอบครัวอื่น ๆ ของฟังก์ชั่นตั้งฉาก (รวมถึงฟังก์ชั่น Bessel) เกิดขึ้นตามธรรมชาติในฟิสิกส์คณิตศาสตร์คลาสสิกเป็นeigenfunctionsสำหรับสมการเชิงอนุพันธ์บางอย่าง (ในขณะที่เขียนนี้, นิเมชั่นที่ด้านบนของการเชื่อมโยงว่าแม้ แสดงตัวอย่างของหัวกลองแบบสั่น)

คำถามสองข้ออยู่ในใจของฉัน ก่อนอื่นถ้าทั้งหมดที่คุณมีคือโปรไฟล์เรเดียล (เฉลี่ย) ดังนั้นคุณจำเป็นต้องมีข้อ จำกัด เกี่ยวกับรูปแบบเชิงพื้นที่มากน้อยเพียงใด? ประการที่สองประเภทของความแปรปรวนที่เกิดขึ้นในข้อมูลเชิงพื้นที่?θ

ในแง่ของคำถามแรกมีข้อกังวลสองประการที่อยู่ในใจ เนื่องจากพิกัดเชิงขั้วการสนับสนุนพื้นที่สำหรับแต่ละเซ็นเซอร์มีแนวโน้มที่มีRข้อกังวลประการที่สองคือความเป็นไปได้ของการใช้นามแฝงโดยพื้นฐานแล้วการจัดตำแหน่งเซ็นเซอร์ของคุณไม่ถูกต้องเมื่อเทียบกับเฟสของรูปแบบ (เพื่อใช้การเปรียบเทียบ Fourier / Bessel) โปรดทราบว่าการใช้ชื่อแทนอาจเป็นความไม่แน่นอนหลักในการควบคุมอุณหภูมิสูงสุด (เช่น )rT95

ในแง่ของคำถามที่สองความแปรปรวนของข้อมูลสามารถช่วยแก้ปัญหานามแฝงได้จริง ๆ แล้วโดยทั่วไปแล้วการปรับตำแหน่งผิดพลาดนั้นจะทำให้ค่าเฉลี่ยของการวัดต่างกัน (สมมติว่าไม่มีอคติอย่างเป็นระบบ ... แต่นั่นจะเป็นปัญหาสำหรับวิธีการใด ๆ โดยไม่ต้องเช่นแบบจำลองทางกายภาพเพื่อให้ข้อมูลเพิ่มเติม)

ดังนั้นความเป็นไปได้อย่างหนึ่งก็คือการกำหนดฟังก์ชั่น orthogonal เชิงพื้นที่ของคุณที่ตำแหน่งเซ็นเซอร์อย่างหมดจด "ฟังก์ชั่นมุมฉากเชิงประจักษ์"เหล่านี้สามารถคำนวณได้ผ่านPCAในเมทริกซ์ข้อมูลเชิงพื้นที่ของคุณ (อาจเป็นไปได้ว่าคุณสามารถใช้การถ่วงน้ำหนักเพื่อพิจารณาพื้นที่สนับสนุนเซนเซอร์แบบปรับได้ แต่เนื่องจากกริดขั้วแบบเดียวและเป้าหมายของค่าเฉลี่ยเรเดียลอาจไม่จำเป็นต้องทำ)

โปรดทราบว่าถ้ามีเป็นข้อมูลการสร้างแบบจำลองทางกายภาพใด ๆ ที่มีอยู่สำหรับ "คาดว่า" การเปลี่ยนแปลงของอุณหภูมิที่มีอยู่บนหนาแน่นตารางคำนวณ spatiotemporal แล้วขั้นตอน PCA เดียวกันสามารถนำไปใช้ว่าข้อมูลไปยังฟังก์ชั่นการสืบทอดมามุมฉาก (โดยทั่วไปจะเรียกว่า "การสลายตัวของมุมฉากที่เหมาะสม " ในงานวิศวกรรมซึ่งจะใช้สำหรับการลดแบบจำลองเช่นแบบจำลองพลศาสตร์ของไหลเชิงคำนวณที่มีราคาแพงสามารถถูกกลั่นเพื่อใช้ในกิจกรรมการออกแบบเพิ่มเติม)

ความคิดเห็นสุดท้ายถ้าคุณมีน้ำหนักข้อมูลเซ็นเซอร์โดยพื้นที่การสนับสนุน (เช่นขนาดของเซลล์ขั้วโลก) นี้จะเป็นประเภทของความแปรปรวนในแนวทแยงในกรอบของGLS (นั่นจะนำไปใช้กับปัญหาการทำนายของคุณมากขึ้นแม้ว่า PCA ที่มีน้ำหนักจะเกี่ยวข้องกันอย่างใกล้ชิด)

ฉันหวังว่านี่จะช่วยได้!

อัปเดต:แผนภาพใหม่ของการแจกจ่ายเซ็นเซอร์เปลี่ยนแปลงสิ่งต่าง ๆ ในมุมมองของฉัน หากคุณต้องการประมาณอุณหภูมิภายในแผ่นดิสก์คุณจะต้องมีข้อมูลมากขึ้นกว่าเพียงแค่ "ชุดฟังก์ชั่นมุมฉากบนดิสก์ยูนิต" มีข้อมูลน้อยเกินไปในข้อมูลเซ็นเซอร์

หากคุณต้องการที่แน่นอนในการประมาณการเปลี่ยนแปลงอุณหภูมิเชิงพื้นที่กว่าดิสก์วิธีเดียวที่เหมาะสมฉันสามารถดูจะรักษาปัญหาเป็นหนึ่งในการดูดซึมข้อมูล อย่างน้อยคุณจะต้อง จำกัด รูปแบบพารามิเตอร์ของการแจกแจงเชิงพื้นที่ตามการพิจารณาเชิงฟิสิกส์บางอย่าง (ซึ่งอาจมาจากการจำลองหรืออาจมาจากข้อมูลที่เกี่ยวข้องในระบบที่มีพลวัตคล้ายกัน)

ฉันไม่รู้จักแอปพลิเคชันของคุณโดยเฉพาะ แต่ถ้าเป็นเช่นนี้ฉันจะจินตนาการว่ามีวรรณคดีทางวิศวกรรมมากมายที่คุณสามารถนำมาใช้เพื่อเลือกข้อ จำกัด ที่เหมาะสมก่อนหน้านี้ (สำหรับการเรียงลำดับของความรู้โดเมนแบบละเอียดนี่อาจไม่ใช่ไซต์ StackExchange ที่ดีที่สุดที่จะถาม)


คำตอบที่น่าประทับใจ! ต้องการเวลาในการย่อย คุณถามคำถามสองข้อ: ฉันไม่แน่ใจว่าฉันเข้าใจคำถามแรก ("คุณต้องการข้อ จำกัด เกี่ยวกับรูปแบบเชิงพื้นที่เท่าใด") ฉันคิดว่าการใช้ข้อมูลจากเซ็นเซอร์ทั้ง 40 ตัวนั้นดีกว่าค่าเฉลี่ยตามทิศทางเส้นรอบวงและ ถ้างั้นก็เหมาะสม ... คุณกำลังพูดเรื่องนี้ไม่จำเป็นต้องเป็นเรื่องจริงเหรอ? สำหรับวินาทีที่สอง ("ประเภทของความแปรปรวนเกิดขึ้นในข้อมูล spatio-temporal") ในอีกหนึ่งหรือสองวันข้างหน้าฉันจะวิเคราะห์เอ็นจิ้นแรก (จริง ๆ แล้วฉันมี 5 ของพวกเขา! คำถามในอนาคต ... ) ctd ...
DeltaIV

... ctd ฉันจะทำให้ข้อมูลเป็นมาตรฐานและฉันจะเห็นสิ่งที่ฉันสามารถเผยแพร่ในเว็บไซต์สาธารณะ รูปแบบเชิงพื้นที่และอนุกรมเวลาบางอย่าง ... ฉันคิดว่าพวกเขาควรให้แนวคิดเกี่ยวกับสิ่งที่คุณถาม
DeltaIV

1
สำหรับคำถามแรกของฉัน: หากเป้าหมายสุดท้ายของคุณคือ "คาดการณ์ผลลัพธ์เซ็นเซอร์สำหรับเครื่องยนต์ใหม่" (สรุปจากคำถามอื่นของคุณ) คุณต้องการข้อมูลใด ๆ จาก "ระหว่างเซ็นเซอร์" หรือไม่ ความคิดเห็นของฉันในการขจัดรอยหยักเป็นตัวอย่างของเหตุผลที่คุณจะต้องใช้ข้อมูลดังกล่าวเช่นถ้าไม่ได้วัดที่เชื่อถือได้เซ็นเซอร์ T95
GeoMatt22

1
BTW หากนี่คือปัญหาการออกแบบและมีการจำลองประเภท CFD ที่เกี่ยวข้องนั่นก็เป็นข้อมูลที่มากกว่าคำตอบของคำถามปัจจุบัน (ตัวอย่างเช่นการเข้าหาปัญหาเนื่องจากการรวบรวมข้อมูลอาจใช้วิธีการที่แตกต่างกัน)
GeoMatt22

คำตอบของคุณทำให้ฉันคิดว่า: แทนที่จะเป็นการถดถอยมีการแปลงฟูริเยร์ที่ไม่ต่อเนื่องบางส่วนที่สามารถทำได้หรือไม่? ยกตัวอย่างเช่นการรวมจุดข้อมูลเข้ากับฟังก์ชัน n-th Bessel (แก้ไขอย่างเหมาะสม) แล้วรับการสลายตัวแบบมุมฉาก? ข้อกังวลที่นี่คือ 1) การหาฟังก์ชั่นที่ไม่ต่อเนื่องที่เหมาะสมอาจเป็นไปตามบรรทัดเดียวกับคำตอบของคุณและ 2) ไม่ว่ามันจะมีความละเอียดอ่อนเกินไปกับจุดสุ่มตัวอย่างจำนวนน้อยหรือไม่ .
jwimberley

2

ชื่อที่ประกอบด้วยหลาย Zernlike ไม่ได้เสียงเหมือนทางเลือกที่ดีเพราะพวกเขามีอยู่แล้วและพึ่งพาอาศัยกันและตั้งฉากปรุงสุกใน. แต่เนื่องจากคุณกำลังศึกษาอุณหภูมิการเลือกเนื้อหาอื่น ๆ ที่เหมาะสมและเป็นที่รู้จักกันดีกว่าจะเป็นหน้าที่ Bessel สิ่งเหล่านี้เกิดขึ้นในการศึกษาการไหลของความร้อนในวัตถุทรงกระบอก / ระบบพิกัดดังนั้นจึงมีโอกาสที่พวกมันจะมีความเหมาะสมทางร่างกายมากกว่า ฟังก์ชัน Bessel n-th จะให้การพึ่งพารัศมีที่เกี่ยวข้องกับฟังก์ชันตรีโกณมิติที่สอดคล้องกันสำหรับการพึ่งพาขั้ว คุณสามารถหารายละเอียดได้ในหนังสือเรียนฟิสิกส์และ PDErθ


(+1) การเชื่อมต่อสมการความร้อนของพิกัดเชิงขั้วนั้นเป็นสิ่งที่ดี อีกสิ่งหนึ่งที่ควรค่าแก่การกล่าวถึงก็คือสำหรับกระบวนการแบบเกาส์ฉันรู้ว่าโดยทั่วไปบนกริดแบบสี่เหลี่ยมเมทริกซ์ความแปรปรวนร่วมจะไหลเวียนและใช้ FFT ในทางปฏิบัติ ดังนั้นฟังก์ชั่นเบสเซลจะเป็นตัวเลือกที่น่าสนใจสำหรับแนวทางที่คล้ายกันบนกริดขั้ว
GeoMatt22

คำแนะนำที่น่าสนใจ! อย่างไรก็ตามฉันกำลังวัดอุณหภูมิในของเหลวที่ใช้งานไม่ใช่ในส่วนที่เป็นของแข็งของเครื่องยนต์ ดังนั้นฉันจึงสนใจในปัญหาการพาความร้อนซึ่งตรงข้ามกับปัญหาการนำความร้อน ฟังก์ชั่นเบสเซลนั้นเป็นคำตอบของสมการการนำความร้อน (ฟูริเยร์) แต่ฉันไม่คิดว่ามันเป็นคำตอบของสมการพาความร้อนเนื่องจากการพาขึ้นอยู่กับสนามไหลของของไหล อย่างไรก็ตามอย่างน้อยที่สุดฉันก็สามารถทดสอบพวกเขากับ Zernike แล้ว GLS ล่ะ? คุณสามารถเพิ่มบางสิ่งในส่วนนั้นของคำถามได้หรือไม่
DeltaIV

@DeltaIV ฉันไม่คุ้นเคยกับ GLS มากนัก แต่มีคำถามหนึ่งข้อ - ทำไมคุณถึงคาดหวังว่าข้อผิดพลาดจะมีความสัมพันธ์ในจุดที่แตกต่างกัน? ฉันยอมรับว่าความผันผวนที่แท้จริงจะมีความสัมพันธ์กันระหว่างจุดต่าง ๆ แต่ฉันคิดว่าข้อผิดพลาด (เช่นความไม่แน่นอนในการอ่านเซ็นเซอร์) จะไม่เกี่ยวข้องกัน บางทีความผันผวนของการถดถอยนับเป็นข้อผิดพลาด? ฉันกำลังพิจารณาเพิ่มบางอย่างเกี่ยวกับเงื่อนไขการลงโทษอย่างไรก็ตาม ไม่ว่าคุณจะใช้พื้นฐานแบบใดคุณมีจุดสุ่มจำนวน จำกัด และสามารถค้นหาฟังก์ชันการจับคู่ Bessel ที่มีลำดับสูงมากดังนั้นคำศัพท์ที่มีลำดับต่ำที่สุดจึงควรเป็นที่ต้องการ
jwimberley

@DeltaIV เกี่ยวกับความผันผวนอีกครั้งซึ่งจะแนะนำความสัมพันธ์ระหว่างจุดเชิงพื้นที่: วัตถุของคุณคือการได้รับแผนที่อุณหภูมิใช่มั้ย คุณไม่ต้องการที่จะเห็นสิ่งที่ผันผวนเกิดขึ้น? และแบบจำลองทางสถิติสามารถอธิบายถึงพวกเขาได้เนื่องจากความผันผวนจะถูกขับเคลื่อนด้วยพลศาสตร์ของของเหลวและซับซ้อนในอวกาศและเวลา? (IS นี้ที่เกี่ยวข้องกับการเป็นส่วนหนึ่งขึ้นอยู่กับเวลาของการวิเคราะห์ของคุณว่าคุณซ้ายปิดเพื่อความเรียบง่าย?)
jwimberley

สร้างแกลเลอรี่แชทแล้ว
DeltaIV
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.