อัตราค่าโดยสารของสายการบิน - การวิเคราะห์ใดที่ควรใช้เพื่อตรวจสอบพฤติกรรมการตั้งราคาและความสัมพันธ์ของราคา


12

ฉันต้องการตรวจสอบพฤติกรรมการตั้งราคาของสายการบิน - โดยเฉพาะว่าสายการบินตอบสนองต่อการกำหนดราคาของคู่แข่งอย่างไร

ตามที่ฉันจะบอกความรู้ของฉันเกี่ยวกับการวิเคราะห์ที่ซับซ้อนมากขึ้นค่อนข้าง จำกัด ฉันได้ทำวิธีการพื้นฐานทั้งหมดเพื่อรวบรวมมุมมองโดยรวมของข้อมูล ซึ่งรวมถึงกราฟอย่างง่ายซึ่งช่วยระบุรูปแบบที่คล้ายกัน ฉันใช้ SAS Enterprise 9.4 ด้วย

อย่างไรก็ตามฉันกำลังมองหาวิธีการตามจำนวนมากขึ้น

ชุดข้อมูล

ชุดข้อมูลที่รวบรวม (ตัวเอง) ที่ฉันกำลังใช้อยู่มีประมาณ ~ 54.000 อัตราค่าโดยสาร ค่าโดยสารทั้งหมดถูกรวบรวมภายในหน้าต่างเวลา 60 วันเป็นประจำทุกวัน (ทุกคืนเวลา 00:00 น.)วิธีการเก็บรวบรวม

ดังนั้นทุกค่าโดยสารภายในช่วงเวลาดังกล่าวจะเกิดขึ้นครั้งขึ้นอยู่กับความพร้อมของค่าโดยสารรวมถึงวันที่ออกเดินทางของเที่ยวบินเมื่อผ่านไปตามวันที่เรียกเก็บค่าโดยสาร (คุณไม่สามารถรวบรวมค่าโดยสารสำหรับเที่ยวบินเมื่อวันที่ออกเดินทางของเที่ยวบินในอดีต)n

รูปแบบที่ไม่มีการจัดรูปแบบโดยทั่วไปมีลักษณะดังนี้: (ข้อมูลปลอม)

+--------------------+-----------+--------------------+--------------------------+---------------+
| requestDate        | price| tripStartDeparture | tripDestinationDeparture | flightCarrier |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 725.32    | 16APR2015:10:50:02 | 23APR2015:21:55:04       | XA            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 966.32    | 16APR2015:13:20:02 | 23APR2015:19:00:04       | XY            |
+--------------------+-----------+--------------------+--------------------------+---------------+
| 14APR2015:00:00:00 | 915.32    | 16APR2015:13:20:02 | 23APR2015:21:55:04       | XH            |
+--------------------+-----------+--------------------+--------------------------+---------------+

"DaysBeforeDeparture" มีการคำนวณผ่านที่I=sc

  • & ช่วงเวลา (วันก่อนออกเดินทาง)
  • s & วันที่ของค่าโดยสาร
  • c & วันที่เก็บค่าโดยสาร

นี่คือตัวอย่างของข้อมูลที่จัดกลุ่มโดย I (DaysBeforeDep.) (ข้อมูลปลอม!):

+-----------------+------------------+------------------+------------------+------------------+
| DaysBefDeparture | AVG_of_sale | MIN_of_sale | MAX_of_sale | operatingCarrier |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 880.68           | 477.99           | 2,245.23         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 904.89           | 477.99           | 2,534.55         | DL           |
+-----------------+------------------+------------------+------------------+------------------+
| 0               | 1,044.39         | 920.99           | 2,119.09         | LH               |
+-----------------+------------------+------------------+------------------+------------------+

สิ่งที่ฉันเกิดขึ้นจนถึงตอนนี้

เมื่อดูที่กราฟเส้นฉันสามารถประมาณได้ว่าหลาย ๆ เส้นจะมีปัจจัยความสัมพันธ์สูง ดังนั้นฉันพยายามใช้การวิเคราะห์ความสัมพันธ์ก่อนในข้อมูลที่จัดกลุ่ม แต่นั่นเป็นวิธีที่ถูกต้องหรือไม่ โดยพื้นฐานแล้วฉันพยายามที่จะสร้างความสัมพันธ์กับค่าเฉลี่ยแทนที่จะเป็นราคาของแต่ละคนหรือไม่ มีวิธีอื่นไหม

ฉันไม่แน่ใจว่าตัวแบบการถดถอยแบบใดที่เหมาะกับที่นี่เนื่องจากราคาไม่เคลื่อนไหวในรูปแบบเชิงเส้นใด ๆ และปรากฏแบบไม่เชิงเส้น ฉันจะต้องปรับโมเดลให้เหมาะสมกับการพัฒนาราคาของสายการบินแต่ละแห่งหรือไม่

PS: นี่คือกำแพงข้อความที่มีความยาว ถ้าฉันต้องการชี้แจงอะไรให้ฉันรู้ ฉันยังใหม่กับกลุ่มย่อยนี้

เบาะแสทุกคน? :-)

คำตอบ:


9

คำเตือนจากอดีตนักวิเคราะห์การจัดการรายได้ของสายการบิน: คุณอาจเห่าต้นไม้ผิดด้วยวิธีนี้ ขออภัยสำหรับกำแพงข้อความที่ตามมา แต่ข้อมูลนี้ซับซ้อนและมีเสียงดังมากเกินกว่าที่จะปรากฎในครั้งแรกดังนั้นต้องการให้คำอธิบายสั้น ๆ เกี่ยวกับวิธีการสร้าง ได้รับการเตือนล่วงหน้าแล้ว

อัตราค่าโดยสารของสายการบินมีสององค์ประกอบ ได้แก่ ค่าโดยสารจริง (พร้อมกับกฎค่าโดยสารและสิ่งที่มี) ที่สายการบินมีให้บริการในบางเส้นทางซึ่งส่วนใหญ่มีการเผยแพร่โดยสำนักพิมพ์ Airline Tariff ไม่ใช่ แต่เป็นข้อยกเว้นมากกว่ากฎ) และการจัดการสินค้าคงคลังจริงที่ดำเนินการโดยสายการบินในแต่ละวัน

ค่าโดยสารสามารถส่งไปที่ ATPCO สี่ครั้งต่อวันตามช่วงเวลาที่กำหนดและเมื่อสายการบินทำเช่นนั้นมักจะประกอบด้วยส่วนผสมของการเพิ่มการลบและการแก้ไขค่าโดยสารที่มีอยู่ เมื่อสายการบินเริ่มต้นการดำเนินการเกี่ยวกับราคา (สมมติว่าคู่แข่งของพวกเขาไม่ได้พยายามเคลื่อนไหวที่นี่) พวกเขามักจะต้องรอจนกว่าจะมีการอัปเดตครั้งต่อไปเพื่อดูว่าคู่แข่งทำตาม / ตอบ การสนทนาจะดำเนินไปเมื่อผู้แข่งขันเริ่มต้นการดำเนินการกำหนดราคาเนื่องจากสายการบินต้องรอจนกว่าจะมีการอัปเดตครั้งต่อไปก่อนที่พวกเขาจะสามารถตอบสนองได้

ตอนนี้ทุกอย่างดีและดีเกี่ยวกับค่าโดยสาร แต่ปัญหาคือเพราะทุกอย่างได้รับการเผยแพร่ใน ATPCO ค่าโดยสารเป็นสิ่งที่ดีที่สุดต่อไปในการเปิดเผยข้อมูลสาธารณะ ... คู่แข่งทั้งหมดของคุณจะได้เห็นสิ่งที่คุณได้ ได้รับในคลังแสงของคุณดังนั้นความพยายามที่จะทำให้งงไม่เหมือนไม่เคยได้ยินเช่นการประกาศอัตราค่าโดยสารที่จะไม่ได้รับการกำหนดสินค้าคงคลังใด ๆ จริง ๆ แสดงรายการอัตราค่าโดยสารทั้งหมดเป็นวันออกเดินทางเป็นต้น

ในหลาย ๆ ทางซอสลับลงมาจากการจัดสรรสินค้าจริงนั่นคือคุณจะเต็มใจขายที่นั่งในแต่ละเที่ยวบินในราคาเท่าไหร่และข้อมูลนี้ไม่สามารถเปิดเผยต่อสาธารณะได้ คุณสามารถดูข้อมูลบางอย่างได้โดยการคัดลอกข้อมูลทางเว็บ แต่การรวมเวลาและวันออกเดินทางที่เป็นไปได้และกฎค่าโดยสารมีมากมายและอาจเพิ่มขึ้นอย่างรวดเร็วเกินความสามารถในการติดตามได้อย่างง่ายดาย

โดยทั่วไปแล้วสายการบินจะยินดีที่จะขายที่นั่งจำนวนหนึ่งสำหรับค่าโดยสารที่ต่ำมากและผู้ที่ขัดขวางพวกเขาต้องจองล่วงหน้าค่อนข้างไกลเพื่อไม่ให้กฎค่าโดยสารถูกล็อคพวกเขาหรือผู้เดินทางคนอื่น ๆ สายการบินจะยินดีที่จะขายที่นั่งเพิ่มอีกไม่กี่อันเพื่อค่าโดยสารที่สูงขึ้นและต่อ ๆ ไปเรื่อย ๆ พวกเขายินดีที่จะขายที่นั่งทั้งหมดสำหรับค่าโดยสารสูงสุดที่พวกเขาได้รับการตีพิมพ์ แต่โดยทั่วไปจะไม่สามารถทำได้

สิ่งที่คุณเห็นด้วยอัตราค่าโดยสารที่สูงขึ้นยิ่งคุณเข้าใกล้วันเดินทางมากขึ้นเพียงกระบวนการตามธรรมชาติของการมีที่นั่งราคาถูกถูกจองให้ไกลออกไปในขณะที่สินค้าคงคลังที่เหลือค่อย ๆ แพงขึ้น แน่นอนว่ามีคำเตือนบางอย่างอยู่ที่นี่ กระบวนการจัดการ RM นั้นดำเนินไปอย่างแข็งขันและการแทรกแซงของมนุษย์นั้นเป็นเรื่องปกติเนื่องจากทีม RM มุ่งมั่นที่จะบรรลุเป้าหมายด้านรายได้และเพิ่มรายได้สูงสุดในแต่ละเที่ยวบิน ดังนั้นเที่ยวบินที่เติมเต็มอย่างรวดเร็วอาจ "รัดกุมขึ้น" โดยการปิดค่าโดยสารราคาต่ำ เที่ยวบินที่จองช้าอาจถูก "คลาย" โดยการจัดสรรที่นั่งเพิ่มเติมเพื่อลดค่าโดยสาร

มีการทำงานร่วมกันอย่างต่อเนื่องและการแข่งขันระหว่างสายการบินในพื้นที่นี้ แต่คุณไม่น่าจะจับพลวัตที่เกิดขึ้นจริงจากการขูดบัตรโดยสาร อย่าเข้าใจฉันผิดเรามีเครื่องมือเช่นนี้ในการกำจัดของเราและแม้จะมีข้อ จำกัด แต่ก็มีคุณค่ามาก แต่เป็นแหล่งข้อมูลเพียงแหล่งเดียวที่ป้อนเข้าสู่กระบวนการตัดสินใจ คุณต้องเข้าถึงการตัดสินใจหลายร้อยถ้าไม่ใช่การตัดสินใจด้านปฏิบัติการหลายพันครั้งโดยทีม RM ในแต่ละวันรวมถึงข้อมูลสถานะของโลกตามที่พวกเขาเห็นในเวลานั้น หากคุณไม่พบพันธมิตรสายการบินที่จะทำงานเพื่อรับข้อมูลนี้คุณอาจต้องพิจารณาแหล่งข้อมูลอื่น

ฉันขอแนะนำให้มองหาการเข้าถึงข้อมูลค่าโดยสาร O & D จากคู่มือสายการบินอย่างเป็นทางการ (หรือหนึ่งในคู่แข่งของพวกเขา) และลองใช้เพื่อการวิเคราะห์ของคุณ มันใช้ตัวอย่าง (ประมาณ 10% ของตั๋วที่ขายทั้งหมด) และรวมกันในระดับที่สูงกว่าที่จะเหมาะดังนั้นการเลือกเส้นทางอย่างระมัดระวังจึงเป็นสิ่งจำเป็น (ฉันขอแนะนำบางอย่างที่มีสายการบินมากมายให้บินไม่หยุดวันละหลายเที่ยว เครื่องบินขนาดใหญ่) แต่คุณอาจได้ภาพที่ดีกว่าของสิ่งที่ขายจริง (ค่าโดยสารเฉลี่ย) และจำนวนเท่าไรที่ขาย (ตัวประกอบภาระ) กับจำนวนที่ขายได้ ณ เวลาที่กำหนด การใช้ข้อมูลนั้นคุณอาจอยู่ในสถานะที่ดีขึ้นอย่างน้อยก็สำรวจผลลัพธ์ของกลยุทธ์การกำหนดราคาของสายการบินและทำการอ้างถึงของคุณจากที่นั่น


ขอบคุณสำหรับคำอธิบายอย่างละเอียด ฉันเห็นด้วยกับคุณว่าการวิเคราะห์ราคาดังกล่าวมี จำกัด นอกจากนี้ยังรวมถึงกฎค่าโดยสารที่โดดเด่น (ตั๋วที่คืนเงินได้การเข้าพักขั้นต่ำ ฯลฯ ) ข้อ จำกัด บางอย่างสามารถเอาชนะได้โดยการเก็บค่าโดยสารเดียวกันเสมอเพื่อให้สามารถเปรียบเทียบกันได้ อย่างไรก็ตามข้อมูลสำคัญ - ตามที่คุณกล่าวถึงไม่มีจำนวนที่นั่งที่มี (อาจเป็น! = ที่นั่งในเครื่องบิน) และจำนวนตั๋วที่ขายจริง
s1x

การเข้าถึงข้อมูลดังกล่าวมี จำกัด มากและหาก - ล้าสมัย (เช่น Databank 1B จาก US DOT) งานวิจัยบางคนเช่นอาร์คลาร์กและวินเซนต์เอ็น (2012) การกำหนดราคาความจุ-ผูกพัน [ ... ] เชื่อมโยงรวมถึงข้อมูลดังกล่าวและนำเสนอข้อมูลเชิงลึกที่ดีมาก ฉันตระหนักถึงข้อ จำกัด (หวังว่า ;-)) และตามที่คุณพูดถึงเนื่องจากมีข้อมูลมากมายที่ส่งผลต่อราคา เมื่อสังเกตตลาดที่เฉพาะเจาะจงคุณจะได้รับความรู้สึกของสิ่งที่เกิดขึ้น คุณสามารถดูว่ามีพฤติกรรมที่ต้องปฏิบัติตามและวิธีการกำหนดราคาที่แตกต่างกันหรือไม่ อย่างไรก็ตามคุณจะไม่สามารถหาสาเหตุได้
s1x

1
@ s1x - ฉันเห็นด้วยและฉันหวังว่าฉันมีทางเลือกที่แข็งแกร่งที่จะนำเสนอ แต่ในขณะที่คุณได้เรียนรู้ด้วยตัวคุณเองแล้วรายละเอียดข้อมูลรายละเอียดเป็นความลับที่น่าอิจฉาที่สุดในสายการบินใด ๆ เพียงแค่ต้องการให้แน่ใจว่าคุณรับรู้และสิ่งที่จะเข้าสู่กระบวนการสร้างข้อมูล นอกเหนือจากนั้นฉันชอบสิ่งที่คุณพยายามทำและฉันคิดว่าคำตอบอื่น ๆ เป็นขั้นตอนในทิศทางที่ถูกต้องฉลาดเทคนิค หากฉันอาจแนะนำให้คุณดูที่การใช้สหสัมพันธ์ระหว่าง TS ต่างๆของคุณในระหว่างการสำรวจข้อมูลเพราะมักจะมีประโยชน์สำหรับรูปแบบการแยกแยะระหว่าง TS ที่เชื่อมโยง
habu

4

นอกจากการวิเคราะห์ข้อมูลเชิงสำรวจ (EDA) ทั้งเชิงพรรณนาและเชิงภาพแล้วฉันจะพยายามใช้การวิเคราะห์อนุกรมเวลาเพื่อเป็นการวิเคราะห์ที่ครอบคลุมและซับซ้อนยิ่งขึ้น โดยเฉพาะผมจะดำเนินการวิเคราะห์การถดถอยชุด การวิเคราะห์อนุกรมเวลาคือโดเมนการวิจัยและการฝึกฝนขนาดใหญ่ดังนั้นหากคุณไม่คุ้นเคยกับพื้นฐานฉันขอแนะนำให้เริ่มต้นด้วยบทความ Wikipedia ที่มีลิงก์ข้างต้นค่อยๆค้นหาหัวข้อที่เฉพาะเจาะจงมากขึ้นและอ่านบทความเอกสารและหนังสือที่เกี่ยวข้องกัน

เนื่องจากการวิเคราะห์อนุกรมเวลาเป็นวิธีที่ได้รับความนิยมจึงได้รับการสนับสนุนโดยวิทยาศาสตร์โอเพ่นซอร์สและปิดแหล่งข้อมูลเชิงพาณิชย์ส่วนใหญ่และสภาพแวดล้อมทางสถิติ (ซอฟต์แวร์)เช่นR , Python , SAS , SPSSและอื่น ๆ อีกมากมาย หากคุณต้องการที่จะใช้Rสำหรับการนี้ให้ตรวจสอบคำตอบของฉันในการวิเคราะห์อนุกรมเวลาทั่วไปและเกี่ยวกับการจำแนกอนุกรมเวลาและการจัดกลุ่ม ฉันหวังว่านี่จะเป็นประโยชน์


ขอบคุณสำหรับคำตอบของคุณ @Alksandr Blekh - ชื่นชมจริงๆ ป่วยขุดเข้าไปในนั้น อาจเป็นคำถามที่โง่ แต่โปรดแก้ไขให้ฉันที่นี่ถ้าฉันผิดที่นี่: การวิเคราะห์ความสัมพันธ์ในขณะที่ใช้สายการบินหนึ่งเป็นตัวแปรที่มีความสัมพันธ์กับ ผลลัพธ์นั้นน่าสนใจมาก ผู้ที่มีข้อตกลง codeshare มีราคาที่คล้ายกัน จะมีความสัมพันธ์สูงเช่น: ColumnUA(LH) 0.90435 <.0001 ColumnSQ 0.32544 <.0001 ColumnAF(DL) 0.55336 <.0001 ฉันคิดว่าผลลัพธ์ดังกล่าวบ่งชี้รูปแบบราคาที่คล้ายกัน ด้วยการวิเคราะห์การถดถอยฉันจะหาอะไรได้บ้าง
s1x

@ s1x: คุณยินดีมาก (อย่าลังเลที่จะโหวต / ยอมรับถ้าคุณให้ความสำคัญกับคำตอบและเมื่อคุณได้รับชื่อเสียงมากพอที่จะทำเช่นนั้นแน่นอน) ตอนนี้คำถามของคุณ ดังที่ฉันได้กล่าวไปแล้วการวิเคราะห์ TS นั้นซับซ้อนและครอบคลุมกว่ามาก โดยเฉพาะอย่างยิ่งการถดถอย TS บัญชีสำหรับautoregression ที่เรียกว่าและความซับซ้อน TS อื่น ๆ ดังนั้นข้อเสนอแนะของฉันที่จะใช้การวิเคราะห์การถดถอย TS แทนแบบดั้งเดิมที่ง่ายกว่า นอกจากนี้คุณควรเริ่มต้นด้วย EDA เสมอไม่ว่าคุณวางแผนจะทำการวิเคราะห์ข้อมูลใด (จริง ๆ แล้ว EDA มักจะเปลี่ยนแผนของคุณ)
Aleksandr Blekh
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.