ความน่าเชื่อถือระหว่างกลางสำหรับเหตุการณ์ในอนุกรมเวลาที่มีความไม่แน่นอนเกี่ยวกับเวลาของเหตุการณ์


13

ฉันมีผู้เขียนโค้ดอิสระหลายคนที่พยายามระบุเหตุการณ์ในอนุกรมเวลา - ในกรณีนี้ดูวิดีโอการสนทนาแบบตัวต่อตัวและมองหาพฤติกรรมที่ไม่เกี่ยวกับภาษา (เช่นพยักหน้า) และการเข้ารหัสเวลาและหมวดหมู่ของแต่ละรายการ เหตุการณ์ ข้อมูลนี้อาจได้รับการพิจารณาว่าเป็นชุดข้อมูลที่ไม่ต่อเนื่องโดยมีอัตราการสุ่มตัวอย่างสูง (30 เฟรม / วินาที) หรือเป็นอนุกรมเวลาต่อเนื่องแล้วแต่ว่างานใดจะใช้งานได้ง่ายกว่า

ฉันต้องการคำนวณความน่าเชื่อถือระหว่างผู้ประเมินบางอย่าง แต่ฉันคาดว่าจะมีความไม่แน่นอนเมื่อเกิดเหตุการณ์ขึ้น นั่นคือฉันคาดหวังว่า coder หนึ่งอาจยกตัวอย่างเช่นโค้ดที่การเคลื่อนไหวบางอย่างเริ่มต้นขึ้นภายในหนึ่งวินาทีหลังจากที่ตัวแปลงสัญญาณอื่นคิดว่ามันเริ่มต้นขึ้น สิ่งเหล่านี้เป็นเหตุการณ์ที่เกิดขึ้นน้อยมากหากสิ่งนั้นช่วยได้ โดยทั่วไปแล้วอย่างน้อยหลายวินาที (หลายร้อยเฟรมวิดีโอ) ระหว่างเหตุการณ์

มีวิธีที่ดีของการประเมินความน่าเชื่อถือระหว่างผู้ประเมินที่มีลักษณะที่ทั้งสองเหล่านี้ชนิดของข้อตกลงและความขัดแย้ง (1) ทำผู้ประเมินเห็นด้วยกับสิ่งที่เหตุการณ์ที่เกิดขึ้น (ถ้ามี) และ (2) พวกเขาไม่เห็นด้วยในเมื่อมันเกิดขึ้น? ข้อที่สองมีความสำคัญต่อฉันเพราะฉันสนใจที่จะดูเวลาของเหตุการณ์เหล่านี้เทียบกับสิ่งอื่น ๆ ที่เกิดขึ้นในการสนทนาเหมือนกับที่คนอื่นพูดกัน

การฝึกมาตรฐานในสาขาของฉันดูเหมือนจะแบ่งสิ่งต่าง ๆ ออกเป็นชิ้นเวลาพูด 1/4 ของวินาทีหรือมากกว่านั้นรวมเหตุการณ์ที่ผู้ทำโค้ดแต่ละคนรายงานต่อเวลาชิ้นจากนั้นคำนวณคัปปาของโคเฮนหรือการวัดที่คล้ายกัน แต่ตัวเลือกระยะเวลาการแบ่งเป็นแบบเฉพาะกิจและฉันไม่ได้รับความคิดที่ดีเกี่ยวกับความไม่แน่นอนในช่วงเวลาของเหตุการณ์

ความคิดที่ดีที่สุดที่ฉันมีมาจนถึงตอนนี้คือฉันสามารถคำนวณกราฟความน่าเชื่อถือบางชนิดได้ สิ่งที่คล้ายคัปปาเป็นฟังก์ชั่นของขนาดของหน้าต่างที่ฉันพิจารณาสองเหตุการณ์ว่าถูกให้รหัสในเวลาเดียวกัน ฉันไม่แน่ใจจริงๆว่าจะไปจากที่นั่น ...


ดูเหมือนว่าสถานการณ์ที่สามารถใช้วิธีการวิเคราะห์ข้อมูลการทำงานได้ คุณคิดว่าพวกเขา?
mpiktas

ฉันคิดเกี่ยวกับการวิเคราะห์ข้อมูลการทำงาน แต่มันไม่ใช่เรื่องที่ฉันคุ้นเคย ตอนนี้ฉันกำลังทำงานกับ Ramsay และหนังสือของ Silverman แต่ฉันไม่เห็นวิธีจัดการกับตัวแปรผลลัพธ์แบบหลายชื่อในทันที ... ?

มีมาตรฐานทองคำสำหรับการวัดเหล่านั้น (เช่นคุณรู้หรือไม่เมื่อมีเหตุการณ์ที่น่าสนใจเกิดขึ้น) มีโคเดอร์จำนวนเท่าใดในการศึกษานี้? เราสามารถคาดการณ์เหตุการณ์ที่แตกต่างได้กี่เหตุการณ์
chl

คำตอบ:


2

ต่อไปนี้เป็นวิธีคิดสองวิธี

1

A) คุณสามารถปฏิบัติตามลำดับ codings เต็มรูปแบบตามลำดับเหตุการณ์ (เช่น ["พยักหน้าหัว", "หัวสั่น", "หัวผงกหัว", "ยกคิ้ว"] และ ["หัวพยักหน้า", "หัวสั่น" , "ยกคิ้ว"]) จากนั้นจัดลำดับตามลำดับโดยใช้อัลกอริทึมที่เหมาะสมกับคุณ ( http://en.wikipedia.org/wiki/Sequence_alignment ) จากนั้นคุณสามารถคำนวณความน่าเชื่อถือของ coder อินเตอร์สำหรับลำดับทั้งหมด

B) จากนั้นอีกครั้งโดยใช้ลำดับที่จัดชิดคุณสามารถเปรียบเทียบเมื่อพวกเขากล่าวว่าเหตุการณ์ที่เกิดขึ้นเนื่องจากพวกเขาทั้งสองสังเกตเห็นเหตุการณ์

2) อีกวิธีหนึ่งคุณสามารถสร้างแบบจำลองนี้เป็นแบบซ่อนมาร์คอฟและใช้บางอย่างเช่นอัลกอรึทึม Baumn-Welch เพื่อกำหนดความน่าจะเป็นที่ทำให้เกิดเหตุการณ์จริงขึ้นมา http://en.wikipedia.org/wiki/Baum-Welch_algorithm


เทคนิคนี้ดูเหมือนจะคล้ายกับสิ่งที่Grafsgaard 2012ทำเพื่อให้เกิดเสียงที่คล้ายกัน
KevinL

0

แทนที่จะแบ่งข้อมูลออกเป็นส่วน ๆ คุณสามารถพิจารณาความแตกต่างของเวลาจริงได้ Coder 1 รายงานเวลาและการกระทำ:

049 D
113 C
513 C
724 G

วิธีง่ายๆในการดูว่า coder ใดที่น่าเชื่อถือที่สุดตามโคเดอร์อื่น ๆ คือให้คะแนนดังนี้:

Add a point for each other coder that reported a D between (049-025) and (049+025)
Add a point for each other coder that reported a C between (113-025) and (113+025)
Add a point for each other coder that reported a C between (513-025) and (513+025)
Add a point for each other coder that reported a C between (724-025) and (724+025)
Subtract a point for each reported action.

หากความใกล้ชิดมีความสำคัญสำหรับคุณให้พิจารณาทางเลือกเช่นนี้:

Add 25/(Time_Thiscoder-Time_Othercoder)^2 points for each other coder that reported a matching observation.

ด้วยข้อมูลปัญหาทั้งหมดที่มีอยู่คุณจึงไม่ควรใช้ความคิดนี้ในทางปฏิบัติ


1
"25" มาจากไหน คุณมีการอ้างอิงหรือคุณสามารถอธิบายทฤษฎีที่แสดงให้เห็นถึงข้อเสนอนี้หรือไม่?
whuber
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.