การเซ็นเซอร์และการตัดทอนแตกต่างกันอย่างไร


30

ในหนังสือแบบจำลองทางสถิติและวิธีการสำหรับข้อมูลอายุการใช้งานเขียนไว้:

การเซ็นเซอร์:เมื่อการสังเกตไม่สมบูรณ์เนื่องจากสาเหตุบางอย่างแบบสุ่ม
การตัดปลาย:เมื่อธรรมชาติที่ไม่สมบูรณ์ของการสังเกตเกิดจากกระบวนการคัดเลือกอย่างเป็นระบบซึ่งมีอยู่ในการออกแบบการศึกษา

อะไรคือความหมายของ "กระบวนการคัดเลือกอย่างเป็นระบบซึ่งมีอยู่ในการออกแบบการศึกษา" ในคำจำกัดความของการตัดทอน?

การเซ็นเซอร์และการตัดทอนแตกต่างกันอย่างไร


3
ลองดูที่คำตอบที่นี่
Dimitriy V. Masterov

3
การเซ็นเซอร์: "เราเคยสังเกตในภูมิภาคนั้นที่ไหนซักแห่ง แต่เราไม่รู้ว่ามันคืออะไร" การตัดปลาย: "การสังเกต? การสังเกตคืออะไร"
Glen_b -Reinstate Monica

คำจำกัดความของคุณมาจากไหน
Glen_b -Reinstate Monica

1
@Glen_b ฉันได้แก้ไขคำถามของฉัน
ABC

คำตอบ:


57

คำจำกัดความแตกต่างกันไปและบางครั้งทั้งสองคำจะใช้แทนกันได้ ฉันจะพยายามอธิบายการใช้งานทั่วไปโดยใช้ชุดข้อมูลต่อไปนี้:

11.25245

การเซ็นเซอร์ :การสังเกตบางอย่างจะถูกเซ็นเซอร์ซึ่งหมายความว่าเราจะรู้ว่ามันอยู่ด้านล่าง (หรือสูงกว่า) บางขอบเขต เช่นนี้สามารถเกิดขึ้นได้ถ้าเราวัดความเข้มข้นของสารเคมีในตัวอย่างน้ำ หากความเข้มข้นต่ำเกินไปอุปกรณ์ในห้องปฏิบัติการจะไม่สามารถตรวจพบสารเคมีได้ มันอาจยังปรากฏอยู่ดังนั้นเราจึงรู้เพียงว่าความเข้มข้นต่ำกว่าขีด จำกัด การตรวจจับของห้องปฏิบัติการ

<1.5<1.5245,

การตัดปลาย :กระบวนการที่สร้างข้อมูลนั้นเป็นไปได้ที่จะสังเกตผลลัพธ์ข้างบน (หรือด้านล่าง) ขีด จำกัด การตัด เช่นนี้สามารถเกิดขึ้นได้หากการวัดนั้นใช้เครื่องตรวจจับซึ่งจะเปิดใช้งานเฉพาะเมื่อสัญญาณที่ตรวจพบอยู่เกินขีด จำกัด ที่กำหนด อาจมีสัญญาณขาเข้าที่อ่อนแอจำนวนมาก แต่เราไม่สามารถบอกได้โดยใช้เครื่องตรวจจับนี้

245

ดังนั้นในการใช้คำนี้ "เซ็นเซอร์" จะทำให้เข้าใจผิดถ้าเราคิดว่าในแง่ของการใช้คำที่ไม่ใช่ด้านเทคนิคของคำ? เช่นในความหมายทางสถิตินี้มันหมายถึงบางสิ่งบางอย่างเช่น "คลุมเครือ" หรือ "รู้เพียงตกอยู่ในช่วง" แทนที่จะเป็นในสิ่งที่ไม่ใช่ความรู้สึกด้านเทคนิค - คือเก็บกดหรือลบออกเมื่อหนังสือถูกลบออกจากร้านเพราะ ของเนื้อหา
ดาวอังคาร

3
สำหรับตัวอย่างที่เป็นรูปธรรมของการตัดทอน บริษัท ประกันภัยรถยนต์ไม่เคยได้ยินเกี่ยวกับอุบัติเหตุที่ความเสียหายนั้นน้อยกว่าการหักลดหย่อนเนื่องจากผู้คนไม่ได้รายงานที่นั่น นี่คือการตัดทอนเหลือ เราไม่เคยเห็นข้อมูลเกี่ยวกับเหตุการณ์เหล่านี้เลย สำหรับตัวอย่างของการเซ็นเซอร์ที่ถูกต้องเมื่อผู้ป่วยป่วยตัดสินใจหยุดพบแพทย์หรือย้ายไปยังเมืองอื่นแล้วสิ่งที่เป็นที่รู้จักก็คือพวกเขายังมีชีวิตอยู่ในวันที่พวกเขาจากไป แต่เราไม่รู้ว่าพวกเขาตายเมื่อไหร่ .
เดวิดไวท์

@Mars: ฉันยอมรับว่ามันฟังดูย้อนหลังจากการใช้ที่ไม่ใช่ด้านเทคนิคที่ทันสมัยซึ่ง "การเซ็นเซอร์" กำลังลบร่องรอยทั้งหมดและ "การตัดทอน" กำลังลบรายละเอียด แต่ในสถิติ "การเซ็นเซอร์" ถูกนำมาใช้ในความรู้สึกที่ไม่ใช่ด้านเทคนิคที่เซ็นเซอร์สามารถลบออกได้ แต่ไม่กำจัดร่องรอยใด ๆ : กล่องสีดำหรือพร่าเลือนไปวางบนส่วนที่ไม่เหมาะสมของภาพถ่ายหรือวิดีโอ ทางวิทยุหรือจดหมายของทหารไปที่บ้านหรือเอกสารที่เป็นความลับที่ถูกตัดออก (ส่วนคำที่ทันสมัยกว่า "redacted") จะถูกลบออก
Wayne

ลองนึกภาพฉันวัดเวลาล่วงเลยไประหว่างเหตุการณ์เหตุการณ์สองประเภท แต่ฉันสามารถบันทึกเหตุการณ์ได้เพียง 1 ปีเท่านั้น เวลาจะถูกเซ็นเซอร์หรือถูกตัดทอน?
skan

4

เช่นเดียวกับมุมมองจากสาขาอื่น (การเขียนโปรแกรม) การตัดและการตัดทอนเป็นการดำเนินการสองอย่างที่แตกต่างกัน

เมื่อทำงานกับชุดข้อมูลที่ละเอียดอ่อนเช่นหมายเลขประกันสังคมและหมายเลขโทรศัพท์ฉันอาจตรวจสอบหรือให้เซ็นเซอร์ตรวจสอบก่อนที่จะอนุญาตให้เข้าถึง:

123-12-1234 => 999-99-9999
567-56-5678 => 999-99-9999
(906) 123-4567 => (000) 000-0000

สิ่งนี้ช่วยให้แอปพลิเคชั่นที่เหลือสามารถทำงานได้ตามปกติโดยมีโครงสร้างข้อมูลที่คล้ายกัน แต่ไม่มีเนื้อหาข้อมูลจริงหรือการเผยแพร่ข้อมูลส่วนตัว

ในทางตรงกันข้ามการตัดทอนมักจะตัดค่าที่เหลือหลังจากจุดหนึ่ง ในการทำงานกับแอปพลิเคชันฉันไม่ต้องการบันทึกเป็นร้อยเป็นพันบางทีฉันอาจต้องมีเพียง 50 รายการเท่านั้นที่ทำให้การเข้าถึงข้อมูลเร็วขึ้นมากและชุดข้อมูลมีขนาดเล็กลง

ตัวแปรที่คล้ายกันของการตัดปลายคือการแทรกค่าลงในคอลัมน์หรือประเภทข้อมูลที่มีความยาวหรือความแม่นยำ จำกัด :

abcdefghijklmnopqrstuv => abcdef
10.23412421345 => 10.23
10.92455311 => 10

1
+1 สิ่งสำคัญคือต้องรู้ว่าการตัดและตัดทอนอาจมีความหมายที่แตกต่างไปจากเดิมอย่างสิ้นเชิง!
MånsT
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.