คำถามสัมภาษณ์ที่ดีสำหรับผู้สมัครขั้นตอนวิธีเชิงสถิติคืออะไร?


15

ฉันกำลังสัมภาษณ์ผู้คนถึงตำแหน่งนักพัฒนาอัลกอริทึม / นักวิจัยในด้านสถิติ / การเรียนรู้ของเครื่องจักร / บริบทการขุดข้อมูล

ฉันกำลังมองหาคำถามที่จะถามเพื่อพิจารณาเป็นพิเศษความคุ้นเคยความเข้าใจและความลื่นไหลของผู้สมัครกับทฤษฎีพื้นฐานเช่นคุณสมบัติพื้นฐานของความคาดหวังและความแปรปรวนการแจกแจงทั่วไปบางอย่าง ฯลฯ

คำถามไปที่ปัจจุบันของฉันคือ: "มีปริมาณที่ไม่รู้จักซึ่งเราอยากจะประเมินด้วยเหตุนี้เรามีตัวประมาณY 1 , Y 2 , , Y nซึ่งได้รับXนั้นไม่เอนเอียงและเป็นอิสระและ แต่ละคนมีความแปรปรวนที่รู้จักกันσ 2 ฉันแตกต่างกันไปสำหรับแต่ละคนค้นหาตัวประมาณที่เหมาะสมที่สุดY = f ( Y 1 , , Y n )ซึ่งไม่เอนเอียงและมีความแปรปรวนน้อยที่สุด "XY1,Y2,...,YnXσผม2Y=(Y1,...,Yn)

ฉันคาดหวังว่าผู้สมัครที่จริงจังในการจัดการกับมันได้อย่างง่ายดาย (ให้เวลาในการคำนวณการคำนวณ) แต่ฉันก็ยังประหลาดใจกับจำนวนผู้สมัครที่คาดคะเนจากสาขาที่เกี่ยวข้องล้มเหลวที่จะทำให้ความคืบหน้าเล็กน้อย ฉันคิดว่าเป็นคำถามที่ดีและเลือกปฏิบัติ ปัญหาเดียวของคำถามนี้คือมันเป็นปัญหาเดียวเท่านั้น

คำถามอื่นใดที่สามารถนำมาใช้กับเรื่องนี้ได้? อีกวิธีหนึ่งฉันจะค้นหาชุดคำถามเหล่านี้ได้จากที่ใด


7
สำหรับคนที่เรียนรู้ด้วยเครื่องหลายคน (รวมถึงคนดี) คำถามนั้นเป็นวิธีที่ไม่สะดวกสบาย นี่เป็นคำถามเชิงสถิติที่ชัดเจน
Marc Claesen

4
คำถามนี้เป็นเส้นขอบบน / ปิดหัวข้อที่ถูกต้องตามกฎหมาย อย่างไรก็ตามมันมีหลายมุมมอง, อัปโหลดหลายครั้ง, คำตอบที่มีหลายอัปโหลด, &, ยิ่งไปกว่านั้นคือ CW มันคงเปิดอยู่ IMO
gung - Reinstate Monica

2
XXXX

4
ข้อควรระวัง Google ได้ทำการศึกษาอย่างมากเกี่ยวกับกระบวนการทรัพยากรบุคคลภายในของพวกเขาและพบว่าคะแนนผู้สัมภาษณ์ไม่สัมพันธ์กับผลการปฏิบัติงานในครั้งต่อไป !! ความประทับใจของฉันเกี่ยวกับวรรณกรรมที่นี่คือ (1) คำถามประเภทปริศนาเป็นสิ่งที่เลวร้ายที่สุดการให้บริการเพียงเพื่อทำให้ผู้สัมภาษณ์รู้สึกฉลาด (เช่นพลังพยากรณ์ 0) และ (2) ประวัติย่อคำถามจากประสบการณ์อาจมีค่าคาดการณ์ได้ ประสิทธิภาพที่ผ่านมาคาดการณ์ประสิทธิภาพในอนาคต & คุณอาจต้องการโฟกัสคำถามเพื่อยืนยันว่าผลการดำเนินงานในอดีตของพวกเขาคืออะไร แต่การสัมภาษณ์นั้นให้ข้อมูลน้อยกว่าที่ผู้สัมภาษณ์คิด
Matthew Gunn

3
ความเป็นกลางมีการประกันโดยการมีน้ำหนักรวมถึงความสามัคคี อย่างไรก็ตามแม้กระทั่งการ จำกัด โซลูชันของคุณกับชุดค่าผสมเชิงเส้นของตัวประมาณค่ามันก็มักจะเป็นกรณีที่ตัวประมาณค่าหลายตัวที่ใช้ข้อมูลเดียวกันจะมีความสัมพันธ์สูง (หากพวกเขามีความเป็นอิสระอย่างแท้จริงพวกเขาก็จะถูกนำไปใช้เพื่อแยกส่วนย่อยของข้อมูลที่เป็นอิสระ) มันไม่ชัดเจนเลยว่าการรวมกันเชิงเส้นของตัวประมาณจะเหมาะสมที่สุด
whuber

คำตอบ:


12

คุณต้องการให้นักพัฒนาสถิติของคุณทำอะไร

กองทัพสหรัฐฯกล่าวว่า "ฝึกให้คุณต่อสู้เพราะคุณจะต่อสู้เหมือนคุณได้รับการฝึกฝน" ทดสอบพวกเขาในสิ่งที่คุณต้องการให้พวกเขาทำตลอดทั้งวัน คุณต้องการให้พวกเขา "สร้างคุณค่า" หรือ "สร้างรายได้" ให้กับ บริษัท

บอส 101

คิดว่า "แสดงเงินให้ฉัน"

  • เงินเติบโตบนต้นไม้ที่เรียกว่าพนักงาน คุณใส่ใน "ค่าเล็กน้อย" (ค่าจ้างของพวกเขา) และพวกเขาจ่ายให้คุณ "ไตรมาส" (มูลค่าของพวกเขา)
  • หากคุณไม่สามารถเกี่ยวข้องกับงานของพวกเขากับวิธีที่พวกเขาสร้างรายได้ให้กับ บริษัท แล้วคุณหรือพวกเขาไม่ได้ทำงานอย่างถูกต้อง

หมายเหตุ: หากคำถามการจัดการเชิงสัญลักษณ์ของคุณไม่ได้เชื่อมต่อกับ "เงิน" อย่างเรียบร้อยคุณอาจกำลังถามคำถามที่ผิด

มี 3 สิ่งที่พนักงานทุกคนต้องทำเพื่อเป็นพนักงาน:

  • สามารถทำงานได้จริง
  • ทำงานได้ดีกับทีม
  • เต็มใจ / มีแรงบันดาลใจในการทำงาน

ถ้าคุณไม่เข้าใจว่าหินเหล่านี้จะไม่มีคำตอบอื่นใดให้คุณทำได้ดี

หากคุณสามารถแทนที่ซอฟต์แวร์เหล่านั้นด้วยซอฟต์แวร์ที่ดีหรือวัยรุ่นที่ผ่านการฝึกอบรมมาอย่างดีแล้วคุณจะต้องทำสิ่งนั้นในที่สุดและจะทำให้คุณเสียค่าใช้จ่าย

ข้อมูล 101

สิ่งที่พวกเขาควรทำ:

  • ใช้ซอฟต์แวร์รสชาติภายในของคุณ (เครือข่าย, ระบบปฏิบัติการ, สำนักงาน, การนำเสนอและการวิเคราะห์)
  • ใช้ซอฟต์แวร์มาตรฐานอุตสาหกรรมบางอย่าง (Excel, R, JMP, MatLab, pick_three )
  • รับข้อมูลด้วยตนเอง พวกเขาควรรู้ชุดข้อมูลพื้นฐานสำหรับงานพื้นฐาน พวกเขาควรรู้ที่เก็บ พวกเขาควรรู้ว่าจะใช้ข้อมูลที่มีชื่อเสียงสำหรับงานใด ฟิชเชอร์ไอริส เพียร์สันปู ... อาจมีองค์ประกอบ 20 อย่างที่ควรไปที่นี่ UCI, NIST, NOAA
  • พวกเขาควรรู้กฎการจัดการข้อมูล ข้อมูลไบนารี (T / F) มีเนื้อหาข้อมูลที่แตกต่างจากหมวด (A, B, C, D) หรือต่อเนื่อง การจัดการข้อมูลอย่างเหมาะสมตามประเภทข้อมูลเป็นสิ่งสำคัญ
  • งานทางสถิติขั้นพื้นฐานบางอย่างประกอบด้วย: งานทั้งสองนี้เหมือนหรือแตกต่างกัน (aka cluster / classify) สิ่งนี้เกี่ยวข้องกับอย่างไร
    (การถดถอย / การประกอบรวมถึงแบบจำลองเชิงเส้น, glm, พื้นฐานรัศมี,
    สมการความแตกต่าง) เป็นจริงหรือไม่ "x "(การทดสอบสมมติฐาน) ฉันต้องการตัวอย่างกี่ตัวอย่าง (ยอมรับการสุ่มตัวอย่าง) ฉันจะได้รับ
    ข้อมูลมากที่สุดจากการทดลองน้อย / ราคาถูก / มีประสิทธิภาพ (การออกแบบทางสถิติของ
    การทดลอง) - ข้อจำกัดความรับผิดชอบฉันเป็นวิศวกรไม่ใช่นักสถิติ คุณอาจถามพวกเขา คำถาม "งานพื้นฐานที่แตกต่างกันคืออะไรและคุณทดสอบอย่างไรว่านักสถิติสามารถทำงานได้อย่างมีประสิทธิภาพและถูกต้อง?
  • เข้าถึง / ใช้ข้อมูลด้วยตนเอง นี่คือเกี่ยวกับรูปแบบและเครื่องมือ
    พวกเขาควรจะสามารถอ่านได้จาก csv, xlsx (excel), SQL และ
    รูปภาพ (HDF5, Rdata) หากคุณมีรูปแบบที่กำหนดเองพวกเขาควร
    จะสามารถอ่านมันและทำงานกับเครื่องมือได้อย่างรวดเร็วและ
    มีประสิทธิภาพ พวกเขาควรรู้จุดแข็ง / จุดอ่อนของรูปแบบ CSV คือการใช้งานที่รวดเร็วรับไปตลอดกาลต้นแบบที่รวดเร็ว แต่ป่องไม่มีประสิทธิภาพและทำงานช้า
  • ประมวลผลข้อมูลอย่างถูกต้องโดยใช้แนวปฏิบัติที่เหมาะสมและไม่ทำบาป อย่าทิ้งข้อมูลไปเลย ไม่พอดีกับข้อมูลทวินามกับสายต่อเนื่อง อย่าท้าทายฟิสิกส์
  • เกิดขึ้นกับผลลัพธ์ที่สามารถทำซ้ำและทำซ้ำได้ บาง
    คนพูดว่า "มีเรื่องโกหกคำด่าและสถิติ" แต่ไม่ใช่ที่
    บริษัทของฉัน อินพุตที่ดีเดียวกันให้ผลลัพธ์ที่ดีเหมือนกัน ผลลัพธ์ไม่ใช่ตัวเลข แต่เป็นการตัดสินใจทางธุรกิจที่แจ้งให้ทราบถึง
    การดำเนินการด้านเทคนิคและผลลัพธ์ในผลลัพธ์ทางธุรกิจ การทดสอบที่แตกต่างกันอาจตั้งค่าการหมุนที่ 5.5 หรือ 6.5 แต่ความสามารถนั้นสูงกว่า 1.33 เสมอ
  • นำเสนอการค้นพบในภาษาและในระดับที่
    ผู้มีอำนาจตัดสินใจและ / หรือผู้พัฒนา minion และ / หรือตนเองในหนึ่งปีสามารถ
    เข้าใจด้วยข้อผิดพลาดน้อยที่สุด สิ่งสวยงามสามารถอธิบายได้เพื่อให้คุณยายของคุณได้รับ นี่ ( ลิงค์ ) คือคำตอบของฉัน แต่ฉันชอบมัน

zingers วิเคราะห์:

ฉันคิดว่าคำถามที่เป็นไปไม่ได้นั้นยอดเยี่ยม พวกเขาเป็นไปไม่ได้ด้วยเหตุผล ความสามารถในการรู้ว่าสิ่งที่เป็นไปไม่ได้ออกประตูเป็นสิ่งที่ดี รู้ว่าทำไมการมีส่วนร่วมในบางวิธีหรือสามารถถามคำถามอื่น ๆ ได้ดีกว่า

คำถาม CV อื่น ๆ ( ลิงก์ ) ใน Reddit ( ลิงก์ ) อื่น ๆ ( ลิงก์ )

BTW: นี่เป็นคำถามที่ดี ฉันอาจต้องปรับปรุงคำตอบนี้เมื่อเวลาผ่านไป


3
นี่ดูเหมือนจะเป็นคำตอบที่ดีสำหรับคำถามที่แตกต่างจากคำถามที่ฉันถาม ฉันไม่ได้ถามว่าจะเลือกพนักงานที่ดีได้อย่างไร (ฉันอาจถามอะไรแบบนั้นในที่ทำงานถ้าฉันต้องการ) ฉันถามเกี่ยวกับการทดสอบคุณสมบัติเฉพาะ
Meni Rosenfeld

ฉันจะลดลงเป็นสถิติเท่านั้นแล้ว
EngrStudent - Reinstate Monica
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.