ลูกค้าต้องการให้เรากลั่นกรองเครื่องทำงานเพื่อสื่อลามก มันเป็นไปได้?


30

ไคลเอนต์เป็นเวลานานได้ขอให้เราช่วยกลั่นกรองงานของพวกเขาสำหรับสื่อลามก พวกเขากังวลเกี่ยวกับความรับผิดชอบหากพบวัสดุที่ละเอียดอ่อน ข้อกังวลหลักของพวกเขา (ด้วยเหตุผลที่ชัดเจน) คือไฟล์วิดีโอเสียงและรูปภาพ หากเป็นไปได้พวกเขาต้องการสแกนเอกสารที่เป็นข้อความเพื่อหาเนื้อหาที่ไม่เหมาะสม พวกเขามีลำดับขั้นของเนื้อหาที่ไม่เหมาะกับการทำงานที่เริ่มต้นโดยผิดกฎหมายโจ๋งครึ่ม (ฉันไม่จำเป็นต้องใส่รายละเอียด) เลื่อนลงไปสู่ความไม่พอใจอย่างเห็นได้ชัดและรวมถึงสิ่งที่อาจเป็นที่น่ารังเกียจสำหรับบางคนด้วย ก้นแตกและอะไรที่เกี่ยวข้องกับโฮวี่ Mandel

คำถามของฉันคือ:

  • จริยธรรมนี้หรือไม่ ฉันคิดว่าเป็นเพราะพนักงานทุกคนเห็นพ้องต้องกันว่าเครื่องทำงานเป็นของ บริษัท และอยู่ภายใต้การค้นหา การฉายภาพยนตร์จะไม่เกิดขึ้นกับเครื่องส่วนตัวที่นำมาใช้งาน
  • เป็นไปได้ไหม ฉันได้ทำการประมวลผลภาพ / การจัดทำดัชนีมาหลายครั้งแล้ว แต่ดูเหมือนว่าโลกใหม่แห่งความซับซ้อน
  • มีการอ้างอิงถึงเทคนิคที่ประสบความสำเร็จในการค้นพบสื่อลามกหรือไม่?
  • ฉันควรจะเก็บผลลัพธ์เมื่อมีการค้นพบอะไรหรือไม่

29
สื่อลามกที่จะใช้ในการทดสอบนี้?
ChaosPandion

12
ฉันต้องการเป็นผู้ทดสอบสำหรับโครงการนี้ !!
Mayank

56
สร้างสคริปต์ที่โพสต์ภาพทั้งหมดที่พบใน 4chan; ถ้าสมาชิกคนอื่นตอบว่า "MOAR!" คุณก็รู้ว่ามันเป็นเรื่องลามก หากสคริปต์ถูกแบนอาจเป็น CP
281377

8
คุณต้องคิดว่ามีผลิตภัณฑ์เชิงพาณิชย์มากมายสำหรับผลิตภัณฑ์นี้
GrandmasterB

34
คำถามที่ซื่อสัตย์: นี่เป็นปัญหาที่เกิดขึ้นจริงหรือ พรบนคอมพิวเตอร์ที่ทำงานหรือไม่ ฉันหมายถึง…ใครทำอย่างนั้น? นอกจากนี้พวกเขาตั้งใจจะจัดการกับเนื้อหาอนาจารโดยไม่ตั้งใจอย่างไร GF ของฉันมีไวรัสบนพีซีที่ทำงานของเธอเมื่อเร็ว ๆ นี้ซึ่งเปลี่ยนเส้นทาง Google ไปยังเว็บไซต์ลามกโดยไม่ตั้งใจและบ่อยครั้งที่ฉันจะพิมพ์ "python.com" [NSFW!] โดยไม่ได้ตั้งใจแทนที่จะเป็น "python.org" ... มีอะไรมากกว่านี้ จริงๆแล้วมีปัญหาฉันคิดว่านี่เป็นการทรยศต่อความไว้วางใจและ / หรือปัญหาด้านอาชีพใน บริษัท ที่อยู่ที่แทนที่จะค้นหาคอมพิวเตอร์
Konrad Rudolph

คำตอบ:


125

คุณสามารถทำได้ด้วย 90% Headology , 10% software

ประการแรกสแกนคอมพิวเตอร์ของพนักงานอย่างเงียบ ๆ สร้างฐานข้อมูลไฟล์และขนาดสำหรับพนักงานแต่ละคน

จากนั้นทำบันทึกย่อว่าพีซีทั้งหมดจะถูกสแกนเพื่อหาเนื้อหาที่น่าสงสัยเช่นหัวหน้ามีShazamเช่นโปรแกรมที่สามารถระบุสื่อลามก ฯลฯ

หลังจากนั้นสองสามวันให้สแกนคอมพิวเตอร์เพื่อหาไฟล์และขนาดอีกครั้ง ดูไฟล์ที่ถูกลบไฟล์เหล่านั้นเป็นไฟล์ภาพยนตร์หรือไฟล์ภาพหรือไม่? จากนั้นเป็นพนักงานที่คุณต้องจับตามอง

สแกนรูปภาพและภาพยนตร์ของพนักงานพีซีเหล่านั้นเป็นประจำและตรวจสอบเนื้อหาที่น่าสงสัยด้วยตนเอง


9
และ +1 สำหรับการกล่าวถึงต้นกำเนิด
TRiG

5
@ ไบนารี: วิธีการสองขั้นตอนเป็นที่น่าประทับใจแน่นอน
Matthieu M.

2
+1จากฉันสำหรับการอ้างอิงถึงยาย!
sbi

2
@ ไม่ระบุชื่อในขณะที่คุณอยู่ที่นี่ สร้าง GUI ใน Visual Basic เพื่อดูว่าคุณสามารถติดตามที่อยู่ IP ได้หรือไม่ youtube.com/watch?v=hkDD03yeLnU อย่างจริงจังแม้ว่านี่เป็นวิธีที่ยอดเยี่ยมของเทคนิคในการเขียนสคริปต์รายการทีวีเรทที่สอง
Evan Plaice

2
ช่างเป็นความคิดที่ชั่วร้าย! รักเลย♥
Chani

75

นี่เป็นงานเครือข่ายประสาทที่เห็นได้ชัด ก่อนอื่นคุณต้องมีชุดฝึกอบรมภาพจำนวนมากที่คัดเลือกโดยผู้เชี่ยวชาญใน บริษัท ของคุณ .....

ทางออกที่มีประสิทธิภาพมากขึ้นคือการประกาศว่าคุณจะตรวจสอบทุก ๆ เครื่องสำหรับสื่อลามก NEXT สัปดาห์ / เดือน / อะไรก็ตามจากนั้นเขียนแอปง่าย ๆ ที่เพียงแค่ออกกำลังกายดิสก์ ฉันรับประกันได้ว่าเครื่องจะได้รับการทำความสะอาดแล้ว


ป.ล. - คะแนน 'จริงจัง' สองเท่า - จริง ๆ แล้วคุณไม่ต้องการค้นหาอะไรเลย

หากคุณพบภาพสองสามภาพในแคชของเบราว์เซอร์บางทีพวกเขาอาจจะไปถึงลิงค์ที่ไม่ดีหรือป๊อปอัปซึ่งหลบ ๆ - จำได้ไหมว่าครูยิงไปที่ whitehouse.com? หากคุณยิง / ลงโทษพวกเขาในเรื่องนี้ก็จะมีฟันเฟืองจากคนงาน / สหภาพ บริษัท ของคุณจะทำงานอย่างไรหากการคลิกทุกครั้งจะต้องถูกส่งไปยังกฎหมายเพื่อขออนุมัติก่อนที่พนักงานของคุณจะทำการวิจัยคำถามหรือตรวจสอบราคาออนไลน์

หากคุณพบสื่อลามกบนเครื่องคุณจะพิสูจน์ได้อย่างไรว่าพนักงานคนนั้นใส่มันไว้ที่นั่น? คุณมีระบบรักษาความปลอดภัยและการตรวจสอบที่จะขึ้นศาลหรือไม่? คุณใช้ (หรือแม้แต่รู้จัก) ระบบปฏิบัติการที่ผู้ดูแลระบบไม่สามารถวางไว้ที่นั่นและทำให้มันดูเหมือนไฟล์ของผู้ใช้หรือไม่?

นอกจากนี้ในประสบการณ์ของฉันตำแหน่งที่พบบ่อยที่สุดสำหรับการหยุดชะงักของสื่อลามกนั้นอยู่ในแล็ปท็อปของ CxO และรองประธานอาวุโส

มันดีกว่าที่จะจัดเรียงไฟล์ให้หายไปก่อนเวลา


+1 - แม้ว่าฉันจะรวมสิ่งนี้กับเช็คที่ใช้มนุษย์% อาจจะสุ่มเลือก 0.1% ของเวิร์กสเตชันสำหรับการตรวจสอบจริง
Drew

@ นินี่: มาร์ตินกำลังสร้างเรื่องตลกเกี่ยวกับชุดฝึกซ้อม
Andrew Grimm

นี้เป็นทางออกที่ตลกมากและเป็นหนึ่งที่ถูกต้อง :)
crosenblum

10
รอ. คุณรู้ได้อย่างไรว่าฉันวางสื่อลามกลงในแล็ปท็อปของ CEO
Jaap

1
ฉันต้องการจะประหลาดใจถ้าคนจะจริงๆลบทั้งหมดโป๊ของพวกเขาเมื่อต้องเผชิญกับความคาดหวังของเครื่องของพวกเขาได้รับการสแกน โปรแกรมเมอร์อาจจะทำเช่นนั้น แต่คนอื่น ๆ ของ IME นั้นล้วน แต่เป็นคนที่ "แปลก" เกี่ยวกับสิ่งเหล่านี้ อย่างไรก็ตามคุณสามารถรวมสิ่งนี้เข้ากับแนวคิดของ Binary และมองเข้าไปใกล้เครื่องจักรเหล่านั้นที่มีการลบ MB จำนวนมาก อย่างไรก็ตาม+1จากฉันสำหรับการสังเกตที่คุณไม่ต้องการที่จะหาบางสิ่งบางอย่าง
sbi

8

วิธีการควบคุมนี้เจ็บปวดอย่างแน่นอนสำหรับทั้งพนักงานและคนไอที เมื่อมีสิ่งใดเข้าไปในเครื่องของพนักงานก็ไม่มีวิธีที่จะตรวจจับได้อย่างแน่นอน คุณต้องหยุดมันเข้าไปในเครื่องในสถานที่แรก
วิธีปฏิบัติที่เป็นที่รู้จักมากที่สุดในเรื่องนี้คือการควบคุมเว็บไซต์ / โดเมนที่สามารถเข้าชมได้อย่างชัดเจน รายการดังกล่าวจะต้องมีที่ไหนสักแห่งในเน็ต นอกจากนี้คุณยังสามารถติดตามจำนวนรูปภาพวิดีโอที่พนักงานดาวน์โหลดและจากที่มา
มีโอกาสที่วัสดุอาจมาจากที่อื่นนอกเหนือจากเว็บเช่นจากฮาร์ดไดรฟ์ภายนอก อาจมีการสแกนระบบสุ่มเดือนละครั้งซึ่งคุณสามารถสุ่มเลือกวิดีโอและรูปภาพและตรวจสอบด้วยตนเอง ไม่แน่ใจว่าจะสามารถทำได้ แต่การตรวจสอบภาพและวิดีโอโดยอัตโนมัตินั้นไม่อยู่ในขอบเขตที่แน่นอนและจะผิดพลาดอย่างแน่นอน
จริงๆแล้วฉันไม่ได้มีความคิดที่จะ จำกัด การทำงานของพนักงาน คุณควรเชื่อใจพนักงานในเรื่องนี้ พนักงานของคุณควรยุ่งพอในสำนักงานเพื่อให้พวกเขาไม่มีเวลาทำสิ่งนี้ ความกังวลมากขึ้นคือพนักงานไม่ทำงานของเขา / เธอใช่ไหม? หรือมีการติดตั้งซอฟต์แวร์ที่แตกหรือแฮ็กบ้าง


1
ฉันยอมรับว่านักพัฒนาซอฟต์แวร์และกลุ่มโฆษณาอื่น ๆ ไม่ควรมีเครื่องที่ล็อค อย่างไรก็ตาม - และเชื่อใจฉันเมื่อฉันพูดแบบนี้ - เมื่อคุณมีพนักงาน 200+ คนที่กำลังประมวลผลเอกสารเวิร์กโฟลว์คุณไม่ต้องการให้คนเหล่านั้นทำอะไรที่สามารถเบี่ยงเบนความสนใจของพวกเขาและรวมถึงเบราว์เซอร์ ใช่ 90% ของคนทำงานหนักและจะไม่ถูกรบกวน แต่นั่นหมายความว่าคุณจะมี 20+ gobshites ดึงปัสสาวะและไม่ก่อผล
ไบนารี Worrier

6
10% นั้นจะไม่ก่อผลเลย หากไม่ได้เรียกดูเว็บไซต์ให้ลองเล่นเกมอ่านหนังสือทำผิด ๆ นั่งเบื่อ ๆ ฯลฯ )
jwenting

2
ผู้คนสามารถทำงานให้เสร็จได้หรือไม่ สังเกตได้ง่ายกว่าเมื่อคุณมี 200 งานที่คล้ายกันที่สามารถวัดได้
JeffO

2
ในสหรัฐอเมริกามีปัญหาทางกฎหมายที่เกี่ยวข้องกับสื่อลามกบนคอมพิวเตอร์ของ บริษัท และมีประเด็นทางกฎหมายที่ร้ายแรงเกี่ยวกับสื่อลามกสำหรับเด็ก เป็นการปลอดภัยที่สุดที่จะมีนโยบายที่ไม่มีภาพอนาจารและดำเนินการตามขั้นตอนต่อไป
David Thornley

7

มีผลิตภัณฑ์จำนวนหนึ่งในตลาดที่ดำเนินการ "การกรองเนื้อหา" ในรูปแบบต่างๆ (การค้นหาโดย Google ในคำศัพท์ที่ชัดเจนทำให้ผู้สมัครบางคนเห็นได้ชัด) อาจเป็นความคิดที่ดีกว่าที่จะใช้หนึ่งในผลิตภัณฑ์เหล่านี้มากกว่าการสร้างซอฟต์แวร์สแกน / กรองจำนวนมากตั้งแต่เริ่มต้น อีกทางเลือกหนึ่งคือดูที่ชายแดน เช่นโดยการตรวจสอบอีเมลภายนอกและการเข้าชมเว็บ อีกครั้งมีผลิตภัณฑ์ที่ทำสิ่งนี้

ในขณะที่มีข้อสงสัยว่ามันเป็นจริยธรรมสำหรับ บริษัท ที่จะสแกนคอมพิวเตอร์สำหรับ "สิ่งที่ไม่ดี" นี้ไม่ได้หมายความว่าไม่มีปัญหา

ประเด็นแรก:

  • การกำหนดว่าอะไรคือสิ่งที่ไม่ใช่เนื้อหาที่น่ารังเกียจ
  • ซอฟต์แวร์สำหรับการตรวจจับภาพวิดีโอที่มี (ให้เราบอกว่า) "การพรรณนาถึงร่างกายที่เปลือยเปล่า" คือ (AFAIK) น่าจะไม่น่าเชื่อถือส่งผลให้เกิดผลบวกปลอมและลบเชิงลบ

ดังนั้น ... หมายความว่ามีคนในองค์กรของลูกค้าของคุณต้องตรวจสอบ "การเข้าชม" นั่นคือค่าใช้จ่าย

ปัญหาที่สอง: อาจมีคำอธิบายที่ไร้เดียงสา ไฟล์อาจถูกดาวน์โหลดโดยไม่ตั้งใจหรืออาจถูกเพื่อนร่วมงานที่พยาบาทตั้งไว้ หากมีคำอธิบายที่ไร้เดียงสาองค์กรของลูกค้าจะต้องระมัดระวังสิ่งที่พวกเขาทำ / พูด (ตกลงนี่ไม่ได้เป็นปัญหาของคุณจริงๆแต่คุณอาจจัดการกับการล้างย้อนกลับ)

ประเด็นที่สาม: ไม่ว่าจะมีสิทธิ์ในการตรวจสอบวัสดุที่ไม่เหมาะสม แต่พนักงานจำนวนมากจะพบว่าสิ่งนี้น่ารังเกียจ และหากพวกเขาอยู่ไกลเกินไปสิ่งนี้จะส่งผลกระทบต่อขวัญและกำลังใจของพนักงาน พนักงานบางคนจะ "เดิน" คนอื่นอาจทำการประท้วง ... เช่นโดยพยายามสร้างผลบวกปลอมจำนวนมาก (ไม่ใช่ปัญหาของคุณแต่ ... )

ปัญหาที่สี่: ผู้คนสามารถซ่อนเนื้อหาที่ไม่เหมาะสมโดยการเข้ารหัสโดยการใส่ลงในสื่อแบบพกพาหรือแบบถอดได้ ฯลฯ ผู้คนสามารถปลอมข้อมูลเมตาเพื่อให้ดูเหมือนว่าคนอื่นเป็นผู้รับผิดชอบ


1
OP กล่าวว่านี่เป็นปัญหาหนี้สินซึ่งมีเหตุผลอย่างมากในสหรัฐอเมริกา นั่นหมายถึงการเอาสิ่งต่าง ๆ ออกจากคอมพิวเตอร์โดยไม่จำเป็นต้องตำหนิผู้คน
David Thornley

ฉันจะบอกว่ามันเป็นมากกว่านั้น พิจารณาส่วนท้ายของรายการ "ไม่เหมาะกับการทำงาน" ในคำถาม ดูเหมือนว่ามีบางคนมี "วาระ" ...
สตีเฟนซี

@David: มันเป็นเรื่องเกี่ยวกับโทษคนเสมอ หากคุณมีปัญหาหนี้สินที่อาจเกิดขึ้นการหาคนที่จะตำหนิ ("บุคคลนี้ทำหน้าที่ละเมิดนโยบาย บริษัท และเราสามารถพิสูจน์ได้ดังนั้นจึงมีความรับผิดชอบเป็นการส่วนตัวมากกว่าที่เราเป็น บริษัท ") กลายเป็นวิธีการทำงานมาตรฐาน ในความเป็นจริงมันเป็นสิ่งที่คนส่วนใหญ่ในตำแหน่งที่รับผิดชอบใน บริษัท จำนวนมากใช้เวลาส่วนหนึ่งของพวกเขาทำพยายามหาคนที่จะตำหนิสำหรับสิ่งที่อาจผิดไปและมั่นใจว่าไม่มีใครสามารถตำหนิพวกเขาสำหรับปัญหาที่เกิดขึ้น ใน
jwenting

6

เกี่ยวกับกฎหมายในฝรั่งเศส:

เจ้านายเป็นเจ้าของคอมพิวเตอร์และการเชื่อมต่ออินเทอร์เน็ต: เขาสามารถทำอะไรก็ได้ที่เขาพอใจ

แต่ความเป็นส่วนตัวของพนักงานจะต้องไม่ถูกละเมิด หากไดเรกทอรีในคอมพิวเตอร์ชื่อ PERSONAL เจ้านายจะไม่ได้รับอนุญาตให้สแกน

วิธีเดียวที่จะหลีกเลี่ยงสิ่งนั้นคือการได้รับหลักฐานประกอบว่าพนักงานเก็บข้อมูลผิดกฎหมายและขอให้ศาลสแกนคอมพิวเตอร์ (โปรดทราบว่าภาพลามกอนาจารนั้นผิดกฎหมายในฝรั่งเศส)


ยกเว้นตราบเท่าที่มันเป็นเนื้อหาที่มีลิขสิทธิ์สิ่งใด ๆ ที่อาจถูกนับว่าเป็นการขโมย
TRiG

6
ในฝรั่งเศสมีความเห็นเกี่ยวกับข้อยกเว้นการคัดลอกส่วนตัว: คุณไม่ได้รับอนุญาตให้คัดลอกเนื้อหาที่มีลิขสิทธิ์ แต่ผู้ถือลิขสิทธิ์ไม่สามารถเรียกร้องอะไรได้หากสำเนาของคุณถูกนำไปใช้เป็นการส่วนตัว
mouviciel

ฉันต้องการอยู่ในฝรั่งเศส ... ยกเว้นฉันพูดภาษาฝรั่งเศสไม่ได้!
ไม่ระบุตัวตนพิมพ์

5

หากพนักงานเห็นพ้องต้องกันว่าเครื่องจักรทำงานของพวกเขาเป็นของ บริษัท และอยู่ภายใต้การค้นหาใช่ถูกต้องตามกฎหมาย สำหรับการพิสูจน์การเก็บถาวรของไฟล์น่าจะมีความจำเป็นมากที่สุด

สำหรับวิธีการหาวัสดุจริง คุณสามารถ:

  1. อันดับแรกและสำคัญที่สุดให้สแกนชื่อไฟล์เพื่อหาคำบางคำ (ลามก, เลสเบี้ยน, ฯลฯ )
  2. สแกนเอกสารข้อความเพื่อหาคำชุดเดียวกัน
  3. สำหรับรูปภาพคุณสามารถค้นหาสีเฉลี่ยของภาพและถ้าสีนั้นอยู่ในช่วงที่ส่วนใหญ่จะเรียกว่า 'เนื้อ' สีให้ตั้งค่าสถานะของภาพ (มีคนตรวจสอบภาพที่ถูกตั้งค่าสถานะเหล่านี้ซ้ำ ๆ ) ไม่ต้องการรายงานใครบางคนถึงภาพที่กลายเป็นภาพถ่ายครอบครัวจากชายหาด

หากคุณสแกนไฟล์ขณะที่พวกเขากำลังเข้าสู่คอมพิวเตอร์ (เช่นมีโปรแกรมโหลดทุกเครื่องทำงานและบันทึกกรณีที่ถูกทำเครื่องหมายฐานข้อมูลกลาง) แล้วฉันไม่คิดว่ามันจะเสือกเกินไป (นอกเหนือจากความไม่ไว้วางใจดัง นายจ้างชัดเจนสำหรับพนักงาน)

ด้วยไฟล์วิดีโอฉันไม่แน่ใจ 100% อาจเป็นวิธีที่คล้ายกันเช่นเดียวกับการสแกนภาพ (เลือกเฟรมแบบสุ่มและสแกนหาสี 'เนื้อ' ในระดับหนึ่ง)

การสแกนไฟล์เสียงดูเหมือนว่าจะเป็นการรู้จำเสียงพูดซึ่งเป็นเวิร์มที่เต็มไปด้วยเวิร์ม อย่างไรก็ตามการสแกนชื่อไฟล์นั้นทำได้ง่ายและสามารถทำได้เช่นเดียวกับเอกสารรูปภาพและวิดีโอ


ใช่ฉันกำลังคิดตามบรรทัดเดียวกัน โทนสีเนื้อแข็งกับพันธุ์ทั้งหมด ไม่ต้องพูดถึงภาพเก่าที่ยิ่งใหญ่ของหัวใครบางคน (เช่น gravatar ของฉัน) มีแนวโน้มที่จะเรียกเนื้อคำเตือนอัตราส่วนที่ไม่ใช่เนื้อ เริ่มต้นดีเลิศแล้ว
Scant Roger

ความเสี่ยงมากเกินไปจากผลบวกที่ผิดพลาด (ขึ้นอยู่กับส่วนของธุรกิจที่เกี่ยวข้อง)
jwenting

มีพื้นที่สีที่โทนสีผิวมนุษย์ส่วนใหญ่ตกอยู่ในช่วงที่กำหนด YCbCr ถ้าฉันจำได้ถูกต้อง สับรูปภาพให้เป็นบล็อกและในกรณีส่วนใหญ่บล็อกค่าพิกเซลเฉลี่ยอยู่ในช่วงให้ตั้งค่าสถานะเป็นภาพถ่าย "สกิน"
Vitor Py

มีปัญหาอื่นอีก บุคคลที่ได้รับมอบหมายให้ตรวจสอบวิดีโออาจฟ้องคุณ ฉันไม่อยากทำแบบนั้นแน่นอน (ไม่ใช่ทุกสื่อลามกที่เป็นรสนิยมของทุกคน)
Christopher Mahan

สีเขียวดำ (ใช่จากรัฐบาลพี่ใหญ่ในภาคตะวันออก) มีเจตนาที่จะใช้ OpenCV สำหรับความสามารถในการตรวจจับใบหน้าของมัน สิ่งนี้จะยังคงสร้างผลบวกปลอมจำนวนมากแม้เมื่อรวมกับการตรวจจับสีผิว
rwong

4

ดังที่ @Ryan กล่าวว่าการวิเคราะห์ภาพสามารถมุ่งเน้นไปที่การวิเคราะห์สี

ความเป็นไปได้? น้องสาวของฉันทำงานในพื้นที่ของรัฐบาลที่พวกเขาได้รับรูปแบบของการตรวจสอบทุกปีและเมื่อมันเป็นเรื่องโป๊ เธอ (นักธรณีฟิสิกส์) มีผลบวกปลอมหลายอย่าง (หินสีชมพู)


4

มีการวิจัยที่สำคัญเมื่อเร็ว ๆ นี้ในการตรวจจับภาพลามกอนาจารโดยใช้วิธีการจำแนกแบบดั้งเดิม ตัวอย่างที่มีอยู่ที่นี่และที่นี่


3
  • จริยธรรมนี้หรือไม่

ขึ้นอยู่กับการนำไปปฏิบัติและความคาดหวังที่สมเหตุสมผลของพนักงาน ตัวอย่างเช่นหากซอฟต์แวร์ของคุณสแกนเครื่องใด ๆ ที่เชื่อมต่อกับเครือข่ายนั้นมีข้อกำหนดเพิ่มเติมที่อินฟาต้องป้องกันไม่ให้เครื่องที่ไม่ได้รับอนุญาตเสียบเข้า (อาจจะเห็นได้ชัด แต่มันมักถูกมองข้ามในเครือข่ายที่ฉันเคยเห็น)

  • เป็นไปได้ไหม ฉันได้ทำการประมวลผลภาพ / การจัดทำดัชนีมาหลายครั้งแล้ว แต่ดูเหมือนว่าโลกใหม่แห่งความซับซ้อน

เป็นไปได้ไหมที่จะทำการทดสอบยาเสพติดของพนักงานทุกคน? อาจเป็นเช่นนั้น แต่ฉันถามถึงคุณค่าของมัน ฉันจะสุ่มมัน ให้พนักงานทราบว่าอาจสแกนเครื่องเพื่อหาเนื้อหาที่ไม่เหมาะสมได้ตลอดเวลา

  • มีการอ้างอิงถึงเทคนิคที่ประสบความสำเร็จในการค้นพบสื่อลามกหรือไม่?

ฉันไม่ได้แตะต้องตัวนี้ ฉันไม่คิดว่าฉันจะเก็บอารมณ์ขันของฉันในการตรวจสอบ แต่ระวังปัญหา Scunthorpeเมื่อค้นหาข้อความ

  • ฉันควรจะเก็บผลลัพธ์เมื่อมีการค้นพบอะไรหรือไม่

อันนี้เกี่ยวข้องกับฉันมากที่สุดและฉันจะถามทนายความ ฉันสงสัยว่าคุณพบเนื้อหาที่ผิดกฎหมายหรือไม่คุณอาจต้องเปิดเผยข้อมูลทางเทคนิคตามกฎหมาย ไม่ดีโดยเฉพาะอย่างยิ่งหากผู้ใช้ถูกเปิดเผยโดยไม่มีข้อผิดพลาดที่แท้จริงของเขาเอง คุณ (ลูกค้าราย) จะต้องการคำแนะนำทางกฎหมายที่แท้จริงเกี่ยวกับวิธีจัดการกับปัญหานี้ รับทรัพยากรบุคคลและนักกฎหมายที่เกี่ยวข้อง


2

จากจุดยืนทางเทคนิคอย่างหมดจด: ดูเหมือนว่าปัญหาการจำแนกหมวดหมู่วัตถุ ฉันไม่เคยทำอะไรแบบนั้นมาก่อน แต่จากสิ่งที่ฉันได้อ่านระบบการจำแนกหมวดหมู่ที่ทันสมัยใช้งานได้เช่นนี้:

  • ก่อนอื่นคุณต้องค้นหาจุดสนใจจำนวนมาก (เช่นใช้ Harris Corner Detector, จุดสุดยอดของตัวกรอง LoG / DoG ในสเกลพื้นที่; ผู้เขียนบางคนแนะนำให้เลือกจุดสุ่ม)
  • จากนั้นคุณใช้คุณสมบัติที่แปลงให้แต่ละจุด (เช่น SIFT, SURF, GLOH หรืออื่น ๆ อีกมากมาย)
  • รวมคุณสมบัติทั้งหมดที่คุณพบในฮิสโตแกรม (Bag-Of-Features)
  • ใช้อัลกอริทึมการเรียนรู้ของเครื่องมาตรฐาน (เช่นสนับสนุนเวกเตอร์แมชชีน) เพื่อเรียนรู้ความแตกต่างระหว่างประเภทวัตถุโดยใช้ภาพการฝึกอบรมจำนวนมาก

2

อาจมีการติดตั้งระบบปฏิบัติการคอมพิวเตอร์ของทุกคนจากอิมเมจของดิสก์

  1. เริ่มด้วยดิสก์อิมเมจและรับรายการไฟล์ที่คุณอาจไม่จำเป็นต้องสแกน
  2. รับรายการไฟล์อื่น ๆ ทั้งหมดในพีซีแต่ละเครื่อง
  3. ดึงไฟล์จริงจากเครื่องสุ่ม 10-20 เครื่องและใช้เป็นเตียงทดสอบ
  4. ค้นหารายการด้วยคำหยาบคายและคำที่สงสัย (hotties, jugs, 'barely legal', joke, etc) พจนานุกรม
  5. ดูวิดีโอ - ทุกคนควรมีวิดีโอใด ๆ บ้างไหม?
  6. ดูรูป
  7. ไฟล์วิดีโอหรือไฟล์รูปภาพใด ๆ ที่น่าสงสัยสามารถใช้ค้นหาเครื่องอื่นได้

ต้องใช้พนักงานหนึ่งหรือสองคนในการดักจับก่อนที่จะมีใครใส่อะไรลงไปในคอมพิวเตอร์ที่ทำงาน

เรียกเก็บเงินจำนวนลามกอนาจารสำหรับบริการนี้ ฉันจะเป็น Zappos ฉันจะไม่ทำสิ่งนี้กับพนักงานของพวกเขา


2

สมมติว่าคุณเป็นผู้ดูแลโดเมนบนเครือข่าย

  1. C $ ในเครื่องเดสก์ท็อปของผู้ใช้แต่ละคน
  2. คัดลอกไฟล์อนาจารลงในการแชร์ส่วนตัวส่วนตัว
  3. ลบออกจากตำแหน่งเดิม
  4. ทำข้าวโพดคั่ว
  5. วิเคราะห์รายละเอียดทั้งหมดของ "หลักฐาน" ให้ครบถ้วน

1

ฉันแค่อยากจะแสดงความคิดเห็น แต่มีเพียง 1 ตัวแทนดังนั้นฉันไม่สามารถ

ในกรณีของ Gravatar คุณสามารถเพิ่มฟังก์ชั่นเพื่อกรองออกจากรายการไซต์ที่สะอาดในตำแหน่งแคชอินเทอร์เน็ต IE Gravatar และเว็บไซต์อื่น ๆ ที่คุณไม่ต้องการผลบวกปลอม คุณสามารถกรองสิ่งต่าง ๆ เช่นพื้นหลังของเดสก์ท็อป หากพวกเขากำลังแสดงภาพอนาจารบนเดสก์ท็อปคุณคิดว่าผู้คนจะสังเกตเห็นภายนอกการตรวจสอบของคุณ


1

สิ่งต่าง ๆ ไม่เคยทำงานได้อย่างน่าเชื่อถือ คุณสามารถใช้รายการบล็อกเพื่อบล็อกโดเมนไม่ว่าจะในชื่อหรือรวมอยู่ในบางรายการ (วิธีปฏิบัติทั่วไป) แต่รายการเหล่านั้นจะไม่สมบูรณ์และการปิดกั้นชื่อตามเกณฑ์อาจทำให้เกิดผลบวกปลอมหลายประการ

คุณสามารถบล็อกคำที่ปรากฏในข้อความของไซต์ได้ แต่สิ่งนี้อาจนำไปสู่ผลบวกปลอม (และช้ามากเพราะคุณต้องแยกวิเคราะห์ข้อมูลทุกบิตที่ผ่านเครือข่ายของคุณเพื่อตรวจจับ "บิตซุกซน")

คุณสามารถบล็อกรูปภาพ (และไซต์ที่อาจมีรูปภาพ) ซึ่งแสดงมากกว่าร้อยละหนึ่งของสเกนโทน แต่อีกครั้งมันนำไปสู่การบวกเท็จจำนวนมาก แผนกการแพทย์ของมหาวิทยาลัยปิดกั้นสารานุกรมทางการแพทย์ที่มีภาพแขนขาและลำตัวที่แสดงบาดแผลและสภาพผิวเป็นตัวอย่างที่รู้จักกันดี และแน่นอนว่ามันเป็นการเหยียดสีผิวเพราะมันปิดกั้นบางสิ่งบางอย่าง หากคุณบล็อกสีที่ตรงกับผิวคนผิวขาวมีสื่อลามกโดยใช้นักแสดงผิวดำเสมอ

ดีที่สุดเพียงแค่เชื่อมั่นในพนักงานของคุณและมีนโยบายที่เหมาะสมสำหรับเมื่อความเชื่อมั่นนั้นเสียหาย


พร็อกซีเซิร์ฟเวอร์ส่วนตัว, พาร์ทิชันที่ซ่อนอยู่ที่เข้ารหัส, เครื่องเสมือน มีวิธีซ่อนสิ่งของอยู่เสมอ แน่นอนว่ามีสมาร์ทโฟน Android พร้อม 3g ครั้งล่าสุดที่ฉันตรวจสอบไม่มีทางที่นายจ้างจะหยุดพนักงานของพวกเขาดูสิ่งที่พวกเขาต้องการในโทรศัพท์ของตัวเองด้วยแบนด์วิธของตัวเอง
Christopher Mahan

นั่นเป็นสาเหตุที่วิธีการทางเทคนิคไร้ประโยชน์อย่างแน่นอนโดยไม่มีนโยบาย หากผู้คนรู้ว่าอะไรได้รับอนุญาตและสิ่งที่ไม่ได้ (และฉันไม่สามารถนึกถึงคนที่มีการศึกษาที่ต้องการใช้เครื่องจักรทำงานเพื่อสื่อลามกแม้ว่าจะไม่มีนโยบายดังกล่าว แต่เป็นเรื่องอื่น) ส่วนใหญ่จะยึดมั่น ผู้ที่จะไม่พบในไม่ช้าก็เร็วจะทราบว่ามีวิธีการทางเทคนิคอยู่หรือไม่ (คนส่วนใหญ่มีแนวโน้มที่จะเห็นบางสิ่งบางอย่างบนหน้าจอของพวกเขาพวกเขาไม่ควรเห็นในขณะที่เดินผ่าน)
jwenting

1

ฉันไม่รู้จะต้องมีคำตอบตรงกลางนั่นไม่ใช่การรุกราน แต่เป็นการแก้ปัญหาที่แท้จริงความรับผิด

ให้พวกเขาลงนามในการสละสิทธิ์ที่จะเผยแพร่ บริษัท ที่รับผิดชอบใด ๆ สำหรับสิ่งผิดกฎหมายที่พบในพีซีของงานที่ไม่เกี่ยวข้องกับการทำงาน


ฉันไม่คิดว่าการสละสิทธิ์จะทำงานในสหรัฐอเมริกา ฉันไม่รู้เกี่ยวกับประเทศอื่น
David Thornley

ทำไมมันไม่ทำงาน หากผู้ใช้มีความสามารถในการดาวน์โหลดเนื้อหาให้ติดตั้งซอฟต์แวร์จากนั้นผู้ใช้จะต้องรับผิดชอบเอง
crosenblum

และหาก บริษัท มีความสามารถในการกรองสื่อลามกซึ่งถือว่าเป็นเรื่องปกติและไม่ได้แสดงว่ามันเป็นความรับผิดชอบส่วนหนึ่งของ บริษัท
David Thornley

ไม่ได้ทุกที่ ในบางประเทศ บริษัท มีความรับผิดชอบต่อสิ่งที่เกิดขึ้นกับอุปกรณ์ใด ๆ ที่พวกเขาเป็นเจ้าของไม่ว่าพนักงานจะใช้มันเพื่อจุดประสงค์หรือไม่ก็ตาม สิ่งนี้มีผลบังคับใช้กับสหรัฐอเมริกาเช่นกันในความเป็นจริงแล้วมีความพยายามฟ้อง บริษัท ที่ใช้ผลิตภัณฑ์ของตนอย่างผิดกฎหมายหลังจากที่ผลิตภัณฑ์เหล่านั้นถูกขายถูกกฎหมาย (ดูตัวอย่างการฟ้องร้องต่อผู้ผลิตอาวุธปืนสำหรับความรับผิดเมื่อผลิตภัณฑ์ของตน ใช้ในคดีความคดีที่โชคดีมักถูกโยนออกไป แต่ไม่น่าเศร้าเสมอไป)
jwenting

1
  1. แจ้งให้ผู้ใช้ทราบว่า URL นั้นถือว่าเป็นเนื้อหาสำหรับผู้ใหญ่ - พรอกซี bluecoatทำเช่นนั้น
  2. ให้สิทธิ์สิ่งที่ google ทำในการค้นหารูปภาพ http://code.google.com/apis/safebrowsing/ http://www.google.com/search?q=google+image+recognition+api
  3. สแกนคอมพิวเตอร์เพื่อหารายการที่ไม่อยู่ในรายการที่ตกลงกันล่วงหน้า

1

การวิเคราะห์ภาพและเนื้อหาเพื่อกำหนดความแตกต่างระหว่างภาพถ่ายรสนิยมของบุคคลรูปถ่ายชุดว่ายน้ำภาพถ่ายเปลือยภาพสื่อลามก ... เท่าที่ฉันรู้ว่าไม่มีที่ไหนใกล้ที่ซับซ้อนพอที่จะทำในซอฟต์แวร์เพียงอย่างเดียว

โชคดีที่ crowdsourcing น่าจะมีประโยชน์ที่นี่ตามที่ @ammoQ แนะนำในความคิดเห็น อย่างไรก็ตามฉันไม่เชื่อว่าสมาชิกของ 4chan หรือฟอรัมอื่น ๆ จะชื่นชอบภาพที่ไม่ใช่ภาพอนาจารมากมายเช่นเว็บกราฟิกทั่วไปสำหรับปุ่มเฟรมโฆษณา ฯลฯ ที่โพสต์

คำแนะนำของฉันจะมองในการแก้ปัญหา crowdsourcing ที่มีอยู่เช่นAmazon วิศวกรรมเติร์ก (อย่างไรก็ตามข้อกำหนดในการให้บริการอาจห้ามการมีส่วนร่วมของเนื้อหาลามกอนาจารอย่างชัดเจนดังนั้นขอแนะนำให้คุณอาจต้องหาวิธีแก้ไขปัญหาอื่นหรือแก้ไขปัญหาของคุณเอง)

เพื่อให้การทำ crowdsourcing ทำได้ซอฟต์แวร์ของคุณควรเตรียมทำสิ่งต่อไปนี้บางส่วนหรือทั้งหมด:

  • จัดเก็บข้อมูลที่เชื่อมโยงเนื้อหากับคอมพิวเตอร์ที่มาจาก
  • ระบุรายการที่ซ้ำซ้อนกันทั่วทั้งคลังโฆษณาและนำออก (แต่จะยังคงมีข้อมูลดั้งเดิมอยู่)
  • ลดขนาดภาพลงในบางมิติซึ่งอาจ 320x200 ซึ่งเพียงพอที่จะระบุเนื้อหาของภาพโดยไม่ต้องเก็บรายละเอียดที่ไม่จำเป็นและสิ้นเปลืองพื้นที่เก็บข้อมูล / แบนด์วิดท์
  • สร้างภาพนิ่งของเนื้อหาวิดีโอในบางช่วงเวลาปกติและใช้กฎการสุ่มตัวอย่างแบบเดียวกัน

ในที่สุดฐานข้อมูลของภาพที่ลดขนาดซึ่งแสดงถึงภาพต้นฉบับและเนื้อหาวิดีโอจะถูกตรวจสอบโดยผู้ใช้ (หรือทีมที่กำหนดหากคุณมีทรัพยากร) ตามแนวทางปฏิบัติของ บริษัท ของคุณ โปรแกรมหรืออินเทอร์เฟซอาจแสดงภาพครั้งละหนึ่งภาพหรือหน้าจอขนาดย่อ - สิ่งที่คุณคิดว่าดีที่สุดในการรับข้อมูลที่ถูกต้อง

ตัวตนของคอมพิวเตอร์ที่มีภาพมาควรเป็นความลับและไม่เป็นที่รู้จักสำหรับผู้ที่ประเมินข้อมูล นอกจากนี้ควรมีการสุ่มและแต่ละภาพอาจมีการตรวจสอบมากกว่าหนึ่งครั้งเพื่อลบอคติ

เทคนิคเดียวกันนี้สามารถใช้กับข้อความได้ แต่เนื้อหาแรกนั้นสามารถทำคะแนนได้โดยการจัดอันดับคำหลักซึ่งจะลบข้อความจำนวนมากออกจากการตรวจสอบ crowdsource แน่นอนว่าการแยกเอกสารที่มีความยาวจะใช้เวลานานกว่าการจำแนกภาพ

โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.