คำถามติดแท็ก social-network-analysis

2
จริยธรรมควรนำไปใช้ในศาสตร์ข้อมูลอย่างไร
มีความบ้าคลั่งที่ผ่านมากับเป็นFacebook ทดลองกับผู้ใช้ของพวกเขาเพื่อดูว่าพวกเขาสามารถปรับเปลี่ยนอารมณ์ความรู้สึกของผู้ใช้และตอนนี้OkCupid ในขณะที่ฉันไม่ได้เป็นนักวิทยาศาสตร์ข้อมูลมืออาชีพฉันอ่านเกี่ยวกับจริยธรรมข้อมูลวิทยาศาสตร์จากหนังสือ 'การทำวิทยาศาสตร์ข้อมูล' ของ Cathy O'Neillและต้องการทราบว่านี่เป็นสิ่งที่ผู้เชี่ยวชาญได้รับการสอนในระดับวิชาการหรือไม่ ถูกเพิกเฉยหรือถูกนำไปใช้ในโลกมืออาชีพเล็กน้อย โดยเฉพาะอย่างยิ่งสำหรับผู้ที่สิ้นสุดการทำข้อมูลวิทยาศาสตร์ตั้งใจ ในขณะที่บทความที่เชื่อมโยงสัมผัสกับความถูกต้องของข้อมูลหนังสือเล่มนี้ยังได้กล่าวถึงจริยธรรมทางศีลธรรมที่อยู่เบื้องหลังการทำความเข้าใจถึงผลกระทบของแบบจำลองข้อมูลที่สร้างขึ้นและผลกระทบของแบบจำลองเหล่านั้นซึ่งอาจมีผลข้างเคียงเมื่อใช้อย่างไม่เหมาะสม ไม่ถูกต้องสร้างผลลัพธ์ที่ไม่พึงประสงค์อีกครั้ง บทความนี้กล่าวถึงแนวทางปฏิบัติและกล่าวถึงจรรยาบรรณของสมาคมวิทยาศาสตร์ข้อมูลนี่เป็นสิ่งที่ใช้งานอยู่หรือไม่? กฎข้อที่ 7 เป็นสิ่งที่น่าสนใจเป็นพิเศษ (อ้างอิงจากเว็บไซต์ของพวกเขา): (a) บุคคลที่ปรึกษากับนักวิทยาศาสตร์ด้านข้อมูลเกี่ยวกับความเป็นไปได้ในการสร้างความสัมพันธ์กับนักวิทยาศาสตร์ข้อมูลลูกค้าด้วยความเคารพต่อสิ่งนั้นเป็นลูกค้าที่คาดหวัง (b) แม้ว่าจะไม่มีความสัมพันธ์ระหว่างนักวิทยาศาสตร์ข้อมูลลูกค้า แต่นักวิทยาศาสตร์ข้อมูลที่เรียนรู้ข้อมูลจากลูกค้าที่คาดหวังจะต้องไม่ใช้หรือเปิดเผยข้อมูลนั้น (c) นักวิทยาศาสตร์ข้อมูลภายใต้วรรค (b) จะต้องไม่ให้บริการข้อมูลวิทยาศาสตร์ระดับมืออาชีพสำหรับลูกค้าที่มีความสนใจอย่างมากต่อลูกค้าที่คาดหวังในอุตสาหกรรมเดียวกันหรือที่เกี่ยวข้องอย่างมีนัยสำคัญหากนักวิทยาศาสตร์ข้อมูลได้รับข้อมูลจากลูกค้าที่คาดหวัง ที่อาจเป็นอันตรายอย่างมีนัยสำคัญต่อบุคคลนั้นในเรื่อง นี่เป็นสิ่งที่ฝึกฝนอย่างมืออาชีพหรือไม่? ผู้ใช้หลายคนยอมรับว่าเราได้รับบริการฟรี (เมลเครือข่ายสังคมโฮสติ้งรูปภาพแพลตฟอร์มบล็อก ฯลฯ ) และเห็นด้วยกับ EULA เพื่อให้โฆษณาผลักดันให้เรา ในที่สุดกฎระเบียบนี้เป็นอย่างไรฉันมักจะอ่านเกี่ยวกับผู้ใช้ที่มีความพร้อมเมื่อเงื่อนไขของบริการเปลี่ยนไป แต่ดูเหมือนว่ามันต้องการองค์กรอิสระการดำเนินการในชั้นเรียนหรือสมาชิกวุฒิสภาเพื่อตอบสนองต่อสิ่งเหล่านั้น ด้วยวิธีที่ฉันไม่ได้ทำการตัดสินใด ๆ ที่นี่หรือบอกว่านักวิทยาศาสตร์ข้อมูลทั้งหมดทำตัวแบบนี้ฉันสนใจในสิ่งที่สอนด้านวิชาการและฝึกฝนอย่างมืออาชีพ

1
Neo4j กับ OrientDB vs Titan
ฉันกำลังทำงานในโครงการวิทยาศาสตร์ข้อมูลที่เกี่ยวข้องกับการขุดความสัมพันธ์ทางสังคมและต้องการจัดเก็บข้อมูลในฐานข้อมูลกราฟบางตัว ตอนแรกฉันเลือก Neo4j เป็นฐานข้อมูล แต่มันตะเข็บ Neo4j ไม่ได้ปรับขนาดได้ดี ทางเลือกที่ฉันพบคือไททันและ oriebtDB ฉันได้ผ่านนี้เปรียบเทียบทั้งสามฐานข้อมูล แต่ฉันต้องการที่จะได้รับรายละเอียดเพิ่มเติมเกี่ยวกับฐานข้อมูลเหล่านี้ ดังนั้นบางคนสามารถช่วยฉันในการเลือกที่ดีที่สุด ส่วนใหญ่ฉันต้องการเปรียบเทียบประสิทธิภาพการปรับขนาดเอกสารออนไลน์ / แบบฝึกหัดที่มีการสนับสนุนห้องสมุด Python ความซับซ้อนของภาษาคิวรีและการสนับสนุนอัลกอริทึมกราฟของฐานข้อมูลเหล่านี้ มีตัวเลือกฐานข้อมูลที่ดีอื่น ๆ อีกหรือไม่

3
จะสร้างการเติบโตของเครือข่ายโซเชียลอย่างไร?
ฉันกำลังมองหาไลบรารี / เครื่องมือเพื่อให้เห็นภาพว่าเครือข่ายสังคมเปลี่ยนแปลงอย่างไรเมื่อมีการเพิ่มโหนด / ขอบใหม่เข้าไป หนึ่งในโซลูชั่นที่มีอยู่Sonia: Animator มันช่วยให้คุณทำภาพยนตร์เช่นนี้ เอกสารของ SoNIA บอกว่ามันพังในขณะนี้และนอกเหนือจากนี้ฉันต้องการโซลูชันที่ใช้ JavaScript แทน ดังนั้นคำถามของฉันคือคุณคุ้นเคยกับเครื่องมือใด ๆ หรือคุณสามารถชี้ให้ฉันไปที่ห้องสมุดบางแห่งที่จะทำให้งานนี้ง่ายที่สุดเท่าที่จะเป็นไปได้หรือไม่? หลังจากโพสต์คำถามนี้ฉันจะขุดลงในsigma.jsดังนั้นโปรดพิจารณาห้องสมุดนี้ด้วย โดยทั่วไปข้อมูลอินพุตของฉันจะเป็นดังนี้: time_elapsed; node1; node2 1; A; B 2; A; C 3; B; C ดังนั้นที่นี่เรามีสามจุดในเวลา (1, 2, 3), สามโหนด (A, B, C) และสามขอบซึ่งแสดงถึงการปิด triadic ระหว่างสามโหนดที่พิจารณา ยิ่งกว่านั้นทุกโหนดจะมีสองคุณลักษณะ (อายุและเพศ) ดังนั้นฉันจึงต้องการที่จะสามารถเปลี่ยนรูปร่าง / สีของโหนด นอกจากนี้หลังจากเพิ่มโหนดใหม่จะเป็นการดีที่จะมี ForceAtlas2 หรืออัลกอริทึมที่คล้ายกันเพื่อปรับเค้าโครงของกราฟ

7
การขูดเว็บ LinkedIn
ฉันเพิ่งค้นพบแพ็คเกจ R ใหม่สำหรับเชื่อมต่อกับ LinkedIn API น่าเสียดายที่ LinkedIn API นั้นค่อนข้าง จำกัด ในการเริ่มต้น ตัวอย่างเช่นคุณสามารถรับข้อมูลพื้นฐานเกี่ยวกับ บริษัท เท่านั้นและข้อมูลนี้แยกออกจากข้อมูลของแต่ละบุคคล ฉันต้องการรับข้อมูลเกี่ยวกับพนักงานทุกคนของ บริษัท ที่กำหนดซึ่งคุณสามารถทำได้ด้วยตนเองบนเว็บไซต์แต่ไม่สามารถทำได้ผ่าน API import.ioจะสมบูรณ์แบบหากรู้จักการแบ่งหน้า LinkedIn (ดูที่ส่วนท้ายของหน้า) ไม่มีใครรู้ว่าเครื่องมือขูดเว็บหรือเทคนิคใด ๆ ที่ใช้กับรูปแบบปัจจุบันของเว็บไซต์ LinkedIn หรือวิธีการดัด API เพื่อทำการวิเคราะห์ที่ยืดหยุ่นมากขึ้น? โดยเฉพาะอย่างยิ่งใน R หรือบนเว็บ แต่แน่นอนเปิดให้แนวทางอื่น ๆ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.