วิศวกรรมซอฟต์แวร์ search

8

ปัญหาในการพยายามใช้ Google เพื่อค้นหาบทช่วยสอนหรือคำตอบสำหรับภาษาการเขียนโปรแกรม C คือ C ไม่ได้ชื่อที่ชัดเจนพอที่จะ จำกัด ขอบเขตการค้นหาให้แคบลง แม้แต่คู่กับคำหลักเช่น "การเขียนโปรแกรม" และ / หรือ "ภาษา" ให้ผลลัพธ์ส่วนใหญ่สำหรับ C ++, C # และ Objective-C มีวิธีใดในการค้นหาทรัพยากร C ที่เฉพาะเจาะจงอย่างมีประสิทธิภาพยิ่งขึ้นโดยใช้ Google

44 c google search

2

คุณจะใช้ Google Search อย่างไร [ปิด]

สมมติว่าคุณถูกถามในการสัมภาษณ์ "คุณจะใช้ Google Search อย่างไร" คุณจะตอบคำถามนี้อย่างไร อาจมีแหล่งข้อมูลที่อธิบายว่ามีการใช้งานชิ้นส่วนบางอย่างใน Google ได้อย่างไร (BigTable, MapReduce, PageRank, ... ) แต่ไม่เหมาะสำหรับการสัมภาษณ์ คุณจะใช้สถาปัตยกรรมใดโดยรวมและคุณจะอธิบายสิ่งนี้อย่างไรในช่วงเวลา 15-30 นาที ฉันจะเริ่มต้นด้วยการอธิบายวิธีสร้างเครื่องมือค้นหาที่จัดการกับเอกสาร ~ 100k แล้วขยายสิ่งนี้ด้วยการส่งผ่านเอกสารประมาณ 50 ล้านเอกสารจากนั้นอาจก้าวกระโดดทางสถาปัตยกรรม / ทางเทคนิคอื่น นี่คือมุมมอง 20,000 ฟุต สิ่งที่ฉันต้องการคือรายละเอียด - คุณจะตอบอย่างไรในการสัมภาษณ์ โครงสร้างข้อมูลใดที่คุณจะใช้ สถาปัตยกรรมของคุณประกอบด้วยบริการ / เครื่องจักรใด เวลาแฝงของแบบสอบถามทั่วไปจะเป็นอย่างไร สิ่งที่เกี่ยวกับปัญหา failover / split brain? ฯลฯ ...

44 design algorithms architecture search

1

ควรใช้รูปแบบข้อมูล HTML ในสถานการณ์ประจำวันอย่างไร

เมื่อGoogle เปลี่ยนการมุ่งเน้นไปที่ข้อมูลมาร์คอัปที่แรงขึ้นรูปแบบข้อมูลที่ใช้ในSchema.orgทำงานร่วมกับฟอร์แมตไมโครฟอร์แมตได้อย่างไร เหล่านี้ (และรายละเอียดอื่น ๆ ) ชมเชยซึ่งกันและกันอย่างไรและควรใช้สิ่งใดเป็นพิเศษในสถานการณ์ที่แตกต่างกัน แก้ไข: ดูเหมือนว่าจากเนื้อหาที่สร้างขึ้นในเรื่องที่ความคิดเห็นดูเหมือนจะถูกแบ่งระหว่างผู้ที่เชื่อว่า Schema.org คือการลงโทษนรกและกำมะถันและผู้ที่คิดว่าท้ายที่สุดแล้วจะเป็นสิ่งที่ดีไม่ว่าด้วยวิธีใดก็ตาม บทความทั้งสองยอมรับอย่างน้อยว่ารูปแบบที่แตกต่างกันสามารถอยู่ร่วมกันได้อย่างมีความสุขโดยไม่ก่อให้เกิดเครื่องมือค้นหา คำถามเกี่ยวกับวิธีการใช้ตัวเลือกที่แตกต่างกันในบางกรณียังคงอยู่

19 html data search schema

6

Foreach-loop พร้อม break / return vs. while-loop ที่มี invariant และ post-condition อย่างชัดเจน

นี่เป็นวิธีที่นิยมมากที่สุด (ดูเหมือนฉัน) ในการตรวจสอบว่าค่าอยู่ในอาร์เรย์หรือไม่: for (int x : array) { if (x == value) return true; } return false; อย่างไรก็ตามในหนังสือที่ฉันอ่านเมื่อหลายปีก่อนโดยอาจ Wirth หรือ Dijkstra มันก็บอกว่าสไตล์นี้ดีกว่า (เมื่อเทียบกับ while-loop ที่มีทางออกด้านใน): int i = 0; while (i < array.length && array[i] != value) i++; return i < array.length; วิธีนี้เงื่อนไขการออกเพิ่มเติมกลายเป็นส่วนหนึ่งที่ชัดเจนของลูปค่าคงที่ไม่มีเงื่อนไขที่ซ่อนอยู่และออกจากภายในลูปทุกอย่างชัดเจนมากขึ้นและมากขึ้นด้วยวิธีการเขียนโปรแกรมแบบมีโครงสร้าง ฉันมักจะแนะนำนี้รูปแบบหลังเมื่อใดก็ตามที่เป็นไปได้และใช้for-loop เพียงสำทับจากไปab ถึงกระนั้นฉันก็ไม่สามารถพูดได้ว่ารุ่นแรกนั้นมีความชัดเจนน้อยกว่า บางทีมันอาจจะชัดเจนและเข้าใจง่ายกว่าอย่างน้อยก็สำหรับผู้เริ่มต้น ดังนั้นฉันยังคงถามตัวเองว่าคำถามใดดีกว่ากัน? บางทีใครบางคนสามารถให้เหตุผลที่ดีแก่คนใดคนหนึ่งในวิธีการ? …

17 coding-style search loops invariants structured-programming

1

การเรียนรู้ของเครื่องรวมอยู่ในการออกแบบเครื่องมือค้นหาอย่างไร

ขณะนี้ฉันกำลังสร้างเครื่องมือค้นหาภายในองค์กรขนาดเล็กโดยใช้ Apache Lucene จุดประสงค์ของมันคือเรียบง่าย - จากคำหลักบางคำมันจะแนะนำบทความที่เขียนภายใน บริษัท ของเรา ฉันใช้การให้คะแนน TF-IDF ที่ค่อนข้างเป็นมาตรฐานในฐานะตัวชี้วัดพื้นฐานและสร้างกลไกการให้คะแนนของฉันเองอยู่ด้านบน สิ่งเหล่านี้ดูเหมือนจะทำงานได้อย่างยอดเยี่ยมยกเว้นในบางกรณีที่การจัดอันดับดูยุ่งเหยิง ดังนั้นสิ่งที่ฉันวางแผนจะทำคือการเพิ่มลิงค์ที่เกี่ยวข้อง / ไม่เกี่ยวข้องขนาดเล็กลงในหน้าผลการค้นหาเพื่อให้ผู้ใช้สามารถคลิกที่ลิงค์ใดลิงก์หนึ่งขึ้นอยู่กับการรับรู้ของพวกเขาว่าควรรวมผลลัพธ์นั้นไว้ด้วยหรือไม่ ความคิดของฉัน ปฏิบัติต่อป้ายกำกับที่เกี่ยวข้อง / ไม่เกี่ยวข้องเหล่านี้และสร้างข้อมูลการฝึกอบรม ใช้ข้อมูลนี้เพื่อฝึกฝนลักษณนาม (เช่น SVM) รวมโมเดลนี้ลงในเครื่องมือค้นหาเช่นผลลัพธ์ใหม่ทุกรายการจะผ่านตัวแยกประเภทและจะได้รับการกำหนดป้ายกำกับว่าเกี่ยวข้องหรือไม่ วิธีนี้ดูเหมือนง่ายสำหรับฉัน แต่ฉันไม่แน่ใจว่าจะใช้งานได้จริงหรือไม่ ฉันมีคำถามสองข้อ: คุณสมบัติทั้งหมดที่ฉันควรแยกคืออะไร มีวิธีที่ดีกว่าในการรวมส่วนประกอบการเรียนรู้ของเครื่องเข้ากับเครื่องมือค้นหาหรือไม่ เป้าหมายสุดท้ายของฉันคือ "เรียนรู้" ฟังก์ชั่นการจัดอันดับตามตรรกะทางธุรกิจเช่นเดียวกับความคิดเห็นของผู้ใช้

15 search language-agnostic lucene machine-learning search-engine

6

ความสำคัญของการเรียนรู้เพื่อ google อย่างมีประสิทธิภาพสำหรับโปรแกรมเมอร์หรือไม่? [ปิด]

ปิด คำถามนี้เป็นคำถามความคิดเห็นตาม ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบข้อเท็จจริงและการอ้างอิงได้โดยแก้ไขโพสต์นี้ ปิดให้บริการใน4 ปีที่แล้ว นี่ไม่ใช่การถกเถียงกันเรื่องการใช้ Google ว่าดีหรือไม่ดีสำหรับโปรแกรมเมอร์ โปรดงดเว้นจากคำตอบของคุณ คนส่วนใหญ่ (ส่วนใหญ่ที่ใช้อินเทอร์เน็ต) ใช้ Google ในปัจจุบัน สิ่งที่ฉันกำลังพูดถึงคือสิ่งนี้20 เคล็ดลับเพื่อการค้นหาของ Google ที่มีประสิทธิภาพยิ่งขึ้น คำถาม:คุณคิดว่ามันสำคัญกับโปรแกรมเมอร์อย่างไร? คำถาม:การค้นหาที่มีประสบการณ์ (ความรู้เพิ่มเติมเกี่ยวกับปัญหา) เปรียบเทียบกับการค้นหาที่มีประสิทธิภาพได้อย่างไรนั่นคือการค้นหาโดยบุคคลที่มีประสบการณ์และการค้นหาโดยบุคคลที่สามารถค้นหาได้ดีขึ้น ในแง่ของอัตราผลตอบแทนหรือคุณภาพ . คำถาม:คุณคิดว่าควรสอนสิ่งนี้ในโรงเรียนการเขียนโปรแกรมระดับฝึกงานหรือผู้ฝึกงานหรือไม่? โปรดงดเว้นจากการอภิปรายของการพัฒนาการพึ่งพา Google เพื่อแก้ปัญหา 1) มันไม่ได้เป็นจุดหัวข้อ 2) ถ้าพวกเขาไม่สามารถแก้ปัญหาที่เกิดขึ้นส่วนใหญ่เวลาที่พวกเขาจะไม่ได้รับการว่าจ้าง คำถาม:สิ่งนี้ได้รับการสอนในโรงเรียนสอนการเขียนโปรแกรมที่ดีมาแล้วหรือไม่? บันทึก: บทความยอมรับว่าไม่มีอะไรใหม่ บางคำถามในเว็บไซต์ถูกตอบด้วยง่ายของ Google ค้นหาโพสต์โดยโปรแกรมเมอร์ที่อาจมีเพียงการสืบค้นที่ดีกว่าสำหรับมัน โดยไม่คำนึงถึงความคาดหวังจากการสัมผัสส่วนบุคคลต่อคำตอบส่วนใหญ่เหล่านี้เป็นเพียงคำตอบที่แท้จริงในการค้นหาโดยตรงหรือไม่ประสบความสำเร็จ นี่อาจเป็นความรู้ทั่วไปสำหรับโปรแกรมเมอร์ที่ดี แต่ IMHO นี่ไม่ใช่กรณีโดยเฉลี่ย มีความแตกต่างระหว่าง googling และการค้นหาที่มีประสิทธิภาพ

15 efficiency search

8

ค้นหา“ hole” ในรายการตัวเลข

วิธีที่เร็วที่สุดในการค้นหาจำนวนเต็ม (เล็กที่สุด) แรกที่ไม่มีอยู่ในรายการของจำนวนเต็มไม่ได้เรียง (และนั่นคือมากกว่าค่าที่เล็กที่สุดของรายการ)? วิธีดั้งเดิมของฉันคือการเรียงลำดับพวกเขาและก้าวผ่านรายการมีวิธีที่ดีกว่า

14 algorithms search list numbers

4

แนวคิดการค้นหาฐานข้อมูลคลุมเครือ

ฉันคิดเกี่ยวกับเรื่องนี้และพยายามหาวิธีแก้ปัญหาเกี่ยวกับวิธีการค้นหาฐานข้อมูลที่คลุมเครือหากผู้ใช้พิมพ์ตัวอย่างการสะกดผิด มีปัญหาอะไรที่จ้องมองด้วยตรรกะที่อยู่เบื้องหลังสิ่งนี้? มันจะทำงานและเคยทำมาก่อนหรือไม่ ตารางเราต้องการค้นหา: **tblArticles** Body - Soundex_Body - CharacterCoded_Body ดังนั้นเราจึงจัดเก็บเนื้อหาข้อความดิบสำหรับการแสดงผลทางกายภาพ อีก 2 คอลัมน์ใช้สำหรับการค้นหาซึ่งคำนวณล่วงหน้าด้วยวิธีต่อไปนี้: Soundex ร่างกายแบ่งออกเป็นคำพูดและแปลเป็นเวอร์ชั่นซาวด์ IE เนื้อหาที่ได้อาจเป็นดังนี้: H252 B54 C23 E33... etc ดังนั้นบางคนอาจเข้าสู่ 'dinosore' และเนื้อหาของบทความอ่านว่า 'ไดโนเสาร์' สิ่งเหล่านี้ทั้งคู่ประเมินเป็น 26 บาท จากนั้นเราจะเรียกใช้ LIKE บนค่า soundex ของข้อความค้นหา รหัสตัวละคร รับการทำแผนที่ตัวละครที่แมปตัวอักษรกับตัวเลขสำคัญ IE: h = 2 e = 3 l = 5 o = 7 …

13 algorithms concepts search

1

ค้นหาข้อมูลข้ามหลายไมโครไซต์

ฉันมีข้อมูลสำหรับโดเมนที่แน่นอนกระจายอยู่ระหว่าง microservice และฐานข้อมูลดั้งเดิม ฉันมีการค้นหาที่ครอบคลุมฟิลด์ในฐานข้อมูลทั้งแบบเก่าและแบบไมโคร ก่อนหน้านี้ (ก่อนที่จะมีการแบ่งไมโครบริการ) มันทำด้วยคิวรี 1 sql ตอนนี้ฉันต้องการการโทร REST และแบบสอบถามไปยังฐานข้อมูลเดิมเพื่อรองรับฟังก์ชันการค้นหานี้ เรากำลังพูดถึงแถวสองสามล้านแถวที่นี่ ฉันจะสร้างแบบจำลองที่ดีที่สุดได้อย่างไร เนื่องจากปริมาณของข้อมูลการเรียกใช้ REST จะส่งคืนผลลัพธ์การแบ่งหน้าตามปกติเช่นกัน วิธีการที่ไร้เดียงสาในการเริ่มการเรียกใช้ SQL และการรวมและผสานผลลัพธ์กับการตอบกลับของ REST นั้นช้าเกินไปและไม่สามารถใช้งานได้จริง

13 microservices search

8

ทำไมการค้นหาทุกอย่างในเว็บไซต์ MS จึงเป็นเรื่องยาก [ปิด]

ปิด คำถามนี้เป็นคำถามความคิดเห็นตาม ไม่ยอมรับคำตอบในขณะนี้ ต้องการปรับปรุงคำถามนี้หรือไม่ อัปเดตคำถามเพื่อให้สามารถตอบข้อเท็จจริงและการอ้างอิงได้โดยแก้ไขโพสต์นี้ ปิดให้บริการใน4 ปีที่แล้ว ฉันมีคำถามนี้อยู่ในใจเสมอและฉันยินดีที่จะได้รับคำอธิบายเกี่ยวกับเรื่องนี้ เป็นฉันคนเดียวหรือคุณรู้สึกแบบเดียวกับที่หาเว็บไซต์ MS ได้ยาก ตัวอย่างเช่นทุกครั้งที่ฉันต้องดาวน์โหลด. NET Framework ฉันต้องใช้ Google คุณไม่มีทางรู้ว่าคุณสามารถดาวน์โหลดอะไรไม่มีหมวดหมู่สำหรับการดาวน์โหลด คุณเหลือเพียงแค่ช่องค้นหา คุณไม่มีทางรู้ว่าคุณดาวน์โหลดไฟล์เวอร์ชันล่าสุดหรือไม่ ความจริงที่น่าเศร้าคือคุณต้องพึ่งพาคู่แข่งของ Google เพื่อหาอะไรในเว็บไซต์ของพวกเขา ฉันรู้ว่าพวกเขาเป็น บริษัท ใหญ่ แต่เป็นเรื่องยากไหมที่จะมีวิธีจัดระเบียบเพื่อเผยแพร่ข้อมูล

11 websites information search

1

การจับคู่ชื่อบางส่วนในล้านเรคคอร์ด

เราได้พัฒนาแอพพลิเคชั่นบนเว็บสำหรับการจับคู่ชื่อ มันทำงานโดยการแบ่งชื่อออกเป็นส่วน ๆ และค่าSoundexของแต่ละส่วนจะถูกเก็บไว้ในฐานข้อมูล เมตริก Levenshtein ระยะทางที่ใช้ในการสมัครเปอร์เซ็นต์การจับคู่ของเสียงเช่นเดียวกับการสะกดคำกับชื่อที่กำหนด ที่รันไทม์เราโหลดเร็กคอร์ดทั้งหมดลงในหน่วยความจำและใช้ระยะทาง Levenshtein กับค่า Soundex ทั้งหมดและการสะกดคำของส่วนทั้งหมดของชื่อทั้งหมด สิ่งนี้ใช้ได้ดีในตอนแรกเพราะมีชื่อสูงสุด 20,000 ชื่อ แต่ตอนนี้ลูกค้าของเรารายหนึ่งมีชื่อ 30 ล้านชื่อ การโหลดรายการขนาดใหญ่นี้ลงในหน่วยความจำสำหรับคำขอแต่ละครั้งและการใช้การจับคู่ประเภทนี้เป็นวิธีที่น่าสมเพชโดยใช้หน่วยความจำและเวลาดำเนินการจำนวนมาก เรากำลังมองหาคำแนะนำในการค้นหาฐานข้อมูล 30 ล้านรายการขึ้นไปในอนาคตอันใกล้นี้ด้วยการจับคู่เปอร์เซ็นต์ของเสียงและการสะกดคำ ฟังก์ชั่นหลัก ผู้ใช้ปลายทางป้อนชื่อที่จะจับคู่และเปอร์เซ็นต์ขั้นต่ำ เราควรจะแสดงชื่อเหล่านั้นทั้งหมดในฐานข้อมูลที่ส่วนใดส่วนหนึ่งของชื่อตรงกับส่วนใดส่วนหนึ่งของชื่อที่กำหนดจนถึงเปอร์เซ็นต์ที่กำหนด ไม่จำเป็นต้องใช้ชื่อเต็มในการจับคู่ส่วนใดส่วนหนึ่งหากตรงกันไม่เกินเปอร์เซ็นต์ก็จะสำเร็จ ตัวอย่างเช่น. Given Name: Helen Hunt Name in DB: Holly Hunter ทั้งสองส่วนของชื่อทั้งสองไม่ตรงกันอย่างแน่นอน แต่ไม่เกินขอบเขตให้เราสมมติ 80% ดังนั้นหากผู้ใช้ป้อน 80% ดังนั้นชื่อใน DB จะต้องแสดงเป็นชื่อที่ตรงกัน

10 asp.net sql-server search oracle big-data

คำถามติดแท็ก search