คำถามติดแท็ก cache

แคชคือสำเนาภายในของไฟล์ที่มีอยู่ที่อื่น การแคชอาจเกิดขึ้นในเบราว์เซอร์บนเครื่องเฉพาะบนเครือข่ายหรือที่ ISP

30
กู้คืนเว็บไซต์ที่สูญหายโดยไม่มีข้อมูลสำรองหรือไม่
น่าเสียดายที่ผู้ให้บริการโฮสต์ของเราประสบปัญหาข้อมูลสูญหาย 100% ดังนั้นฉันจึงสูญเสียเนื้อหาทั้งหมดสำหรับเว็บไซต์บล็อกที่โฮสต์สองแห่ง: http://blog.stackoverflow.com http://www.codinghorror.com (ใช่แล้วฉันควรทำข้อมูลสำรองนอกสถานที่อย่างสมบูรณ์น่าเสียดายที่ข้อมูลสำรองทั้งหมดของฉันอยู่ในเซิร์ฟเวอร์ดังนั้นบันทึกการบรรยายคุณถูก 100% จริง ๆ แต่นั่นไม่ได้ช่วยฉันได้ในตอนนี้ จดจ่อกับคำถามที่นี่!) ฉันเริ่มกระบวนการที่ช้าและเจ็บปวดในการกู้คืนเว็บไซต์จากแคชของโปรแกรมรวบรวมข้อมูลเว็บ มีเครื่องมืออัตโนมัติบางอย่างสำหรับการกู้คืนเว็บไซต์จาก web web spider (Yahoo, Bing, Google, ฯลฯ ) แคชเช่นWarrickแต่ฉันมีผลลัพธ์ที่ไม่ดีเมื่อใช้สิ่งนี้: ที่อยู่ IP ของฉันถูกแบนจาก Google อย่างรวดเร็วเนื่องจากใช้งาน ฉันได้รับข้อผิดพลาด 500 และ 503 มากมายและ "รอ 5 นาที ... " ในที่สุดฉันสามารถกู้คืนเนื้อหาข้อความด้วยมือได้เร็วขึ้น ฉันโชคดีขึ้นมากโดยใช้รายการโพสต์บล็อกทั้งหมดคลิกผ่านไปยังแคช Google และบันทึกไฟล์แต่ละไฟล์เป็น HTML ในขณะที่มีจำนวนมากของบล็อกโพสต์มีไม่ว่าจำนวนมากและฉันคิดว่าฉันสมควรได้รับบางตัวเองลงแส้ไม่ได้มีกลยุทธ์การสำรองข้อมูลที่ดีกว่า อย่างไรก็ตามสิ่งที่สำคัญคือฉันโชคดีที่ได้รับข้อความจากบล็อกด้วยวิธีนี้และฉันสามารถนำข้อความของเว็บเพจออกจากแคชอินเทอร์เน็ตได้อย่างแน่นอน ขึ้นอยู่กับสิ่งที่ฉันได้ทำเพื่อให้ห่างไกลผมมั่นใจผมสามารถกู้คืนทั้งหมดที่หายไปบล็อกโพสต์ข้อความและแสดงความคิดเห็น อย่างไรก็ตามภาพที่ไปพร้อมกับการโพสต์บล็อกแต่ละครั้งนั้นพิสูจน์ได้ยากขึ้น เคล็ดลับทั่วไปสำหรับการกู้คืนหน้าเว็บไซต์จากแคชอินเทอร์เน็ตและโดยเฉพาะอย่างยิ่งสถานที่กู้ภาพที่เก็บถาวรจากหน้าเว็บไซต์ ? (และอีกครั้งโปรดไม่มีการสำรองข้อมูลคุณเต็มเปาครบถ้วนถูกต้องที่สุด! แต่ความถูกต้องไม่ได้แก้ปัญหาในทันทีของฉัน…เว้นแต่คุณจะมีเครื่องย้อนเวลา…)

4
ฉันจะตั้งค่าส่วนหัวการหมดอายุสำหรับ CSS, JS และรูปภาพได้อย่างไร
ฉันเพิ่งวิเคราะห์เว็บไซต์ของฉันด้วยการเพิ่ม pagepeed บน firebug แนะนำให้ฉันตั้งค่าหมดอายุบน CSS, JS และไฟล์รูปภาพ ฉันสงสัยว่าฉันจะทำเช่นนี้ได้อย่างไร

5
ส่วนหัวเพื่อป้องกันคำขอ 304 / If-modified-since / HEAD
ฉันควรส่งส่วนหัวใดให้หยุดการร้องขอทั้งหมดไปยังเซิร์ฟเวอร์ทันทีหลังจากที่เนื้อหาถูกแคช เรามีเซิร์ฟเวอร์เวลาในการตอบสนองสูง (ถอนหายใจ, VMWare) ดังนั้นแม้การส่งHEADคำขอไปยังเซิร์ฟเวอร์จะใช้เวลา + 40ms ขณะนี้เหล่านี้เป็นส่วนหัวที่ถูกส่ง / รับ; ขอครั้งแรก ลูกค้าส่ง; GET http://dugong:8080/Rvi24mYJkxFRGNzq73PPvgWGh1j/IMG_2071.jpg HTTP/1.1 Host: dugong:8080 User-Agent: Mozilla/5.0 (Windows NT 5.1; rv:9.0) Gecko/20100101 Firefox/9.0 Accept: text/html,application/xhtml+xml,application/xml;q=0.9,*/*;q=0.8 Accept-Language: en-us,en;q=0.5 Accept-Encoding: gzip, deflate Accept-Charset: ISO-8859-1,utf-8;q=0.7,*;q=0.7 Pragma: no-cache, no-cache, no-cache Cache-Control: no-cache, no-cache, no-cache เซิร์ฟเวอร์ตอบสนอง; HTTP/1.1 200 OK Server: nginx/1.0.11 Date: Wed, …

5
ทำไมเบราว์เซอร์ไม่ได้ติดตั้ง jQuery
ฉันใช้ jQuery ในเว็บไซต์หลายแห่งของฉันและถึงแม้ว่าฉันใช้ CDN เพื่อให้บริการ แต่ก็ไม่สมเหตุสมผลเลยที่ผู้เยี่ยมชมจะดาวน์โหลด jQuery ทุกครั้ง jQuery ต้องเป็นเฟรมเวิร์ก JavaScript ที่ใช้กันอย่างแพร่หลายมากที่สุดในโลก - จะไม่เหมาะสมกว่านี้หากเบราว์เซอร์เพิ่งติดตั้งตามค่าเริ่มต้น ด้วยวิธีดังกล่าวหลายล้านครั้งต่อวันการดาวน์โหลด jQuery สามารถป้องกันได้ ไม่ว่าจะมาจากเว็บไซต์ของผู้คนหรือจาก CDN ทั้งหมดที่จะต้องมีจริงๆคือถ้าคำสั่งเช่น: <!--[if jQuery gt 11]> มีบางสิ่งที่จะช่วยป้องกันไม่ให้ผู้ใช้เดินทางไปที่ CDN หากพวกเขามี jQuery ในแคชของพวกเขาจากเว็บไซต์อื่นอยู่แล้ว?
19 cache  browsers  jquery 

1
ฉันจะป้องกันไม่ให้ Google แสดงเว็บไซต์ที่เป็นเวอร์ชันแคชได้อย่างไร
จากสิ่งที่ฉันเข้าใจฉันสามารถบอกให้ Google ลบหน้าจากการเก็บถาวรของพวกเขาหากฉันเพิ่มส่วนหัว: <meta name="ROBOTS" contents="NOARCHIVE" /> แต่จะไม่ลบหน้านี้ออกจากผลการค้นหาหรือไม่ ฉันต้องการลบลิงก์ "แคช" เท่านั้น
19 seo  google  cache 

1
จะเกิดอะไรขึ้นถ้าคุณไม่ตั้งค่าส่วนหัวควบคุมแคช?
จะเกิดอะไรขึ้นถ้าคุณไม่ตั้งcache-controlส่วนหัว HTTP ระบุพฤติกรรมเริ่มต้นที่ลูกค้าควรทำตามหรือไม่ขึ้นอยู่กับการตัดสินใจของลูกค้าหรือไม่ ใน Chrome ผมได้เห็นบางส่วนคำขอจาวาสคริปต์ที่ไม่มีส่วนหัวแสดงขึ้นเป็นcache-control 200 (from disk cache)Chrome กำลังปรับปรุงสิ่งนี้หรือไม่ ใน IE 304 (not modified)ฉันได้เห็นมันแสดงเป็น ฉันจะเข้าใจสิ่งนี้ดีขึ้นได้อย่างไร

2
ควบคุม Internet Archive นอกเหนือจาก“ ไม่อนุญาต /”?
มีกลไกใดบ้างในการควบคุมสิ่งที่เก็บถาวรข้อมูลอินเทอร์เน็ตบนเว็บไซต์หรือไม่ ฉันรู้ว่าไม่อนุญาตให้เพิ่มหน้าทั้งหมด: User-agent: ia_archiver Disallow: / ฉันบอกบอตว่าฉันต้องการให้พวกเขารวบรวมข้อมูลเว็บไซต์ของฉันเดือนละครั้งหรือปีละครั้งได้หรือไม่ ฉันมีเว็บไซต์ / หน้าเว็บที่ไม่ได้ / ไม่ได้รับการเก็บถาวรอย่างถูกต้องเนื่องจากสินทรัพย์ไม่มารับ มีวิธีบอกบอตของ Internet Archive หรือไม่ว่าจะต้องใช้สินทรัพย์อะไรถ้ามันกำลังจะคว้าไซต์?

2
URL ที่มีคิวรีปิดใช้งานการแคชหรือไม่
การมีสตริงการสืบค้นติดอยู่กับ URL ทำให้เบราว์เซอร์ไม่เคยแคชหรือไม่ ตัวอย่างเช่นเว็บไซต์ของฉันทำสิ่งนี้: /radar-picture.png?v=sep2013 และดูเหมือนว่า FireFox จะไม่เก็บภาพนั้นไว้ มันจะถูกดาวน์โหลดในทุกคำขอ ฉันต้องการให้ FireFox ทำการแคชตราบเท่าที่มันต้องการ ฉันต้องการบังคับให้ดาวน์โหลดเฉพาะเมื่อv=พารามิเตอร์มีการเปลี่ยนแปลง

1
Cloudflare: แคช HTML แบบคงที่เมื่อ URL มีสตริงการสืบค้น
คำถาม 'ผู้ใช้ใหม่' Quick CloudFlare สำหรับคุณ: ความเป็นมา: หน้า HTML ที่เสริฟโดยเซิร์ฟเวอร์ต้นทางของฉันไม่เคยเปลี่ยนแปลง เนื้อหาแบบไดนามิกทั้งหมดจะถูกดาวน์โหลดผ่าน JavaScript หลังจากโหลดหน้าเว็บในเบราว์เซอร์ของผู้ใช้ เนื้อหาแบบไดนามิกที่ได้รับจาก JavaScript ขึ้นอยู่กับส่วนของสตริงการสืบค้นของ URL แต่สตริงการสืบค้นนั้นไม่มีผลกับเนื้อหา HTML ที่ดาวน์โหลดมาในตอนแรก URL ต่อไปนี้จึงสร้างทั้งหมดว่า HTML ที่เดียวกันจากแหล่งกำเนิดก่อนที่จะถูกดำเนินการโดย JavaScript ในเบราว์เซอร์: https://www.example.com/private/my-investments?portfolioID=296 https://www.example.com/private/my-investments?portfolioID=325 https://www.example.com/private/my-investments?portfolioID=319 คำถาม: ระบุว่า CloudFlare ไม่แคช HTML โดยค่าเริ่มต้นวิธีการที่ฉันจะต้องสร้างกฎหน้าของฉันเพื่อให้สำเนาแคชเดียวของhttps://www.example.com/private/my-investments?[anyValue]จะถูกส่งกลับไปยังผู้ใช้ทุกคน ? นี่คือสิ่งที่ฉันได้ลอง: "แคชทุกอย่าง:" การใช้คำสั่ง 'ทุกอย่างแคช' ทำให้ HTML ของฉันถูกแคช (ดี) แต่ใช้สตริงข้อความค้นหาทั้งหมดเป็นส่วนหนึ่งของคีย์แคช (ไม่ดี) ดังนั้นหากผู้ใช้เข้าชม URL ต่อไปนี้ ... https://www.example.com/private/my-investments?portfolioID=296 …
10 html  cache  cloudflare 

4
“404 นั่นเป็นข้อผิดพลาด” เมื่อดูจากแคชของ Google
เว็บไซต์ของฉันได้รับ404 นั่นเป็นข้อผิดพลาด ข้อความเมื่อฉันคลิกที่แคชจากผลการค้นหาของ Google นี่คือข้อความแสดงข้อผิดพลาดจาก Google: That’s an error. /search?q=cache:8kxLAgFrhZQJ:www.mysite.com.....&cd=8&hl=en&ct=clnk&gl=ukไม่พบURL ที่ร้องขอบนเซิร์ฟเวอร์นี้ นั่นคือทั้งหมดที่เรารู้. สิ่งที่ฉันทำก่อนที่ฉันจะได้รับข้อผิดพลาดนี้คือเมื่อประมาณ 10 วันที่แล้วฉันย้ายโฮสติ้งของฉันจากIxwebhostingไปที่Gearhost (บนคลาวด์) ฉันยังเพิ่ม 301 เปลี่ยนเส้นทางจากไปnon wwwwww ฉันไม่รู้ว่าทำไมฉันถึงได้รับข้อผิดพลาดนี้ โปรดแนะนำสิ่งที่อาจเป็นสาเหตุหากมีวิธีแก้ปัญหาสำหรับมัน แม้ว่าหน้าเว็บทั้งหมดของฉันจะได้รับการจัดทำดัชนีโดย Google
10 google  404  cache 

3
มันคุ้มค่าหรือไม่ที่จะเปลี่ยนโครงสร้างไฟล์รูปภาพผู้ใช้ทั้งหมดของฉันเพื่อใช้ประโยชน์จากการแคชเบราว์เซอร์อย่างง่าย ๆ ?
ในเว็บไซต์มือถือของฉันฉันเก็บรูปภาพโปรไฟล์ผู้ใช้ของฉันเป็น '1.jpg' ในโฟลเดอร์ผู้ใช้และเพิ่มขึ้นจากที่นั่นสำหรับรูปภาพเพิ่มเติมที่พวกเขาอัปโหลด ซึ่งหมายความว่าเมื่อใดก็ตามที่พวกเขาเปลี่ยนรูปโปรไฟล์เช่นชื่อไฟล์จะยังคงเหมือนเดิม ฉันต้องการใช้ประโยชน์จากการแคชรูปภาพเพื่อไม่ให้ดาวน์โหลดรูปภาพเก่าซ้ำแล้วซ้ำอีกเมื่อใดก็ตามที่โปรไฟล์ของผู้ใช้ถูกดูและดูซ้ำ แต่ในเวลาเดียวกันฉันต้องการให้เบราว์เซอร์ผู้ใช้ของฉัน ดาวน์โหลดใหม่หากมีการเปลี่ยนแปลง จากสิ่งที่ฉันได้อ่านดูเหมือนว่าวิธีเดียวที่จะทำสิ่งนี้อย่างแท้จริงคือการใช้ชื่อไฟล์สุ่มและติดตามชื่อไฟล์เหล่านั้นทั้งหมดในฐานข้อมูลเพื่อให้คุณสามารถตั้งค่าแคชที่ไม่หมดอายุในขณะนี้ รูปภาพที่เปลี่ยนแปลงจะถูกดึงอีกครั้งเนื่องจากมีชื่อไฟล์ใหม่ ความสวยงามของวิธีที่ฉันมีโครงสร้างจนถึงตอนนี้คือฉันสามารถข้ามฐานข้อมูลทั้งหมดและเข้าถึงไฟล์ได้โดยตรงเนื่องจากตำแหน่งของพวกเขาสามารถคาดเดาได้ ดังนั้นคำถามของฉันคือมันคุ้มค่าหรือไม่ที่ฉันจะเปลี่ยนโครงสร้างไฟล์ทั้งหมดของเว็บไซต์ของฉันรวมทั้งเพิ่มองค์ประกอบ DB เพื่อประโยชน์ของการแคชนิรันดร์และการดาวน์โหลดอัตโนมัติใหม่เมื่ออัปโหลดใหม่ นี่เป็นงานที่ยิ่งใหญ่ แต่ถ้ามันถือว่ามีค่าฉันก็ไม่มีปัญหาที่จะก้าวไปข้างหน้ากับการเปลี่ยนแปลงครั้งใหญ่นี้ ฉันแค่ต้องการทำให้แน่ใจว่านี่เป็นวิธีที่ "ชายใหญ่" ทำเพื่อที่ฉันจะได้ไม่ต้องเปลี่ยนโครงสร้างไฟล์อีกต่อไป ขอบคุณ
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.