ฉันต้องการจัดเก็บไฟล์ข้อมูลไบนารีในฐานข้อมูล PostgreSQL ซึ่งทำงานบนเซิร์ฟเวอร์ Ubuntu ตอนแรกจะมีไฟล์ขนาดไม่กี่โหลประมาณ 250kb ต่อไฟล์ อย่างไรก็ตามจำนวนไฟล์จะเพิ่มขึ้นเมื่อเวลาผ่านไป บางครั้งฉันอาจจำเป็นต้องดึงข้อมูลจากไฟล์สำหรับการวิเคราะห์ดาวน์สตรีมอื่น ๆ
ฉันได้ทำการวิจัยบางอย่างเกี่ยวกับคำถามอายุของการจัดเก็บข้อมูลไบนารีเป็น BLOB หรือการอ้างอิง ทั้งสองเห็นได้ชัดว่ามีข้อดีและข้อเสีย มีปัญหาเฉพาะที่เกี่ยวข้องกับ PostgreSQL ที่ฉันควรทราบหรือไม่? เป็นวิธีหนึ่งหรือวิธีที่ดีกว่าถ้าฉันต้องการดึงข้อมูลจากไฟล์ทั้งผ่านฟังก์ชั่น PostgreSQL หรือผ่านโปรแกรม Python ภายนอก?
ถ้าฉันจะจัดเก็บไฟล์ข้อมูลโดยตรงในฐานข้อมูลมันจะดีกว่าหรือไม่ที่จะเก็บไว้ในตารางที่แยกต่างหากพร้อมกับคีย์ต่างประเทศที่อ้างอิงถึงตาราง "main" แทนที่จะเป็นตารางที่มีฟิลด์อื่นทั้งหมด
ฉันได้อ่านคำถามและคำตอบที่นี่ ; ความคิดเห็นมีแสดงให้เห็นว่าการจัดเก็บไฟล์ไบนารีโดยอ้างอิง (ในระบบไฟล์) บน Linux จะดีกว่า คำถามของฉันเกี่ยวข้องกับ PostgreSQL โดยเฉพาะและเพื่อดึงข้อมูลจากไฟล์สำหรับการวิเคราะห์ที่หลากหลาย