2
ลำดับทางชีวภาพของ UniProt ใน PostgreSQL
วิธีที่ดีที่สุดในการจัดเก็บลำดับทางชีวภาพของ UniProt ใน PostreSQL คืออะไร รายละเอียดข้อมูล เราดึงลำดับ 12 ล้านจากUniProt - จำนวนนี้น่าจะเพิ่มเป็นสองเท่าทุก 3-10 เดือน ความยาวของลำดับสามารถเปลี่ยนแปลงได้ตั้งแต่ 10 ถึง 50 พันล้านตัวอักษร น้อยกว่า 1% ของลำดับนั้นยาวกว่า 10,000 ตัวอักษร มันจะปรับปรุงประสิทธิภาพในการจัดเก็บลำดับที่ยาวกว่าแยกกันหรือไม่ ลำดับสามารถเป็นได้ทั้งโปรตีนหรือตัวอักษรดีเอ็นเอ ตัวอักษร DNA มี 5 ตัวอักษร (A, T, C, G หรือ -) ตัวอักษรโปรตีนจะมีประมาณ 30 ตัวอักษร เราไม่รังเกียจที่จะเก็บลำดับของตัวอักษรสองตัวที่แตกต่างกันในคอลัมน์ที่แตกต่างกันหรือแม้แต่ตารางที่แตกต่างกัน จะช่วยได้ไหม รายละเอียดการเข้าถึงข้อมูล เพื่อตอบความคิดเห็นของ Jeremiah Peschka: ลำดับโปรตีนและ DNA จะเข้าถึงได้ในเวลาที่ต่างกัน ไม่จำเป็นต้องค้นหาภายในลำดับ (ที่ทำนอกฐานข้อมูล) …
11
postgresql