อัปเดตฟิลด์ MongoDB โดยใช้ค่าของฟิลด์อื่น


372

ใน MongoDB เป็นไปได้หรือไม่ที่จะอัปเดตค่าของฟิลด์โดยใช้ค่าจากฟิลด์อื่น? SQL ที่เทียบเท่าจะมีลักษณะดังนี้:

UPDATE Person SET Name = FirstName + ' ' + LastName

และหลอกโค้ด MongoDB จะเป็น:

db.person.update( {}, { $set : { name : firstName + ' ' + lastName } );

คำตอบ:


258

วิธีที่ดีที่สุดที่จะทำคือในรุ่น 4.2 ขึ้นไปซึ่งจะช่วยให้การใช้ท่อรวมในเอกสารการปรับปรุงและupdateOne, updateManyหรือupdateวิธีการเก็บรวบรวม โปรดทราบว่าโปรแกรมหลังเลิกใช้งานแล้วส่วนใหญ่หากไม่ใช่ไดรเวอร์ภาษาทั้งหมด

MongoDB 4.2+

เวอร์ชัน 4.2 ยังแนะนำผู้ประกอบการขั้นตอนท่อซึ่งเป็นนามแฝงสำหรับ$set $addFieldsฉันจะใช้$setที่นี่ตามแผนที่กับสิ่งที่เราพยายามบรรลุ

db.collection.<update method>(
    {},
    [
        {"$set": {"name": { "$concat": ["$firstName", " ", "$lastName"]}}}
    ]
)

MongoDB 3.4+

ใน 3.4+ คุณสามารถใช้$addFieldsและ$outตัวดำเนินการไปป์ไลน์การรวม

db.collection.aggregate(
    [
        { "$addFields": { 
            "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
        }},
        { "$out": "collection" }
    ]
)

โปรดทราบว่านี่ไม่ได้อัปเดตคอลเลกชันของคุณ แต่แทนที่คอลเลกชันที่มีอยู่หรือสร้างใหม่ นอกจากนี้สำหรับการดำเนินการอัปเดตที่ต้องใช้"การหล่อแบบ" คุณจะต้องดำเนินการด้านไคลเอนต์และขึ้นอยู่กับการดำเนินการคุณอาจต้องใช้find()วิธีการแทน.aggreate()วิธีการ

MongoDB 3.2 และ 3.0

วิธีที่เราทำคือการทำ$projectเอกสารของเราและใช้$concatตัวดำเนินการรวมสตริงเพื่อส่งคืนสตริงที่ต่อกัน เราจากที่นั่นจากนั้นให้คุณย้ำเคอร์เซอร์และใช้ตัว$setดำเนินการอัปเดตเพื่อเพิ่มฟิลด์ใหม่ลงในเอกสารของคุณโดยใช้การทำงานเป็นกลุ่มเพื่อประสิทธิภาพสูงสุด

แบบสอบถามรวม:

var cursor = db.collection.aggregate([ 
    { "$project":  { 
        "name": { "$concat": [ "$firstName", " ", "$lastName" ] } 
    }}
])

MongoDB 3.2 หรือใหม่กว่า

จากนี้คุณต้องใช้bulkWriteวิธีการ

var requests = [];
cursor.forEach(document => { 
    requests.push( { 
        'updateOne': {
            'filter': { '_id': document._id },
            'update': { '$set': { 'name': document.name } }
        }
    });
    if (requests.length === 500) {
        //Execute per 500 operations and re-init
        db.collection.bulkWrite(requests);
        requests = [];
    }
});

if(requests.length > 0) {
     db.collection.bulkWrite(requests);
}

MongoDB 2.6 และ 3.0

จากรุ่นนี้คุณจำเป็นต้องใช้ตอนนี้เลิกใช้BulkAPI และวิธีการที่เกี่ยวข้อง

var bulk = db.collection.initializeUnorderedBulkOp();
var count = 0;

cursor.snapshot().forEach(function(document) { 
    bulk.find({ '_id': document._id }).updateOne( {
        '$set': { 'name': document.name }
    });
    count++;
    if(count%500 === 0) {
        // Excecute per 500 operations and re-init
        bulk.execute();
        bulk = db.collection.initializeUnorderedBulkOp();
    }
})

// clean up queues
if(count > 0) {
    bulk.execute();
}

MongoDB 2.4

cursor["result"].forEach(function(document) {
    db.collection.update(
        { "_id": document._id }, 
        { "$set": { "name": document.name } }
    );
})

ฉันคิดว่ามีปัญหากับรหัสสำหรับ "MongoDB 3.2 หรือใหม่กว่า" เนื่องจาก forEach นั้นเป็น async โดยทั่วไปแล้วจะไม่มีการเขียนอะไรใน bulkWrite ล่าสุด
Viktor Hedefalk

3
4.2+ ไม่ทำงาน MongoError: เขตข้อมูลนำหน้าดอลล่าร์ ($) '$ concat' ในชื่อ '$ concat' ไม่ถูกต้องสำหรับการจัดเก็บ
Josh Woodcock

@JoshWoodcock ฉันคิดว่าคุณมีคำสะกดผิดในแบบสอบถามที่คุณใช้อยู่ ฉันขอแนะนำให้คุณตรวจสอบอีกครั้ง
styvane

@JoshWoodcock มันทำงานได้อย่างสวยงาม โปรดทดสอบสิ่งนี้โดยใช้MongoDB Web Shell
styvane

2
สำหรับผู้ที่พบปัญหาเดียวกัน @JoshWoodcock อธิบาย: ให้ระวังว่าคำตอบสำหรับ 4.2+ อธิบายไปป์ไลน์การรวมดังนั้นอย่าพลาดวงเล็บเหลี่ยมในพารามิเตอร์ที่สอง!
philsch

240

คุณควรทำซ้ำ สำหรับกรณีเฉพาะของคุณ:

db.person.find().snapshot().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

4
จะเกิดอะไรขึ้นหากผู้ใช้รายอื่นเปลี่ยนเอกสารระหว่าง find () และ save () ของคุณ?
UpTheCreek

3
จริง แต่การคัดลอกระหว่างเขตข้อมูลไม่ควรกำหนดให้ธุรกรรมเป็นแบบปรมาณู
UpTheCreek

3
สิ่งสำคัญคือให้สังเกตว่าsave()แทนที่เอกสารทั้งหมด ควรใช้update()แทน
Carlos

12
แล้วdb.person.update( { _id: elem._id }, { $set: { name: elem.firstname + ' ' + elem.lastname } } );
Philipp Jardas

1
ฉันสร้างฟังก์ชันที่เรียกcreate_guidว่าสร้าง guid เฉพาะต่อเอกสารเมื่อวนซ้ำด้วยforEachวิธีนี้ (เช่นใช้create_guidในupdateคำสั่งที่mutli=trueทำให้ guid เดียวกันถูกสร้างขึ้นสำหรับเอกสารทั้งหมด) คำตอบนี้ใช้ได้อย่างสมบูรณ์แบบสำหรับฉัน +1
rmirabelle

103

เห็นได้ชัดว่าไม่มีทางที่จะทำเช่นนี้ได้อย่างมีประสิทธิภาพตั้งแต่ MongoDB 3.4 ให้ดูคำตอบของ styvane


คำตอบที่ล้าสมัยด้านล่าง

คุณไม่สามารถอ้างถึงเอกสารเองในการอัปเดต (ยัง) คุณจะต้องวนซ้ำเอกสารและอัปเดตแต่ละเอกสารโดยใช้ฟังก์ชั่น ดูคำตอบนี้เป็นตัวอย่างหรืออย่างใดอย่างหนึ่งeval()สำหรับฝั่งเซิร์ฟเวอร์


31
วันนี้ยังใช้ได้หรือไม่
Christian Engel

3
@ChristianEngel: มันจะปรากฏขึ้น ฉันไม่พบสิ่งใดในเอกสาร MongoDB ที่กล่าวถึงการอ้างอิงถึงเอกสารปัจจุบันในการupdateดำเนินการ คำขอเกี่ยวกับคุณลักษณะนี้ยังไม่ได้รับการแก้ไขเช่นกัน
Niels van der Rest

4
ยังคงใช้ได้ในเดือนเมษายน 2017 หรือไม่? หรือมีคุณสมบัติใหม่อยู่แล้วซึ่งสามารถทำได้?
Kim

1
@ Kim ดูเหมือนว่าจะยังใช้ได้อยู่ นอกจากนี้ขอคุณสมบัติที่ @ Niels รถตู้-เดอร์ส่วนที่เหลือกลับชี้ให้เห็นในปี 2013 OPENยังคงอยู่ใน
Danziger

8
นี่ไม่ใช่คำตอบที่ถูกต้องอีกต่อไปดูที่ @styvane คำตอบ
aitchkhan

45

สำหรับฐานข้อมูลที่มีกิจกรรมสูงคุณอาจพบปัญหาที่การอัปเดตของคุณส่งผลต่อการเปลี่ยนแปลงระเบียนอย่างแข็งขันและด้วยเหตุนี้ฉันขอแนะนำให้ใช้สแนปชอต ()

db.person.find().snapshot().forEach( function (hombre) {
    hombre.name = hombre.firstName + ' ' + hombre.lastName; 
    db.person.save(hombre); 
});

http://docs.mongodb.org/manual/reference/method/cursor.snapshot/


2
จะเกิดอะไรขึ้นหากผู้ใช้รายอื่นแก้ไขบุคคลระหว่าง find () และ save () ฉันมีกรณีที่สามารถทำการโทรหลายครั้งไปยังวัตถุเดียวกันโดยเปลี่ยนค่าปัจจุบันได้ ผู้ใช้คนที่สองควรรอด้วยการอ่านจนกว่าจะเสร็จสิ้นการบันทึก สิ่งนี้ทำให้สำเร็จหรือไม่?
Marco

4
เกี่ยวกับลิงค์snapshot() : Deprecated in the mongo Shell since v3.2. Starting in v3.2, the $snapshot operator is deprecated in the mongo shell. In the mongo shell, use cursor.snapshot() instead.
ppython

10

เกี่ยวกับคำตอบนี้ฟังก์ชั่นสแนปชอตจะเลิกใช้ในเวอร์ชั่น 3.6 ตามการอัพเดทนี้ ดังนั้นในเวอร์ชั่น 3.6 ขึ้นไปเป็นไปได้ที่จะดำเนินการตามนี้:

db.person.find().forEach(
    function (elem) {
        db.person.update(
            {
                _id: elem._id
            },
            {
                $set: {
                    name: elem.firstname + ' ' + elem.lastname
                }
            }
        );
    }
);

9

เริ่มต้นMongo 4.2, db.collection.update()สามารถยอมรับท่อรวมในที่สุดก็ช่วยให้การปรับปรุง / การสร้างสนามขึ้นอยู่กับข้อมูลอื่น:

// { firstName: "Hello", lastName: "World" }
db.collection.update(
  {},
  [{ $set: { name: { $concat: [ "$firstName", " ", "$lastName" ] } } }],
  { multi: true }
)
// { "firstName" : "Hello", "lastName" : "World", "name" : "Hello World" }
  • ส่วนแรก{}คือข้อความค้นหาที่ตรงกันกรองเอกสารที่จะอัปเดต (ในกรณีของเราคือเอกสารทั้งหมด)

  • ส่วนที่สอง[{ $set: { name: { ... } }]คือไปป์ไลน์การรวมการอัปเดต (โปรดสังเกตว่าวงเล็บเหลี่ยมกำลังสองที่แสดงถึงการใช้ไพพ์ไลน์การรวม) เป็นผู้ประกอบการรวมตัวใหม่และนามแฝงของ$set$addFields

  • อย่าลืม{ multi: true }มิฉะนั้นเฉพาะเอกสารการจับคู่แรกเท่านั้นที่จะได้รับการอัปเดต


8

ฉันลองใช้วิธีแก้ปัญหาข้างต้น แต่พบว่าไม่เหมาะสมกับข้อมูลจำนวนมาก จากนั้นฉันได้ค้นพบคุณสมบัติการสตรีม:

MongoClient.connect("...", function(err, db){
    var c = db.collection('yourCollection');
    var s = c.find({/* your query */}).stream();
    s.on('data', function(doc){
        c.update({_id: doc._id}, {$set: {name : doc.firstName + ' ' + doc.lastName}}, function(err, result) { /* result == true? */} }
    });
    s.on('end', function(){
        // stream can end before all your updates do if you have a lot
    })
})

1
มันแตกต่างกันอย่างไร ไอน้ำจะถูกควบคุมโดยกิจกรรมอัพเดทหรือไม่? คุณมีการอ้างอิงถึงมันหรือไม่? เอกสาร Mongo นั้นค่อนข้างแย่
Nico

2

นี่คือสิ่งที่เราเกิดขึ้นสำหรับการคัดลอกเขตข้อมูลหนึ่งไปยังอีกเขตข้อมูลสำหรับระเบียน ~ 150_000 รายการ ใช้เวลาประมาณ 6 นาที แต่ก็ยังมีทรัพยากรน้อยกว่าอย่างมีนัยสำคัญมากกว่าที่จะยกตัวอย่างและวนซ้ำกับวัตถุทับทิมจำนวนเท่าเดิม

js_query = %({
  $or : [
    {
      'settings.mobile_notifications' : { $exists : false },
      'settings.mobile_admin_notifications' : { $exists : false }
    }
  ]
})

js_for_each = %(function(user) {
  if (!user.settings.hasOwnProperty('mobile_notifications')) {
    user.settings.mobile_notifications = user.settings.email_notifications;
  }
  if (!user.settings.hasOwnProperty('mobile_admin_notifications')) {
    user.settings.mobile_admin_notifications = user.settings.email_admin_notifications;
  }
  db.users.save(user);
})

js = "db.users.find(#{js_query}).forEach(#{js_for_each});"
Mongoid::Sessions.default.command('$eval' => js)

1

ด้วยMongoDB รุ่น 4.2 ขึ้นไป , การปรับปรุงจะมีความยืดหยุ่นมากขึ้นเนื่องจากจะช่วยให้การใช้งานของท่อรวมในของมันupdate, และupdateOne updateManyตอนนี้คุณสามารถแปลงเอกสารของคุณโดยใช้ตัวดำเนินการรวมแล้วอัปเดตโดยไม่จำเป็นต้องอธิบาย$setคำสั่ง (เราจะใช้แทน$replaceRoot: {newRoot: "$$ROOT"})

ที่นี่เราใช้แบบสอบถามแบบรวมเพื่อแยกการประทับเวลาจากฟิลด์ ObjectID "_id" ของ MongoDB และอัปเดตเอกสาร (ฉันไม่ใช่ผู้เชี่ยวชาญใน SQL แต่ฉันคิดว่า SQL ไม่ได้ให้ ObjectID ที่สร้างขึ้นอัตโนมัติที่มีการประทับเวลาคุณจะต้อง สร้างวันที่นั้นโดยอัตโนมัติ)

var collection = "person"

agg_query = [
    {
        "$addFields" : {
            "_last_updated" : {
                "$toDate" : "$_id"
            }
        }
    },
    {
        $replaceRoot: {
            newRoot: "$$ROOT"
        } 
    }
]

db.getCollection(collection).updateMany({}, agg_query, {upsert: true})

คุณไม่จำเป็นต้อง{ $replaceRoot: { newRoot: "$$ROOT" } }; มันหมายถึงการแทนที่เอกสารด้วยตัวเองซึ่งไม่มีจุดหมาย หากคุณแทนที่$addFieldsด้วยนามแฝง$setและupdateManyเป็นชื่อแทนอย่างใดอย่างหนึ่งupdateคุณจะได้คำตอบเดียวกับที่กล่าวมาข้างต้น
Xavier Guihot
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.