จัดเรียงไฟล์ตามตัวอักษรก่อนประมวลผล


12

ฉันใช้คำสั่ง

find . -type f -exec sha256sum {} \; > sha256SumOutput

เพื่อแฮชไฟล์ทุกไฟล์ในลำดับชั้นของโฟลเดอร์ น่าเสียดายที่sha256sumไม่ได้รับชื่อไฟล์จากfindตัวอักษรอื่น ๆ จะแก้ไขได้อย่างไร?

ฉันต้องการสั่งให้พวกเขาก่อนที่พวกเขาจะถูกแฮชดังนั้นพวกเขาจึงถูกแฮชตามลำดับตัวอักษร (นี่มีเหตุผล)


ค้นหาไฟล์, ไปที่sortเพื่อเรียงลำดับรายการและไปที่ sha256sum
Sergiy Kolodyazhnyy

การเรียงลำดับตัวอักษรและตัวเลข
UTF-8

คำตอบอยู่แล้วที่unix.stackexchange.com/questions/34325/...
sampablokuper

คำตอบ:


16

ใช้ท่อและ sort

find . -type f -print0 | sort -z | xargs -r0 sha256sum > sha256SumOutput

คำอธิบาย

จาก man find

   -print0
        True; print the full file name on the standard output, followed
        by a null character (instead of the newline character that -print
        uses). This allows file names that contain newlines or other
        types of white space to be  correctly  interpreted by programs
        that process the find output.  This option corresponds to the -0
        option of xargs.

จาก man sort

   -z, --zero-terminated
        line delimiter is NUL, not newline

จาก man xargs

   -0   
        Input items are terminated by a null character instead of by
        whitespace, and the quotes and backslash are not special (every
        character is taken literally).  Disables the end of file string,
        which is treated like any  other  argument. Useful when input
        items might contain white space, quote marks, or backslashes.
        The GNU find -print0 option produces input suitable for this mode.

ตัวอย่าง

% ls -laog
total 4288
drwxrwxr-x  2 4329472 Aug 17 08:20 .
drwx------ 57   20480 Aug 17 08:20 ..
-rw-rw-r--  1       0 Aug 17 08:15 a
-rw-rw-r--  1       0 Aug 17 08:15 a b
-rw-rw-r--  1       0 Aug 17 08:15 b
-rw-rw-r--  1       0 Aug 17 08:15 c

% find -type f -print0 | sort -z | xargs -r0 sha256sum                  
e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855  ./a
e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855  ./a b
e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855  ./b
e3b0c44298fc1c149afbf4c8996fb92427ae41e4649b934ca495991b7852b855  ./c

ค่าในคอลัมน์แรกเหมือนกันเนื่องจากไฟล์ไม่มีเนื้อหาใด ๆ ในการทดสอบของฉัน


1
อือ! Null ยกเลิกแทนการขึ้นบรรทัดใหม่
3591723

1

คุณควรจะสามารถที่จะเพียงแค่ท่อส่งออกของคุณจากไปfindsort


ใช่ แต่ก็ไม่มี-execสวิตช์
UTF-8

2
ฉันไม่เชื่อว่าfindมีวิธีที่จะเรียงลำดับตัวอักษรเอาท์พุท แต่ท่อไปsortแล้วใช้xargsจะให้ผลลัพธ์ที่คาดหวัง find . -type f | sort | xargs sha256sum. แม้ว่ามันจะมีปัญหากับไดเรกทอรีย่อย ..
3591723

วิธีแฮ็กเพื่อจัดการกับไดเรกทอรีย่อยจะเป็นfind . -type f | awk -F/ '{print $NF, $0}' | sort | awk '{print $2}' | xargs sha256sum
user3591723

xargs: unmatched single quote; by default quotes are special to xargs unless you use the -0 option sha256sum: invalid option -- 'l' Try 'sha256sum --help' for more information.นี้จะพิมพ์ข้อผิดพลาด
UTF-8

ฉันเดาว่าไฟล์หนึ่งของคุณมีเครื่องหมายคำพูดเดียวในชื่อ
user3591723
โดยการใช้ไซต์ของเรา หมายความว่าคุณได้อ่านและทำความเข้าใจนโยบายคุกกี้และนโยบายความเป็นส่วนตัวของเราแล้ว
Licensed under cc by-sa 3.0 with attribution required.