159

ฉันมีที่เก็บข้อมูลหลายพันไฟล์ในนั้น ฉันจะค้นหาที่ฝากข้อมูลได้อย่างไร มีเครื่องมือที่คุณสามารถแนะนำได้หรือไม่?

amazon-web-services amazon-s3

ฉันมีที่เก็บหลายอันฉันจึงเขียนสคริปต์สั้น ๆ เพื่อค้นหาทั้งหมด: github.com/laurenfitch/utilities/blob/master/query_s3.py

— Lauren Fitch

31

S3 ไม่ได้มีเจ้าของภาษา "ค้นหาฝากข้อมูลนี้" เนื่องจากไม่ทราบเนื้อหาจริง - เนื่องจาก S3 เป็นคีย์ / ค่าตามไม่มีวิธีดั้งเดิมในการเข้าถึงโหนดจำนวนมากในคราวเดียวนอกจากนี้ยังมีดาต้าเบสแบบดั้งเดิมที่ให้ (SELECT * FROM ... WHERE ...) (ใน SQL รูปแบบ)

สิ่งที่คุณต้องทำคือทำListBucketรายการของออบเจ็กต์ในที่เก็บข้อมูลแล้ววนซ้ำทุกไอเท็มที่มีการดำเนินการแบบกำหนดเองที่คุณใช้ซึ่งก็คือการค้นหาของคุณ

— Cody Caughlan
แหล่งที่มา

42

นี่ไม่ใช่กรณีอีกต่อไป ดูคำตอบของ rhonda ด้านล่าง: stackoverflow.com/a/21836343/1101095

— Nate

11

สำหรับผู้อัปโหลดทั้งหมดของความคิดเห็นข้างต้น: OP ไม่ได้ระบุว่าต้องการค้นหาชื่อไฟล์หรือเนื้อหาสำคัญ (เช่นเนื้อหาไฟล์) ดังนั้นคำตอบของ @ rhonda อาจยังไม่เพียงพอ ดูเหมือนว่าในที่สุดนี่คือแบบฝึกหัดสำหรับผู้บริโภคเนื่องจากการใช้ S3 Console แทบจะไม่สามารถใช้ได้กับผู้ใช้แอปและผู้ใช้ทั่วไปของคุณ โดยทั่วไปแล้วจะมีผลเฉพาะกับเจ้าของถังและ / หรือบทบาทของ IAM

— Cody Caughlan

มีบริการจัดทำดัชนีเช่น lucene.net หรือไม่ในการจัดทำดัชนีเอกสารฝากข้อมูลเหล่านี้

— Munavvar

ฉันยังคงกลับมาที่คำตอบนี้และสร้างเครื่องมือเพื่อช่วย: bucketsearch.net - อนุญาตให้ใช้การค้นหาตัวแทนอื่น ๆ

— Jon M

251

เพียงบันทึกที่จะเพิ่มที่นี่: ตอนนี้ 3 ปีต่อมา แต่โพสต์นี้ติดอันดับใน Google เมื่อคุณพิมพ์ใน "วิธีการค้นหา S3 Bucket"

บางทีคุณกำลังมองหาบางอย่างที่ซับซ้อนกว่านี้ แต่ถ้าคุณลงมาที่นี่พยายามคิดหาวิธีค้นหาวัตถุ (ไฟล์) โดยใช้ชื่อเป็นเรื่องง่าย ๆ :

เปิดที่ฝากข้อมูลเลือก "none" ทางด้านขวามือแล้วเริ่มพิมพ์ชื่อไฟล์

http://docs.aws.amazon.com/AmazonS3/latest/UG/ListingObjectsinaBucket.html

— Rhonda Bradley
แหล่งที่มา

43

นี่คือสิ่งที่ฉันกำลังมองหา การออกแบบประสบการณ์การใช้งานที่แย่มากที่จะไม่มีตัวชี้นำภาพ

— Keith Entzeroth

2

จำเป็นต้องเลือกไฟล์ในที่เก็บข้อมูลจากนั้นเริ่มพิมพ์

— cabe56

30

ยังคงให้คุณค้นหาด้วยคำนำหน้าของชื่อรายการ

— Daniel Flippance

21

นี่มันช่างน่าโมโหจริงๆ! ผู้คนกำลังพูดถึงบางสิ่งที่อยู่ทางด้านขวามือหรือกล่องสีเหลือง แต่ฉันไม่พบอะไรเลย ข้อความ "พิมพ์คำนำหน้า ... " เหมือนกัน "Search Bucket" ไม่ใช่ค่าเริ่มต้นอย่างไร มันเกือบจะเป็นไม่สามารถค้นหาได้เป็นซอฟต์แวร์ Atlassian ...

— vegather

40

คำตอบนี้ยังคงเป็นปัจจุบันหรือไม่? ฉันไม่เห็น '' ไม่มี 'ทางด้านขวามือ' และลิงค์เอกสารในคำตอบตอนนี้ส่งต่อไปยังหน้าอื่น

— BiscuitBaker

112

นี่เป็นวิธีสั้น ๆ และน่าเกลียดในการค้นหาชื่อไฟล์โดยใช้AWS CLI :

aws s3 ls s3://your-bucket --recursive | grep your-search | cut -c 32-

— Abe Voelker
แหล่งที่มา

1

aws s3 ls s3: // your-bucket --recursive | grep การค้นหาของคุณดีพอสำหรับการค้นหาของฉันขอบคุณ Abe Voelker

— man.2067067

3

ถังทั้งหมด: aws s3 ls | awk '{พิมพ์ $ 3}' | ในขณะที่อ่านบรรทัด ทำ echo $ line; aws s3 ls s3: // $ line --recursive | grep การค้นหาของคุณ; เสร็จแล้ว

— Akom

1

สิ่งที่ถูกตัด -c 32 โดยไม่ต้องนี้ยังค้นหาคือการทำงาน

— sunil

1

cut -c 32-เพียงแค่ตัดการประทับเวลาและข้อมูลขนาดไฟล์จากผลลัพธ์ซึ่งในระบบของฉันมีความยาวสูงสุด 32 อักขระ คุณไม่จำเป็นต้องใช้มัน แต่ถ้าคุณกำลังไพพ์เอาท์พุทไปยังคำสั่งอื่นมันอาจจะเป็นประโยชน์หากมีเอาต์พุต "ที่ชัดเจน"

— Abe Voelker

include/excludeสนับสนุน CLI ดังนั้นaws s3 ls s3://bucket --recursive --exclude '*' --include 'myfile*'

— Mohnish

25

มีอย่างน้อยสองกรณีการใช้งานที่แตกต่างกันซึ่งอาจอธิบายได้ว่า "ค้นหาถัง"

ค้นหาสิ่งที่อยู่ภายในทุกวัตถุที่เก็บไว้ที่ฝากข้อมูล นี่ถือว่าเป็นรูปแบบทั่วไปสำหรับวัตถุทั้งหมดในที่ฝากข้อมูล (พูดไฟล์ข้อความ) ฯลฯ ฯลฯ สำหรับบางสิ่งเช่นนี้คุณจะถูกบังคับให้ทำในสิ่งที่ Cody Caughlan เพิ่งตอบ เอกสาร AWS S3 มีรหัสตัวอย่างที่แสดงวิธีการใช้ AWS SDK สำหรับ Java: รายการคีย์โดยใช้ AWS SDK สำหรับ Java (ที่นั่นคุณจะพบ PHP และตัวอย่าง C #)
รายการสินค้าค้นหาบางสิ่งบางอย่างในคีย์วัตถุที่อยู่ในที่ฝากข้อมูลนั้น S3 จะมีบางส่วนที่ได้รับการสนับสนุนนี้ในรูปแบบของการอนุญาตให้ใช้คำนำหน้าแน่นอนแมตช์การแข่งขัน + ยุบหลังจากที่คั่น นี่คือคำอธิบายในรายละเอียดเพิ่มเติมได้ที่คู่มือนักพัฒนา AWS S3 สิ่งนี้ทำให้ตัวอย่างเช่นการใช้ "โฟลเดอร์" ผ่านการใช้เป็นวัตถุคีย์บางอย่างเช่น
```
โฟลเดอร์ / โฟลเดอร์ย่อย / file.txt
```
หากคุณปฏิบัติตามอนุสัญญานี้ S3 GUIs ส่วนใหญ่ (เช่นคอนโซล AWS) จะแสดงมุมมองโฟลเดอร์ของที่เก็บข้อมูลของคุณ

— Eduardo Pareja Tobes
แหล่งที่มา

เอกสารสำหรับการใช้คำนำหน้าในทับทิม

— James

22

AWS เปิดตัวบริการใหม่เพื่อสืบค้น S3 กลุ่มข้อมูลด้วย SQL: Amazon Athena https://aws.amazon.com/athena/

— hellomichibye
แหล่งที่มา

2

argh …ฉันเข้าใจ… "Athena ไม่มีให้บริการใน US West (N. California) โปรดเลือกภูมิภาคอื่น"

— Clintm

2

เป็นค่าใช้จ่ายในการสืบค้น SQL ทั้งหมดเนื่องจากฉันต้องการ grep

— Ali Gajani

4

@Clintm - เปลี่ยนเป็น us-east-1 (N. Virginia)

— slocumro

21

มีหลายตัวเลือกไม่มีวิธีแก้ไขปัญหาข้อความแบบเต็ม "one shot" อย่างง่าย:

การค้นหารูปแบบชื่อคีย์ : ค้นหาคีย์ที่เริ่มต้นด้วยสตริง - ถ้าคุณออกแบบชื่อคีย์อย่างระมัดระวังคุณอาจมีวิธีแก้ปัญหาที่ค่อนข้างรวดเร็ว
ค้นหาข้อมูลเมตาที่แนบกับคีย์ : เมื่อโพสต์ไฟล์ไปยัง AWS S3 คุณสามารถประมวลผลเนื้อหาแตกข้อมูลเมตาและแนบข้อมูลเมตานี้ในรูปแบบของส่วนหัวที่กำหนดเองลงในคีย์ สิ่งนี้ช่วยให้คุณสามารถดึงชื่อคีย์และส่วนหัวโดยไม่จำเป็นต้องดึงเนื้อหาที่สมบูรณ์ การค้นหาจะต้องทำตามลำดับไม่มีตัวเลือกการค้นหา "sql like" สำหรับสิ่งนี้ ด้วยไฟล์ขนาดใหญ่ทำให้ประหยัดเวลาและปริมาณการใช้เครือข่ายได้มาก
จัดเก็บข้อมูลเมตาบน SimpleDB : เป็นจุดก่อนหน้า แต่มีการจัดเก็บข้อมูลเมตาบน SimpleDB ที่นี่คุณมี SQL เช่นเลือกคำสั่ง ในกรณีที่ชุดข้อมูลขนาดใหญ่คุณอาจถึงขีด จำกัด SimpleDB ซึ่งสามารถเอาชนะได้ (พาร์ติชันเมตาดาต้าข้ามโดเมน SimpleDB หลายโดเมน) แต่ถ้าคุณไปไกลมากคุณอาจต้องใช้ฐานข้อมูลเมตาดาต้าชนิดอื่น
ค้นหาข้อความแบบเต็มตามลำดับของเนื้อหา - ประมวลผลปุ่มทั้งหมดทีละตัว ช้ามากถ้าคุณมีคีย์ที่ต้องดำเนินการมากเกินไป

เรากำลังจัดเก็บไฟล์ 1440 เวอร์ชันต่อวัน (หนึ่งต่อนาที) เป็นเวลาสองสามปีโดยใช้ที่ฝากข้อมูลเวอร์ชันที่เป็นไปได้อย่างง่ายดาย แต่การใช้เวอร์ชั่นที่เก่ากว่านั้นต้องใช้เวลา บางครั้งฉันใช้ดัชนี CSV แบบเรียบง่ายพร้อมระเบียนแสดงเวลาการเผยแพร่พร้อมรหัสเวอร์ชันเมื่อมีสิ่งนี้ฉันสามารถข้ามไปยังเวอร์ชันเก่ากว่าได้อย่างรวดเร็ว

อย่างที่คุณเห็น AWS S3 ไม่ได้เป็นของตัวเองที่ออกแบบมาสำหรับการค้นหาข้อความแบบเต็มมันเป็นบริการจัดเก็บข้อมูลที่เรียบง่าย

— Jan Vlcinsky
แหล่งที่มา

4

ค้นหาตามคำนำหน้าใน S3 Console

โดยตรงในมุมมองที่ฝากข้อมูล AWS Console

คัดลอกไฟล์ที่ต้องการโดยใช้ s3-dist-cp

เมื่อคุณมีหลายพันหรือล้านไฟล์วิธีการที่จะได้รับไฟล์ที่ต้องการก็คือการคัดลอกไปยังสถานที่อื่นโดยใช้สำเนาแจกจ่าย คุณเรียกใช้สิ่งนี้บนEMRในงาน Hadoop สิ่งดีๆเกี่ยวกับ AWS ที่พวกเขาให้กำหนดเองของพวกเขารุ่น S3 S3-อ-CP อนุญาตให้คุณจัดกลุ่มไฟล์ที่ต้องการโดยใช้นิพจน์ทั่วไปในฟิลด์ groupBy คุณสามารถใช้สิ่งนี้ในขั้นตอนที่กำหนดเองบน EMR

[
    {
        "ActionOnFailure": "CONTINUE",
        "Args": [
            "s3-dist-cp",
            "--s3Endpoint=s3.amazonaws.com",
            "--src=s3://mybucket/",
            "--dest=s3://mytarget-bucket/",
            "--groupBy=MY_PATTERN",
            "--targetSize=1000"
        ],
        "Jar": "command-runner.jar",
        "Name": "S3DistCp Step Aggregate Results",
        "Type": "CUSTOM_JAR"
    }
]

— H6
แหล่งที่มา

ดูเหมือนว่ามุมมองที่ฝากข้อมูลคอนโซล AWS ไม่ได้ไปตามไฟล์โดยใช้ตัวกรอง สามารถส่งคืนผลลัพธ์ได้อย่างรวดเร็วอย่างยิ่งหากมีสตริงย่อยของไฟล์ที่ฉันกำลังค้นหา มีไคลเอนต์ / เครื่องมือ / API ที่ฉันสามารถใช้นอกเหนือจากคอนโซล AWS เพื่อรับผลลัพธ์ในคฤหาสน์ที่ทันเวลาเดียวกันหรือไม่ @ high6 ในอดีตที่ผ่านมาฉันพยายามใช้ boto แต่วิธีที่ดีที่สุดดูเหมือนจะวนซ้ำทั้งถังโดยใช้เกณฑ์การค้นหาของคุณกับทุกชื่อไฟล์ IE ช้ามาก

— คัดลอกและวาง

4

หากคุณใช้ Windows และไม่มีเวลาหาgrepทางเลือกที่ดีวิธีที่รวดเร็วและสกปรกก็คือ:

aws s3 ls s3://your-bucket/folder/ --recursive > myfile.txt

จากนั้นทำการค้นหาอย่างรวดเร็วใน myfile.txt

บิต "โฟลเดอร์" เป็นตัวเลือก

ป.ล. ถ้าคุณไม่ได้ติดตั้ง AWS CLI นี่เป็นหนึ่งซับในที่ใช้ตัวจัดการแพคเกจ Chocolatey

choco install awscli

PPS ถ้าคุณไม่มีผู้จัดการแพ็คเกจ Chocolatey - รับไปเลย! ชีวิตของคุณบน Windows จะดีขึ้น 10 เท่า (ฉันไม่ได้มีส่วนเกี่ยวข้องกับ Chocolatey แต่อย่างใด แต่มันเป็นสิ่งที่ต้องมีจริงๆ)

— อเล็กซ์
แหล่งที่มา

หากผู้ใช้สามารถติดตั้ง choco awscli พวกเขาสามารถติดตั้ง grep ได้หรือไม่? หรือใช้การค้นหาของ windows พื้นเมือง

— Dean Radcliffe

2

ระบุว่าคุณอยู่ใน AWS ... ฉันคิดว่าคุณต้องการใช้เครื่องมือ CloudSearch ของพวกเขา ใส่ข้อมูลที่คุณต้องการค้นหาในบริการของพวกเขา ... ให้ชี้ไปที่ปุ่ม S3

http://aws.amazon.com/cloudsearch/

— Andrew Siemer
แหล่งที่มา

7

ไม่ใช่สิ่งที่ OP กำลังมองหาอยู่

— จริงๆ

สำหรับฉันมันจะหมายถึงบันทึกที่นั่นข้อมูลทั้งหมด - การทำซ้ำของข้อมูล

— BG Bruno

1

อีกทางเลือกหนึ่งคือการทำมิเรอร์ถัง S3 บนเว็บเซิร์ฟเวอร์ของคุณและท่องไปในเครื่อง เคล็ดลับคือไฟล์โลคัลว่างเปล่าและใช้เป็นโครงกระดูกเท่านั้น อีกวิธีหนึ่งไฟล์โลคัลสามารถเก็บข้อมูลเมตาที่เป็นประโยชน์ซึ่งโดยปกติคุณจะต้องได้รับจาก S3 (เช่นขนาดไฟล์, mimetype, ผู้แต่ง, เวลาประทับ, uuid) เมื่อคุณระบุ URL เพื่อดาวน์โหลดไฟล์ให้ค้นหาในเครื่องและให้ลิงค์ไปยังที่อยู่ S3

การข้ามไฟล์ในเครื่องเป็นเรื่องง่ายและวิธีการสำหรับการจัดการ S3 นี้ไม่เชื่อเรื่องภาษา การข้ามผ่านไฟล์โลคัลยังหลีกเลี่ยงการดูแลรักษาและการเคียวรีฐานข้อมูลของไฟล์หรือความล่าช้าในการเรียกชุดรีโมต API เพื่อพิสูจน์ตัวตนและรับเนื้อหาที่ฝากข้อมูล

คุณสามารถอนุญาตให้ผู้ใช้อัปโหลดไฟล์ไปยังเซิร์ฟเวอร์ของคุณโดยตรงผ่าน FTP หรือ HTTP จากนั้นถ่ายโอนชุดของไฟล์ใหม่และที่อัปเดตไปยังอเมซอนในช่วงเวลาเร่งด่วนโดยเพียงแค่เรียกใช้ซ้ำไดเรกทอรีสำหรับไฟล์ทุกขนาด เมื่อการถ่ายโอนไฟล์ไปยัง Amazon เสร็จสิ้นให้แทนที่ไฟล์เว็บเซิร์ฟเวอร์ด้วยชื่อเดียวที่ว่างเปล่า หากไฟล์โลคัลมีขนาดไฟล์ใด ๆ ให้บริการไฟล์โดยตรงเพราะกำลังรอการถ่ายโอนแบตช์

— Dylan Valade
แหล่งที่มา

วิธีที่ดีที่จะระเบิดพื้นที่จัดเก็บโหนดของคุณบน EXTFS2 / 3 ดิสก์ถ้าคุณมีนับล้านของไฟล์ในถัง S3 ของคุณ ...

— tpartee

1

วิธีที่ฉันทำคือฉันมีไฟล์หลายพันไฟล์ใน s3 ฉันเห็นแผงคุณสมบัติของหนึ่งไฟล์ในรายการ คุณสามารถดู URI ของไฟล์นั้นและฉันคัดลอกวางไปยังเบราว์เซอร์ - มันเป็นไฟล์ข้อความและแสดงผลได้ดี ตอนนี้ฉันแทนที่ uuid ใน url ด้วย uuid ที่ฉันมีอยู่ในมือ

ฉันหวังว่า AWS มีวิธีที่ดีกว่าในการค้นหาไฟล์ แต่วิธีนี้ใช้ได้สำหรับฉัน

— ดอกกุหลาบ
แหล่งที่มา

1

ลองคำสั่งนี้:

aws s3api list-objects --bucket your-bucket --prefix sub-dir-path --output text --query 'Contents[].{Key: Key}'

จากนั้นคุณสามารถไพพ์นี้ลงใน grep เพื่อรับชนิดไฟล์เฉพาะเพื่อทำสิ่งที่คุณต้องการ

— โรเบิร์ตอีแวนส์
แหล่งที่มา

1

หมายเหตุ: --output textระบุว่าผลลัพธ์จะเป็นข้อความธรรมดาไม่ใช่ JSON เป็นต้นและ--query 'Contents[].{Key: Key, Size: Size}'เพียงกรองผลลัพธ์ของรายการเป็นชื่อไฟล์และขนาดไฟล์ มันไม่ได้ค้นหาKey: Keyหรือชอบ

— Matt

1

ฉันลองด้วยวิธีต่อไปนี้

aws s3 ls s3://Bucket1/folder1/2019/ --recursive |grep filename.csv

เอาต์พุตนี้พา ธ จริงที่มีไฟล์อยู่

2019-04-05 01:18:35     111111 folder1/2019/03/20/filename.csv

— Dheeraj
แหล่งที่มา

1

นี่เป็นข้อความเก่า ๆ เล็กน้อย - แต่อาจช่วยคนที่ยังค้นหา - ฉันเป็นคนที่ค้นหาปี

วิธีแก้ไขอาจเป็น " AWS Athena " ที่คุณสามารถค้นหาข้อมูลเช่นนี้

'SELECT user_name FROM S3Object WHERE cast(age as int) > 20'

https://aws.amazon.com/blogs/developer/introducing-support-for-amazon-s3-select-in-the-aws-sdk-for-javascript/

การกำหนดราคาปัจจุบันคือ5 ดอลลาร์สำหรับข้อมูล 1TB - ตัวอย่างเช่นหากคำค้นหาของคุณมากกว่าหนึ่งไฟล์ 1TB 3 ครั้งต้นทุนของคุณคือ $ 15 - แต่ตัวอย่างเช่นถ้ามีเพียง 1 คอลัมน์ใน "รูปแบบคอลัมน์ที่แปลงแล้ว" สิ่งที่คุณต้องการอ่าน / 3 ของราคาหมายถึง $ 1.67 / TB

— BG Bruno
แหล่งที่มา

ดูเหมือนจะไม่เป็นไปได้สำหรับแอปพลิเคชันใด ๆ ที่ต้องการการค้นหาอย่างละเอียดเนื่องจากราคาค่อนข้างสูงแม้ว่า ...

— tnkh

@tnkh ฉันเห็นด้วย - ฉันต้องการตัวเลือกเพิ่มเติมด้วย # s3 ด้วย

— BG Bruno

0

ดูเอกสารนี้: http://docs.aws.amazon.com/AWSSDKforPHP/latest/index.html#m=amazons3/get_object_list

คุณสามารถใช้นิพจน์ปกติที่เข้ากันได้กับ Perl (PCRE) เพื่อกรองชื่อ

— Ragnar
แหล่งที่มา

0

ฉันทำบางอย่างด้านล่างเพื่อค้นหารูปแบบในที่เก็บข้อมูลของฉัน

def getListOfPrefixesFromS3(dataPath: String, prefix: String, delimiter: String, batchSize: Integer): List[String] = {
    var s3Client = new AmazonS3Client()
    var listObjectsRequest = new ListObjectsRequest().withBucketName(dataPath).withMaxKeys(batchSize).withPrefix(prefix).withDelimiter(delimiter)
    var objectListing: ObjectListing = null
    var res: List[String] = List()

    do {
      objectListing = s3Client.listObjects(listObjectsRequest)
      res = res ++ objectListing.getCommonPrefixes
      listObjectsRequest.setMarker(objectListing.getNextMarker)
    } while (objectListing.isTruncated)
    res
  }

สำหรับที่เก็บขนาดใหญ่การใช้เวลามากเกินไปเนื่องจากสรุปวัตถุทั้งหมดจะถูกส่งคืนโดย Aws และไม่เพียง แต่ที่ตรงกับคำนำหน้าและตัวคั่นเท่านั้น ฉันกำลังมองหาวิธีในการปรับปรุงประสิทธิภาพและจนถึงตอนนี้ฉันเพิ่งพบว่าฉันควรตั้งชื่อคีย์และจัดระเบียบมันในที่เก็บอย่างถูกต้อง

— Raghvendra Singh
แหล่งที่มา

0

ฉันประสบปัญหาเดียวกัน การค้นหาใน S3 ควรง่ายกว่าสถานการณ์ปัจจุบันมากขึ้น นั่นเป็นเหตุผลที่ฉันใช้เครื่องมือโอเพนซอร์ซนี้เพื่อค้นหาใน S3

SSEARCHเป็นเครื่องมือค้นหา S3 แบบโอเพ่นซอร์สแบบเต็ม มันถูกนำมาใช้เสมอทำให้ทราบว่าประสิทธิภาพเป็นปัจจัยสำคัญและตามมาตรฐานนั้นจะค้นหาที่ฝากข้อมูลที่มี ~ 1,000 ไฟล์ภายในไม่กี่วินาที

ติดตั้งง่าย คุณดาวน์โหลดเฉพาะไฟล์นักเทียบท่าและรันด้วย

docker-compose up

SSEARCH จะเริ่มขึ้นและคุณสามารถค้นหาอะไรก็ได้ในที่เก็บข้อมูลใด ๆ ที่คุณมี

— Arda Güçlü
แหล่งที่มา

0

กรอไปข้างหน้าอย่างรวดเร็วถึงปี 2020 และการใช้ aws-okta เป็น 2fa ของเราคำสั่งต่อไปนี้ในขณะที่ช้าเหมือนนรกในการย้ำผ่านวัตถุและโฟลเดอร์ทั้งหมดในที่เก็บข้อมูลชุดนี้ (+270,000) ทำงานได้ดี

aws-okta exec dev -- aws s3 ls my-cool-bucket --recursive | grep needle-in-haystax.txt

— jamescampbell
แหล่งที่มา

0

ใช้ Amazon Athena เพื่อสอบถาม S3 bucket นอกจากนี้โหลดข้อมูลไปยังการค้นหาของ Amazon ยืดหยุ่น หวังว่านี่จะช่วยได้

— ถามฉัน
แหล่งที่มา

0

ไม่ใช่คำตอบทางเทคนิค แต่ฉันได้สร้างแอปพลิเคชันที่อนุญาตให้ค้นหาไวด์การ์ด: https://bucketsearch.net/

มันจะทำดัชนีแบบไม่ประสานกันในที่เก็บข้อมูลของคุณแล้วให้คุณค้นหาผลลัพธ์

ใช้งานได้ฟรี (donationware)

— จอนม
แหล่งที่มา

-1

สถานะ 2018-07: อเมซอนจะมี SQL Native เช่นการค้นหาสำหรับ CSV และ JSON ไฟล์!

https://aws.amazon.com/blogs/developer/introducing-support-for-amazon-s3-select-in-the-aws-sdk-for-javascript/

— JSI
แหล่งที่มา

คุณจะค้นหากลุ่มฝาก amazon s3 ได้อย่างไร

ค้นหาตามคำนำหน้าใน S3 Console

คัดลอกไฟล์ที่ต้องการโดยใช้ s3-dist-cp