การมาช้าไปหน่อยฉันคิดว่านี่อาจเป็นประโยชน์หากคุณต้องการข้อมูลเมตาเพื่อคงอยู่เหนือ I / O มีแพ็คเกจใหม่ที่เรียกว่าh5ioที่ฉันใช้เพื่อทำสิ่งนี้ให้สำเร็จ
ควรช่วยให้คุณอ่าน / เขียนได้อย่างรวดเร็วจาก HDF5 สำหรับรูปแบบทั่วไปสองสามรูปแบบหนึ่งในนั้นคือ dataframe ตัวอย่างเช่นคุณสามารถใส่ dataframe ในพจนานุกรมและรวมข้อมูลเมตาเป็นช่องในพจนานุกรมได้ เช่น:
save_dict = dict(data=my_df, name='chris', record_date='1/1/2016')
h5io.write_hdf5('path/to/file.hdf5', save_dict)
in_data = h5io.read_hdf5('path/to/file.hdf5')
df = in_data['data']
name = in_data['name']
etc...
อีกทางเลือกหนึ่งคือการดูโปรเจ็กต์เช่นxrayซึ่งมีความซับซ้อนกว่าในบางวิธี แต่ฉันคิดว่ามันช่วยให้คุณใช้ข้อมูลเมตาและแปลงเป็น DataFrame ได้ค่อนข้างง่าย