MongoDB lưu trữ dữ liệu ở một định dạng hoàn toàn khác, được gọi là BSON, sẽ chiếm nhiều dung lượng đĩa hơn. Không chỉ các giá trị cần được lưu trữ cho mỗi trường, nó cũng sẽ phải lưu trữ lại tên cột trong mỗi tài liệu (hàng). Nếu bạn có tên cột lớn, điều này chắc chắn có thể tăng kích thước trong MongoDB lên 8 đến 10 lần tệp CSV của bạn. Nếu có thể, bạn có thể xem xét việc rút ngắn tên trường của mình nếu điều này quá khó đối với bạn.
MongoDB cũng phân bổ trước tệp dữ liệu cho bạn. Ví dụ:thời điểm nó bắt đầu thêm dữ liệu vào taq.2
, nó sẽ tạo taq.3
và tương tự khi nó bắt đầu ghi vào taq.4
nó tạo thẻ tag.5
. Vì vậy, trong trường hợp của bạn, giả sử tệp 230MB của bạn sẽ tạo ra 1,9 GB dữ liệu, MongoDB đã cấp phát taq.5
có kích thước 2.0G . Hành vi này có thể được tắt bằng cách chỉ định --noprealloc
trên dòng lệnh khi bắt đầu mongod
.