Open
Description
При конвертации файлов jsonl.zst
в формат parquet
, очень сильно вырастает потребление RAM и SWAP. Программа завершается c помощью OOMKiller. Нагрука на CPU - незначительная
Размер исходного файла от 5 до 8Gb
Интересно, что в коде я не увидел явной поддержки zst, может какие-то нюансы у формата..
undatum convert --format-in jsonl ~/records0.jsonl.zst test.parquet
OS: Linux 6.10.13 (x86_64)
RAM: 32Gb DDR5
Storage: SSD NVMe
CPU: AMD Ryzen 7 7700 8-Core
Metadata
Metadata
Assignees
Labels
Type
Projects
Status
🏗 In progress