プログラミング

デカいファイルを探すにはdu -shより圧倒的に高速なpdu(parallel-disk-usage)

2021年8月11日

GitHub - KSXGitHub/parallel-disk-usage: Highly parallelized, blazing fast directory tree analyzer https://github.com/KSXGitHub/parallel-disk-usage

Rust製のdu、並列でduしてくれるので非常に高速なのとカレントディレクトリ配下にある大きいファイルがなんなのかが1回実行すればわかるので便利。

du -shだと1階層目のファイルの容量はわかるけど容量が大きいディレクトリをさらにduしてという感じで日が暮れてしまう、なんて面倒なんだ。

MacOSやubuntuでpduするには3ステップでできる。

curl https://sh.rustup.rs -sSf | sh
cargo install parallel-disk-usage --bin pdu
pdu

例えばmastodonのgitリポジトリでpduしてみるとこんな感じ。

.git/objects/pack/pack-cb601f231204f674daa4f60a876555152b167878.packが70%を占めているのが一目瞭然、しかも超高速

他にもGo製のduとかいろいろあるみたいだけどベンチマークではpduが一番高速らしい。

https://camo.githubusercontent.com/af93320be65319ec6f1f415e0705903dce756e229bce229293943d2c341e2160/68747470733a2f2f6b73786769746875622e6769746875622e696f2f706172616c6c656c2d6469736b2d75736167652d302e352e322d62656e63686d61726b732f746d702e62656e63686d61726b2d7265706f72742e636f6d706574696e672e626c6b73697a652e737667

-プログラミング
-