]> git.saurik.com Git - apt.git/commit
de-duplicate version strings in the cache
authorDavid Kalnischkies <david@kalnischkies.de>
Wed, 23 Jul 2014 12:52:11 +0000 (14:52 +0200)
committerDavid Kalnischkies <david@kalnischkies.de>
Fri, 26 Sep 2014 22:09:40 +0000 (00:09 +0200)
commitb13ce62c7e7db6a0e80a0f4729ee00105466c3ac
treeea3217f2298037f24e1e47c697356fc069527d20
parent78a5476f3177a2a74ae51a1878c26ca322a25003
de-duplicate version strings in the cache

Turns out that version numbers aren't as random as you might guess.
In my cache for example, I have:
  Total package names: 69513 (1390 k)
  Total package structures: 188259 (9036 k)
  Total distinct versions: 186345 (13.4 M)
  Total dependencies: 2052242 (57.5 M)
which amounts to 1035873 (10,1 M) strings.
Reusing version strings reduces this to 161465 (3.479 k).

This comes at a cost of course: Generation is slightly slower, but we
are still faster than what we started with and it makes room (also cache
size wise) for further changes.
apt-pkg/pkgcachegen.cc