Mercurial: mercurial/pvec.py annotate

annotate mercurial/pvec.py @ 41327:1281b2265ff5

convert: use raw strings for XML strings Due to the source transformer, we were passing bytes into the XML APIs. This results in not finding elements and doing compares against mismatched types. Use raw string literals so we use str everywhere. Differential Revision: https://phab.mercurial-scm.org/D5664

author	Gregory Szorc <gregory.szorc@gmail.com>
date	Wed, 23 Jan 2019 16:21:36 -0800
parents	e7aa113b14f7
children	2372284d9457

rev	line source
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	1 # pvec.py - probabilistic vector clocks for Mercurial
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	2 #
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	3 # Copyright 2012 Matt Mackall <mpm@selenic.com>
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	4 #
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	5 # This software may be used and distributed according to the terms of the
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	6 # GNU General Public License version 2 or any later version.
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	7
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	8 '''
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	9 A "pvec" is a changeset property based on the theory of vector clocks
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	10 that can be compared to discover relatedness without consulting a
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	11 graph. This can be useful for tasks like determining how a
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	12 disconnected patch relates to a repository.
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	13
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	14 Currently a pvec consist of 448 bits, of which 24 are 'depth' and the
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	15 remainder are a bit vector. It is represented as a 70-character base85
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	16 string.
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	17
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	18 Construction:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	19
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	20 - a root changeset has a depth of 0 and a bit vector based on its hash
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	21 - a normal commit has a changeset where depth is increased by one and
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	22 one bit vector bit is flipped based on its hash
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	23 - a merge changeset pvec is constructed by copying changes from one pvec into
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	24 the other to balance its depth
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	25
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	26 Properties:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	27
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	28 - for linear changes, difference in depth is always <= hamming distance
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	29 - otherwise, changes are probably divergent
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	30 - when hamming distance is < 200, we can reliably detect when pvecs are near
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	31
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	32 Issues:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	33
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	34 - hamming distance ceases to work over distances of ~ 200
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	35 - detecting divergence is less accurate when the common ancestor is very close
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	36 to either revision or total distance is high
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	37 - this could probably be improved by modeling the relation between
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	38 delta and hdist
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	39
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	40 Uses:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	41
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	42 - a patch pvec can be used to locate the nearest available common ancestor for
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	43 resolving conflicts
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	44 - ordering of patches can be established without a DAG
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	45 - two head pvecs can be compared to determine whether push/pull/merge is needed
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	46 and approximately how many changesets are involved
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	47 - can be used to find a heuristic divergence measure between changesets on
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	48 different branches
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	49 '''
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	50
27501 983e93d88193 pvec: use absolute_import Gregory Szorc <gregory.szorc@gmail.com> parents: 24339 diff changeset	51 from __future__ import absolute_import
983e93d88193 pvec: use absolute_import Gregory Szorc <gregory.szorc@gmail.com> parents: 24339 diff changeset	52
983e93d88193 pvec: use absolute_import Gregory Szorc <gregory.szorc@gmail.com> parents: 24339 diff changeset	53 from .node import nullrev
983e93d88193 pvec: use absolute_import Gregory Szorc <gregory.szorc@gmail.com> parents: 24339 diff changeset	54 from . import (
38783 e7aa113b14f7 global: use pycompat.xrange() Gregory Szorc <gregory.szorc@gmail.com> parents: 32201 diff changeset	55 pycompat,
27501 983e93d88193 pvec: use absolute_import Gregory Szorc <gregory.szorc@gmail.com> parents: 24339 diff changeset	56 util,
983e93d88193 pvec: use absolute_import Gregory Szorc <gregory.szorc@gmail.com> parents: 24339 diff changeset	57 )
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	58
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	59 _size = 448 # 70 chars b85-encoded
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	60 _bytes = _size / 8
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	61 _depthbits = 24
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	62 _depthbytes = _depthbits / 8
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	63 _vecbytes = _bytes - _depthbytes
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	64 _vecbits = _vecbytes * 8
17424 e7cfe3587ea4 fix trivial spelling errors Mads Kiilerich <mads@kiilerich.com> parents: 16249 diff changeset	65 _radius = (_vecbits - 30) / 2 # high probability vectors are related
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	66
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	67 def _bin(bs):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	68 '''convert a bytestring to a long'''
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	69 v = 0
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	70 for b in bs:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	71 v = v * 256 + ord(b)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	72 return v
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	73
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	74 def _str(v, l):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	75 bs = ""
38783 e7aa113b14f7 global: use pycompat.xrange() Gregory Szorc <gregory.szorc@gmail.com> parents: 32201 diff changeset	76 for p in pycompat.xrange(l):
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	77 bs = chr(v & 255) + bs
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	78 v >>= 8
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	79 return bs
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	80
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	81 def _split(b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	82 '''depth and bitvec'''
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	83 return _bin(b[:_depthbytes]), _bin(b[_depthbytes:])
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	84
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	85 def _join(depth, bitvec):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	86 return _str(depth, _depthbytes) + _str(bitvec, _vecbytes)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	87
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	88 def _hweight(x):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	89 c = 0
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	90 while x:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	91 if x & 1:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	92 c += 1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	93 x >>= 1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	94 return c
38783 e7aa113b14f7 global: use pycompat.xrange() Gregory Szorc <gregory.szorc@gmail.com> parents: 32201 diff changeset	95 _htab = [_hweight(x) for x in pycompat.xrange(256)]
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	96
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	97 def _hamming(a, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	98 '''find the hamming distance between two longs'''
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	99 d = a ^ b
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	100 c = 0
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	101 while d:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	102 c += _htab[d & 0xff]
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	103 d >>= 8
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	104 return c
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	105
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	106 def _mergevec(x, y, c):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	107 # Ideally, this function would be x ^ y ^ ancestor, but finding
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	108 # ancestors is a nuisance. So instead we find the minimal number
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	109 # of changes to balance the depth and hamming distance
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	110
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	111 d1, v1 = x
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	112 d2, v2 = y
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	113 if d1 < d2:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	114 d1, d2, v1, v2 = d2, d1, v2, v1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	115
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	116 hdist = _hamming(v1, v2)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	117 ddist = d1 - d2
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	118 v = v1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	119 m = v1 ^ v2 # mask of different bits
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	120 i = 1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	121
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	122 if hdist > ddist:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	123 # if delta = 10 and hdist = 100, then we need to go up 55 steps
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	124 # to the ancestor and down 45
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	125 changes = (hdist - ddist + 1) / 2
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	126 else:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	127 # must make at least one change
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	128 changes = 1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	129 depth = d1 + changes
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	130
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	131 # copy changes from v2
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	132 if m:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	133 while changes:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	134 if m & i:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	135 v ^= i
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	136 changes -= 1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	137 i <<= 1
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	138 else:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	139 v = _flipbit(v, c)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	140
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	141 return depth, v
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	142
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	143 def _flipbit(v, node):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	144 # converting bit strings to longs is slow
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	145 bit = (hash(node) & 0xffffffff) % _vecbits
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	146 return v ^ (1<<bit)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	147
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	148 def ctxpvec(ctx):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	149 '''construct a pvec for ctx while filling in the cache'''
24339 bcc319d936a3 pvec: replace 'ctx._repo' with 'ctx.repo()' Matt Harbison <matt_harbison@yahoo.com> parents: 18918 diff changeset	150 r = ctx.repo()
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	151 if not util.safehasattr(r, "_pveccache"):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	152 r._pveccache = {}
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	153 pvc = r._pveccache
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	154 if ctx.rev() not in pvc:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	155 cl = r.changelog
38783 e7aa113b14f7 global: use pycompat.xrange() Gregory Szorc <gregory.szorc@gmail.com> parents: 32201 diff changeset	156 for n in pycompat.xrange(ctx.rev() + 1):
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	157 if n not in pvc:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	158 node = cl.node(n)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	159 p1, p2 = cl.parentrevs(n)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	160 if p1 == nullrev:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	161 # start with a 'random' vector at root
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	162 pvc[n] = (0, _bin((node * 3)[:_vecbytes]))
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	163 elif p2 == nullrev:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	164 d, v = pvc[p1]
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	165 pvc[n] = (d + 1, _flipbit(v, node))
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	166 else:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	167 pvc[n] = _mergevec(pvc[p1], pvc[p2], node)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	168 bs = _join(*pvc[ctx.rev()])
32201 4462a981e8df base85: proxy through util module Yuya Nishihara <yuya@tcha.org> parents: 27501 diff changeset	169 return pvec(util.b85encode(bs))
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	170
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	171 class pvec(object):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	172 def __init__(self, hashorctx):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	173 if isinstance(hashorctx, str):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	174 self._bs = hashorctx
32201 4462a981e8df base85: proxy through util module Yuya Nishihara <yuya@tcha.org> parents: 27501 diff changeset	175 self._depth, self._vec = _split(util.b85decode(hashorctx))
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	176 else:
18918 5093d2a87ff6 pvec: use the correct name for an identifier Bryan O'Sullivan <bryano@fb.com> parents: 17424 diff changeset	177 self._vec = ctxpvec(hashorctx)
16249 0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	178
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	179 def __str__(self):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	180 return self._bs
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	181
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	182 def __eq__(self, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	183 return self._vec == b._vec and self._depth == b._depth
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	184
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	185 def __lt__(self, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	186 delta = b._depth - self._depth
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	187 if delta < 0:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	188 return False # always correct
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	189 if _hamming(self._vec, b._vec) > delta:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	190 return False
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	191 return True
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	192
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	193 def __gt__(self, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	194 return b < self
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	195
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	196 def __or__(self, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	197 delta = abs(b._depth - self._depth)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	198 if _hamming(self._vec, b._vec) <= delta:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	199 return False
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	200 return True
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	201
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	202 def __sub__(self, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	203 if self \| b:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	204 raise ValueError("concurrent pvecs")
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	205 return self._depth - b._depth
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	206
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	207 def distance(self, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	208 d = abs(b._depth - self._depth)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	209 h = _hamming(self._vec, b._vec)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	210 return max(d, h)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	211
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	212 def near(self, b):
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	213 dist = abs(b.depth - self._depth)
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	214 if dist > _radius or _hamming(self._vec, b._vec) > _radius:
0d175ac527c1 pvec: introduce pvecs Matt Mackall <mpm@selenic.com> parents: diff changeset	215 return False

Mercurial > hg

annotate mercurial/pvec.py @ 41327:1281b2265ff5