Mercurial: comparison mercurial/verify.py

equal deleted inserted replaced

-:01c0f01b562b
+:733db72f0f54
 elif (size > 0 or not revlogv1) and f.startswith('data/'):
 storefiles.add(_normpath(f))
 state = {
 # TODO this assumes revlog storage for changelog.
-'expectedversion': self.repo.changelog.version & 0xFFFF
+'expectedversion': self.repo.changelog.version & 0xFFFF,
+'skipflags': self.skipflags,
+# experimental config: censor.policy
+'erroroncensored': ui.config('censor', 'policy') == 'abort',
 }
 files = sorted(set(filenodes) | set(filelinkrevs))
 revisions = 0
 progress = ui.makeprogress(_('checking'), unit=_('files'),
 self.fncachewarned = True
 if not len(fl) and (self.havecl or self.havemf):
 self.err(lr, _("empty or missing %s") % f)
 else:
+# Guard against implementations not setting this.
+state['skipread'] = set()
 for problem in fl.verifyintegrity(state):
+if problem.node is not None:
+linkrev = fl.linkrev(fl.rev(problem.node))
+else:
+linkrev = None
 if problem.warning:
 self.warn(problem.warning)
 elif problem.error:
-self.err(lr, problem.error, f)
+self.err(linkrev if linkrev is not None else lr,
+problem.error, f)
 else:
 raise error.ProgrammingError(
 'problem instance does not set warning or error '
 'attribute: %s' % problem.msg)
 seen = {}
-rp = None
 for i in fl:
 revisions += 1
 n = fl.node(i)
 lr = self.checkentry(fl, i, n, seen, linkrevs, f)
 if f in filenodes:
 if havemf and n not in filenodes[f]:
 self.err(lr, _("%s not in manifests") % (short(n)), f)
 else:
 del filenodes[f][n]
-# Verify contents. 4 cases to care about:
+if n in state['skipread']:
-#
+continue
-#   common: the most common case
-#   rename: with a rename
-#   meta: file content starts with b'\1\n', the metadata
-#         header defined in filelog.py, but without a rename
-#   ext: content stored externally
-#
-# More formally, their differences are shown below:
-#
-#                       | common | rename | meta  | ext
-#  -------------------------------------------------------
-#   flags()             | 0      | 0      | 0     | not 0
-#   renamed()           | False  | True   | False | ?
-#   rawtext[0:2]=='\1\n'| False  | True   | True  | ?
-#
-# "rawtext" means the raw text stored in revlog data, which
-# could be retrieved by "revision(rev, raw=True)". "text"
-# mentioned below is "revision(rev, raw=False)".
-#
-# There are 3 different lengths stored physically:
-#  1. L1: rawsize, stored in revlog index
-#  2. L2: len(rawtext), stored in revlog data
-#  3. L3: len(text), stored in revlog data if flags==0, or
-#     possibly somewhere else if flags!=0
-#
-# L1 should be equal to L2. L3 could be different from them.
-# "text" may or may not affect commit hash depending on flag
-# processors (see revlog.addflagprocessor).
-#
-#              | common  | rename | meta  | ext
-# -------------------------------------------------
-#    rawsize() | L1      | L1     | L1    | L1
-#       size() | L1      | L2-LM  | L1(*) | L1 (?)
-# len(rawtext) | L2      | L2     | L2    | L2
-#    len(text) | L2      | L2     | L2    | L3
-#  len(read()) | L2      | L2-LM  | L2-LM | L3 (?)
-#
-# LM:  length of metadata, depending on rawtext
-# (*): not ideal, see comment in filelog.size
-# (?): could be "- len(meta)" if the resolved content has
-#      rename metadata
-#
-# Checks needed to be done:
-#  1. length check: L1 == L2, in all cases.
-#  2. hash check: depending on flag processor, we may need to
-#     use either "text" (external), or "rawtext" (in revlog).
-try:
-skipflags = self.skipflags
-if skipflags:
-skipflags &= fl.flags(i)
-if not skipflags:
-fl.read(n) # side effect: read content and do checkhash
-rp = fl.renamed(n)
-# the "L1 == L2" check
-l1 = fl.rawsize(i)
-l2 = len(fl.revision(n, raw=True))
-if l1 != l2:
-self.err(lr, _("unpacked size is %s, %s expected") %
-(l2, l1), f)
-except error.CensoredNodeError:
-# experimental config: censor.policy
-if ui.config("censor", "policy") == "abort":
-self.err(lr, _("censored file data"), f)
-except Exception as inst:
-self.exc(lr, _("unpacking %s") % short(n), inst, f)
 # check renames
 try:
+# This requires resolving fulltext (at least on revlogs). We
+# may want ``verifyintegrity()`` to pass a set of nodes with
+# rename metadata as an optimization.
+rp = fl.renamed(n)
 if rp:
 if lr is not None and ui.verbose:
 ctx = lrugetctx(lr)
 if not any(rp[0] in pctx for pctx in ctx.parents()):
 self.warn(_("warning: copy source of '%s' not"

changeset 39872	733db72f0f54
parent 39845	e6d3d39cc1c7
child 39938	fec944719324