hg-stable: mercurial/parser.py@77272d28b53f (annotated)

11274 77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	1	# parser.py - simple top-down operator precedence parser for mercurial
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	2	#
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	3	# Copyright 2010 Matt Mackall <mpm@selenic.com>
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	4	#
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	5	# This software may be used and distributed according to the terms of the
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	6	# GNU General Public License version 2 or any later version.
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	7
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	8	# see http://effbot.org/zone/simple-top-down-parsing.txt and
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	9	# http://eli.thegreenplace.net/2010/01/02/top-down-operator-precedence-parsing/
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	10	# for background
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	11
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	12	# takes a tokenizer and elements
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	13	# tokenizer is an iterator that returns type, value pairs
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	14	# elements is a mapping of types to binding strength, prefix and infix actions
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	15	# an action is a tree node name, a tree label, and an optional match
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	16	# __call__(program) parses program into a labelled tree
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	17
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	18	class parser(object):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	19	def __init__(self, tokenizer, elements, methods=None):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	20	self._tokenizer = tokenizer
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	21	self._elements = elements
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	22	self._methods = methods
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	23	def _advance(self):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	24	'advance the tokenizer'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	25	t = self.current
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	26	self.current = self._iter.next()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	27	return t
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	28	def _match(self, m):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	29	'make sure the tokenizer matches an end condition'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	30	if self.current[0] != m:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	31	raise SyntaxError(self.current)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	32	self._advance()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	33	def _parse(self, bind=0):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	34	token, value = self._advance()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	35	# handle prefix rules on current token
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	36	prefix = self._elements[token][1]
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	37	if not prefix:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	38	raise SyntaxError("not a prefix: %s" % token)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	39	if len(prefix) == 1:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	40	expr = (prefix[0], value)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	41	else:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	42	if len(prefix) > 2 and prefix[2] == self.current[0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	43	self._match(prefix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	44	expr = (prefix[0], None)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	45	else:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	46	expr = (prefix[0], self._parse(prefix[1]))
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	47	if len(prefix) > 2:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	48	self._match(prefix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	49	# gather tokens until we meet a lower binding strength
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	50	while bind < self._elements[self.current[0]][0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	51	token, value = self._advance()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	52	# handle infix rules
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	53	infix = self._elements[token][2]
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	54	if len(infix) == 3 and infix[2] == self.current[0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	55	self._match(infix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	56	expr = (infix[0], expr, (None))
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	57	else:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	58	if not infix[0]:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	59	raise SyntaxError("not an infix")
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	60	expr = (infix[0], expr, self._parse(infix[1]))
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	61	if len(infix) == 3:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	62	self._match(infix[2])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	63	return expr
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	64	def parse(self, message):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	65	'generate a parse tree from a message'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	66	self._iter = self._tokenizer(message)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	67	self.current = self._iter.next()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	68	return self._parse()
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	69	def eval(self, tree):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	70	'recursively evaluate a parse tree using node methods'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	71	if not isinstance(tree, tuple):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	72	return tree
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	73	return self._methods[tree[0]](*[self.eval(t) for t in tree[1:]])
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	74	def __call__(self, message):
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	75	'parse a message into a parse tree and evaluate if methods given'
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	76	t = self.parse(message)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	77	if self._methods:
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	78	return self.eval(t)
77272d28b53f revset: introduce basic parser Matt Mackall <mpm@selenic.com> parents: diff changeset	79	return t

author	Matt Mackall <mpm@selenic.com>
	Tue, 01 Jun 2010 11:18:57 -0500
changeset 11274	77272d28b53f
child 11278	7df88cdf47fd
permissions	-rw-r--r--