1 files changed, 0 insertions, 451 deletions
diff --git a/xml2txt.py b/xml2txt.py
deleted file mode 100755
index e0c5efde..00000000
--- a/xml2txt.py
+++ /dev/null
@@ -1,451 +0,0 @@
-#!/usr/bin/env python
-##########################################################################
-#
-# Copyright 2008-2009 VMware, Inc.
-# All Rights Reserved.
-#
-# Permission is hereby granted, free of charge, to any person obtaining a copy
-# of this software and associated documentation files (the "Software"), to deal
-# in the Software without restriction, including without limitation the rights
-# to use, copy, modify, merge, publish, distribute, sublicense, and/or sell
-# copies of the Software, and to permit persons to whom the Software is
-# furnished to do so, subject to the following conditions:
-#
-# The above copyright notice and this permission notice shall be included in
-# all copies or substantial portions of the Software.
-#
-# THE SOFTWARE IS PROVIDED "AS IS", WITHOUT WARRANTY OF ANY KIND, EXPRESS OR
-# IMPLIED, INCLUDING BUT NOT LIMITED TO THE WARRANTIES OF MERCHANTABILITY,
-# FITNESS FOR A PARTICULAR PURPOSE AND NONINFRINGEMENT. IN NO EVENT SHALL THE
-# AUTHORS OR COPYRIGHT HOLDERS BE LIABLE FOR ANY CLAIM, DAMAGES OR OTHER
-# LIABILITY, WHETHER IN AN ACTION OF CONTRACT, TORT OR OTHERWISE, ARISING FROM,
-# OUT OF OR IN CONNECTION WITH THE SOFTWARE OR THE USE OR OTHER DEALINGS IN
-# THE SOFTWARE.
-#
-##########################################################################/
-
-
-import sys
-import optparse
-import xml.parsers.expat
-import gzip
-
-from model import *
-
-
-ELEMENT_START, ELEMENT_END, CHARACTER_DATA, EOF = range(4)
-
-
-class XmlToken:
-
-    def __init__(self, type, name_or_data, attrs = None, line = None, column = None):
-        assert type in (ELEMENT_START, ELEMENT_END, CHARACTER_DATA, EOF)
-        self.type = type
-        self.name_or_data = name_or_data
-        self.attrs = attrs
-        self.line = line
-        self.column = column
-
-    def __str__(self):
-        if self.type == ELEMENT_START:
-            return '<' + self.name_or_data + ' ...>'
-        if self.type == ELEMENT_END:
-            return '</' + self.name_or_data + '>'
-        if self.type == CHARACTER_DATA:
-            return self.name_or_data
-        if self.type == EOF:
-            return 'end of file'
-        assert 0
-
-
-class XmlTokenizer:
-    """Expat based XML tokenizer."""
-
-    def __init__(self, fp, skip_ws = True):
-        self.fp = fp
-        self.tokens = []
-        self.index = 0
-        self.final = False
-        self.skip_ws = skip_ws
-        
-        self.character_pos = 0, 0
-        self.character_data = ''
-        
-        self.parser = xml.parsers.expat.ParserCreate()
-        self.parser.StartElementHandler  = self.handle_element_start
-        self.parser.EndElementHandler    = self.handle_element_end
-        self.parser.CharacterDataHandler = self.handle_character_data
-    
-    def handle_element_start(self, name, attributes):
-        self.finish_character_data()
-        line, column = self.pos()
-        token = XmlToken(ELEMENT_START, name, attributes, line, column)
-        self.tokens.append(token)
-    
-    def handle_element_end(self, name):
-        self.finish_character_data()
-        line, column = self.pos()
-        token = XmlToken(ELEMENT_END, name, None, line, column)
-        self.tokens.append(token)
-
-    def handle_character_data(self, data):
-        if not self.character_data:
-            self.character_pos = self.pos()
-        self.character_data += data
-    
-    def finish_character_data(self):
-        if self.character_data:
-            if not self.skip_ws or not self.character_data.isspace(): 
-                line, column = self.character_pos
-                token = XmlToken(CHARACTER_DATA, self.character_data, None, line, column)
-                self.tokens.append(token)
-            self.character_data = ''
-    
-    def next(self):
-        size = 16*1024
-        while self.index >= len(self.tokens) and not self.final:
-            self.tokens = []
-            self.index = 0
-            data = self.fp.read(size)
-            self.final = len(data) < size
-            data = data.rstrip('\0')
-            try:
-                self.parser.Parse(data, self.final)
-            except xml.parsers.expat.ExpatError, e:
-                #if e.code == xml.parsers.expat.errors.XML_ERROR_NO_ELEMENTS:
-                if e.code == 3:
-                    pass
-                else:
-                    raise e
-        if self.index >= len(self.tokens):
-            line, column = self.pos()
-            token = XmlToken(EOF, None, None, line, column)
-        else:
-            token = self.tokens[self.index]
-            self.index += 1
-        return token
-
-    def pos(self):
-        return self.parser.CurrentLineNumber, self.parser.CurrentColumnNumber
-
-
-class TokenMismatch(Exception):
-
-    def __init__(self, expected, found):
-        self.expected = expected
-        self.found = found
-
-    def __str__(self):
-        return '%u:%u: %s expected, %s found' % (self.found.line, self.found.column, str(self.expected), str(self.found))
-
-
-
-class XmlParser:
-    """Base XML document parser."""
-
-    def __init__(self, fp):
-        self.tokenizer = XmlTokenizer(fp)
-        self.consume()
-    
-    def consume(self):
-        self.token = self.tokenizer.next()
-
-    def match_element_start(self, name):
-        return self.token.type == ELEMENT_START and self.token.name_or_data == name
-    
-    def match_element_end(self, name):
-        return self.token.type == ELEMENT_END and self.token.name_or_data == name
-
-    def element_start(self, name):
-        while self.token.type == CHARACTER_DATA:
-            self.consume()
-        if self.token.type != ELEMENT_START:
-            raise TokenMismatch(XmlToken(ELEMENT_START, name), self.token)
-        if self.token.name_or_data != name:
-            raise TokenMismatch(XmlToken(ELEMENT_START, name), self.token)
-        attrs = self.token.attrs
-        self.consume()
-        return attrs
-    
-    def element_end(self, name):
-        while self.token.type == CHARACTER_DATA:
-            self.consume()
-        if self.token.type != ELEMENT_END:
-            raise TokenMismatch(XmlToken(ELEMENT_END, name), self.token)
-        if self.token.name_or_data != name:
-            raise TokenMismatch(XmlToken(ELEMENT_END, name), self.token)
-        self.consume()
-
-    def character_data(self, strip = True):
-        data = ''
-        while self.token.type == CHARACTER_DATA:
-            data += self.token.name_or_data
-            self.consume()
-        if strip:
-            data = data.strip()
-        return data
-
-
-class GzipFile(gzip.GzipFile):
-
-    def _read_eof(self):
-        # Ignore incomplete files
-        try:
-            gzip.GzipFile._read_eof(self)
-        except IOError:
-            pass
-
-
-class TraceParser(XmlParser):
-
-    def __init__(self, stream):
-        XmlParser.__init__(self, stream)
-        self.call_no = 0
-
-    def parse(self):
-        self.element_start('trace')
-        while self.token.type not in (ELEMENT_END, EOF):
-            self.parse_call()
-        if self.token.type != EOF:
-            self.element_end('trace')
-
-    def parse_call(self):
-        attrs = self.element_start('call')
-        name = attrs['name']
-        args = []
-        ret = None
-        properties = {}
-        while self.token.type == ELEMENT_START:
-            if self.token.name_or_data == 'arg':
-                arg = self.parse_arg()
-                args.append(arg)
-            elif self.token.name_or_data == 'ret':
-                ret = self.parse_ret()
-            elif self.token.name_or_data in ('duration', 'starttsc', 'endtsc'):
-                property = self.token.name_or_data
-                properties[property] = self.parse_hex(self.token.name_or_data)
-            elif self.token.name_or_data == 'call':
-                # ignore nested function calls
-                self.parse_call()
-            else:
-                raise TokenMismatch("<arg ...> or <ret ...>", self.token)
-        self.element_end('call')
-        
-        self.call_no += 1
-
-        call = Call(self.call_no, name, args, ret, properties)
-
-        self.handle_call(call)
-
-    def parse_arg(self):
-        attrs = self.element_start('arg')
-        name = attrs['name']
-        value = self.parse_value()
-        self.element_end('arg')
-
-        return name, value
-
-    def parse_ret(self):
-        attrs = self.element_start('ret')
-        value = self.parse_value()
-        self.element_end('ret')
-
-        return value
-
-    def parse_hex(self, token_name):
-        attrs = self.element_start(token_name)
-        value = int(self.character_data(), 16)
-        self.element_end(token_name)
-        return value
-
-    def parse_value(self):
-        if self.token.type == ELEMENT_START:
-            if self.token.name_or_data == 'int':
-                return self.parse_int()
-            if self.token.name_or_data == 'uint':
-                return self.parse_uint()
-            if self.token.name_or_data == 'float':
-                return self.parse_float()
-            if self.token.name_or_data == 'string':
-                return self.parse_string()
-            if self.token.name_or_data == 'wstring':
-                return self.parse_wstring()
-            if self.token.name_or_data == 'const':
-                return self.parse_const()
-            if self.token.name_or_data == 'bitmask':
-                return self.parse_bitmask()
-            if self.token.name_or_data == 'ref':
-                return self.parse_ref()
-        raise TokenMismatch("<elem ...>, <ref ...>, or text", self.token)
-
-    def parse_elems(self):
-        elems = [self.parse_elem()]
-        while self.token.type != ELEMENT_END:
-            elems.append(self.parse_elem())
-        return Struct("", elems)
-
-    def parse_elem(self):
-        attrs = self.element_start('elem')
-        value = self.parse_value()
-        self.element_end('elem')
-
-        try:
-            name = attrs['name']
-        except KeyError:
-            name = ""
-
-        return name, value
-
-    def parse_ref(self):
-        attrs = self.element_start('ref')
-        if self.token.type != ELEMENT_END:
-            value = self.parse_value()
-        else:
-            value = None
-        self.element_end('ref')
-
-        return Pointer(attrs['addr'], value)
-
-    def parse_bitmask(self):
-        self.element_start('bitmask')
-        elems = []
-        while self.token.type != ELEMENT_END:
-            elems.append(self.parse_value())
-        self.element_end('bitmask')
-        return Bitmask(elems)
-
-    def parse_int(self):
-        self.element_start('int')
-        value = self.character_data()
-        self.element_end('int')
-        return Literal(int(value))
-
-    def parse_uint(self):
-        self.element_start('uint')
-        value = self.character_data()
-        self.element_end('uint')
-        return Literal(int(value))
-
-    def parse_float(self):
-        self.element_start('float')
-        value = self.character_data()
-        self.element_end('float')
-        return Literal(float(value))
-
-    def parse_string(self):
-        self.element_start('string')
-        value = self.character_data()
-        self.element_end('string')
-        return Literal(value)
-
-    def parse_wstring(self):
-        self.element_start('wstring')
-        value = self.character_data()
-        self.element_end('wstring')
-        return Literal(value)
-
-    def parse_const(self):
-        self.element_start('const')
-        value = self.character_data()
-        self.element_end('const')
-        return NamedConstant(value)
-
-    def handle_call(self, call):
-        pass
-
-
-class DumpTraceParser(TraceParser):
-
-    def __init__(self, stream, formatter):
-        XmlParser.__init__(self, stream)
-        self.formatter = formatter
-        self.pretty_printer = PrettyPrinter(self.formatter)
-        self.call_no = 0
-
-    def handle_call(self, call):
-        call.visit(self.pretty_printer)
-        self.formatter.newline()
-
-
-class StatsTraceParser(TraceParser):
-
-    def __init__(self, stream, formatter):
-        TraceParser.__init__(self, stream, formatter)
-        self.stats = {}
-
-    def parse(self):
-        TraceParser.parse(self)
-
-        sys.stdout.write('%s\t%s\t%s\n' % ("name", "calls", "duration"))
-        for name, (calls, duration) in self.stats.iteritems():
-            sys.stdout.write('%s\t%u\t%f\n' % (name, calls, duration/1000000.0))
-
-    def handle_call(self, name, args, ret, duration):
-        try:
-            nr_calls, total_duration = self.stats[name]
-        except KeyError:
-            nr_calls = 1
-            total_duration = duration
-        else:
-            nr_calls += 1
-            if duration is not None:
-                total_duration += duration
-        self.stats[name] = nr_calls, total_duration
-
-
-class Main:
-
-    def __init__(self):
-        pass
-
-    def main(self):
-        optparser = self.get_optparser()
-        (options, args) = optparser.parse_args(sys.argv[1:])
-    
-        if args:
-            for arg in args:
-                if arg.endswith('.gz'):
-                    from gzip import GzipFile
-                    stream = GzipFile(arg, 'rb')
-                elif arg.endswith('.bz2'):
-                    from bz2 import BZ2File
-                    stream = BZ2File(arg, 'rU')
-                else:
-                    stream = open(arg, 'rt')
-                self.process_arg(stream, options)
-        else:
-            self.process_arg(stream, options)
-
-    def get_optparser(self):
-        optparser = optparse.OptionParser(
-            usage="\n\t%prog [options] [traces] ...")
-        optparser.add_option(
-            '-s', '--stats',
-            action="store_true",
-            dest="stats", default=False,
-            help="generate statistics instead")
-        optparser.add_option(
-            '--color', '--colour',
-            type="choice", choices=('never', 'always', 'auto'), metavar='WHEN',
-            dest="color", default="always",
-            help="coloring: never, always, or auto [default: %default]")
-        return optparser
-
-    def process_arg(self, stream, options):
-        if options.color == 'always' or options.color == 'auto' and sys.stdout.isatty():
-            formatter = format.DefaultFormatter(sys.stdout)
-        else:
-            formatter = format.Formatter(sys.stdout)
-        
-        if options.stats:
-            factory = StatsTraceParser
-        else:
-            factory = DumpTraceParser
-
-        parser = DumpTraceParser(stream, formatter)
-        parser.parse()
-
-
-if __name__ == '__main__':
-    Main().main()
-