Source code for mltk.core.tflite_micro.tflite_micro_model

from __future__ import annotations
from typing import List, Dict, Callable
import re
from dataclasses import dataclass
import collections
import numpy as np
import msgpack


from .tflite_micro_accelerator import TfliteMicroAccelerator
from .tflite_micro_model_details import TfliteMicroModelDetails



[docs]@dataclass
class TfliteMicroLayerError:
    WARNING_RE = re.compile(r'.*Op(\d+)-(\S+)\ not supported: (.*)')
    index:int 
    """The layer's index"""
    name:str
    """The layer's full name"""
    msg:str 
    """The layer's error msg"""

     
    @staticmethod
    def create(msg) -> TfliteMicroLayerError:
        match = TfliteMicroLayerError.WARNING_RE.match(msg)
        if not match:
            return None
        return TfliteMicroLayerError(
            index=int(match.group(1)),
            name=msg.split()[0],
            msg=match.group(3)
        )

    def __str__(self) -> str:
        return f'{self.name}: {self.msg}'


[docs]class TfliteMicroProfiledLayerResult(collections.defaultdict):
    """Result of profiling a specifc model layer"""
[docs]    def __init__(self, result:dict):
        collections.defaultdict.__init__(self, lambda: 0, result)

    @property
    def name(self) -> int:
        """Name of layer"""
        return self['name']
    @property
    def macs(self) -> int:
        """Number of Multiple-Accumulate operations required by this profiler"""
        return self['macs']
    @property
    def ops(self) -> int:
        """Number of operations required by this profiler"""
        return self['ops']
    @property
    def accelerator_cycles(self) -> int:
        """Number of accelerator clock cycles required by this profiler"""
        return self['accelerator_cycles']
    @property
    def time(self) -> float:
        """Time in seconds required by this layer"""
        return self['time']
    @property
    def cpu_cycles(self) -> float:
        """Number of CPU clock cycles required by this layer"""
        return self['cpu_cycles']
    @property
    def energy(self) -> float:
        """Energy in Joules required by this layer
        The energy is relative to the 'baseline' energy (i.e. energy used while the device was idling)"""
        return self['energy']


[docs]class TfliteMicroModel:
    """This class wrappers the TF-Lite Micro interpreter loaded with a .tflite model"""

[docs]    def __init__(
        self,
        tflm_wrapper,
        tflm_accelerator:TfliteMicroAccelerator,
        flatbuffer_data:bytes,
        enable_profiler:bool=False,
        enable_recorder:bool=False,
        enable_tensor_recorder:bool=False,
        force_buffer_overlap:bool=False,
        runtime_buffer_sizes:List[int] = None,
    ):
        # pylint: disable=protected-access
        from .tflite_micro import TfliteMicro

        self._layer_callback:Callable[[int,List[bytes]], bool] = None
        self._layer_errors:List[TfliteMicroLayerError] = []
        self._tflm_accelerator = tflm_accelerator

        if not runtime_buffer_sizes:
            runtime_buffer_sizes = [0]

        TfliteMicro._clear_logged_errors()
        accelerator_wrapper = None if tflm_accelerator is None else tflm_accelerator.accelerator_wrapper
        self._model_wrapper = tflm_wrapper.TfliteMicroModelWrapper()
        if not self._model_wrapper.load(
            flatbuffer_data,
            accelerator_wrapper,
            enable_profiler,
            enable_recorder,
            enable_tensor_recorder,
            force_buffer_overlap,
            runtime_buffer_sizes
        ):
            raise RuntimeError(
                f'Failed to load model, additional info:\n{TfliteMicro._get_logged_errors_str()}'
            )

        layer_msgs = self._model_wrapper.get_layer_msgs()
        for msg in layer_msgs:
            err = TfliteMicroLayerError.create(msg)
            if err:
                self._layer_errors.append(err)

    @property
    def accelerator(self) -> TfliteMicroAccelerator:
        """Reference to hardware accelerator used by model"""
        return self._tflm_accelerator

    @property
    def layer_errors(self) -> List[TfliteMicroLayerError]:
        """List of error messages triggered by kernels while loading the model.
        Typically, these errors indicate that a given model layer is not supported by
        a hardware accelerator and had to fallback to a default kernel implementation.
        """
        return self._layer_errors

    @property
    def details(self) -> TfliteMicroModelDetails:
        """Return details about loaded model"""
        return TfliteMicroModelDetails(self._model_wrapper.get_details())

    @property
    def input_size(self) -> int:
        """Number of input tensors"""
        return self._model_wrapper.get_input_size()


[docs]    def input(self, index = 0, value: np.ndarray=None) -> np.ndarray:
        """Return a reference to a model input tensor's data
        If the value argument is provided then copy the value to the input tensor's buffer
        """
        if index >= self.input_size:
            raise IndexError(f'Input index: {index} >= max size: { self.input_size}')
        input_tensor = self._model_wrapper.get_input(index)
        if value is not None:
            np.copyto(input_tensor, value)

        return input_tensor

    @property
    def output_size(self) -> int:
        """Number of output tensors"""
        return self._model_wrapper.get_output_size()


[docs]    def output(self, index = 0) -> np.ndarray:
        """Return a reference to a model output tensor's data
        """
        if index >= self.output_size:
            raise IndexError(f'Output index: {index} >= max size: { self.output_size}')
        return self._model_wrapper.get_output(index)


[docs]    def invoke(self):
        """Invoke the model to execute one inference"""
        # pylint: disable=protected-access
        from .tflite_micro import TfliteMicro

        TfliteMicro._clear_logged_errors()
        if not self._model_wrapper.invoke():
            raise RuntimeError(f'Failed to invoke model, additional info:\n{TfliteMicro._get_logged_errors_str()}')


    @property
    def is_profiler_enabled(self) -> bool:
        """Return if the profiler is enabled"""
        return self._model_wrapper.is_profiler_enabled()


[docs]    def get_profiling_results(self) -> List[TfliteMicroProfiledLayerResult]:
        """Return the profiling results of each model layer

        Returns:
            A list where each entry contains the profiling results
            of the associated model layer
        """
        retval = []
        results = self._model_wrapper.get_profiling_results()
        for e in results:
            retval.append(TfliteMicroProfiledLayerResult(e))
        return retval



    @property
    def is_recorder_enabled(self) -> bool:
        """Return if the model recorder is enabled """
        return self._model_wrapper.is_recorder_enabled()
    
    @property
    def is_tensor_recorder_enabled(self) -> bool:
        """Return if the tensor recorder is enabled """
        return self._model_wrapper.is_tensor_recorder_enabled()


[docs]    def get_recorded_data(self) -> Dict:
        """Return the recorded contents of the model

        Returns:
            A list where each entry contains the input/output tensors
            of the associated model layer
        """
        results_bin = self._model_wrapper.get_recorded_data()
        if results_bin is None:
            raise RuntimeError('Failed to retrieve recorded model data from Tensorflow-Lite Micro')

        try:
            recorded_data = msgpack.loads(results_bin)
        except Exception as e:
            raise RuntimeError(f'Failed to parse recorded model binary msgpack data, err: {e}')

        retval = dict(
            memory_plan=recorded_data.pop('memory_plan', None),
            layers=[]
        )
        

        init_layers = recorded_data.pop('init', [])
        prepare_layers = recorded_data.pop('prepare', [])
        execute_layers = recorded_data.pop('execute', [])

        def _merge_layers(layers):
            for l in layers:
                index = l.pop('index')
                while len(retval['layers']) <= index:
                    retval['layers'].append({})
                retval['layers'][index].update(l)

        _merge_layers(init_layers)
        _merge_layers(prepare_layers)
        _merge_layers(execute_layers)
        retval.update(recorded_data)

        return retval
    

[docs]    def get_layer_error(self, index:int) -> TfliteMicroLayerError:
        """Return the TfliteMicroLayerError at the given layer index if found else return None"""
        for err in self._layer_errors:
            if err.index == index:
                return err
        return None

    def set_layer_callback(
        self, 
        callback:Callable[[int,List[bytes]], bool]
    ):
        self._layer_callback = callback 
        self._model_wrapper.set_layer_callback(self._layer_callback_handler if callback else None)


    def _layer_callback_handler(self, param:dict) -> bool:
        if not self._layer_callback:
            return 

        layer_index = param.get('index')
        layer_outputs = param.get('outputs')

        return self._layer_callback(
            index=layer_index, 
            outputs=layer_outputs
        )

    def __str__(self) -> str:
        return f'{self.details}'