Source code for emmental.scorer

"""Emmental scorer."""
import logging
from functools import partial
from typing import Callable, Dict, List, Union

from numpy import ndarray

from emmental.metrics import METRICS
from emmental.utils.utils import array_to_numpy

logger = logging.getLogger(__name__)


[docs]class Scorer(object):
    """A class to score tasks.

    Args:
      metrics: A list of metric names which provides
        in emmental (e.g., accuracy), defaults to [].
      customize_metric_funcs: a dict of customize metric where key is the metric
        name and value is the metric function which takes golds, preds, probs, uids as
        input, defaults to {}.
    """

    def __init__(
        self, metrics: List[str] = [], customize_metric_funcs: Dict[str, Callable] = {}
    ) -> None:
        """Initialize Scorer."""
        self.metrics: Dict[str, Callable] = dict()
        for metric in metrics:
            if metric in METRICS:
                self.metrics[metric] = METRICS[metric]  # type: ignore
            elif metric.startswith("accuracy@"):
                self.metrics[metric] = partial(
                    METRICS["accuracy"], topk=int(metric.split("@")[1])  # type: ignore
                )
            else:
                raise ValueError(f"Unrecognized metric: {metric}")

        self.metrics.update(customize_metric_funcs)

[docs]    def score(
        self,
        golds: Union[ndarray, List[ndarray]],
        preds: Union[ndarray, List[ndarray]],
        probs: Union[ndarray, List[ndarray]],
        uids: List[str] = None,
    ) -> Dict[str, float]:
        """Calculate the score.

        Args:
          golds: Ground truth values.
          probs: Predicted probabilities.
          preds: Predicted values.
          uids: Unique ids, defaults to None.

        Returns:
          Score dict.
        """
        metric_dict = dict()

        for metric_name, metric in self.metrics.items():
            # handle no examples
            if len(golds) == 0:
                metric_dict[metric_name] = float("nan")
                continue
            try:
                golds = array_to_numpy(golds)
            except ValueError:
                pass
            try:
                probs = array_to_numpy(probs) if probs is not None else probs
            except ValueError:
                pass
            try:
                preds = array_to_numpy(preds) if preds is not None else preds
            except ValueError:
                pass
            res = metric(golds, preds, probs, uids)

            if isinstance(res, dict):
                metric_dict.update(res)
            else:
                metric_dict[metric_name] = res

        return metric_dict