MetrikaBox: An open framework for experimenting with audio classification

Jorge Perianez-Pascual, Juan D. Gutiérrez, Emilio Delgado, Fernando Sánchez-Figueroa, Roberto Rodriguez-Echeverria

agosto 2025

Resumen

Este artículo presenta MetrikaBox, un paquete de clasificación de audio de propósito general, de código abierto y extensible, diseñado para facilitar el desarrollo de modelos de deep learning (DL) aplicados a una amplia gama de tareas de procesamiento de audio. El software gestiona todas las etapas de preprocesamiento necesarias para construir modelos de clasificación capaces de distinguir entre clases definidas por el usuario mediante técnicas avanzadas de inteligencia artificial (IA). MetrikaBox resulta especialmente adecuado para tareas como la clasificación de géneros musicales, la discriminación voz-música y otras aplicaciones de clasificación o segmentación de audio. Los usuarios pueden emplear el paquete tal y como se proporciona o bien ampliarlo mediante la integración de sus propios conjuntos de datos, modelos de clasificación, sistemas de carga de datos, técnicas de aumentación de datos (data augmentation), entre otros. El paquete ha sido evaluado tanto en entornos comerciales como académicos, donde ha permitido generar modelos para el procesamiento industrial de audio y ha servido como plataforma para creación de pruebas de concepto. La documentación completa y los ejemplos prácticos incluidos en el repositorio proporcionan apoyo a los usuarios en la integración del sistema en sus proyectos de análisis de audio. MetrikaBox está disponible de forma abierta y cuenta con una interfaz de usuario que facilita su evaluación y experimentación.

Tipo

Artículo de revista

Publicación

SoftwareX