MetrikaBox: An open framework for experimenting with audio classification

Resumen

Este artículo presenta MetrikaBox, un paquete de clasificación de audio de propósito general, de código abierto y extensible, diseñado para facilitar el desarrollo de modelos de deep learning (DL) aplicados a una amplia gama de tareas de procesamiento de audio. El software gestiona todas las etapas de preprocesamiento necesarias para construir modelos de clasificación capaces de distinguir entre clases definidas por el usuario mediante técnicas avanzadas de inteligencia artificial (IA). MetrikaBox resulta especialmente adecuado para tareas como la clasificación de géneros musicales, la discriminación voz-música y otras aplicaciones de clasificación o segmentación de audio. Los usuarios pueden emplear el paquete tal y como se proporciona o bien ampliarlo mediante la integración de sus propios conjuntos de datos, modelos de clasificación, sistemas de carga de datos, técnicas de aumentación de datos (data augmentation), entre otros. El paquete ha sido evaluado tanto en entornos comerciales como académicos, donde ha permitido generar modelos para el procesamiento industrial de audio y ha servido como plataforma para creación de pruebas de concepto. La documentación completa y los ejemplos prácticos incluidos en el repositorio proporcionan apoyo a los usuarios en la integración del sistema en sus proyectos de análisis de audio. MetrikaBox está disponible de forma abierta y cuenta con una interfaz de usuario que facilita su evaluación y experimentación.

Publicación
SoftwareX
Jorge Perianez-Pascual
Jorge Perianez-Pascual
Investigador

Ingeniero de software e investigador en i3lab. Co-fundador de MetrikaMedia.

Juan D. Gutiérrez
Juan D. Gutiérrez
Profesor Ayudante Doctor

Profesor Ayudante Doctor en la Universidade de Santiago de Compostela. Me gusta la informática pero, sobre todo, aprender cosas nuevas.

Fernando Sánchez-Figueroa
Fernando Sánchez-Figueroa
Profesor titular

Mi investigación se centra en la ingeniería web, la visualización de grandes datos y el MDD.

Roberto Rodriguez-Echeverria
Roberto Rodriguez-Echeverria
Profesor titular

Profesor titular en la Universidad de Extremadura. Software passionate, Deep learner, MTB rider and father of 2.