Uno de los artículos que ha caído en mis manos últimamente propone el uso de medidas de la Recuperación de Información (Information Retrieval) para consignar el rendimiento del reconocedor de voz. En otras palabras, en vez de usar el famoso WER, usar los índices de Recall, Precision y la integración de ambas, llamada F’. En el artículo se desgranan las limitaciones del WER (en cuanto a su coste y los datos que se desprenden) y la adecuación de estas otras medidas. Yo lo he probado para testear el rendimiento de un modelo SLM (Stochastic Language Model) implementado con grxml (contrastando transcripciones frente al reconocimiento real) y me ha parecido de una sencillez y de una riqueza patente. Os dejo el enlace a continuación:
On the Use of Information Retrieval Measures for Speech Recognition Evaluation




Información Bitacoras.com…
Valora en Bitacoras.com: Uno de los artículos que ha caído en mis manos últimamente propone el uso de medidas de la Recuperación del Información (Information Retrieval) para consignar el rendimiento del reconocedor de voz. En otras palabras, ……
Fantastico aporte, buen estilo. Me has ayudado mucho. Gracias