Parkinson's Voice Initiative

Résumé

Ce projet vise à recueillir 10 000 phonations prolongées (les sons ‘aaah’) à travers des lignes audio numériques de la qualité du téléphone, sous des conditions de vie réelle et non de laboratoire, pour tester l’hypothèse selon laquelle il est possible de déceler la maladie de Parkinson grâce à ces enregistrements. Ceci s’appuie sur plusieurs études récentes dans lesquelles nous avons montré que le dépistage est possible avec des enregistrements audio numériques de phonations prolongées faites en laboratoire [1,3-8], et que ces résultats ne sont pas sévèrement dégradés quand l’audio passe à travers une compression audio similaire à un téléphone mobile à bande passante étroite avec distorsion des canaux [2]. En outre, nous pouvons prédire avec précision la sévérité des symptômes de la maladie de Parkinson selon une échelle clinique (l’UPDRS) [3].

Méthode

Pour dépister la maladie de Parkinson d’après la voix, nous sélectionnons un grand nombre de traits de dysphonie (132 dans les études récentes [1-2] à partir des signaux numériques audio de phonations prolongées (le son ‘aaah’). Ces traits couvrent un grand nombre d’analyses algorithmiques de dysphonie clinique, de type classique ou nouveau (voir [3] pour une liste complète). Nous appliquons ensuite plusieurs algorithmes qui sélectionnent les traits (Lasso, mRMR, RELIEF, LLBFS [1]), et nous passons les traits sélectionnés sur le classificateur algorithme standard (forêts aléatoires et machines à vecteurs de support). Quand nous prédisons la sévérité de symptômes, nous utilisons les forêts aléatoires et les machines à vecteurs de support en mode régression [2,3] puisque l’échelle UPDRS est un nombre entier. Pour redresser le sur-apprentissage nous utilisons la validation croisée, à la fois les schémas ‘exclure les échantillons audio’ et ‘exclure les sujets’ de façon à estimer la performance réelle de généralisation pour les cas inconnus [1-3].

Les données

Les études se basent sur deux principaux ensemble de données audio: les phonations prolongées des malades de Parkinson enregistrées chez eux, chaque semaine, sur une période de 6 mois chacun (50 personnes, 5875 échantillons audio [3], et les enregistrements en laboratoire de personnes en bonne santé et avec la maladie de Parkinson (43 personnes, 263 échantillons audio [1,2]). D’autres ensembles de données ont été utilisés dans des études précédentes où de nouveaux traits de dysphonie se sont développés [4-8].

Résultats

Pour le dépistage de la maladie, la précision maximum est de 98.6% (c’est-à-dire le pourcentage des échantillons qui ont été correctement identifiés comme étant ou en bonne santé ou atteint de la maladie de Parkinson, en moyenne sur toutes les validations croisées) sous conditions de laboratoire [1]. Pour la sévérité des symptômes, l’erreur de prédiction moyenne est de 3,5 points sur l’échelle d’évaluation à 176 points de la maladie de Parkinson (approximativement 2% veut dire une erreur de validation croisée absolue) sous des conditions imitant le téléphone mobile. [2]. En outre, la performance de dépistage semble se niveler autour de 10 signes de dysphonie, qui comprennent les signes mesurant l’oscillation irrégulière de la corde vocale, le souffle voilé et le bruit, ainsi que les fluctuations de résonance de l’appareil vocal [1].

Discussion

Ces résultats sont encourageants mais ils ne répondent pas au grand potentiel de confusion qui peut se produire quand les enregistrements de voix se font en dehors des conditions de laboratoire: des facteurs tels que le bruit environnemental et le comportement inattendu de la personne qui appelle, ne peuvent pas être contrôlés. C’est la possibilité pour ces éléments de confusion de bouleverser les résultats qui a motivé cette étude.

Références

[1] [PDF] A. Tsanas, M.A. Little, P.E. McSharry, J. Spielman, L.O. Ramig (2012)
Novel speech signal processing algorithms for high-accuracy classification of Parkinson’s disease
IEEE Transactions on Biomedical Engineering, 59(5):1264-1271

[2] [PDF] A. Tsanas, M.A. Little, P.E. McSharry, L.O. Ramig (2012)
Using the cellular mobile telephone network to remotely monitor Parkinson's disease symptom severity
IEEE Transactions on Biomedical Engineering (submitted)

[3] [PDF] A. Tsanas, M.A. Little, P.E. McSharry, L.O. Ramig (2010)
Nonlinear speech analysis algorithms mapped to a standard metric achieve clinically useful quantification of average Parkinson’s disease symptom severity
Journal of the Royal Society Interface, 8(59):842-855

[4] [PDF] A. Tsanas, M.A. Little, Patrick E. McSharry, Lorraine O. Ramig (2009)
Accurate telemonitoring of Parkinson’s disease progression by non-invasive speech tests
IEEE Transactions on Biomedical Engineering, 57(4):884-893

[5] [PDF] [HTML] M.A. Little, Patrick E. McSharry, Eric J. Hunter, Jennifer Spielman, Lorraine O. Ramig (2009)
Suitability of dysphonia measurements for telemonitoring of Parkinson’s disease
IEEE Transactions on Biomedical Engineering, 56(4):1015-1022

[6] [PDF] M.A. Little (2007)
Biomechanically informed nonlinear speech signal processing
D.Phil., Oxford University, Oxford, UK

[7] [PDF] M.A. Little, P.E. McSharry, S.J. Roberts, D.A.E. Costello, I.M. Moroz (2007)
Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection
BioMedical Engineering OnLine 2007, 6:23.

[8] [PDF] M. Little, P. McSharry, I. Moroz, S. Roberts (2006)
Nonlinear, biophysically-informed speech pathology detection
in 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, 2006. ICASSP 2006 Proceedings.: Toulouse, France. pp. II-1080-II-1083.