R�sum�
Ce projet vise � recueillir 10 000 phonations prolong�es (les sons �aaah�) � travers des lignes audio num�riques de la qualit� du t�l�phone, sous des conditions de vie r�elle et non de laboratoire, pour tester l�hypoth�se selon laquelle il est possible de d�celer la maladie de Parkinson gr�ce � ces enregistrements. Ceci s�appuie sur plusieurs �tudes r�centes dans lesquelles nous avons montr� que le d�pistage est possible avec des enregistrements audio num�riques de phonations prolong�es faites en laboratoire [1,3-8], et que ces r�sultats ne sont pas s�v�rement d�grad�s quand l�audio passe � travers une compression audio similaire � un t�l�phone mobile � bande passante �troite avec distorsion des canaux [2]. En outre, nous pouvons pr�dire avec pr�cision la s�v�rit� des sympt�mes de la maladie de Parkinson selon une �chelle clinique (l�UPDRS) [3].
M�thode
Pour d�pister la maladie de Parkinson d�apr�s la voix, nous s�lectionnons un grand nombre de traits de dysphonie (132 dans les �tudes r�centes [1-2] � partir des signaux num�riques audio de phonations prolong�es (le son �aaah�). Ces traits couvrent un grand nombre d�analyses algorithmiques de dysphonie clinique, de type classique ou nouveau (voir [3] pour une liste compl�te). Nous appliquons ensuite plusieurs algorithmes qui s�lectionnent les traits (Lasso, mRMR, RELIEF, LLBFS [1]), et nous passons les traits s�lectionn�s sur le classificateur algorithme standard (for�ts al�atoires et machines � vecteurs de support). Quand nous pr�disons la s�v�rit� de sympt�mes, nous utilisons les for�ts al�atoires et les machines � vecteurs de support en mode r�gression [2,3] puisque l��chelle UPDRS est un nombre entier. Pour redresser le sur-apprentissage nous utilisons la validation crois�e, � la fois les sch�mas �exclure les �chantillons audio� et �exclure les sujets� de fa�on � estimer la performance r�elle de g�n�ralisation pour les cas inconnus [1-3].
Les donn�es
Les �tudes se basent sur deux principaux ensemble de donn�es audio: les phonations prolong�es des malades de Parkinson enregistr�es chez eux, chaque semaine, sur une p�riode de 6 mois chacun (50 personnes, 5875 �chantillons audio [3], et les enregistrements en laboratoire de personnes en bonne sant� et avec la maladie de Parkinson (43 personnes, 263 �chantillons audio [1,2]). D�autres ensembles de donn�es ont �t� utilis�s dans des �tudes pr�c�dentes o� de nouveaux traits de dysphonie se sont d�velopp�s [4-8].
R�sultats
Pour le d�pistage de la maladie, la pr�cision maximum est de 98.6% (c�est-�-dire le pourcentage des �chantillons qui ont �t� correctement identifi�s comme �tant ou en bonne sant� ou atteint de la maladie de Parkinson, en moyenne sur toutes les validations crois�es) sous conditions de laboratoire [1]. Pour la s�v�rit� des sympt�mes, l�erreur de pr�diction moyenne est de 3,5 points sur l��chelle d��valuation � 176 points de la maladie de Parkinson (approximativement 2% veut dire une erreur de validation crois�e absolue) sous des conditions imitant le t�l�phone mobile. [2]. En outre, la performance de d�pistage semble se niveler autour de 10 signes de dysphonie, qui comprennent les signes mesurant l�oscillation irr�guli�re de la corde vocale, le souffle voil� et le bruit, ainsi que les fluctuations de r�sonance de l�appareil vocal [1].
Discussion
Ces r�sultats sont encourageants mais ils ne r�pondent pas au grand potentiel de confusion qui peut se produire quand les enregistrements de voix se font en dehors des conditions de laboratoire: des facteurs tels que le bruit environnemental et le comportement inattendu de la personne qui appelle, ne peuvent pas �tre contr�l�s. C�est la possibilit� pour ces �l�ments de confusion de bouleverser les r�sultats qui a motiv� cette �tude.
R�f�rences
[1] [PDF] A. Tsanas, M.A. Little, P.E. McSharry, J. Spielman, L.O. Ramig (2012)
Novel speech signal processing algorithms for high-accuracy classification of Parkinson�s disease
IEEE Transactions on Biomedical Engineering, 59(5):1264-1271
[2] [PDF] A. Tsanas, M.A. Little, P.E. McSharry, L.O. Ramig (2012)
Using the cellular mobile telephone network to remotely monitor Parkinson's disease symptom severity
IEEE Transactions on Biomedical Engineering (submitted)
[3] [PDF] A. Tsanas, M.A. Little, P.E. McSharry, L.O. Ramig (2010)
Nonlinear speech analysis algorithms mapped to a standard metric achieve clinically useful quantification of average Parkinson�s disease symptom severity
Journal of the Royal Society Interface, 8(59):842-855
[4] [PDF] A. Tsanas, M.A. Little, Patrick E. McSharry, Lorraine O. Ramig (2009)
Accurate telemonitoring of Parkinson�s disease progression by non-invasive speech tests
IEEE Transactions on Biomedical Engineering, 57(4):884-893
[5] [PDF] [HTML] M.A. Little, Patrick E. McSharry, Eric J. Hunter, Jennifer Spielman, Lorraine O. Ramig (2009)
Suitability of dysphonia measurements for telemonitoring of Parkinson�s disease
IEEE Transactions on Biomedical Engineering, 56(4):1015-1022
[6] [PDF] M.A. Little (2007)
Biomechanically informed nonlinear speech signal processing
D.Phil., Oxford University, Oxford, UK
[7] [PDF] M.A. Little, P.E. McSharry, S.J. Roberts, D.A.E. Costello, I.M. Moroz (2007)
Exploiting nonlinear recurrence and fractal scaling properties for voice disorder detection
BioMedical Engineering OnLine 2007, 6:23.
[8] [PDF] M. Little, P. McSharry, I. Moroz, S. Roberts (2006)
Nonlinear, biophysically-informed speech pathology detection
in 2006 IEEE International Conference on Acoustics, Speech and Signal Processing, 2006. ICASSP 2006 Proceedings.: Toulouse, France. pp. II-1080-II-1083.