Évaluation de la qualité des données lors du test à distance d'applications médicales

Les logiciels ont besoin d'une interface conviviale. Pour évaluer si c'est le cas, il existe différentes possibilités. La plupart d'entre elles concernent la facilité d'utilisation des applications de bureau. Le test d'applications mobiles (apps) reste donc largement ignoré. La plupart du temps, l'utilisabilité des applications est testée en laboratoire d'utilisabilité.

Le laboratoire d'utilisabilité présente quelques inconvénients. L'environnement de test est très présent, car la personne testée utilise l'application alors qu'elle se trouve dans une pièce inconnue et qu'elle est observée par le responsable du test. De plus, son comportement complet est enregistré. Seules les tâches prédéfinies sont exécutées par la personne-test et la collecte des personnes-test appropriées est coûteuse [1].

Une alternative, déjà courante pour les sites web dans un contexte non médical, est le test à distance [1, 2]. Pour ce faire, la personne testée visite le site web depuis son propre terminal, effectue des tâches, est éventuellement observée à travers la webcam et reste virtuellement en contact avec le responsable du test. La quantité et la qualité des résultats obtenus en laboratoire d'utilisabilité et lors du test à distance sont comparables (2, 4).

Le test d'utilisabilité à distance pour les apps est actuellement peu courant. Il présente pourtant divers avantages, comme la prolongation de la phase de test [3]. De plus, l'app peut être testée dans des conditions quotidiennes et toutes les caractéristiques de performance peuvent néanmoins être saisies [5].

Les inconvénients, quant à eux, sont la séparation locale des deux parties. Lors de l'utilisation d'un smartphone, l'observation par la caméra frontale pour interpréter les expressions faciales n'a pas beaucoup de sens et la protection des données est plus complexe. Par conséquent, l'eye tracking souvent utilisé n'est pas non plus nécessaire. Il faut donc trouver un moyen de s'assurer que la qualité des données est adéquate. Cette qualité ne concerne pas seulement les données de test, mais aussi les entrées de données après la phase de test, afin d'en vérifier la fiabilité.

Les saisies frénétiques, généralement effectuées dans des situations stressantes, sont souvent porteuses d'erreurs. Une mauvaise utilisabilité, par exemple la recherche d'un bouton, est également source de stress.

Deux mesures physiologiques connues pour être en corrélation avec le stress sont la conductivité cutanée et la fréquence cardiaque [5]. La conductivité de la peau (plus d'humidité / de sueur, augmente la conductivité) est mesurée avec un appareil supplémentaire. Elle n'est donc pas adaptée au test à distance car le scénario du test devient très présent et elle n'est pas adaptée au quotidien.

L'augmentation du pouls et la variabilité du rythme cardiaque sont mesurables sans matériel supplémentaire. L'appareil photo intégré du smartphone peut faire office d'oxymètre de pouls. Certes, en fonction du smartphone, cela est également inconfortable et inhabituel, mais les données saisies peuvent ainsi être mises en contexte.

La durée de la saisie est également utile. Dans le cadre du test à distance, les différents événements (boutons) sont dotés d'un timestamp, ce qui facilite leur saisie [3]. La durée attendue d'une saisie peut ainsi être comparée à la durée réelle de la saisie.

L'accéléromètre intégré mesure l'accélération du smartphone. Il est ainsi possible de déterminer si la saisie a été effectuée au repos ou en mouvement.

Demander à la personne testée son niveau de stress actuel est subjectif et demande des données supplémentaires qui ne sont pas soumises à un contrôle de qualité.

La "méthode Think-aloud" ne convient que rarement pour les tests à distance, car elle n'est pas adaptée à la vie quotidienne [1]. Si elle est néanmoins utilisée, il existe différentes solutions logicielles qui permettent d'évaluer le stress à l'aide de la voix.

A l'aide de différents points de mesure, il est ainsi possible de se prononcer sur la qualité des données. Une augmentation du pouls et de la variabilité du rythme cardiaque, mesurée par la caméra du smartphone, ainsi que les mouvements frénétiques du smartphone, enregistrés par l'accéléromètre, et la comparaison de la durée de saisie avec les valeurs attendues peuvent déterminer un niveau de stress et ainsi mettre les données en contexte.

Cela devrait être automatisé dans la mesure du possible. Vérifier ces entrées en plus du test proprement dit représenterait une charge de travail supplémentaire considérable.

Bibliographie :

[1] Sauer, J, Muenzberg, A, Siewert, L, Hein, &, Roesch, N. (2019). Test à distance de l'utilisabilité dans les applications médicales. 8th EAI International Conference, MobiHealth 2019, Dublin, Ireland, November 14-15, 2019, Proceedings, 3-17. ISSN : 1867-8211.

[2] Brush, B, Ames, M & Davis, J (2004). A Comparison of Remote and Local Usability Studies for an Expert Interface, CHI Vienna, 1179-1182. doi : 10.1145/985921.986018

[3] Sauer, J, Muenzberg, A, Hein, &, Roesch, N. (2019). Simplifier les tests des applications médicales mobiles en utilisant des horodatages pour une évaluation automatisée à distance. 2019 International Conference on Wireless and Mobile Computing, Networking and Communications (WiMob), 203-206. doi : 10.1109/WiMOB.2019.8923241

[4] Thompson, K, Rozanskim E & Haake, A. (2004) Here, There, Anywhere : Les tests d'utilisabilité à distance qui fonctionnent. Actes de la 5e conférence sur l'enseignement des technologies de l'information, SIGITE Salt Lake City, UT, USA, octobre 28-30, 2004, 132-127. doi : 10.1145/1029533.1029567

[5] Tullis, T, Albert ,B. (2008). Mesurer l'expérience utilisateur. Burlington, United States : Elsevier.