はじめに

臨床試験は、製薬会社に薬物作用や効能に関する情報を提供し、新薬の安全性を立証するために不可欠です。しかし、費用と時間がかかることで有名で、失敗すれば大きな商業的打撃をうけます。収集した治験データが有効で信頼性があり、治験目的達成に有用であることが最も重要です。その結果、医療業界はデジタル技術の力を使ったプロセス向上(スマートフォンのアプリを使った参加者の治験データ収集)を図っています。

Clinical trials: how technology is driving digitisation

アプリを使って測定することが特に難しい変数は、治験参加者が自己報告するストレスレベルです。ストレスレベルは、昔から治験でよく測定されてきました。治験参加者が臨床医と治験中に面談を行い、ある期間に受けたストレスレベルに関する様々な質問に答えます。これらの測定は毎日、毎週、またはより頻度を空けて行われ、臨床医は知覚化されたストレス尺度(Perceived Stress Scale: PSS)[1]など標準化され広く使われている測定尺度を使います。アプリを使った自己報告データの遠隔収集には多くの利点があります。患者は過去のストレスレベルについて自身の記憶に頼る必要なく、より正確で、正直で、最新のデータを提供することができます。また臨床医はより多くのデータポイントを入手することができ、データ収集が早く安くなり、精神衛生上の問題が発生する前にデータを収集することが可能になります。

広範なプロジェクトの一環として、弊社は臨床試験などで使うストレス測定自己報告アプリ(Verum Trial App)を開発しました。このアプリは数多くの設計課題を抱えているため、開発の全ての段階において十分な検討が必要です。紙に書かれた既存の測定尺度の質問を単にアプリに変換するという単純なものではなく、ニールセンのユーザビリティに関するヒューリスティクス[2]やW3Cのウェブデザイン・アプリケーション標準仕様[3]のような既存のUXデザイン標準を忠実に守るという単純なものでもありません。弊社がVerum Trial App開発中に直面したユニークな課題についてこれから書いていきます。

質疑応答形式

Verum Trail Appで使用する質疑応答形式は、慎重に設計する必要がありました。既存の測定方法で使っている質問を、言葉を変えず単にアプリに移行することは可能ですが、質問の形式や応答方法は変える必要があります。例えば、「先月どのぐらいの頻度で予期せず起きたことに動揺しましたか」という質問があり、5段階評価で応答するとします。しかし、それぞれの評価の意味を横書きで説明するスペースは典型的なスマートフォンの画面にはありません。代わりに横向きのスライダースタイルの応答オプションを使い、スライダーがスケールの適切な位置にある時のみ応答の意味(「ほとんどない」など)が表示されるようにすることができます。これにより画面に表示する情報量は少なくて済みますが、ユーザーがスライダーを動かすためには、スライダーはスケールのどこかでスタートする必要があり、参加者がその位置を「正しい」応答と推測して、応答に偏りが生じる可能性があります。そのためスケールは縦書きにするのがベストですが、ここでも参加者がこの縦の並びを選択肢の優先順位であると解釈すれば偏りが生じます[4]。質疑応答に必ずしも「正しい」形式があるわけではありません。図1に両者がどのようにVerum Trial Appに使われたかを示します。質疑応答形式は十分検討する必要があることがアプリの開発を通して分かりました。

図1:縦書きと横書きの応答形式の例

情報量とその複雑さ

参加者がアプリを使って遠隔からデータ提供する場合、治験側が追加情報や説明を提供する機会が少なくなります(臨床医が面直で話をする場合と比較して)。そのため、フォントは十分な大きさやコントラストであり、デバイスの画面サイズ等に合ったフォーマットである必要があり、質問は誤解のないようシンプルな言葉で、ユーザーグループに適した読解レベルにする必要があります。文章が適切な読解レベルかどうかを見極める方法はいくつかありますが(Flesch-Kincaid Readibility Testなど)、間接的に複雑さを回避するという方法もあります。例えば、ある質問を前向きな表現、別の質問を後ろ向き表現することによって、参加者は全部の質問に同じように回答するのではなく慎重に考えて回答するようになります。しかしこれは複雑さを招き、誤解や間違いを生む可能性があります。結果、参加者が質問に回答しない、または知らずに間違った回答をしてデータの妥当性が損なわれるということもあります。

情報アクセス

紙ベースの測定尺度を参加者に見せる場合、一枚の紙に全ての情報を載せることができます。スマートフォンインターフェースの小ささを考えると、情報は分割する必要があり、画面間のナビゲーションや必要な時に必要な画面にアクセスすることが難しくなります。参加者が必要とする情報は、簡単に見ることができなければいけませんが、それと同時に参加者が情報過多にならないようにする必要もあります。画面サイズやタッチスクリーンであることを考えるとポップアップは一般的にアプリには適しません。私たちは解決策として、詳細情報を載せた導入画面の前に重要な画面を表示させました。これにより画面上の文章を最小限にすることができ、特にユーザーにしっかりと読んでもらいたい手順などが読みやすくなりました。例えば図2にある「ウェルカム」画面は、一つ目の質問の前に表示されます。

図2:ウェルカム画面

ストレスレベルに影響を与える

アプリの操作が参加者に余分なストレスを与えないということも非常に重要です。臨床試験に十分な情報を提供しつつ、最小限の障害となるような頻度で参加者にアプリを操作してもらわなくてはなりません。単にどの程度のストレスを感じているか質問するだけでも、自身のストレスレベルに普段意識を向けていない参加者はストレスを気にするようになり、それがストレスになるという場合があります。そしてアプリが参加者にデータを入力するよう定期的に通知を送るとストレスはさらに大きくなります。そのためグラフィカルユーザーインターフェース(GUI: Graphical User Interface)のデザイン、データ収集の頻度、および参加者をリマインドする仕組みについては十分に検討する必要があります。またアプリは、スマートフォンを使い慣れない参加者にもイライラやストレスを与えないような、楽しく簡単に使えるもでなければなりません。

参加者の積極的な参加

治験におけるもう一つの課題は、頻繁なデータ入力の依頼が参加者の積極的な参加を損なうことです。そのためデータ入力に要する時間は最小限にする必要があります。これを踏まえて私たちはVerum Trial Appを開発し、FitBitやMyFitnessPalのような他のソースから自動でデータをインポートできるようにしました。参加者には、データが正しいかだけを確認してもらいます(図3を参照)。また通常聞く質問の数は少なくして、より深い質問を少ない頻度で行うことにより、参加者を圧倒することなく、質問に積極的に参加できるよう気持ちをリフレッシュさせます。飽きたり、時間がなかったとしても参加者データ入力を「スキップする」ことがないようGUIをデザインすることも重要です。Verum Trail Appは、応答入力(スライダーを動かすなど)をしない限り「次へ」ボタンをクリックできないよう参加者の進み具合を制限します。そして敬語で説明的に直接的な言語を使うよう意識にしました。これは信頼すべき印象を与えて参加者に治験を真剣に捉えてもらい、データ入力をタイムリーに行ってもらうためのものです。

図3:MyFitnessPalのデータ入力

見栄えを考慮

治験によるストレスを測るアプリは、全体的な見栄えも考慮する必要があります。例えば、画像は参加者の応答に影響を与えることから、アプリに使用する画像は十分検討しました。不健康な人の画像を載せるか健康な人の画像を載せるかで、健康状態の自己評価に影響が出ることが分かっています[5]。また穏やか、近代的、清潔、医学的、プロフェッショナルな印象を視覚言語で表し、参加者がストレスを受けることなくデータ入力を真剣に行い、アプリや治験に信頼を寄せられるようにしました。図4がこの見栄えを表現した画面です。

図4:穏やかで近代的でプロフェッショナルな見栄え

学び

治験のデータ収集にアプリを使う利点は多くありますが、遠隔からのストレスデータ収集をそのデータの妥当性や信頼性を損なうことなく行うには課題があります。さらに、現代のアプリユーザーは、ユーザビリティ、見栄え、操作性、他のアプリとの一貫性などを大いに期待します。そのためこの点において遅れを取ったアプリを使うとすぐ不安になります。このブログに書いた設計的課題の他にも、アプリの開発費や収集できるデータの深さ、このような形でデジタル技術を使うことに慣れていない業界を打ち破ることなど、克服しなければならない課題があります。これら設計課題に対する正しいまたは正しくない対応方法というのはないかも知れませんが、人間工学、UXデザイン、データ収集分野の専門知識を融合させた非常に面白い分野あることは確かです。治験プロセスの中で面白い開発が生まれることを期待しています。

参考

[1] Cohen, S., Kamarck, T. and Mermelstein, R., 1994. Perceived stress scale. Measuring stress: A guide for health and social scientists, pp.235-283.

[2] Neilsen’s Heuristics https://www.nngroup.com/articles/ten-usability-heuristics/

[3] W3C Guidelines https://www.w3.org/standards/webdesign/ 

[4] Galesic, M., Tourangeau, R., Couper, M.P. and Conrad, F.G., 2008. Eye-tracking data: New insights on response order effects and other cognitive shortcuts in survey responding. Public Opinion Quarterly, 72(5), pp.892-913.

[5] Couper, M.P., Conrad, F.G. and Tourangeau, R., 2007. Visual context effects in web surveys. Public Opinion Quarterly, 71(4), pp.623-634.

Author
Katie Cornish
Senior Human Factors Engineer