生理指標計測データ処理ツール
本ツールは、生理指標データを研究対象とする際に、以下の2点の問題があると考え、これらのデータをいかにして処理するかを目的に制作されたものである。
■データが数値のみで、解釈が難しい
基本的に、生理指標とは2点以上の電極を人間に装着したり、光の戻り具合を光センサで捉えたりする事で、その電圧差をデータとして捉えるものである。これは、数値のみのデータであり、例えグラフ化したとしても、波形が現れるのみで、その解釈が問題となる。
■データ量がきわめて多い
上記で述べた電圧差を計測する際に、高いサンプリング周波数で計測が行われると、数分の実験であっても、そのデータ量が膨大になる。
データ収集を、本ツール指定の形式で行なえば、シーン分割を容易に行うことができ、また、基本的に利用可能と考えられる値を自動的に生成することが可能となる。またこれらのデータは、Microsoft Exselに読み込み可能な「.csv」形式(カンマ区切り)で出力されるので、解析前のデータ処理にかかる手間を大幅に削減することが可能となる。
本ツールを起動すると、[図06]のような画面が現れる。ある一人の被験者データを『読込み』ボタンで読み込む(読み込みデータの形式に関しては、後述する)。これが「被験者データ」となるが、読み込みが完了すると、[図07]のようにグラフの描画、各ラベルの抽出を行ったうえでのラベルに関するラインの描画、また、総サンプル数、総ラベル数、総実験時間、が自動的に算出される。
この「被験者データ」に対し、ラベルビュー欄にあるラベルを選択範囲欄の"ここにドロップ"というフィールドにドラック&ドロップすることで、対象とする選択範囲を選択する。選択範囲は、複数にすることが可能であり、その選択範囲グループに名前をつけ、登録ボタンを押して選択範囲登録を行う。同様の方式で、出力データ設定欄にて、出力したいデータを選択し、「データ処理の法則」を決定する。
選択範囲と出力データの設定が完了したら、選択範囲番号を押すことで、[図08]のような結果を導き出すことができる。
『書出し』ボタンでデータ処理済みデータを.csv形式で書き出すことが可能である。(これで一人分のデータ処理が完了)続けて、2人目のデータを、『読込み』ボタンで読み込む。そのまま『書出し』ボタンを押せば、同様の処理法則で、データ処理済みデータの書き出しが可能となり、読込み/書出し、を繰り返せば、複数人のデータ処理を一気に行うことができる。
また、この時用いた処理法則を『保存』ボタンで「選択範囲設定」として保存しておけば、あとから同形式の実験で収集したデータを処理する際に、同じ「選択範囲設定」でデータ処理する事が可能となる。「選択範囲設定」を読み込むには、『開く』ボタンで読み込む。
■本ツールが指定するデータ形式
生理指標データは、既に述べたようにデータが数値のみであり、その量が膨大となる。また、通常生理指標データを用いた実験を行う際には、被験者に対して刺激を与え、その反応を見ることが多い為、本ツールでは、
"この時刻に刺激を与えた"等を示す「ラベル」と
被験者の実験刺激がPCにおけるコンテンツである事を加味し、
"被験者がこの時刻にクリックした"ことを示す「クリックラベル」
の2種類のラベル含んだデータを扱う。その形式は、以下の通りである。
■データフォーマット
["ラベル1", xxxx1 , xxxx2, xxxx3, xxxx4, xxxx5, "ラベル2", xxxx6, xxxx7, xxxx8, xxxx9, "click1", xxxx10, xxxx11, xxxx12, "click2", xxxx13, xxxx14, xxxx15, "ラベル3", xxxx16, xxxx17, "click3", xxxx18, "ラベル4"]
[t1, t2, t3, t4, t5, t6, t7, t8, t9, t10, t11, t12, t13, t14, t15, t16, t17, t18, t19, t20, t21, t22, t23, t24, t25]
本ツールが扱うデータでは
[ ] (角カッコ)
, (カンマ)
" " (ダブルコーテーション)
の3つの半角記号をもちいる。
データフォーマットのように[ ](角カッコ)で囲まれたものが2つあるが、前にあるものが、「電位差を示す数字の羅列データ」の中に、「ラベル」と「クリックラベル」が時系列的に内包された『生データ(値&ラベル)』である。改行コードをはさんで、後に続く[ ](角カッコ)で囲まれたものが『生データ(値&ラベル)』各々に対応する時間(本ツールでは、ミリ秒を想定しているが、特にその単位を限定するものではない)を示す『生データ(時間)』である。
また、 ,(カンマ)は、データの区切りを示す。例示のデータフォーマットでは、合計25のデータが格納されており、各々が,(カンマ)で区切られている。当然[ ](角カッコ)で囲まれた(値&ラベル)と(時間)2つのデータ数は、一致していなくてはならない。
,(カンマ)で区切られたデータは、先にも述べたように、
1. 電位差を示す単なる数字
2.「この時刻に刺激を与えた」等を示す「ラベル」
3.「被験者がこの時刻にクリックした」ことを示す「クリックラベル」
の3つからなる。
1.はデータフォーマットにて「xxxx」で示してある部分で、単なる数値である。半角数字のみを使用する必要がある。また、この1.と区別する為に、2.3.は、" "(ダブルコーテーション)で囲う。" "(ダブルコーテーション)で囲まれたものは、数値ではなく、ラベルとして認識される。また、2.と3.の区別の関しては、この" "(ダブルコーテーション)で囲まれたものの中に、 click という文字列が入っているかいないかを判断基準としている。つまり2.では、 click という文字列を使用することはできない。また、本ツールには、「正解のクリックか/不正解のクリックか」、を認識する機能があり、click_t という文字列を内包する場合には、正解のクリックであり、 click_f という文字を内包する場合には、不正解のクリックであるという認識をさせる事が可能である。
なお、2.3.両方に関して、同じラベル名を使用することはできない。また、データの最初と最後には、2.「ラベル」を置く必要がある。
下記は、扱うデータのサンプルである。
■データサンプル
["実験スタート" ,167, 196, 211, 215, 215, "実験解説開始", 209, 209, 208, 208, "click1", 208, 206, 202,"click2" ,183, 170, 169, "実験刺激1表示", 162, 154, "click3",147, "実験終了"]
[0, 39, 119, 206, 292, 333, 466, 555, 609, 690, 778, 863, 1062, 1174, 1286, 1408, 1468, 1571, 1629, 1690, 1742, 1819, 1871, 1924, 1976]