2018-08-03

ブログの名前変更しました

ブログ名をAzarashi Blogにしました。

Changed this blog's name to "Azarashi Blog"

2018-08-03

MFT2018向けダーツスキル解析(6) - DNNモデル改善⇒収束！

背景

前回、データを再度プロットしたり、低次元に圧縮して可視化してみたりしたが、生データのクラスタリングだけでは無理っぽかった。
DNNモデルを工夫して、再度トライしてみる。

DNNモデル(改善版)

前回のモデルに、Batch NormalizationとDropoutを追加してみた。
これで過学習抑えられて学習速度もあがるだろう、と思う。
まぁ最適なモデルになった、とはいえないけど、前回よりもかなりマシな構造になったはず。

f:id:surumetic-machine-83:20180803194536p:plain

学習

とりあえず１万エポック回してみた。Adamでlr=0.0001,beta_1=0.9, beta_2=0.999。
以下のようなロスカーブ。valはそんなに小さくないけど、前回よりはマシ。
dropout入れてるからか、すごいグラフが振動している。大丈夫かな？
１万エポック時点では、lossは以下のような感じ。
- train loss : 0.0007517132
- validation loss : 0.0585273126

f:id:surumetic-machine-83:20180803194525p:plain

推論テスト

一通り、各スコア(0.0, 0.1, 0.6, 1.0)に対応するデータをもってきて、正しく結果が出てくるか試してみる。

テスト結果

スコア１.0のデータ例に対する推論結果　：　

y_predicted : [0.99993074]
スコア0.6のデータ例に対する推論結果：

　y_predicted : [0.5921314]

スコア0.1のデータ例に対する推論結果：

y_predicted : [0.05314487]
スコア0.0のデータ例に対する推論テスト結果：

y_predicted : [0.01145243]

考察

それっぽい値が出た！！！！！
１万エポックだけど、まだtrain lossが小さくなりそうなので、学習をもっとまわしてみるとしよう。

まとめ

DNNモデルの性能が悪かったのは、モデルの構造が良くなかったからのようです。
さて、またダーツ投げまくってデータ増しして性能を向上させますかね！（）

追記 2018-08-04

１万epoch学習させましたが、更に追加で9万epoch学習させました。
以下のグラフの通り。やっぱりグラフの変動が大きすぎる気が・・・。train lossの変動の上(?)が最終的な性能くらいだと思っといたほうがいいのか？よくわからないけども。変動の下(?)はこれ以上下がらない雰囲気なので、学習時間は十分のように見える。
最終的な収束値： train loss: 9.0574e-05 - val_loss: 0.0573

f:id:surumetic-machine-83:20180804040558p:plain

テスト結果

推論値も良くなった。やっぱりスコア0.1の推論が少し悪い。僕の問題設定が悪いかも？インブルもブルもscore 0にすればよかったかなぁ。
スコア１.0のデータ例に対する推論結果　：

y_predicted : [0.99999976]

スコア0.6のデータ例に対する推論結果：

y_predicted : [0.5994751]

スコア0.1のデータ例に対する推論結果：

y_predicted : [0.12352057]

スコア0.0のデータ例に対する推論テスト結果：

y_predicted : [2.8647633e-05]

2018-08-03

MFT2018向けダーツスキル解析(5) - データの特徴を再確認

MFT2018はついに明日ですね！

ダーツを投げた時の人の各種データを取る仕組みだけできてますが、肝心のデータを解析して上手い下手判定をしてくれる部分が全然できてないのでやばいです笑

データ取りの仕組みは、それはそれで結構イイ感じにできたと思うので、そっちをメインにフィーチャする感じですかね。まぁデータ解析は、ベストエフォートでできるところまで頑張ってみます。

今回

テキトーにデータをテキトーに作ったDNNに突っ込んで結果を見るのは一旦やめて、きちんとデータを見るところから始めます。
各種スコアにおけるグラフを今一度チェックしてみます。

データ確認

スコアの対応表の再掲

ダーツのスコアは、以下のように0.0, 0.1, 0.6, 1.0の４種にわけることにしています。

f:id:surumetic-machine-83:20180801180459p:plain

生データを凝視してみる。

何はともあれ、各種スコアのナマのデータを比較して、上手い下手が判別できるか見てみます。
各スコアごとに、とりあえず意味の強そうな「親指の指圧=finger1」「親指の曲げ=finger0」「人差し指の曲げ=finger2」「中指の曲げ=finger4」を適当に６サンプルずつ拾ってグラフを比較してみます。

各スコアのグラフ

インブル(loss score=0.0)のときの例６個
ブル(loss score=0.1)のときの例６個
内側シングル＋トリプル(loss score=0.6)のときの例６個
外側シングル＋ダブル(loss score=0.0)のときの例６個

凝視してみたが・・・

なるほど、わからん
例えばうまくインブルに入っているデータ同士でも、結構データにはばらつきがありそう。「インブルに入るべくして入ったケース」と「インブルにたまたま入ったケース」があるのだろうが、それを区別できないといけないようだなぁ。
クラスタリングしたら何か分かるかも？

生データをt-SNEで低次元に落として可視化してみる。

データの可視化手法でよく使わっるPCAとかt-SNEを使って、生データを低次元で可視化してみる。低次元に落とした時に、きちんとデータがスコアごとにグループ分けされるか確認したい。
なお、今のところ「ダーツの矢が刺さった２秒前までの指と体の動きの時系列データ」を記録してきたが、実質投げるのに関係していそうなのは１秒前までなので、１秒前までのデータのみ切り取って来て使うことにする。

PCAの結果

クラスごとに、うまくグループ分けできていない・・・。インブルだろうがダブルだろうが、近さが変わらない。

tSNEの結果

PCAよりも、うまく次元圧縮できると話題のt-SNEだが・・・
やっぱりうまくグループ分けできていない。インブルだろうがダブルだろうが、近さが変わらない。
t-SNEで2Dに次元圧縮

f:id:surumetic-machine-83:20180803172320p:plain

t-SNEで3Dに次元圧縮 (plotlyで描画)

まとめ

今回は、ダーツを投げた時の指・体の時系列データが、スコアに応じて優位に差があるかどうかをチェックしてみました。
結果、生データを純粋に見比べても、よくわからないし、次元圧縮をしてみてもグループ分けされていませんでした。
DNNとかで、うまく特徴抽出してやった結果をうまくｔ−SNEかけてプロットすれば、いい感じにグループ分けされるのかもしれません。
もう一回良いDNNを設計する方向性で頑張ろうかな。あとデータまし・・・。

余談

t-SNEもplotlyも始めた使ってみたけど、いいツールだなぁ。
あと一ヶ月時間がほしい・・・。

2018-08-02

MFT2018向けダーツスキル解析(4)

背景

前回、性能はよくわからないですが、指の動きと指圧、そして体の関節位置の時系列データから、ダーツのスコアを推定するDeep Neural Network(DNN)を作りました。
ほんとにこれで収束してんのか？というところ今一度値を見て調べてみようと思います。

どうチェックするの？

スコアが0のデータ、0.1のデータ、0.6のデータ、1.0のデータを入力して、モデルがどんな出力を返すのか見てみます。

結果

いや、すごい恥ずかしいのですが、モデルにどのデータを入力しても、「0.5336971」が帰ってきました笑
ただの平均値計算になってましたね！いやぁ、お恥ずかしい！ああっ！！！（寝不足のテンション）

次のステップ

しかしこれで、収束してないことがわかりました。前のデータで、validation気にせずlossが小さくできていた例をみました。要は、validationを犠牲にしてでもlossを降下する方向性へもっていくべきだったのですね。
汎化性能維持するために、Dropoutとか入れてみる必要があるかもしれません。
データの質以前の問題ということで、ハイパーパラメータチューニングに手を出すか？

うううう・・・

この分野はまだまだ素人なので、色々とハマりますね・・・。

余談

Maker Faire、ヘタしたらただのダーツの矢を投擲するデータをロギングするシステムを展示するだけになってしまうかな・・・。それは避けたい・・・。
あと残り一日になってしまった・・・。

とりあえず一回寝ますかね。

2018-08-02

MFT2018向けダーツスキル解析(3)

前回

指および体の動きの時系列データを正規化して２Dの時空間マップにしました。

今回

時空間マップからスコアを推定するDeep Neural Network(DNN)をいくつか作り、学習させ、収束するかみてみます。
結論から言って、途中までやって「お、うまくいくんではないか？」と思ったら、案外「うまくいってなかったなぁ・・・」っていう結果です。

学習環境

GPU : GTX780Ti
- 新入社員のときに買ったけど、随分時代遅れになっちゃったなぁ・・・
学習フレームワーク : Keras
- BackendはTensorflow

方針

今回は、まずシンプルなFully-Connected層だけで構成されたモデルを試します。
1. fingerデータ(指の動き・指圧の時系列データ)から、スコアを推定するDNN①を作る
2. bodyデータ(各関節位置の時系列データ)から、スコアを推定するDNN②を作る
3. DNN①とDNN②の中間層を統合してスコアを推定するDNN③を作る
ちなみに「時系列データを扱うならRNNかLSTM使うの？」と思われるかもしれませんが、今回入力は連続値ですが固定長で、しかも出力は１つですので、すごいシンプルなため、使う必要はないと判断しています。

fingerデータからスコア推定トライ

fingerデータからスコア推定モデル(シンプル)

以下のようなモデルを作り、学習してみる。
- Fully Connectedレイヤを３つくっつけただけ。

f:id:surumetic-machine-83:20180802114844p:plain

学習結果

とりあえず、SGDとAdamで10000エポック学習して見た。
SGDはかなりlossが小さくなるけどvalが悪くなってるので、過学習気味。
Adamはloss: 0.0378 - val_loss: 0.0374止まりだけど、valと同等で、収束がかなり早い模様。

SGD (Learning Rate = 0.01, Momentum= 0.9)

Adam (lr=0.01, beta_1=0.9, beta_2=0.999, decay=0.0)

ふむ、で結局、fingerデータだけで、どのくらい的中できるの？

今回のlossは、mean_squared_errorとなっている。なので、これにsqrtかければ、RMSEになる。
RMSEにすれば、元の単位系と比較しても問題ないはず。
今回の場合、ADAMで試した結果を使うとして、sqrt(0.0374) = 0.194。大体誤差±0.2ポイントくらいってことかな。
もしかすると、インブルかブルかは見分けられないけど、もしかしたらブルかそれ以外は0.5ポイント差があるので、区別できるかもしれない。

fingerデータからのスコア推定に関する考察

テキトーなわりにいい感じでは。思ったよりfigerデータには情報量があるかもしれない。
もしくは、一部のデータの偏りが大きいから、マジョリティに寄る出力を出しているだけなのかもしれない。

bodyデータからスコアの推定トライ

bodyデータからスコア推定モデル(シンプル)

bodyについても、同じくシンプルなモデルで学習させてみる。
fingerよりも次元が多いので、気持ち中間層多めに作ってみた。

f:id:surumetic-machine-83:20180802133832p:plain

学習結果

fingersデータでうまくいったAdamで実施
learning rate=0.001で結構いい感じに収束した。

Adam (lr=0.001, beta_1=0.9, beta_2=0.999, decay=0.0)

ちなみにlearning rate(=lr)が、fingersのときにはここでは0.001にしてある。これが0.01のままだと、lrが小さすぎるがために全然学習が進まない。

Adam (lr=0.01, beta_1=0.9, beta_2=0.999, decay=0.0)

逆にもっとlrを小さくすると、下図のように過学習して変な風になった。調整難しいなぁ。

Adam (lr=0.0001, beta_1=0.9, beta_2=0.999, decay=0.0)

bodyデータからのスコア推定に関する考察

bodyデータの学習でのval_lossの収束時の値も、ほぼ0.0374で、fingersによる結果と同じだった。sqrt(0.0374) = 0.194。大体誤差±0.2ポイント。
fingersとbodyによる推定結果にほとんど差がないことがわかった！と言ってもいいかな？と一瞬思ったが、それはないだろう。
データのバイアスがありすぎて、そっちのほうこうによった値をテキトーに出力するDNNができあがってしまった気がしている。

finger+bodyデータからスコアの推定トライ

finger, bodyともにだいたい同じ誤差に収束している感じがかなりあやしいが・・・何はともあれ、DNN③を作って学習してみる。
- まぁとにかく、今回は最後まで走り抜けます。
理想的には、finger単体、body単体よりも良い結果となってほしいが・・・

fingers＋bodyデータからスコア推定モデル(シンプル)

前節までで説明していたモデルを、最終出力層を除いて、単純にもってきて、後段を2つのFully-Conncectedでくっつけたモデルですね。

f:id:surumetic-machine-83:20180802150845p:plain

学習結果

Adamでlr=0.0001で学習。
今までで学習したfingersデータによるスコア推定DNNと、bodyデータによるスコア推定DNNの学習済みのパラメータをロードして、事前学習させた状態から学習を開始させました。
結果は下図の通り。学習開始時点から、ほとんど値が変化していない。収束したときの値はまさしく、finger単体およびbody単体と同等の結果・・・。ううううう・・・。

f:id:surumetic-machine-83:20180802155259p:plain

finger+bodyデータからのスコア推定に関する考察

はい、これは間違いなくデータのバイアスか何かが悪さしていて、まともに学習しきれていないですね。
データを洗いなおして出直しますか。

まとめ

うまくいったかな？と思いましたが甘かったですね。
モデルの見直しだけなく、学習データの見直しをしないといけないですね。
最近書いてるブログが本当にただのメモで、説明が下手すぎて誰にも理解されないレベルかもしれません。そのうちきちんとまとめよう。

次回

一旦、今回作ったモデルでどの程度の性能か検証
学習データのなかで、ある数値にバイアスがでていて学習に悪影響を及ぼしていないかチェックする。
うまくいったら、ハイパーパラメータチューニングを試す。

2018-08-01

MFT2018向けダーツスキル解析(2)

前回(数時間前)までのあらすじ

ダーツスキル解析のために、どういうデータをどのように撮っているかについて説明。
データをプロットしてみて、正規化が必要と確認。
データの正規化を施して、データの特徴が見やすくなったことを確認
- 初投稿時からちょこちょこ追記
ラーメン食べてきました。

今回

Deep Neural Networkへの入力にするため、各データの二次元の時空間マップに変換します。

時空間マップ

その名の通り、１つの軸が時間で、もうひとつの軸が空間的なデータになっているもの。
- 空間といっても、今回は指の曲げ度合、指圧、関節の位置など、ばらばらですが・・・。
前回までの進捗で、各データがすべて0〜１ないしは-1~1に揃えたので、すでにマップにしやすい状態になっています。
曲げ度合と指圧で１つのマップ、関節の位置で１つのマップという風にして、２つのマップを作りました。
- そしてseabornを使って綺麗に描画します。