今回は、田近先生ゼミ(3年生)にお邪魔しました!
プログラミング、シミュレーション、人工知能について研究している田近ゼミの皆さん。
今日は、「強化学習」の一つである、「DQN」のアルゴリズムについての講義から始まりました。
「DQN」を取り入れることは、田近ゼミ3年生の最終目標でもあります。
この迷路は、三角形4つで構成された四角形のマスで組み立てられており、
この上をボールがスタートからゴールまで転がっていきます。
ボールのスタートからゴールまでの軌跡は、エピソードとしてどんどんカウントされていきます。
そして、こっちに行った方がゴールまで早くたどり着けるよ、という情報をマスに記録していきます。
このシミュレータを使って、ロボットが学習して最短ルートを記録していく様子を、画面上で確認しました。
また実際に、ALPHA(学習率)、EPSILON(探査率)、GAMMA(割引率)などのパラメータの数字を変えることによって、
ロボットの動きがどう変化するかといった実験も行い、パラメータのチューニングの難しさを体感しました。
今回学んだことは、4年生時の卒業研究へとつながるテーマでもあり、
ゼミの皆さんは、難しい内容でありながらも、とても興味深く聴講していました。
後半は、前回の続きから、「Java」の基本プログロムの中身について。
Shootingゲームを例に、Javaの文法について、理解度を深めました。
さすが、田近ゼミの皆さん。
指示されたプログラムをあっという間に組み、反映させていました。