- リンクを取得
- ×
- メール
- 他のアプリ
下記のサイトの手順を参考にして、環境を作ってみました。
基本的にはサイトの説明通りですが、個人的にハマった点が1つ。
Player オブジェクトに Ray Perception Sensor 3D を追加するところで、「以下のように設定する~」とあってその下に画面コピーがあるのですが、そこで赤枠で囲まれているところだけでなく、"Detectable Tags" に Wall を追加する必要があります。確かに画面コピーではそのようになっているので、忠実に指示に従えば間違えなかったのですが、赤枠のところしか見なかったのでしばらくハマりました・・・
(壁を検知しないので引っかかってばかりいました)
tensorboard で学習状況を見てみると、このように報酬グラフが遷移しました。参考にしたサイトでは 20,000回ぐらいの学習でスムーズに動くようになったとありますが、こちらで試した際は 30,000回ぐらい学習させないと全然でした。
結果のモデルを適用させると、こんな感じです。
コメント
コメントを投稿