FACULTY
教員紹介
屋並 仁史 YANAMI Hitoshi
大学院
強化学習と組合せゲーム研究室
効率的な学習手法と組合せゲームの計算機解析の研究
専門分野
- 強化学習
- 組合せゲーム理論
- 数理最適化
研究テーマ
ヒトのように効率的に学ぶ強化学習
組合せゲームの解析
ゲームデザイン・制度設計
研究分野とその概要
囲碁、将棋、チェスなどのプレーヤー二人が交互にアクションを行うゲームで強化学習により計算機が人間のトップレベルを超えるようになった。本研究室では、強化学習アルゴリズムの研究と強化学習のゲーム解析への応用に関する研究を行っている。
ヒトのように効率的に学ぶ強化学習
強化学習はビデオゲームやボードゲームで人間を超える能力を持つ計算機プレーヤーを生み出したが、学習は莫大な回数の試行を通じて達成される。一方、人間は圧倒的に少ない学習機会で上達することができる。人間は新しいゲームに取り組む際、過去にプレイした類似のゲームの経験や相手と競い合うゲームにおけるよい戦術とはどんなものであるかという知識や推論を活用している。過去のタスクの学習経験を活用して計算機に新たなタスクを効率的に学習させる手法を開発する。
計算機によるゲームの解析
強化学習はビデオゲームのように一人のプレーヤーが環境の中でアクションを繰り返すタイプのものや囲碁、将棋、チェスなど二人のプレーヤーが交互に行動するゲームで近年画期的な成果を上げている。より一般のゲーム、例えばプレーヤーが複数(三人以上)いるゲームや複数のプレーヤーが同時に意思決定を行うゲーム、の解析に(マルチエージェント)強化学習を適用する手法を開発する。また、解析を通じてゲームのルールを適切に設定する方法を考える。