WEKO3
アイテム
Multi-Faceted Decision Making Using Multiple Reinforcement Learning to Reducing Wasteful Actions
http://hdl.handle.net/10258/0002000061
http://hdl.handle.net/10258/0002000061a0754c5f-97c4-4235-9211-1a25fbeea808
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
| アイテムタイプ | 学術雑誌論文 / Journal Article.(1) | |||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-10-05 | |||||||||||||||||
| 書誌情報 |
en : Journal of Advanced Computational Intelligence and Intelligent Informatics 巻 26, 号 4, p. 504-512, ページ数 9, 発行日 2022-07-20 |
|||||||||||||||||
| タイトル | ||||||||||||||||||
| タイトル | Multi-Faceted Decision Making Using Multiple Reinforcement Learning to Reducing Wasteful Actions | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 言語 | ||||||||||||||||||
| 言語 | eng | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | multi-agent system | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | reinforcement learning | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | multi-agent reinforcement learning | |||||||||||||||||
| 資源タイプ | ||||||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||||||||||
| 資源タイプ | journal article | |||||||||||||||||
| アクセス権 | ||||||||||||||||||
| アクセス権 | open access | |||||||||||||||||
| アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||||||||||||||
| 著者 |
成田, 陸矩
× 成田, 陸矩
× 倉重, 健太郎
|
|||||||||||||||||
| 抄録 | ||||||||||||||||||
| 内容記述タイプ | Abstract | |||||||||||||||||
| 内容記述 | Reinforcement learning can lead to autonomous behavior depending on the environment. However, in complex and high-dimensional environments, such as real environments, a large number of trials are required for learning. In this paper, we propose a solution for the learning problem using local learning to select an action based on the surrounding environmental information. Simulation experiments were conducted using maze problems, pitfall problems, and environments with random agents. The actions that did not contribute to task accomplishment were compared between the proposed method and ordinary reinforcement learning method. | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 出版者 | ||||||||||||||||||
| 出版者 | Fuji Technology Press Ltd. | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 出版者 | ||||||||||||||||||
| 出版者 | 富士技術出版株式会社 | |||||||||||||||||
| 言語 | ja | |||||||||||||||||
| DOI | ||||||||||||||||||
| 関連タイプ | isIdenticalTo | |||||||||||||||||
| 識別子タイプ | DOI | |||||||||||||||||
| 関連識別子 | 10.20965/jaciii.2022.p0504 | |||||||||||||||||
| ISSN | ||||||||||||||||||
| 収録物識別子タイプ | PISSN | |||||||||||||||||
| 収録物識別子 | 1343-0130 | |||||||||||||||||
| ISSN | ||||||||||||||||||
| 収録物識別子タイプ | EISSN | |||||||||||||||||
| 収録物識別子 | 1883-8014 | |||||||||||||||||
| 権利 | ||||||||||||||||||
| 権利情報 | © 富士技術出版株式会社 | |||||||||||||||||
| 言語 | ja | |||||||||||||||||
| 権利 | ||||||||||||||||||
| 権利情報 | © Fuji Technology Press Ltd. | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 著者版フラグ | ||||||||||||||||||
| 出版タイプ | VoR | |||||||||||||||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||