WEKO3
アイテム
Proposal of Decision-Making Method Under Multi-Task Based on Q-Value Weighted by Task Priority
http://hdl.handle.net/10258/0002000060
http://hdl.handle.net/10258/000200006053ae5649-dfe5-4374-918c-8b37a44cea48
| 名前 / ファイル | ライセンス | アクション |
|---|---|---|
|
|
| アイテムタイプ | 学術雑誌論文 / Journal Article.(1) | |||||||||||||||||
|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|---|
| 公開日 | 2023-10-05 | |||||||||||||||||
| 書誌情報 |
en : Journal of Advanced Computational Intelligence and Intelligent Informatics 巻 26, 号 5, p. 706-714, ページ数 9, 発行日 2022-09-20 |
|||||||||||||||||
| タイトル | ||||||||||||||||||
| タイトル | Proposal of Decision-Making Method Under Multi-Task Based on Q-Value Weighted by Task Priority | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 言語 | ||||||||||||||||||
| 言語 | eng | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | reinforcement learning | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | multi-task | |||||||||||||||||
| キーワード | ||||||||||||||||||
| 言語 | en | |||||||||||||||||
| 主題Scheme | Other | |||||||||||||||||
| 主題 | priority | |||||||||||||||||
| 資源タイプ | ||||||||||||||||||
| 資源タイプ識別子 | http://purl.org/coar/resource_type/c_6501 | |||||||||||||||||
| 資源タイプ | journal article | |||||||||||||||||
| アクセス権 | ||||||||||||||||||
| アクセス権 | open access | |||||||||||||||||
| アクセス権URI | http://purl.org/coar/access_right/c_abf2 | |||||||||||||||||
| 著者 |
花形, 知美
× 花形, 知美
× 倉重, 健太郎
|
|||||||||||||||||
| 抄録 | ||||||||||||||||||
| 内容記述タイプ | Abstract | |||||||||||||||||
| 内容記述 | Robots make decisions in a variety of situations requiring multitasking. Therefore, in this work, a method is studied to address multiple tasks based on reinforcement learning. Our previous method selects an action when the q-values of the action for each task correspond to a priority value in the q-table. However, the decision-making would select an ineffective action in particular situations. In this study, an action value weighted by priority is defined (termed as action priority) to indicate that the selected action is effective in accomplishing the task. Subsequently a method is proposed for selecting actions using action priorities. It is demonstrated that the proposed method can accomplish tasks faster with fewer errors. | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 出版者 | ||||||||||||||||||
| 出版者 | Fuji Technology Press Ltd. | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 出版者 | ||||||||||||||||||
| 出版者 | 富士技術出版株式会社 | |||||||||||||||||
| 言語 | ja | |||||||||||||||||
| DOI | ||||||||||||||||||
| 関連タイプ | isIdenticalTo | |||||||||||||||||
| 識別子タイプ | DOI | |||||||||||||||||
| 関連識別子 | 10.20965/jaciii.2022.p0706 | |||||||||||||||||
| ISSN | ||||||||||||||||||
| 収録物識別子タイプ | PISSN | |||||||||||||||||
| 収録物識別子 | 1343-0130 | |||||||||||||||||
| ISSN | ||||||||||||||||||
| 収録物識別子タイプ | EISSN | |||||||||||||||||
| 収録物識別子 | 1883-8014 | |||||||||||||||||
| 権利 | ||||||||||||||||||
| 権利情報 | © Fuji Technology Press Ltd. | |||||||||||||||||
| 言語 | en | |||||||||||||||||
| 権利 | ||||||||||||||||||
| 権利情報 | © 富士技術出版株式会社 | |||||||||||||||||
| 言語 | ja | |||||||||||||||||
| 著者版フラグ | ||||||||||||||||||
| 出版タイプ | VoR | |||||||||||||||||
| 出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||||||||||