WEKO3
アイテム
大規模ニューラルネットワークの分散管理を可能にするサーバ連携技術に関する研究
https://kindai.repo.nii.ac.jp/records/2001935
https://kindai.repo.nii.ac.jp/records/2001935e441956a-43d8-4761-b4ff-d1596496de06
名前 / ファイル | ライセンス | アクション |
---|---|---|
![]() |
|
Item type | 報告書 / report(1) | |||||||||
---|---|---|---|---|---|---|---|---|---|---|
公開日 | 2024-10-24 | |||||||||
タイトル | ||||||||||
タイトル | 大規模ニューラルネットワークの分散管理を可能にするサーバ連携技術に関する研究 | |||||||||
言語 | ja | |||||||||
タイトル | ||||||||||
タイトル | A study of server management technology for sustaining a large scale distributed neural network | |||||||||
言語 | en | |||||||||
研究代表者 |
水谷, 后宏
× 水谷, 后宏
e-Rad_Researcher
40845939
|
|||||||||
言語 | ||||||||||
言語 | jpn | |||||||||
キーワード | ||||||||||
主題 | 広域分散コンピューティング, 分散学習, 分散ニューラルネットワーク, ネットワーク管理 | |||||||||
内容記述 | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | 本研究は,自律的なニューラルネットワークの分散実行基盤を実現するための基盤技術を創出し,多数のサーバから構成される分散実行環境の確立を目指した.具体的には,学習サーバの分散連携を可能にする構造化オーバレイ技術を用いて,故障対応の高速化を実現した.また,分散環境下での連合学習の実現に向けて,連合学習の同時実行性を考慮したサーバ管理手法を検討し,多様な階層関係を持つ連合学習要求を調停するアルゴリズムを実装し,その有効性を検証した.さらに,分散実行基盤内で発生するトラフィックの効率的な推定方法や,それらの知的制御アルゴリズムを通して,コストの低い基盤構築技術の確立も行った. | |||||||||
言語 | ja | |||||||||
内容記述 | ||||||||||
内容記述タイプ | Abstract | |||||||||
内容記述 | In this study, we aim to construct a distributed neural network execution platform by developing core technologies. First, we used structured overlay network technology to quickly restore the distributed platform. This method's strength is in estimating the union of failure nodes and quickly propagating failure information to them. This approach reduces unnecessary failure information propagation and shortens the platform's Mean Time to Repair (MTTR). Secondly, we integrated distributed federated learning techniques into the platform to manage scalable learning nodes. We proposed an efficient scalable node management tree architecture that balances learning efficiency and high fault tolerance. Finally, we developed various schemes for traffic data estimation and control within the platform. By combining these technologies, we expect to maintain a robust and fault-tolerant future distributed neural network management platform. | |||||||||
言語 | en | |||||||||
内容記述 | ||||||||||
内容記述タイプ | Other | |||||||||
内容記述 | 研究分野:情報ネットワーク | |||||||||
言語 | ja | |||||||||
資源タイプ | ||||||||||
資源タイプ識別子 | http://purl.org/coar/resource_type/c_93fc | |||||||||
資源タイプ | report | |||||||||
出版タイプ | ||||||||||
出版タイプ | VoR | |||||||||
出版タイプResource | http://purl.org/coar/version/c_970fb48d4fbd8a85 | |||||||||
助成情報 | ||||||||||
助成機関名 | 独立行政法人日本学術振興会 | |||||||||
言語 | ja | |||||||||
助成機関名 | Japan Society for the Promotion of Science | |||||||||
言語 | en | |||||||||
研究課題番号URI | https://kaken.nii.ac.jp/grant/KAKENHI-PROJECT-20K19791/ | |||||||||
研究課題番号 | 20K19791 | |||||||||
研究課題名 | 大規模ニューラルネットワークの分散管理を可能にするサーバ連携技術に関する研究 | |||||||||
言語 | ja | |||||||||
研究課題名 | A study of server management technology for sustaining a large scale distributed neural network | |||||||||
言語 | en | |||||||||
書誌情報 |
ja : 科学研究費助成事業研究成果報告書 (2023) ページ数 8 |