Current Issue: <FITEE>

Frontiers of Information Technology & Electronic Engineering (former title: Journal of Zhejiang University SCIENCE C (Computers & Electronics), 2010-2014)

ISSN 2095-9184 (print); ISSN 2095-9230 (online); CN 33-1389/TP; Monthly.


FITEE is an international peer-reviewed journal indexed by SCI-E, Ei Compendex, DBLP, IC, Scopus, JST, CSA, etc. It covers research in Electrical and Electronic Engineering, including Computer Science, Information Sciences, Control, Automation, Telecommunications, and related disciplines.

Impact factor: 0.308 (2011), 0.297 (2012), 0.380 (2013), 0.415 (2014), 0.392 (2015), 0.622 (2016), 0.910 (2017), 1.033 (2018), 1.604 (2019), 2.161 (2020), 2.526 (2021).

 


Frontiers of Information Technology & Electronic Engineering

ISSN 2095-9184 (print), ISSN 2095-9230 (online), monthly

   Cover:  <416>
      
Contents:  <203>

<<<                         CONTENTS                         >>>

Special Feature on Institutionalized and Systematized Gaming (InSys Gaming) for Multi-agent Systems
(Guest Editor-in-Chief: Jun LU; Guest Executive Lead Editor: Fei-Yue WANG; Guest Editors: Qi DONG, Qibin SUN, Qinglai WEI, Xin YAO)

Editorial: Institutionalized and systematized gaming for multi-agent systems

Jun LU, Fei-Yue WANG, Qi DONG, Qinglai WEI

DOI: 10.1631/FITEE.2240000 Downloaded: 1436 Clicked: 1708 Cited: 0 Commented: 0(p.991-994) <Full Text>

Perspective: Existence and practice of gaming: thoughts on the development of multi-agent system gaming

Qi DONG, Zhenyu WU, Jun LU, Fengsong SUN, Jinyu WANG, Yanyu YANG, Xiaozhou SHANG

DOI: 10.1631/FITEE.2100593 Downloaded: 2170 Clicked: 1830 Cited: 0 Commented: 0(p.995-1001) <Full Text>

Chinese summary   <29>  博弈的存在與實踐:對多智能體(tǐ)博弈發展的思考

董琦1,吳鎮宇1,2,陸軍1,孫鳳松1,3,王錦宇1,3,楊焱煜1,尚曉舟1
1中(zhōng)國電子科學研究院,中(zhōng)國北(běi)京市,100049
2北(běi)京理工(gōng)大(dà)學信息與電子學院,中(zhōng)國北(běi)京市,100081
3北(běi)京郵電大(dà)學信息與通信工(gōng)程學院 ,中(zhōng)國北(běi)京市,100876
摘要:博弈是宇宙中(zhōng)的一(yī)種普遍存在。本文從人類對博弈的認識過程出發,探讨了博弈的存在與實踐,闡述了多智能體(tǐ)博弈研究難點,并基于演化思想,從系統論的角度出發,提出多智能體(tǐ)演化博弈理論框架。以下(xià)一(yī)代預警探測系統爲例,介紹了多智能體(tǐ)演化博弈的應用實踐。構建了多智能體(tǐ)自組織博弈決策模型和多智能體(tǐ)強化學習方法,對研究高維複雜(zá)環境下(xià)的組織化、體(tǐ)系化博弈行爲具有重要意義。

關鍵詞組:博弈;多智能體(tǐ)系統;多智能體(tǐ)演化博弈;預警探測

Perspective: Prospects for multi-agent collaboration and gaming: challenge, technology, and application

Yu LIU, Zhi LI, Zhizhuo JIANG, You HE

DOI: 10.1631/FITEE.2200055 Downloaded: 3165 Clicked: 1895 Cited: 0 Commented: 0(p.1002-1009) <Full Text>   <PPT>  322

Chinese summary   <30>  多智能體(tǐ)協作與博弈展望:挑戰、技術和應用

劉瑜1,李徵2,姜智卓2,何友1
1清華大(dà)學電子工(gōng)程系,中(zhōng)國北(běi)京市,100084
2清華大(dà)學深圳國際研究生(shēng)院,中(zhōng)國深圳市,518055
摘要:近年來,多智能體(tǐ)系統在解決複雜(zá)環境中(zhōng)各種決策問題方面取得顯著進步,并已實現與人類相似甚至更好的決策性能。本文從任務挑戰、技術方向和應用領域3個角度簡要回顧多智能體(tǐ)協作和博弈相關技術。首先回顧近期多智能體(tǐ)系統工(gōng)作中(zhōng)的典型研究問題和挑戰,然後進一(yī)步讨論關于多智能體(tǐ)協作和遊戲任務的前沿研究方向,最後對多智能體(tǐ)協作與博弈的應用領域進行重點展望。

關鍵詞組:多智能體(tǐ);博弈論;集體(tǐ)智能;強化學習;智能控制

Optimal synchronization control for multi-agent systems with input saturation: a nonzero-sum game

Hongyang LI, Qinglai WEI

DOI: 10.1631/FITEE.2200010 Downloaded: 3317 Clicked: 2038 Cited: 0 Commented: 0(p.1010-1019) <Full Text>   <PPT>  298

Chinese summary   <27>  輸入飽和下(xià)多智能體(tǐ)系統最優一(yī)緻性控制:一(yī)類非零和博弈方法

李洪陽1,2,魏慶來1,2,3
1中(zhōng)國科學院大(dà)學人工(gōng)智能學院,中(zhōng)國北(běi)京市,100049
2中(zhōng)國科學院自動化研究所複雜(zá)系統管理與控制國家重點實驗室,中(zhōng)國北(běi)京市,100190
3澳門科技大(dà)學系統工(gōng)程研究所,中(zhōng)國澳門特别行政區,999078
摘要:本文針對輸入飽和下(xià)的多智能體(tǐ)系統,提出一(yī)種最優一(yī)緻性控制方法。引入多智能體(tǐ)博弈理論,将最優一(yī)緻性控制問題轉化爲多智能體(tǐ)非零和博弈。之後,通過求解具有非二次輸入能量項的耦合Hamilton–Jacobi–Bellman(HJB)方程,實現Nash平衡。提出脫策強化學習方法,在系統模型未知(zhī)情況下(xià)獲得Nash平衡解;引入評判神經網絡和執行神經網絡實現所提方法。理論分(fēn)析顯示叠代控制律收斂到Nash平衡。仿真實驗驗證了所提方法的有效性。

關鍵詞組:最優一(yī)緻性控制;多智能體(tǐ)系統;非零和博弈;自适應動态規劃;輸入飽和;脫策強化學習;策略叠代

Distributed game strategy for unmanned aerial vehicle formation with external disturbances and obstacles

Yang YUAN, Yimin DENG, Sida LUO, Haibin DUAN

DOI: 10.1631/FITEE.2100559 Downloaded: 5833 Clicked: 1893 Cited: 0 Commented: 0(p.1020-1031) <Full Text>   <PPT>  283

Chinese summary   <27>  具有外(wài)部幹擾和障礙物(wù)的無人機編隊分(fēn)布式博弈策略

袁洋1,鄧亦敏1,羅斯達2,段海濱1,3
1北(běi)京航空航天大(dà)學自動化科學與電氣工(gōng)程學院虛拟現實技術與系統國家重點實驗室,中(zhōng)國北(běi)京市,100083
2北(běi)京航空航天大(dà)學機械工(gōng)程及自動化學院,中(zhōng)國北(běi)京市,100191
3鵬城實驗室,中(zhōng)國深圳市,518000
摘要:本文研究了具有外(wài)部幹擾和障礙物(wù)的無人機編隊分(fēn)布式博弈策略,該策略基于分(fēn)布式模型預測控制(MPC)框架和基于Levy飛行的鴿群優化算法(LFPIO)。首先,提出一(yī)種非奇異快速終端滑模觀測器(NFTSMO)估計無人機受擾動的影響,并利用Lyapunov函數證明該觀測器在固定時間内收斂。其次,設計一(yī)種基于拓撲重構的避障策略,使無人機能夠以較小(xiǎo)能量消耗安全通過障礙物(wù)。然後,建立一(yī)個分(fēn)布式MPC框架,該框架中(zhōng)每架無人機僅與鄰居交換消息,通過設計分(fēn)布式MPC代價函數,将無人機編隊問題轉化爲博弈問題,并利用基于Levy飛行的鴿群優化算法求解納什均衡。最後,利用數值仿真對比實驗驗證所提策略的有效性。

關鍵詞組:分(fēn)布式博弈策略;無人機;分(fēn)布式模型預測控制;基于Levy飛行的鴿群優化算法;非奇異快速終端滑模觀測器;避障策略

Coach-assisted multi-agent reinforcement learning framework for unexpected crashed agents

Jian ZHAO, Youpeng ZHAO, Weixun WANG, Mingyu YANG, Xunhan HU, Wengang ZHOU, Jianye HAO, Houqiang LI

DOI: 10.1631/FITEE.2100594 Downloaded: 3800 Clicked: 1751 Cited: 0 Commented: 0(p.1032-1042) <Full Text>   <PPT>  290

Chinese summary   <26>  針對意外(wài)崩潰智能體(tǐ)的教練輔助多智能體(tǐ)強化學習框架

趙鑒1,趙有朋1,王維埙2,陽明宇1,胡迅晗1,周文罡1,郝建業2,李厚強1
1中(zhōng)國科學技術大(dà)學信息科學技術學院,中(zhōng)國合肥市,230026
2天津大(dà)學智能與計算學部,中(zhōng)國天津市,300072
摘要:多智能體(tǐ)強化學習在實際場景中(zhōng)很難應用,一(yī)部分(fēn)原因在于模拟環境和現實環境之間存在差距。造成這種差距的一(yī)個原因是,模拟系統總是假設智能體(tǐ)可以一(yī)直正常工(gōng)作,而實際上,由于不可避免的硬件或軟件故障,一(yī)個或多個智能體(tǐ)可能會在合作過程中(zhōng)意外(wài)“崩潰”。這樣的崩潰會破壞智能體(tǐ)之間的合作,導緻系統性能下(xià)降。本文中(zhōng),我(wǒ)們給出了意外(wài)崩潰情況下(xià)合作多智能體(tǐ)強化學習系統的正式定義。爲增強系統應對崩潰時的魯棒性,提出教練輔助多智能體(tǐ)強化學習框架,其在訓練過程中(zhōng)引入一(yī)個虛拟教練智能體(tǐ),以調整系統的崩潰概率。爲教練智能體(tǐ)設計了3種教練策略和重采樣策略。據我(wǒ)們所知(zhī),這是研究多智能體(tǐ)系統中(zhōng)意外(wài)崩潰情況的首項工(gōng)作。在網格環境和星際争霸微管理任務上的大(dà)量實驗表明,相比固定崩潰概率和課程學習的教練策略,自适應策略更加有效。消融實驗進一(yī)步展現了重采樣策略的有效性。

關鍵詞組:多智能體(tǐ)系統;強化學習;意外(wài)崩潰智能體(tǐ)

Multi-agent differential game based cooperative synchronization control using a data-driven method

Yu SHI, Yongzhao HUA, Jianglong YU, Xiwang DONG, Zhang REN

DOI: 10.1631/FITEE.2200001 Downloaded: 3531 Clicked: 1946 Cited: 0 Commented: 0(p.1043-1056) <Full Text>   <PPT>  305

Chinese summary   <25>  基于多智能體(tǐ)微分(fēn)博弈的數據驅動協同一(yī)緻控制

石宇1,化永朝2,于江龍1,董希旺1,2,任章1
1北(běi)京航空航天大(dà)學自動化科學與電氣工(gōng)程學院,中(zhōng)國北(běi)京市,100191
2北(běi)京航空航天大(dà)學人工(gōng)智能研究院,中(zhōng)國北(běi)京市,100191
摘要:本文研究了多智能體(tǐ)微分(fēn)博弈問題及其在協同一(yī)緻控制中(zhōng)的應用。提出系統化的多智能體(tǐ)微分(fēn)博弈構建和分(fēn)析方法,同時給出一(yī)種基于強化學習技術的數據驅動方法。首先論證了由于網絡交互的耦合特性,典型的分(fēn)布式控制器無法充分(fēn)保證微分(fēn)博弈的全局納什均衡。其次通過定義最優對策的概念,将問題分(fēn)解爲局部微分(fēn)博弈問題,并給出局部納什均衡解。構造了一(yī)種無需系統模型信息的離(lí)軌策略強化學習算法,利用在線鄰居交互數據對控制器進行優化更新,并證明控制器的穩定性和魯棒性。進一(yī)步提出一(yī)種基于改進耦合指标函數的微分(fēn)博弈模型及其等效的強化學習求解方法。與現有研究相比,該模型解決了多智能體(tǐ)所需信息的耦合問題,并實現分(fēn)布式框架下(xià)全局納什均衡和穩定控制。構造了與此納什解對應的等價并行強化學習方法。最後,仿真結果驗證了學習過程的有效性和一(yī)緻控制的穩定性。

關鍵詞組:多智能體(tǐ)系統;微分(fēn)博弈;一(yī)緻控制;數據驅動;強化學習

Finite-time leader-follower consensus of a discrete-time system via sliding mode control

Ruizhuo SONG, Shi XING, Zhen XU

DOI: 10.1631/FITEE.2100565 Downloaded: 2206 Clicked: 1834 Cited: 0 Commented: 0(p.1057-1068) <Full Text>   <PPT>  309

Chinese summary   <26>  基于離(lí)散系統滑模控制的有限時間領導-跟随一(yī)緻性

宋睿卓1,2,邢适1,2,許鎮3
1北(běi)京科技大(dà)學自動化學院,中(zhōng)國北(běi)京市,100083
2北(běi)京市工(gōng)業波譜成像工(gōng)程技術研究中(zhōng)心,中(zhōng)國北(běi)京市,100083
3北(běi)京科技大(dà)學土木與資(zī)源工(gōng)程學院,城鎮化與城市安全研究院,中(zhōng)國北(běi)京市,100083
摘要:研究了離(lí)散時間二階多智能體(tǐ)系統在外(wài)部幹擾約束下(xià)的有限時間領導-跟随一(yī)緻性問題。首先利用自适應滑模控制理論,設計了一(yī)種新的有限時間一(yī)緻性方案。自适應控制律是在傳統滑模趨近律基礎上改進設計的,其優點是減少抖振并保持對幹擾的不變性。此外(wài),通過給出一(yī)個離(lí)散李雅普諾夫函數,證明了離(lí)散時間二階多智能體(tǐ)系統的有限時間穩定性。最後,數值模拟結果驗證了理論分(fēn)析的有效性。

關鍵詞組:有限時間;領導-跟随一(yī)緻性;自适應滑模控制;多智能體(tǐ)系統

Cooperative planning of multi-agent systems based on task-oriented knowledge fusion with graph neural networks

Hanqi DAI, Weining LU, Xianglong LI, Jun YANG, Deshan MENG, Yanze LIU, Bin LIANG

DOI: 10.1631/FITEE.2100597 Downloaded: 2107 Clicked: 1755 Cited: 0 Commented: 0(p.1069-1076) <Full Text>

Chinese summary   <28>  基于融合任務信息圖神經網絡的多智能體(tǐ)系統協同規劃

戴漢奇1,2,蘆維甯2,李祥隆3,楊君1,孟德山4,劉衍澤5,梁斌1
1清華大(dà)學自動化系,中(zhōng)國北(běi)京市,100084
2清華大(dà)學北(běi)京信息科學與技術國家研究中(zhōng)心,中(zhōng)國北(běi)京市,100084
3天津大(dà)學科學技術發展研究院,中(zhōng)國天津市,300350
4中(zhōng)山大(dà)學航空航天學院,中(zhōng)國深圳市,518107
5諾丁漢大(dà)學電氣與電子工(gōng)程系,中(zhōng)國甯波市,315154
摘要:協同規劃是多智能體(tǐ)系統博弈領域的關鍵問題之一(yī)。本文聚焦每個智能體(tǐ)隻有一(yī)個局部觀測範圍和局部通信情況下(xià)的協作規劃。提出一(yī)種新型協同規劃框架,該框架将圖神經網絡與融合任務信息采樣方法相結合。本文的兩個主要貢獻是基于與前期工(gōng)作的比較:(1)使用圖采樣與聚合方法(GraphSAGE)實現動态近鄰智能體(tǐ)信息融合,這是該方法首次用于處理協同規劃問題;(2)提出一(yī)種面向任務的采樣方法,從特定方向聚合知(zhī)識,使所提模型獲得高效、穩定的訓練過程。實驗結果證明了所提方法的有效性。

關鍵詞組:多智能體(tǐ)系統;協同規劃;圖采樣與聚合(GraphSAGE);融合任務信息

Regular Papers

Review Article: Light field imaging for computer vision: a survey

Chen JIA, Fan SHI, Meng ZHAO, Shengyong CHEN

DOI: 10.1631/FITEE.2100180 Downloaded: 4415 Clicked: 2861 Cited: 0 Commented: 0(p.1077-1097) <Full Text>   <PPT>  292

Chinese summary   <26>  用于計算機視覺任務的光場成像技術綜述

賈晨1,2,石凡1,2,趙萌1,2,陳勝勇1,2
1天津理工(gōng)大(dà)學學習型智能系統教育部工(gōng)程研究中(zhōng)心,中(zhōng)國天津市,300384
2天津理工(gōng)大(dà)學計算機視覺與系統教育部重點實驗室,中(zhōng)國天津市,300384
摘要:光場成像因其解決計算機視覺問題的能力而備受關注。本文首先簡要回顧了近年來計算機視覺的研究進展。對于影響計算機視覺發展的大(dà)多數因素來說,視覺信息獲取的豐富性和準确性起着決定性作用。光場成像技術利用照相機或微透鏡陣列記錄光線位置和方向信息,獲取完整三維場景信息,爲計算機視覺研究做出巨大(dà)貢獻。光場成像提高了深度估計以及圖像分(fēn)割、融合和三維重建的精度。光場成像還被創新地應用于虹膜和人臉識别、材料和虛假行人識别、極平面圖像采集和形狀恢複以及光場顯微鏡。我(wǒ)們進一(yī)步總結了光場成像技術在計算機視覺研究中(zhōng)存在的問題和發展趨勢,如光場數據集的建立和評估、在高動态範圍條件下(xià)的應用、光場增強和虛拟現實。光場成像在各種研究中(zhōng)取得巨大(dà)成功。在過去(qù)25年,超過180篇文獻報道了光場成像在解決計算機視覺問題上的能力。我(wǒ)們梳理了這些文獻,使研究人員(yuán)更容易搜索有關解決方案的詳細方法。

關鍵詞組:光場成像;相機陣列;微透鏡陣列;極平面圖像;計算機視覺

Enhanced solution to the surface–volume–surface EFIE for arbitrary metal–dielectric composite objects

Han WANG, Mingjie PANG, Hai LIN

DOI: 10.1631/FITEE.2100387 Downloaded: 3727 Clicked: 2592 Cited: 0 Commented: 0(p.1098-1109) <Full Text>   <PPT>  292

Chinese summary   <25>  任意金屬–介電混合體(tǐ)面體(tǐ)面電場積分(fēn)方程(SVS-EFIE)的增強解

王涵,龐銘傑,林海
浙江大(dà)學計算機輔助設計與圖形學國家重點實驗室,中(zhōng)國杭州市,310027
摘要:利用矩量法求解面體(tǐ)面電場積分(fēn)方程(SVS-EFIE),公式複雜(zá),實現困難,算法複雜(zá)度高。本文提出求解任意金屬–介電混合體(tǐ)電磁散射問題的通用矩陣方程(GME),并給出該方程的增強解。矩量法隻考慮包含3個區域的金屬–介電混合體(tǐ),且SVS-EFIE的兩步過程導緻兩個積分(fēn)符号,難以實現且算法複雜(zá)度高。爲解決該問題,本文首次提出能夠用于分(fēn)析均勻介質體(tǐ)和超過3個區域金屬–介電混合體(tǐ)的GME方法。提出基于耦合度和子區域間距相關的GME加速求解策略,并自适應設置耦合度标準以平衡精度和效率。将變形後的加法定理用于強耦合情況,将叠代法用于弱耦合情況。并行性可以方便地應用于該增強解。數值結果表明,與直接解相比,該方法平均隻需11.6%的内存和11.8%的中(zhōng)央處理器時間。

關鍵詞組:混合體(tǐ);積分(fēn)方程;矩量法;加法定理;叠代

Cellular automata based multi-bit stuck-at fault diagnosis for resistive memory

Sutapa SARKAR, Biplab Kumar SIKDAR, Mousumi SAHA

DOI: 10.1631/FITEE.2100255 Downloaded: 3226 Clicked: 3679 Cited: 0 Commented: 0(p.1110-1126) <Full Text>   <PPT>  266

Chinese summary   <23>  基于元胞自動機的電阻存儲器多比特固定型故障診斷

Sutapa SARKAR1, Biplab Kumar SIKDAR2, Mousumi SAHA3
1Seacom工(gōng)程學院電子與通信工(gōng)程系,印度西孟加拉邦豪拉市,711302
2印度工(gōng)程科學與技術學院計算機科學與技術系,印度西孟加拉邦豪拉市,711303
3國立技術學院計算機科學與工(gōng)程系,印度西孟加拉邦杜爾加普爾,713209
摘要:本文提出一(yī)種用于可變電阻式存儲器(ReRAM)、基于組的動态固定型故障診斷方案。傳統的靜态随機存取存儲器、動态随機存取存儲器、NAND和NOR閃存受可擴展性、功率、封裝密度等限制。可變電阻式存儲器這類下(xià)一(yī)代存儲器被認爲具有多種優勢,如高封裝密度、非易失性、可擴展性和低功耗,但單元可靠性一(yī)直是個問題。不可靠的内存操作是由于大(dà)量使用寫入或内存密集型工(gōng)作負載而導緻的永久性固定型故障。越來越多的固定型故障也限制了芯片壽命。因此,本文提出一(yī)種基于元胞自動機(CA)的動态消除固定型故障設計,以解決不可靠的電池功能和不穩定的電池壽命問題。引入可擴展的塊級故障診斷和恢複方案,以确保在出現多比特固定型故障情形下(xià)仍可讀取數據。該方案是一(yī)種新穎方法,因其目标是消除一(yī)般故障條件下(xià)對固定型故障的數量和性質的限制。所提方案基于Wolfram零邊界和周期性邊界CA理論。引入多種特殊類别CA--單長循環單吸引子元胞自動機(SACA)、單長循環雙吸引子元胞自動機(TACA)和單長循環多吸引子元胞自動機(MACA)--以實現完全容錯。目标微架構單元設計具有最佳空間開(kāi)銷。

關鍵詞組:電阻存儲器;電池可靠性;塊級故障診斷;單長循環單吸引子元胞自動機;單長循環雙吸引子元胞自動機;單長循環多吸引子元胞自動機

Efficient decoding self-attention for end-to-end speech synthesis

Wei ZHAO, Li XU

DOI: 10.1631/FITEE.2100501 Downloaded: 2636 Clicked: 2095 Cited: 0 Commented: 2(p.1127-1138) <Full Text>   <PPT>  266

Chinese summary   <28>  一(yī)種端到端語音合成中(zhōng)的高效解碼自注意力網絡

趙偉1,2,許力1,2
1浙江大(dà)學電氣工(gōng)程學院,中(zhōng)國杭州市,310027
2浙江大(dà)學機器人研究院,中(zhōng)國餘姚市,315400
摘要:自注意力網絡由于其并行結構和強大(dà)的序列建模能力,被廣泛應用于語音合成(TTS)領域。然而,當使用自回歸解碼方法進行端到端語音合成時,由于序列長度的二次複雜(zá)性,其推理速度相對較慢(màn)。當部署設備未配備圖形處理器(GPU)時,該效率問題更加嚴重。爲解決該問題,提出一(yī)種高效解碼自注意力網絡(EDSA)作爲替代。通過一(yī)個動态規劃解碼過程,有效加速TTS模型推理,使其具有線性計算複雜(zá)度。基于普通話(huà)和英文數據集的實驗結果表明,所提EDSA模型在中(zhōng)央處理器(CPU)和GPU上的推理速度分(fēn)别提高720%和50%,而性能幾乎相同。因此,在GPU資(zī)源有限的情況下(xià),該方法可使此類模型的部署更加容易。此外(wài),所提模型在域外(wài)語言處理上可能比基線Transformer TTS性能更好。

關鍵詞組:高效解碼;端到端;自注意力網絡;語音合成

Journal of Zhejiang University-SCIENCE, 38 Zheda Road, Hangzhou 310027, China
Tel: +86-571-87952783; E-mail: cjzhang@zju.edu.cn
Copyright © 2000 - 2024 Journal of Zhejiang University-SCIENCE