盤算機模擬機器人世界盃足球錦標賽攻防戰術的鑽研

才智咖人氣：2.87W

【摘要】隨著盤算機技巧的發展，散播式人工智慧中多智慧體系統 (MAS Multi-agent System)的理論及利用鑽研已經成為人工智慧鑽研的熱門，RoboCup（Robot World Cup），即機器人世界盃足球錦標賽，是一個在非同步，有噪聲的對抗環境下，鑽研多智慧體的決策和合作的問題。本文詳細介紹了盤算機模擬足球機器人比賽中進攻和防守的設計與實現。

【要害詞】進攻;組織性;正確 ;快速;防守;機動性

RoboCup（Robot World Cup），即機器人世界盃足球錦標賽。它是國際上一項為進步相干領域的教導和鑽研程度而舉辦的大型比賽和學術運動，通過供給一個標準任務來增進散播式人工智慧、智慧機器人技巧、及其相干領域的鑽研與發展。訓練和製作機器人進行足球賽，是當前人工智慧和機器人領域的鑽研熱門之一。在比賽中，當斷定了球隊的陣型後，每個隊員分配了相應的角色，起頭討論球隊的整體和區域性攻防戰術。

全隊進攻戰術

全隊進攻戰術是指比賽中一方獲得球后，通過隊員之間的傳遞配合達到射門的目標而採納的配合法子。與區域性進攻戰術相對比，全隊進攻戰術的進攻面對比廣，參加進攻和快速回擊等。首要有邊路進攻，中路進攻，快速回擊等。

1、邊路進攻：利用球場兩側地區發起進攻的法子叫做邊路進攻。邊路進攻是全隊進攻戰術的首要情勢之一，其首要特性是有利於施展進攻速度，打破對方防線製作缺口。

2、中路進攻：中路進攻是利用球場中間區域組織的進攻，這種進攻雖然能直接射門，但難度最大，因為中路防守最為縝密，突前的攻擊手必須是反應極其敏銳，意識強而且技巧高，敢於冒險，速度快和氣於路位策應的隊員。

3、快速回擊：比賽中當攻方進攻時，後衛線往往壓至中場左近，防守人數也由於插上進攻和助攻而相對減少，此時抓住對方防區空隙對比大和回防較慢的時機，趁其失球發動快速回擊，往往能取得良好的效果，快速回擊是最有要挾的進攻手法，有效發動快速回擊。能有效得分，但其有必然的冒險性。所以要控制正確快速的原則。配合要有組織性，要非常有默契，需要多次練習。否則很難在比賽中實行。

全隊防守戰術

防守戰術可分為兩種根基型別：盯人緊逼防守（人盯人防守），即在規定的領域內盯人緊逼，不交換看守：區域緊逼防守（盯人和區域相聯合），即現今風行的綜合防守，緊逼和保護相聯合，在個人的防區內緊逼，作交替看守。盯人防守即各自都有明確的防守物件。防守最根本的原則是緊逼和保護。只有緊逼才幹有效地主動斷搶，壓抑對方技巧的優勢而獲得主動權：保護是為了更好地緊逼和把持空檔，為博得比賽籌辦機會。防守可以被解釋成一個安排的事件。在清華設計地隊伍中它是應用一個型別，基於情況的策略安排理論。安排最首要的一點是在根基的編隊中，哪個斷定一個隊員的地位通過標準的角色分配，球的地位和球的把持狀態。在這個防守問題上，根基的資訊供給作為一個標準，命名的，一個雷同的角色，因為角色分配和任務評價。另外一個首要的事實是在防守的地位機動性，這個測量多麼危險，如果一個對手站在給定的地位。防守地位機動性因為任意的點在球場上的是先前已經知道在所有的.隊友中間。

四種類型的防守動作：

1、lock(陰礙 )：交叉一個對手的佔領這個球在我們球門的外圍，禁止他向前推動。

2、Press(壓力)：跑，在一個對手佔領這個球，並且在我們球門的左近，維持對他有要挾
3、Mark(盯人)：盯住一個沒有球的對手，因此他的隊友不可以傳球給他
4、Point Defend(地位防禦)：站在根基的資訊地位，這個將有利益，當一個左近的隊友在1vs1中失敗了，或者當這個隊重新奪回了球的把持權。

為了簡化這個問題，我們設定一個規矩，一個防守隊員不可以防守兩個對手在雷同的光陰裡面，還有兩個防守隊友不該當防守雷同的對手。這個互斥的操作被供給在雷同的這些情況下。這個衝突的操作沒有在這裡應用。那裡有一個二中擇一，就是block和press被設定成衝突，替代了互斥，供給一個不同的防守策略。因此另外一個也是可以的，我們不再進一步深入討論。在分解一個防守任務到防守每個進攻的物件，和站在根基的資訊點，佈置被產生通過連結每個防守隊員到每個子任務。那時候，這個程式達到一個評價個體的效用。

我們定義了一個評價函式為了每種型別的動作。這些變數被用來每個評價函式的輸入：猛烈，測量光陰間隔從隊員的當前地位到防守地位，背離，測量距離從防守的點到隊員的根基的編隊地位，要挾，也就是這個防守地位機動性對手當前的地位。這個函式輸出增加隨著要挾和減小隨著距離和背離。為了點防守，只有要挾作為輸入。為了獲得每個函式的實際的值，我們設定一些範例的情景，從他們之間摘錄輸入值，然後賦予輸出值到這個函式。這個值被警惕的裝入來維持輕微的變更。在這個法子下，一個輸入和輸出的列表資料就生成了。

在清華設計中，他們應用 BP網路神經去編碼評價函式。這個列表產生被應用作為訓練網路神經的設定。在訓練之後，網路被測試去確保他們適宜在先前的段中請求的，因此評價函式就斷定了，但我們隊伍還在改善中。剩下的企圖到一個標準的程式現在上面和沒有需要更進一步的討論。還留下一個補救企圖的產生。有時候這個隊保持一致失敗了。例如，當一個對手和兩個防守隊員的地位的距離雷同，而且在雷同的光陰裡面。編隊的點。這兩個佈置將有類似的評價，這兩個防守隊員可能衝突。我們的設計利用這個絕對的反饋存在這個系統中。因為球將維持移動在這個比賽中，和對手必須向前移動去進攻，另外這個根基的資訊地位或者防守的點將轉變在下個週期。那裡有一個小小的轉變使得這兩個佈置仍然維持雷同的評價。一旦這兩個佈置不同的時候足夠明顯為兩個防守隊員去分手出來。這個預先防守隊員將履行這個防守動作，更接近的移動到對手。然後另外一個將移動到另外一個方向。因此，這個對照增加，這個系統提取一個狀態分手來自先前的進退兩難的局面。因此又可以完成一致了。

防守演算法的實現

TAGS：世界盃錦標賽模擬攻防盤算