人工神經(jīng)網(wǎng)絡和人機博弈ppt課件
《人工神經(jīng)網(wǎng)絡和人機博弈ppt課件》由會員分享,可在線閱讀,更多相關《人工神經(jīng)網(wǎng)絡和人機博弈ppt課件(21頁珍藏版)》請在裝配圖網(wǎng)上搜索。
人工神經(jīng)網(wǎng)絡與人機博弈,總目錄,生物學的神經(jīng)網(wǎng)絡,動物的大腦結構 分為灰色的外層和白色的內層?;疑珜又挥袔缀撩缀?,其中緊密地壓縮著幾十億個被稱作神經(jīng)元的微小細胞。白色層在皮層灰質的下面,占據(jù)了皮層的大部分空間,是由神經(jīng)細胞相互之間的無數(shù)連接組成。皮層象核桃一樣起皺,這可以把一個很大的表面區(qū)域塞進到一個較小的空間里。這與光滑的皮層相比能容納更多的神經(jīng)細胞。 人的大腦大約含有1OG (即100億)個這樣的微 小處理單元,生物學的神經(jīng)網(wǎng)絡,神經(jīng)細胞 神經(jīng)細胞都長著一根像電線一樣的稱為軸突(axon)的東西,它的長度有時伸展到幾厘米,用來將信號傳遞給其他的神經(jīng)細胞。它由一個細胞體、一些樹突、和一根可以很長的軸突組成。 神經(jīng)細胞利用電-化學過程交換信號。輸入信號來自另一些神經(jīng)細胞。這些神經(jīng)細胞的軸突末梢和本神經(jīng)細胞的樹突相遇形成突觸,信號就從樹突上的突觸進入本細胞。大腦的神經(jīng)細胞只有兩種狀態(tài):興奮和不興奮。發(fā)射信號的強度不變,變化的僅僅是頻率。神經(jīng)細胞把所有從樹突上突觸進來的信號進行相加,如果全部信號的總和超過某個閥值,就會激發(fā)神經(jīng)細胞進入興奮狀態(tài),這時就會有一個電信號通過軸突發(fā)送出去給其他神經(jīng)細 胞。,神經(jīng)網(wǎng)絡特點,能實現(xiàn)無監(jiān)督的學習—不存在導師,網(wǎng)絡根據(jù)外部數(shù)據(jù)的統(tǒng)計規(guī)律來調節(jié)系統(tǒng)參數(shù),以使網(wǎng)絡輸出能反映數(shù)據(jù)的某種特性。 對損傷有冗余性 —大腦即使有很大一部分受到了損傷,它仍然能夠執(zhí)行復雜的工作。 處理信息的效率極高—神經(jīng)細胞采用了并行的工作方式,使得大腦能夠同時處理大量的數(shù)據(jù)。 善于歸納推廣 —極擅長的事情之一就是模式識別,并能根據(jù)已熟悉信息進行歸納推廣 。 它是有意識的—這個在人工神經(jīng)網(wǎng)絡中不予討論。,人工神經(jīng)網(wǎng)絡,模擬大腦的人工神經(jīng)網(wǎng)絡ANN是由許多叫做人工神經(jīng)細胞(也稱人工神經(jīng)原,或人工神經(jīng)元)的細小結構模塊組成。人工神經(jīng)細胞就像真實神經(jīng)細胞的一個簡化版,但采用了電子方式來模擬實現(xiàn)。 一個人工神經(jīng)細胞可以有任意n個輸入,n代表總數(shù)??梢杂孟旅娴臄?shù)學表達式來代表所有n個輸入: x1, x2, x3, x4, x5, ., xn 同樣 n 個權重可表達為: w1, w2, w3, w4, w5 ., wn 那么激勵值就是所有輸入與它們對應權重的之乘積之總和。,如下圖,網(wǎng)絡的每一層神經(jīng)細胞的輸出都向前饋送到了它們的下一層,直到獲得整個網(wǎng)絡的輸出為止。這一種類型的神經(jīng)網(wǎng)絡就叫前饋網(wǎng)絡。 網(wǎng)絡共有三層(輸入層不是神經(jīng)細胞,神經(jīng)細胞只有兩層)。輸入層中的每個輸入都饋送到了隱藏層,作為該層每一個神經(jīng)細胞的輸入;然后,從隱藏層的每個神經(jīng)細胞的輸出都連到了它下一層(即輸出層)的每一個神經(jīng)細胞。圖中僅僅畫了一個隱藏層,作為前饋網(wǎng)絡,一般地可以有任意多個隱藏層。,人工神經(jīng)網(wǎng)絡,神經(jīng)網(wǎng)絡的人機博弈應用,人機博弈的重要事件,1988年,“深思”擊敗丹麥特級大師拉爾森 1989年,每秒思考速度達200萬步的“深思” 0 比2不敵卡斯帕羅夫 1993年,“深思”二代擊敗了丹麥國家隊,在與前女子世界冠軍小波爾加的對抗中獲勝 1996年,性能高于“深思”數(shù)百倍的“深藍” 以2比4負于卡斯帕羅夫 1997年,“更深的藍” 以3.5比2.5擊敗了卡斯帕羅夫 2001年,一家德國公司開發(fā)的國際象棋軟件“更弗里茨”擊敗了除克拉姆尼克之外的所有排名世界前十位的棋手 2002年10月,“更弗里茨”與克拉姆尼克在巴林進行“人機大戰(zhàn)”,雙方以4比4戰(zhàn)平 2003年1至2月 由兩位以色列電腦專家研究出的“更年少者”與卡斯帕羅夫對弈,雙方3比3戰(zhàn)平。,1997年卡斯帕羅夫與深藍2的人機大戰(zhàn),2003年卡斯帕羅夫與更年少者的人機大戰(zhàn),神經(jīng)網(wǎng)絡的人機博弈應用,Gerald Tesauro 的西洋雙六棋 西洋雙陸棋是西方一種狀態(tài)空間比較大的棋類游戲。1992年,IBM的工程師Gerald Tesauro利用人工神經(jīng)網(wǎng)絡,編寫出一款雙六棋程序TD-Gammon。在本例中使用的神經(jīng)網(wǎng)絡包含198 個輸入節(jié)點、 80個隱含節(jié)點和1 個輸出節(jié)點。其中輸入節(jié)點輸入的是棋盤的局面特征,輸出的是對棋盤的評估值。,,有興趣的可以參考,五子棋 在本例中用這種方法的五子棋程序采用BP 神經(jīng)網(wǎng)絡來求評估值,網(wǎng)絡即為局面評估函數(shù) f 。它有56個輸入節(jié)點,28 個隱含節(jié)點和2 個輸出節(jié)點。,輸入節(jié)點中有28 個代表計算機局面的特征,另 28 個代表對手局面的特征。2 個輸出節(jié)點分別是對計算機棋手局面與對手局面的評估, 兩個值相減得到對局面的評估值。,莫建文等. 基于TD強化學習智能博弈程序的設計與實現(xiàn)[J]. 計算機應用,2004,24(6):287-288,有興趣的可以參考,小實驗:井字過三關,介紹: 即課本第一章習題1.5中提到的tic-tac-toe。兩個玩家,一個打圈(O),一個打叉(X),輪流在3乘3的格上打自己的符號,最先以橫、直、斜連成一線則為勝。先下玩家有優(yōu)勢,雙方無失誤,將是和局。,一個空白的棋盤,一場游戲的過程,原理概述 設計由九個感知器組成的單層人工神經(jīng)網(wǎng)絡 輸入:將棋局分布用九位的二進制數(shù)表示,每一位作為一個輸入。 對方 用 -1 表示;己方 用 1 表示;空白格用 0 表示。 例子:1 -1 -1 0 1 0 1 0 -1 輸出:應該落子的位置輸出為1 其余位置輸出為0,,部分輸入向量,對應的目標輸出值,部分訓練樣例,實驗利用Matlab中的神經(jīng)網(wǎng)絡工具箱來進行,將輸入向量和目標輸出分別保存為p_1和t_1兩個文件,建立神經(jīng)網(wǎng)絡進行訓練。學習速率取0.05,訓練次數(shù)定為1000次。,訓練結果 經(jīng)過訓練,對部分棋局能作出正確判斷,但有時也會出現(xiàn)不正確的結果。,成功的例子,失敗的例子,網(wǎng)絡過于簡單?,,,,,,進一步的改進,利用多層前饋網(wǎng)絡,http://homepages.cae.wisc.edu/~ece539/project/f01/index.html,有興趣的可以參考,程序演示,謝謝,- 配套講稿:
如PPT文件的首頁顯示word圖標,表示該PPT已包含配套word講稿。雙擊word圖標可打開word文檔。
- 特殊限制:
部分文檔作品中含有的國旗、國徽等圖片,僅作為作品整體效果示例展示,禁止商用。設計者僅對作品中獨創(chuàng)性部分享有著作權。
- 關 鍵 詞:
- 人工 神經(jīng)網(wǎng)絡 人機 博弈 ppt 課件
裝配圖網(wǎng)所有資源均是用戶自行上傳分享,僅供網(wǎng)友學習交流,未經(jīng)上傳用戶書面授權,請勿作他用。
鏈接地址:http://www.szxfmmzy.com/p-1569423.html