當(dāng)前位置: 首頁 » 行業(yè)資訊 » 機器人»經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進了？

經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進了？

發(fā)布日期：2017-05-24 來源：雷鋒網(wǎng) 瀏覽次數(shù)：593

核心提示：　　烏鎮(zhèn)圍棋峰會第一局曾經(jīng)停止了，用時4個半小時，以柯潔九段執(zhí)黑負于 AlphaGo，AlphaGo 贏四分之一子了結(jié)，如許河清海晏的成果想必許多人都猜測到了，不外年夜家從一開端就曉得存眷的重點，不在于柯潔怎樣輸?shù)模?/div>

　　烏鎮(zhèn)圍棋峰會第一局曾經(jīng)停止了，用時4個半小時，以柯潔九段執(zhí)黑負于 AlphaGo，AlphaGo 贏四分之一子了結(jié)，如許河清海晏的成果想必許多人都猜測到了，不外年夜家從一開端就曉得存眷的重點，不在于柯潔怎樣輸?shù)模茿lphaGo曾經(jīng)退化到甚么水平了，間隔Deep Mind團隊出論文來詳解AlphaGo有多強還有一段時光，So我們其實可以從現(xiàn)場不雅戰(zhàn)中來看出一些眉目。

　　棋速

　　第一局棋下到一半的時刻，很多棋友群里的人沸騰了，發(fā)明AlphaGo落子速度異?？?，每步棋落子速度在30S－40S之間動搖，對此圍棋專業(yè)5段趙先生表現(xiàn)：“（這局棋）像安泰逝世，不知不覺就輸了，（比擬客歲）機械落子飛快但毛病根本沒有”。

　　綜合整局，AlphaGo落子表示沉著、武斷，而柯潔的落子狀態(tài)較多變。終究在競賽停止了四個多小時以后，AlphaGo贏四分之一子。

　　棋風(fēng)

　　AlphaGo1.0的時刻（客歲3月跟李世石對戰(zhàn)的時刻），它的棋風(fēng)歸納綜合起來就是善于記住棋譜+加強進修+盤算才能，身上還能看到人類棋風(fēng)的影子，等AlphaGo喬裝成Master60連勝的時刻，很多圍棋年夜師包含聶衛(wèi)平在內(nèi)開端評價其棋風(fēng)“很難忖度Master的作風(fēng)……它永久都沒有臉色，永久不受情感影響，永久一個節(jié)拍，就是要贏你。”而明天，第一局棋還沒停止的時刻，搜狗王小川已在知乎上發(fā)文分析AlphaGo2.0 棋風(fēng)“完整離開人類經(jīng)歷”——“而AlphaGo2.0離開了機械對人模擬，走棋作風(fēng)也將完整離開人的定式。在與柯潔的競賽中，會賡續(xù)涌現(xiàn)我們意想不到的走棋，并且這些走棋在教科書中會被以為是初級毛病或許完整弗成理喻，凡是一個正常的棋手都不會這么玩，凡是一個老手這么玩都邑被點撥如許紕謬。而AlphaGo2.0會賡續(xù)制作如許的局勢，癥結(jié)他照樣對的。”

　　不外最初照樣柯潔說了算，他在會后的采訪頂用了一個很好的例子解釋了AlphaGo的棋風(fēng)莫測：（在回想競賽時也對第54手的斷）時，他表現(xiàn)了確定：“很震動，這在人類的下法中是不克不及有的。在斷以后，它把本身的腳步實地化，變得更厚，一舉兩得。”。

　　算法

　　AlphaGo1.0的時刻（客歲3月跟李世石對戰(zhàn)的時刻）應(yīng)用的算法精華，依據(jù)FB田淵棟看完Nature論文的解讀，由估值收集評價棋局，戰(zhàn)略收集選擇落子，疾速走子（Fast rollout）恰當(dāng)加快，再用蒙特卡羅樹搜刮把以上這三個部門連起來，構(gòu)成一個完全的體系。

　　這一次固然知乎服裝論壇t.vhao.net等活潑地皮曾經(jīng)開端紛紜推想此次的AlphaGo2.0用了甚么牛叉的算法，有了硬件的猜測掉誤，本相照樣等Deep Mind前面來親身頒布，目測算法猜測這個要依據(jù)它的單機版10個GPU＋TPU助力猜測比擬靠譜。

　　硬件需求下降

　　依據(jù)DeepMind員工揭橥在2016年1月Nature期刊的論文，散布式版本（AlphaGo Distributed）應(yīng)用了1202個CPU和176個GPU。

　　不外此次競賽AlphaGo用的何種硬件設(shè)置裝備擺設(shè)，DeepMind在會后的消息宣布會中表現(xiàn)，此次競賽的AlphaGo是新版本，它改良了新的算法，重要提高是盤算量少了十倍，自我棋戰(zhàn)更強。Hassabis稱，在競賽中法式是在一個單一的機械上運作的，這與客歲紛歧樣，其時是散布式的。此次有更壯大的算法，運作起來更簡略也更好，取得的速度更快。別的Hassabis表現(xiàn)，盤算力可以“在Google云中取得，用的是TPU，十個處置單元，少了十倍的盤算量”。簡略點說，此次的AlphaGo是單機版。

　　迭代速度

　　哈薩比在此鏈接中的劍橋年夜學(xué)的一次演講中提到，之前從零練習(xí)一個AlphaGo要三個月，如今只須要一個禮拜（“We also optimized the performance. It used to take 3 month to train a new version of AlphaGo from scratch. Now we can do it in one week.”）。

　　假如稱對戰(zhàn)李世石時代的版本為V18迭代版本，喬裝成Master60連勝并宣告進級完成的時辰為V25版本，如今的AlphaGo又是V若干版本，練習(xí)的時刻會不會一周都不要了？這是我們今天要親身問DeepMind團隊的。

　　從單人對戰(zhàn)到團隊對戰(zhàn)

　　心細的同伙確定留意到了，柯潔和AlphaGo棋戰(zhàn)以外，5月26號上午還有一場配對賽，配對賽兩邊－－－古力＋AlphaGoV連笑＋AlphaGo，即棋戰(zhàn)兩邊分離由一名棋手與AlphaGo構(gòu)成，棋手與AlphaGo協(xié)作停止競賽。5月26號上午下晝則是陳耀華，周睿羊，羋昱延，時越，唐韋星和AlphaGo的5對1團隊賽。

　　Google之所以敢如許設(shè)置賽制，獨一的說明就是，AlphaGo如今既懂人類下圍棋的那部門，又懂AI下圍棋的那部門，并可以做到融合貫穿，所以它才敢挑釁配對賽這類跟另外一個錯誤高度合營的賽制，又敢挑釁測試本身“戰(zhàn)役力”極限的集團賽。AI最恐怖的部門不是它單個力氣有多強，而是它開端理解和方圓“互動”，如許的融匯是否是比客歲3月的人機年夜戰(zhàn)恐怖多了呢？

　　小結(jié)：

　　前次AlphaGo喬裝成Master測試的時刻，柯潔曾經(jīng)落敗給Master過一次，他不是沒見識過AI圍棋的兇猛，但聯(lián)合柯潔明天在現(xiàn)場的沉著表示，和他昨晚莫明其妙地深夜感嘆，我們有來由信任，這不是一場比AI圍棋選手和人類圍棋選手哪一個更兇猛的選手，DeepMind團隊必定有些懸而未決的謎底須要這場競賽給一個確定的驗證，然后再往誰人偏向完成更深一步的摸索。

下一篇：大數(shù)據(jù)產(chǎn)業(yè)前景廣闊未來三年年均復(fù)合增長率將達30%左右
上一篇：《中華人民共和國衛(wèi)星導(dǎo)航條例》已被列入立法工作計劃

[ 行業(yè)資訊搜索 ] [ 加入收藏 ] [ 告訴好友 ] [ 打印本文 ] [ 關(guān)閉窗口 ]

同類行業(yè)資訊

共0條 [查看全部] 相關(guān)評論

展會更多+

第26屆上海國際清	2025數(shù)控機床與金
2025中國(上海)機	2025武漢國際工業(yè)

視頻更多+

中舟智能固守科技	玉灃科技：精研滑
新松機器人自動化	羅克韋爾自動化（

亞洲自動化與機器人網(wǎng) - 版權(quán)所有

• 深圳加速落地全國首個“機器人街區(qū)”	• 人形機器人格斗賽，從擂臺看未來！
• 人形機器人“加速跑” 規(guī)模化應(yīng)用亟需實現(xiàn)“三	• 特斯拉Optimus量產(chǎn)啟幕：人形機器人賽道迎來全
• 技術(shù)突破仍是人形機器人量產(chǎn)的關(guān)鍵	• 重磅！騰訊華為同日入局人形機器人，巨頭加速布
• 資本與技術(shù)雙輪驅(qū)動：人形機器人產(chǎn)業(yè)發(fā)展按下快	• 完成數(shù)億元A輪融資！山東未來機器人獲產(chǎn)業(yè)資本
• 科創(chuàng)板企業(yè)推動機器人技術(shù)突破	• 機器人：外骨骼式無源可穿戴下肢助行器在醫(yī)療復(fù)

伊人av超碰久久久麻豆_国产精品一二_欧洲亚洲视频_最新日韩av网址_欧美在线网站_日韩一区二区在线观看视频

我的供應(yīng)

我的求購

商鋪管理

工業(yè)機器人及行業(yè)應(yīng)用

智能機器人

工業(yè)自動化

智能裝備

經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進了？

伊人av超碰久久久麻豆_国产精品一二_欧洲亚洲视频_最新日韩av网址_欧美在线网站_日韩一区二区在线观看视频

我的供應(yīng)

我的求購

商鋪管理

工業(yè)機器人及行業(yè)應(yīng)用

智能機器人

工業(yè)自動化

智能裝備

經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進了？

經(jīng)過一年的修煉，AlphaGo的哪些能力突飛猛進了？