亚洲欧美日韩国产一区二区精品_亚洲国产精品一区二区动图_级婬片A片手机免费播放_亚洲国产成人Av毛片大全,男女爱爱好爽好疼视频免费,中文日韩AV在线,无码视频免费,欧美在线观看成人高清视频,在线播放免费人成毛片,成 人 网 站 在 线 视 频A片 ,亚洲AV成人精品一区二区三区

機(jī)械社區(qū)

 找回密碼
 注冊會員

QQ登錄

只需一步,快速開始

搜索
查看: 4654|回復(fù): 11
打印 上一主題 下一主題

突發(fā)奇想,,如果使用2臺alphaGO主機(jī),,使用同樣的算法和策略,互奕一局,,結(jié)局如何,?

[復(fù)制鏈接]
跳轉(zhuǎn)到指定樓層
1#
發(fā)表于 2016-3-10 18:31:07 | 只看該作者 回帖獎勵 |倒序瀏覽 |閱讀模式
這個是不是有點自相矛盾的味道?,? 但是我對結(jié)果很感興趣
2#
發(fā)表于 2016-3-10 18:42:38 | 只看該作者
這算是“迭代”嗎,,昨天也想到這個了. E% U' h: X  K) j+ B
以后辦圍棋賽,,可以分設(shè)AI組與人類組,

點評

這東西只要勝一次,,以后就會無敵的,,跟人不同,人是有年紀(jì)的,,到一個年紀(jì)會出昏招,,而這東西是學(xué)了所有‘?dāng)≌摺钠遄V,做‘博弈統(tǒng)計’,,用概率跟你玩,你肯定就沒戲了,,如果留下一個高手是‘勝者’,,則可以再撐  發(fā)表于 2016-3-10 18:51
3#
發(fā)表于 2016-3-10 18:42:49 | 只看該作者
勝負(fù)五五開吧
4#
發(fā)表于 2016-3-10 18:46:55 | 只看該作者
早已經(jīng)自我進(jìn)化3000多萬局啦1 z% x* z  ]) w- O& R7 |

9 E$ T  G0 Z0 E* X3 K1 V靠人來比試獲取電腦算法經(jīng)驗值的速度太慢1 I/ n3 c6 o9 W! N( x
5#
發(fā)表于 2016-3-10 18:47:33 | 只看該作者
不會的,依然是一方贏,,并且肯定是一方贏,,毫無疑問,
) X9 t! X6 t* b
* a/ |8 s' m' X: I3 |因為每個系統(tǒng)是一個小組,,其‘策略’是完全不同的,,就是那個‘總策略’的算法與智商水平,決定了誰是贏家,,這家伙假如到賭場,,肯定被‘勸阻’的,跟山本一個級別,,山本就進(jìn)不了賭場,,8 w  a. e- W. r. N5 |
) `9 ^% ^) N- H( S
這個,就跟我玩自動裝配是一個道理,,你裝配車的路徑每個人算法是不同的,,最終效率是不同的,  K1 @2 i: v5 V8 q
. r! u+ z+ E# P) z
古狗其實就是向全世界宣布,,阿拉是‘老大’,,以前是IBM是老大,再后來是洛馬,,' \) B9 ~2 a! c7 ]5 X
! k0 C7 r& ?+ u
洛馬被熊給戲了一次,,丟了大面子,但迅速就找回來了,,依然用170飛,,就是‘挑戰(zhàn)與賭氣’,哈哈,," k) a/ a- C# f/ x/ ^, c
# v7 j3 o+ ]5 J' k8 A
跑速度與航程,,跑不過諾格,,有點‘丟分兒’哈哈,7 ~  G9 n+ _8 s( M% f7 R! E

2 `/ L0 P2 h) n6 H4 Q# ~  x總體說水平,,可能現(xiàn)在還是洛馬第一,,古狗大概排第二,因為洛馬玩這些東西的人,,是古狗的好多倍,,但也不排除古狗里面有一個‘絕世天才’,跟布勞恩一樣的家伙,,
9 M' k1 }, x/ v1 R; S. {( a1 f+ j/ r3 e* y' e
就像中國專家希望在‘神農(nóng)架’里面找的‘非凡者’,,哈哈,他們跟俺說這些,,俺哈哈大笑,,' ~0 O3 k. a; `% i: M

  ?$ p0 K: f. G  {2 a中米社會條件不同,論侃,,米國肯定不是對手,,哈哈,

點評

聯(lián)系這個想到波士頓動力的那個機(jī)器人,,結(jié)合起來是相當(dāng)驚人的東西,,可以做很多事情  發(fā)表于 2016-3-11 08:23
6#
 樓主| 發(fā)表于 2016-3-10 18:48:23 | 只看該作者
滅嘎嘎 發(fā)表于 2016-3-10 18:42
" X: B9 C, R3 n勝負(fù)五五開吧
$ m) \) K+ r7 C1 y4 j
我曾經(jīng)在一臺雙路E5 2680 v2的主機(jī)上,使用軟件對軟件下象棋,,總計25盤,,本來我以為,這個應(yīng)該遵循p=0.5的0-1分布,,但是,,結(jié)果讓人意想不到,紅對藍(lán),,紅勝22盤
& @( i, M! c- }' N) W# i  K( E

點評

同樣軟件嗎,?如果是這樣,紅藍(lán)算法肯定有區(qū)別,!  發(fā)表于 2016-3-10 19:59
7#
 樓主| 發(fā)表于 2016-3-10 18:49:40 | 只看該作者
2266998 發(fā)表于 2016-3-10 18:47 , ?7 g8 \0 ]/ j  i: p
不會的,,依然是一方贏,并且肯定是一方贏,,毫無疑問,,2 o$ o! `/ v, W5 ]/ r

9 H% B# d9 O. W8 k: E* q! M因為每個系統(tǒng)是一個小組,其‘策略’是完全不同的 ...
7 T& E, I( q7 t0 w) e" X7 F
我曾經(jīng)在一臺雙路E5 2680 v2的主機(jī)上,,使用軟件對軟件下象棋,,總計25盤,本來我以為,這個應(yīng)該遵循p=0.5的0-1分布,,但是,,結(jié)果讓人意想不到,紅對藍(lán),,紅勝22盤,;看來就像8爺所說的那樣,還是一方贏
2 b" o& ~: M5 ]& Q

點評

當(dāng)年買了給妹妹做渲染用的,,有64G ECC內(nèi)存,,總價3萬吧  發(fā)表于 2016-3-10 18:59
雙cpu、e5,、2680v2工作站服務(wù)器級,,20核40線程,這配置超萬把了,。  發(fā)表于 2016-3-10 18:58
機(jī)器這個東西,,是贏者恒贏的,必須留下一個家伙,,是贏機(jī)器的,,沒有這個家伙,,機(jī)器就把所有人當(dāng)作‘?dāng)ⅰ�,,其運算邏輯與‘博弈概率’就回到最后被它打敗的那個家伙的算法去了,因為其它家伙都輸給這家伙,,  發(fā)表于 2016-3-10 18:55
8#
發(fā)表于 2016-3-10 19:30:11 | 只看該作者
馬上fps,,rts游戲也要沒意思了,阿爾法狗下一個目標(biāo)就是星際爭霸,。
1 O% A0 \9 ^' D: V; H4 g$ }* ]) ^5 i9 j- d2 i2 j) t
幸好我已經(jīng)是劇情黨了,。
9#
發(fā)表于 2016-3-10 19:34:25 | 只看該作者
看了下DeepMind團(tuán)隊發(fā)表在Nature上的文章,AlphaGO深度學(xué)習(xí),、蒙特卡羅樹狀搜索,、自我進(jìn)化三大招齊出。換句話說,,最開始的時候AlphaGO并不會下棋,,怎么走完全靠隨機(jī)蒙,那些蒙對的走法會記憶下來,,那些蒙錯的走法會淘汰,,這就是訓(xùn)練。等下次再對弈時,,就會使用上次蒙對的走法,。經(jīng)過上萬次甚至甚至上億次的訓(xùn)練淘汰,水平會不斷上升,也就實現(xiàn)了自我進(jìn)化,。
$ v4 }- K6 J) Z. i  A+ w# ]" h根據(jù)這個原理,,兩個AlphaGO對弈,總會有一個獲勝,,獲勝的新的走法會保留,,失敗的會淘汰,實現(xiàn)進(jìn)化,。這很像人類的自然進(jìn)化法則,,這也正是AkphaGO厲害的地方。
- c, P9 T3 m& D3 A# J! E# ]1 T事實上目前AlphaGO的技能很大程度上都是通過自己左右互搏學(xué)習(xí)到的,。

點評

好可怕,!  發(fā)表于 2016-3-11 11:56
原來是這樣啊,!  發(fā)表于 2016-3-11 08:20

評分

參與人數(shù) 2威望 +2 收起 理由
不懂的太多xx + 1
愛貓人士薛定諤 + 1

查看全部評分

10#
發(fā)表于 2016-3-11 09:43:48 | 只看該作者
外太空這要這家伙去開疆拓土,,進(jìn)化吧
您需要登錄后才可以回帖 登錄 | 注冊會員

本版積分規(guī)則

小黑屋|手機(jī)版|Archiver|機(jī)械社區(qū) ( 京ICP備10217105號-1,,京ICP證050210號,,浙公網(wǎng)安備33038202004372號 )

GMT+8, 2025-2-22 04:57 , Processed in 0.059984 second(s), 14 queries , Gzip On.

Powered by Discuz! X3.4 Licensed

© 2001-2017 Comsenz Inc.

快速回復(fù) 返回頂部 返回列表