亚洲欧美日韩国产一区二区精品_亚洲国产精品一区二区动图_级婬片A片手机免费播放_亚洲国产成人Av毛片大全,男女爱爱好爽好疼视频免费,中文日韩AV在线,无码视频免费,欧美在线观看成人高清视频,在线播放免费人成毛片,成 人 网 站 在 线 视 频A片 ,亚洲AV成人精品一区二区三区

機(jī)械社區(qū)

標(biāo)題: 如何讓機(jī)器人通過自學(xué)習(xí)的方式學(xué)會(huì)玩“石頭、剪刀,、布”游戲,? [打印本頁]

作者: 劉景亞    時(shí)間: 2016-4-8 17:44
標(biāo)題: 如何讓機(jī)器人通過自學(xué)習(xí)的方式學(xué)會(huì)玩“石頭、剪刀,、布”游戲,?
本帖最后由 劉景亞 于 2016-4-11 18:26 編輯 ( K9 X+ ]; ~$ k  \5 S3 R, g

! l3 Z+ i$ r# Z$ g' n: E! c, i/ r前段時(shí)間的人機(jī)圍棋大戰(zhàn)賺足了人們的眼球,Google公司的AlphaGO也使機(jī)器學(xué)習(xí)和深度學(xué)習(xí)讓更多的人有了一定的了解,,可謂做了一次很好的科技普及,。
) M6 }- Q& [0 C' S) b現(xiàn)在我們從簡單問題入手,如何基于機(jī)器學(xué)習(xí),,通過自學(xué)習(xí)的方式讓機(jī)器人學(xué)會(huì)玩“石頭,、剪刀、布”游戲?. P' u- T+ o7 y7 f' H) P! @
不知大家有何建議,?歡迎大家發(fā)言參加討論,。
/ M, k" K7 b, k" u& s
*******************************************************************************************
& D: X8 L' K  z; a4 m) P分割線以上為原貼
) T! t  T9 B6 r+ M* u5 g+ D1 J( p* y, u*******************************************************************************************
* i2 [& w2 Q5 U. G; F6 Y非常感謝各位大俠的參與和討論。. [/ d  t6 E# R8 U5 g
關(guān)于機(jī)器人玩“石頭,、剪子,、布”游戲,我本打算分三個(gè)問題和步驟和大家一起探討,�,?吹接懻撝校蠹覍@三個(gè)方面都有所涉及,。
1 D1 n1 F+ i/ p! G' S1 y下面我把我對這個(gè)問題的認(rèn)識(shí)拋出來與大家交流分享,。$ \* |5 t& Y; R. m# K/ c: E
要讓一個(gè)機(jī)器人玩“石頭、剪刀,、布”,,我們分三步走。
6 k  @* c/ j/ T5 Z% _  K9 ]第一步,,如何讓機(jī)器人通過自學(xué)習(xí)的方式學(xué)會(huì)游戲規(guī)則,?比如,一開始機(jī)器人并不知道石頭,、剪子和布,,哪個(gè)贏哪個(gè),要玩游戲首先得學(xué)會(huì)規(guī)則,。當(dāng)然要實(shí)現(xiàn)這一步,,有比較簡單的辦法,最直接的是程序員編程時(shí),,直接定義這個(gè)規(guī)則,,這是以前經(jīng)常用的傳統(tǒng)的方法。現(xiàn)在我們想通過一種新的方法來實(shí)現(xiàn),,讓機(jī)器人像小孩一樣,,通過不斷地實(shí)踐、摸索和總結(jié)掌握這個(gè)規(guī)則,,也就是自學(xué)習(xí)和機(jī)器學(xué)習(xí),。3 Y5 I, l/ S6 y' w
第二步,如何讓機(jī)器人在掌握規(guī)則后大概率獲勝,?# g3 `* f/ n/ p! N* s, C
第三步,,能不能通過一種方法,使機(jī)器人在每局對戰(zhàn)時(shí)100%獲勝,?; d7 A1 F9 o9 ^( y7 ^1 _
*****************************************************************************************) x9 g8 t' N, ?: e' P% T1 @
關(guān)于第一步,,可以用如下方法實(shí)現(xiàn):讓機(jī)器人和人對戰(zhàn),,在對戰(zhàn)的實(shí)踐過程中訓(xùn)練機(jī)器人,使其不斷自學(xué)習(xí)以掌握規(guī)則,。在對戰(zhàn),,人始終隨機(jī)出,機(jī)器人一開始并不知道規(guī)則,,也隨機(jī)出,。贏了有獎(jiǎng)勵(lì),輸了有懲罰,,隨著對戰(zhàn)次數(shù)的增多,機(jī)器人就會(huì)對出拳的種類形成“價(jià)值判斷”,。在訓(xùn)練過程中,,機(jī)器人會(huì)反復(fù)判斷,是隨機(jī)出還是基于已經(jīng)學(xué)到的部分知識(shí),。經(jīng)過不斷訓(xùn)練,,機(jī)器人就會(huì)學(xué)會(huì)游戲規(guī)則。這個(gè)過程區(qū)別于以往的程序員直接定義,,和人類的學(xué)習(xí)過程十分類似,。
3 [: a+ r: }0 A/ L* A# F那么這個(gè)方法有沒有效果,我們驗(yàn)證一下,。: K: U) v& V' ^' R2 t2 l
下圖是我與機(jī)器人玩25局的情況,,注意這個(gè)機(jī)器人一開始并不知道游戲規(guī)則。我隨機(jī)出拳,,機(jī)器人一開始也隨機(jī)出,,贏了獎(jiǎng)勵(lì),輸了懲罰,。大家會(huì)發(fā)現(xiàn),,從第11局開始,機(jī)器人就已經(jīng)完全掌握了規(guī)則,。
1 Z0 B! E8 W7 [3 R- g% {
7 L  f( E5 ], G4 g9 B/ o4 b' T, A
[attach]383558[/attach]
" T* I) A( g$ k: M; m. ^2 J  d5 F( p; q
; u+ D+ n. [, X0 J$ M! A* C

; V( E  U! w: s# r" g  y  x) U
作者: pacelife    時(shí)間: 2016-4-8 17:54
這種純概率的東西,,要做算法是很簡單,但是勝率要提上去不容易啊
作者: 2266998    時(shí)間: 2016-4-8 18:15
應(yīng)該上一個(gè)圖形處理系統(tǒng),,先分辨對面這家伙是誰,,再?zèng)Q定怎么玩,
/ _. c/ ?. \) O: r1 g
0 b; V7 |2 |6 D1 Y6 {% Y2 s人的活動(dòng),,是有固定姿態(tài)的,,比如下一步怎么活動(dòng),有細(xì)微表現(xiàn),,總結(jié)了這些姿態(tài),,就可以勝了對面的家伙,
$ J/ r  _  J$ I4 c& k2 `  X
3 J) J) ^; ?: n
作者: crazypeanut    時(shí)間: 2016-4-8 18:38
本帖最后由 crazypeanut 于 2016-4-8 18:39 編輯
- z0 z% i0 j- I8 E2 ^* v0 V1 b4 b0 X1 a- ^) ^  E- J
如果不考慮心理學(xué)因素的話,猜拳不是博弈系統(tǒng),,是一個(gè)純概率系統(tǒng),,樣本空間為(剪,石),,(剪,,布),(剪,,剪),,(石,剪),,(石,,布),(石,,石),,(布,剪),,(布,,石),(布,,布)' p, Q' {5 X+ e9 u7 M
1 w8 I$ D: X4 j+ w2 Y
獲勝組合是(剪,,布),(石,,剪),,(布,石),,概率為1/3,,相應(yīng)的,平局組合和輸?shù)艚M合均為1/3
; c- k, y- K  B# a( @: O( E- |# C$ d
因此,,如果沒有心理學(xué)算法在里面,,用隨機(jī)算法隨機(jī)選擇出拳的話,獲勝幾率不會(huì)超過1/3* J3 I9 l. n6 [+ J$ x) M

9 q$ D+ M) f$ |; Q  A而將心理學(xué)因素考慮進(jìn)去,,就像8爺所說的,,要加上圖形系統(tǒng),增加了復(fù)雜性,,也偏離了正道
' X& }! d, I/ l, {4 v+ I5 @4 }. u7 T, {0 f" f# Y  I' q" c
個(gè)人建議,,選擇五子棋或者黑白棋作為研究對象更合適,五子棋和黑白棋應(yīng)該算是最簡單的博弈系統(tǒng)了,,棋子就黑白兩種,,相對容易處理- W2 ?+ p, u; l0 P" ~1 Q

7 p2 C9 ?" D$ o/ o有人可能說井字棋更簡單,,但是作為博弈系統(tǒng),井子棋有不敗的策略,,沒有太大的研究價(jià)值
作者: 木子12    時(shí)間: 2016-4-8 19:06
crazypeanut 發(fā)表于 2016-4-8 18:38 ( P7 N, M6 b; k* h" l( c- ^
如果不考慮心理學(xué)因素的話,,猜拳不是博弈系統(tǒng),是一個(gè)純概率系統(tǒng),,樣本空間為(剪,,石),(剪,,布),,(剪 ...
( S0 H& ^, {3 W# {9 `% W* T: K
之前好像有一個(gè)日本的機(jī)械手,就是這么干的,,動(dòng)作相當(dāng)靈活
/ i. L) {  a# r; g" c
作者: fiyu1314    時(shí)間: 2016-4-8 19:54
     玩石頭剪刀布沒問題,。很簡單。生成1 2 3 隨機(jī)數(shù)分別代表石頭剪刀布,。  自學(xué)習(xí)估計(jì)這個(gè)論壇里懂得就少了。去個(gè)程序員論壇估計(jì)能弄明白自學(xué)習(xí)的程序的都不多,。頂多就是 分析下 這個(gè)人出什么的概率,,和出完什么再出什么的概率。然后弄個(gè)算法分析下他會(huì)出什么的概率最大,。再高科技點(diǎn),,就分析他出什么之前的渾身表情動(dòng)作等。
作者: 冷月梧桐    時(shí)間: 2016-4-8 20:25
這是一個(gè)隨機(jī)概率的問題,,石頭,,剪刀,布就是三個(gè)動(dòng)作點(diǎn),,然后隨機(jī)輸出一個(gè)動(dòng)作點(diǎn)就會(huì)呈現(xiàn)一個(gè)動(dòng)作就好了,,從理論上來講是完全可行的
作者: shiqi67    時(shí)間: 2016-4-8 20:45
樓主的意思應(yīng)該是“如何讓機(jī)器人學(xué)會(huì)玩剪刀石頭布”,而不是“使機(jī)器人玩”剪刀石頭布吧……% ^) g! w% O+ M, X* h- I& J9 X, t; ]
樓上都跑偏了吧
作者: huiyu788    時(shí)間: 2016-4-9 07:58
可以根據(jù)對方出拳的情況,,用多項(xiàng)式擬合,,然后用多項(xiàng)式預(yù)測下一步對方出什么,對方每出一次拳,,就修正多項(xiàng)式
作者: wsxm82    時(shí)間: 2016-4-11 10:14
用上“分歧終端機(jī)”呢,,非誠勿擾里的那個(gè)
作者: 劉景亞    時(shí)間: 2016-4-11 18:42
下圖是我與機(jī)器人每次玩25局,重復(fù)了6次的實(shí)驗(yàn)結(jié)果,。' B' K3 P% V6 Q+ H
圖中1表示機(jī)器人勝,,2表示機(jī)器人負(fù),3表示平局,。
! E) u2 O4 a# r7 a- U可以看出,,機(jī)器人基本上在10局左右,,就會(huì)掌握規(guī)則。
) x/ T9 Q3 S8 b# C) n' Q
[attach]383559[/attach]
% d5 c6 K5 @: H2 [/ a, [9 ^
2 ^: T: t, \# X4 m- d/ E4 o. y9 _* _

作者: ywjianghu    時(shí)間: 2016-5-8 09:46
樓主位沒有說明,,這個(gè)機(jī)器人是帶視覺識(shí)別系統(tǒng)的吧,?, }; }' b3 E4 H; M# _4 y1 b! S
單純從概率和經(jīng)驗(yàn)上,是無法判斷人接下去出什么的,。5 P- h. S" \9 K! s: \# I7 V% {





歡迎光臨 機(jī)械社區(qū) (http://giwivy.com.cn/) Powered by Discuz! X3.4