3月9日12点,举世瞩目的谷歌围棋(Alpha GO)挑战李世石的“人机大战”在韩国首尔鈡路区fourseasons酒店正式打响,有关“人工智能”的信息更是引发人们的关注。
Alpha GO主要功能
位于英国伦敦的谷歌旗下DeepMind公司的戴维·西尔弗、艾佳·黄和杰米斯·哈萨比斯与他们的团队,开发了一个叫“AlphaGo”的程序,利用“价值网络”去计算局面,用“策略网络”去选择下子。训练这些深度神经网络的,是对人类专业棋局的监督学习以及让它和自己对弈的增强学习。
“AlphaGo”程序在和其他围棋程序的对抗中获得了99.8%的胜率,并且在一项竞赛中以5比0的成绩战胜了欧洲围棋冠军。计算机程序能在不让子的情况下,在完整的围棋游戏中击败专业选手,这还是第一次。原本人们认为,要到10年后人工智能才能达到这一成就。
系统原理
作为一种人工智能系统,AlphaGo拥有两个大脑,落子选择器 (Move Picker)和棋局评估器 (Position Evaluator)。这也基于两个深度神经网络,policy network与value network。二者极大地降低了需要考虑的搜索空间的复杂度,前者降低搜索的广度,后者降低搜索的深度,很像人脑在下围棋时凭直觉快速锁定策略的思维。
集合了3000万种职业棋手的下法,数百万次深度学习与自我对战,十分接近带着直觉和第六感的人类大脑,能以57%的概率预测与其对阵人类的水平。
研发者表示,AlphaGo有自己学习和进化的能力。人类在长时间的比赛中会因疲劳而犯错,但电脑程序不会,人类可能一年只能下一千盘棋,而AlphaGo一天就能下一百万盘。
网站名称:北京市西城区青少年儿童图书馆中华人民共和国信息产业部网站备案号:京ICP备05085450号 |