首页 > 话题> 文章详情

阿法元100:0完胜阿法狗 已摆脱人类经验

资管网 2017-10-20 01:30:39 浏览量 : 1174

摘要:人类经验由于样本空间大小的限制,往往都收敛于局部最优而不自知(或无法发现),而机器学习可以突破这个限制。


摘要:从0开始,未读取任何历史棋谱,不用参考人类任何的经验,只通过强化学习和自我领悟, DeepMind新一代阿法元(AlphaGo Zero)在和阿法狗的博弈中,百战不殆,最终以100:0击败了老一辈阿法狗。这个突破对解决量化策略失效的问题,具有重大的启示意义。

今年5月,阿法狗3:0战胜柯洁,从此围棋界再无对手,此后阿法狗之父哈萨比斯宣布阿法狗退役,就当人们以为从此阿法狗将要退出历史舞台之际,DeepMind又搞出了大动作——另外一只狗打败了阿法狗。

DeepMind的重磅突破,以Mastering the game of Go without human knowledge为题,发表于2017年10月18日的《自然杂志》(Nature),引起轰动。

论文第一作者是DeepMind的David Silver博士,阿法狗项目负责人。阿法元只需要在4个TPU(一款为机器学习而定制的芯片)上,花三天时间,自己左右互搏490万棋局。而老一辈阿法狗,需要在48个TPU上,花几个月的时间,学习三千万棋局,才打败人类。

博士表示:阿法元远比阿法狗强大,它不再被人类认知所局限,而能够发现新知识,发展新策略。

在本次研究中发现, AlphaGo Zero摆脱人类经验以后,一些招式打发更优于人类,而通过人类的指导,AlphaGo Zero水平反而只能达到上一代阿法狗棋艺水平。如此看来,是人类误导了阿法狗。

美国杜克大学人工智能专家陈怡然教授表示,这证明了人类经验由于样本空间大小的限制,往往都收敛于局部最优而不自知(或无法发现),而机器学习可以突破这个限制。之前大家隐隐约约觉得应该如此,而现在是铁的量化事实摆在面前!

或许,人类的经验束缚住了想象力与生产力,陷入一种自我惯性中。

杜克大学博士研究生谢知遥表示:AlphaGo Zero的表现和训练效率都有了很大的提升,在放弃学习人类棋手的走法以及人工提取特征之后,算法能够取得更优秀的表现,通过摆脱对人类经验和辅助的依赖,类似的深度强化学习算法或许能更容易地被广泛应用到其他人类缺乏了解或是缺乏大量标注数据的领域。

简单的说,此前许多需要人工提前进行标注的活,或许可以交给人工智能去做了。

比如天猫的商品识别,现阶段我们拍照上传到网站进行相同物品的购买,但这之前,需要后台人工对数以千计的商品进行大码标注,系统才会知道图片是苹果、相机或是其他物品。而这个人工打码的过程极为繁琐。这项新技术的出现,或许可以让人一定程度从这项繁琐工作中解脱。就如同早期直播领域鉴黄需要人工手动操作,到后期只需机器自动识别,就可知道直播过程中是否有涉黄图片出现。一旦这项新技术落地运用,或可解放不少劳动力。

在投资领域,尽管巴菲特在1987年给投资者的信中说:“在我看来,投资的成功不会由晦涩难懂的公式、不会由计算机程序或者股票市场闪动的价格信号来产生”,但如今机器已经在金融市场中起到极为重要的作用。2015年创建的对冲基金中40%依赖于计算机模型做投资决策。

根据摩根大通去年的估计,基本面投资者约占当前股票交易量的仅10%,而被动投资和量化投资合计占到投资交易的60%,比十年前该份额翻了一倍还多。

如果要成为赚钱的投资者,你需要正确的信息,你需要控制情绪做出合理地分析,并且对你的信息采取有效行动,你需要在正确的时机做出决定。这的确是人类不如计算机的地方。

但机器决策也是有局限性的,最大的缺陷就是没有前瞻性,因为它是基于历史的数据和历史检验的结论,其逻辑是历史会重复。市场环境是不断变化的,长期看,要战胜市场必须具有前瞻性,这也是投资的艺术性所在。顶尖的基金管理人如巴菲特和索罗斯都是具有超强的前瞻性的。

在量化交易1.0版本,模型是“静态”的,因为交易策略是被事先编程的。举个例子,“动量策略”在一个时期内效果非常好,但在下一时期可能效果不佳。真正的智能机器会在市场进一步发展之前观察到市场异常,而且交易策略本身会随着信息的变化而动态变化。

而AlphaGo Zero的突破对解决量化策略失效的问题,或许具有重大的启示意义。

过去人工智能在量化投资中的运用亦多是结合过往数据的学习,继而预测未来的走向。AlphaGo Zero核心技术的出现或将让人工智能在量化投资中通过不断自我博弈,找出最合适的因子和权重,结合投资者策略继而在资本中获得更好的收益,毕竟AlphaGo Zero一个重要的特点就是摆脱了过往对数据的极大依赖。

当然未来如何运用这项技术,以及这项技术可以得到怎样的运用,还需要时间验证,但不可否认的是,从第一代阿法狗吸取人类经验,继而打败人类,到这一代AlphaGo Zero摆脱了人类的经验,继而通过自我学习,打败了上一代阿法狗,这是一个从0到1的飞跃。

人工智能专家、美国北卡罗莱纳大学夏洛特分校洪韬教授也对人工智能做了并不十分乐观的展望:最终这个火能烧多久,还得看神经网络能解决多少实际问题。对于眼前流行的东西,不要盲目追逐,要先审时度势,看看自己擅长啥、有啥积累,看准了坑再跳。

尤其在嫉妒嘈杂的金融世界,仅仅是聪明远远不够,因为市场本身factor in或者模仿你天才思维的速度极快;如果你想比其他参与者有优势,那么你需要以一种不同于其他参与者的方式“聪明”。

知名投资经理和金融博主Ben Carlson曾持有同样观点:“如果有人都找到了某种有效的方法,不仅其他基金会迅速跟进,金主投资者也会迅速砸钱进来,造成方法失效。很难想象市场不被套利行为迅速拉平。”

分享到:

文章评论

文章话题

  • 量化投资
    量化投资

    量化投资理论是借助现代统计学和数学的方法,利用计算机技术从庞大的历史数据中海选能带来超额收益的多种大概率事件以制定策略,用数量模型验证及固化这些规律和策略,然后严格执行已固化的策略来指导投资,以求获得可持续的、稳定且高于平均的超额回报。

    关注

推荐作者

反馈留言
关闭
网站导航