关灯
护眼
第六十六章 我的赛场听我讲
上一章 书架 目录 存书签 下一章
    张卫国一听又重新平静下来,继续问着关键问题:

    “那你落子时如何选择的?选择方案是什么?”

    “根据我了解的相关论文文献,到现在为止所有研究所设计的相关系统,落子时的选择都是基于两方面的考虑。”

    “一是通过训练形成一个策略络,主要是将棋盘上的局势作为输入信息,并对所有可行的落子位置生成一个概率分布。

    然后,训练出一个价值络对自我对弈进行预测,以1对手的绝对胜利到1的标准,预测所有可行落子位置的结果。

    这两个络自身都十分强大,而目前国际上所有的相关文献描述的都是,将这两种络整合进基于概率的蒙特卡罗树搜索中,实现了它真正的优势。”

    张卫国推了推眼镜,额头微点,这个陈家涛肚子里倒是有不少货啊,他说的正是他们的设计思路。

    “而我的系统在设计如何落子时是将上述两个神经是络合二为一,摒弃了棋谱,通过它自己产生大量自我对弈棋局,为下一代版本提供了训练数据,此过程循环往复。

    让它从低级的对战慢慢成长,从而让它能得到更高效的训练和评估”

    陈家涛停顿了一下,观察了一下评委,发现他们差不多消化了他所说的信息,继续道:

    “在获取棋局信息后,围棋系统会神经络中根据策略络功能,探索哪个位置同时具备高潜在价值和高可能性,进而决定最佳落子位置。

    在分配的搜索时间结束时,模拟过程中被系统最频繁考察的位置将成为阿尔法围棋的最终选择。

    在经过先期的全盘探索和过程中对最佳落子的不断揣摩后,围棋系统的搜索算法就能在其计算能力之上加入近似人类的直觉判断。”

    前世包括阿尔法系统的旧版本,都是结合了数百万人类围棋专家的棋谱,以及强化学习的监督学习进行了自我训练。

    而现在陈家涛所讲述的方法,还没有任何期刊杂志发表过,毫不过分的说陈家涛现在的方法是全球首创也不为过。

    当然这是在获得深度睡眠学习系统后,在梦里附身前世阿尔法的机器人的主创人员学到的办法,只是时间有些短,现在还有一些问题没有解决。

    台上,陈家涛对着一堆博雅的教授副教授继续侃侃而谈,回答者他们各种各样的问题。

    陈家涛根本不像是在进行答辩,反而像是在给他们开报告会,只是地点有些不对罢了。

    问题回答的差不多了两方又开始分析系统没达到预期效果的原因,集思广益,所有的评委都参与进来,众人开始讨论。

    “我觉的进化到专业五段就停止,问题还是在你构建的单一神经络上,会不会是你的络太简略,已经到达了极限无法支撑其继续自我博弈。”

    “我不这么觉得,既然可以自我学习,就代表神经络应该没问题。

    可能是你的电脑硬件的方面的问题,储存空间有限,毕竟你是自己在单打独奏,设备跟不上是有很大可能的。”

    一个皮肤黝黑,理着光头三十岁左右的老师开口道,这还是他今天第一次开口询问。

    陈家涛从上午看到这位老师,就有点疑惑他真的是研究计算机的么?

    隔着衣服都能感觉到他身上的肌肉块棱角分明,出去说他是健身教练一点都不为过。

    所有评委都在发表自己的看法,场面顿时热闹起来,你反驳我我反驳你,大家都说的有理有据的,谁都说服不了谁。

    陈家涛反而被忽略,他在台上津津有味的听着给位大佬的讨论,觉得受益匪浅。

    陈家涛和评委根本没察觉到,已经过去一个多小时了。

    上午答辩完成的参赛选手是可以做在台下听的,下午要上场的


目录 存书签 上一章 下一章
随便看看: 名作家宇智波[综]无双龙魂江湖迟暮灵修九墟腹黑沈少追爱记君侯总是被打脸透视神医在花都开局至尊神兽系统萧然徐雅婷萌妃追夫路子野书狂开局获得天残神功萧尘黄小艾大晋捡到一只战神王谧穿成全修仙界的情敌大秦:开局融合老天师,迎娶东君十三号地球监狱一枪镇山河规则怪谈:这个寝室有亿点点恐怖人在港综,十万死士