-
深度强化学习
人类擅长解决各种具有挑战性的问题,从低级别的运动控制到高级认知任务。我们在DeepMind的目标是创建可以达到类似性能和通用性的人工代理。与人类一样,我们的代理人为 [ 阅读全文 ]
将机器学习应用于头部和头部的放射治疗计划颈癌
我们很高兴地宣布与伦敦大学医院NHS基金会信托基金放射治疗部门建立新的研究合作伙伴关系,该基金会提供世界领先的癌症治疗方法.15名男性中有1名,150名女性中有1名将被 [ 阅读全文 ]
使用无人监督的辅助任务进行强化学习
我们在DeepMind的主要任务是突破人工智能的界限,开发可以学习解决任何复杂问题的程序,而无需如何教授。我们的强化学习代理在Atari 2600游戏和Go游戏中取得了突破。然 [ 阅读全文 ]
在神经网络中实现持续学习
学习执行任务的计算机程序通常也会很快忘记它们。我们表明可以修改学习规则,以便程序在学习新任务时可以记住旧任务。这是迈向更智能的程序的重要一步,这些程序能够逐 [ 阅读全文 ]
提炼:传播机器学习的科学
与所有科学领域一样,机器学习研究中清晰沟通的重要性也不容忽视:通过允许研究团体分享,讨论和建立新发现,它有助于推动最新技术发展 出于这个原因,我们DeepMind [ 阅读全文 ]
通过人工反馈学习
我们相信人工智能将成为有史以来最重要和最广泛有益的科学进步之一,帮助人类应对气候变化和提供先进医疗保健等一些最大的挑战。但是,为了实现这一承诺,我们知道技术 [ 阅读全文 ]
超越平均水平进行强化学习
考虑每天在火车上往返前进的通勤者。大多数早晨,她的火车按时运行,她第一次见面就放松了,准备好了。但是她知道偶尔会发生意外情况:机械问题,信号故障,甚至是特别 [ 阅读全文 ]
AlphaGo Zero:从零开始学习
人工智能研究在语音识别和图像分类,基因组学和药物发现等各个领域取得了快速进展。在许多情况下,这些是利用大量人类专业知识和数据的专业系统。 然而,对于某些问 [ 阅读全文 ]
将机器学习应用于乳腺癌的乳腺X线摄影筛查
我们创立了DeepMind Health,以开发有助于解决社会最严峻挑战的技术。因此,我们非常高兴地宣布,我们最新的研究伙伴关系将专注于乳腺癌。 我们将与伦敦帝国理工学院 [ 阅读全文 ]
从嘈杂的数据中学习解释规则
假设你在踢足球。球到达你的脚,你决定将它传递给没有标记的前锋。看似简单的动作需要两种不同的想法。 首先,你认识到你脚下有一个足球。这种认识需要直观的感性思 [ 阅读全文 ]
重要性加权演员 - 学习者架构:DMLab-30中的可扩展分布式DeepRL
深度强化学习(DeepRL)在一系列任务中取得了显着成功,从机器人技术的持续控制问题到Go和Atari等游戏。迄今为止,这些领域的改进仅限于个别任务,其中为每项任务调整和 [ 阅读全文 ]
通过游戏来学习
让孩子(和成年人)自己整理可能是一项挑战,但我们面临更大的挑战,试图让我们的AI代理商也这样做。成功取决于对几种核心视觉运动技能的掌握:接近物体,抓住并抬起物 [ 阅读全文 ]
通过神经元删除来理解深度学习
深度神经网络由许多单个神经元组成,它们以复杂和违反直觉的方式结合,以解决各种具有挑战性的任务。这种复杂性赋予了神经网络它们的能力,但也使它们成为混乱和不透明 [ 阅读全文 ]
学习编写生成图像的程序
通过人的眼睛,世界不仅仅是我们角膜中反映的图像。例如,当我们看到建筑物并欣赏其设计的复杂性时,我们可以欣赏它所需的工艺。这种通过创建它们的工具来解释对象的能 [ 阅读全文 ]
学习在没有地图的城市中导航
你是如何学习如何在童年的邻居,去朋友家,学校或杂货店的?可能没有地图,只需记住街道的视觉外观和沿途的转弯。随着您逐渐探索您的社区,您变得更加自信,掌握了您的 [ 阅读全文 ]