.fav_bar { 浮动:左;边框:1像素实心# a7b1b5;上边距:10像素;下边距:20像素; } .fav_bar span.fav_bar-label { 文本对齐:中心;填充:8像素0像素0像素0像素;浮动:左;左边距:-1像素;边框右侧:1像素点状# a7b1b5;边框左侧:1像素实心# a7b1b5;显示:块;宽度:69像素;高度:24像素;颜色:# 6e7476;字体加粗;字体大小:12像素;文本转换:大写;字体家族:Arial,Helvetica,sans-serif; } .fav_bar a,#plus-one { 浮动:左;边框右侧:1像素点状# a7b1b5;显示:块;宽度:36像素;高度:32像素;文本缩进:-9999像素; } .fav_bar a.fav_print { 背景:url(’/images/icons/print.gif’)不重复0像素0像素#FFF; } .fav_bar a.fav_print:hover { 背景:url(’/images/icons/print.gif’)不重复0像素0像素#e6e9ea; } .fav_bar a.mobile-apps { 背景:url(’/images/icons/generic.gif’)不重复13像素7像素#FFF;background-size:10像素; } .fav_bar a.mobile-apps:hover { 背景:url(’/images/icons/generic.gif’)不重复13像素7像素#e6e9ea;background-size:10像素} .fav_bar a.fav_de { 背景:url(/images/icons/de.gif)不重复0 0 #fff } .fav_bar a.fav_de:hover { 背景:url(/images/icons/de.gif)不重复0 0 #e6e9ea } .fav_bar a.fav_acm_digital { 背景:url(’/images/icons/acm_digital_library.gif’)不重复0像素0像素#FFF; } .fav_bar a.fav_acm_digital:hover { 背景:url(’/images/icons/acm_digital_library.gif’)不重复0像素0像素#e6e9ea; } .fav_bar a.fav_pdf { 背景:url(’/images/icons/pdf.gif’)不重复0像素0像素#FFF; } .fav_bar a.fav_pdf:hover { 背景:url(’/images/icons/pdf.gif’)不重复0像素0像素#e6e9ea; } .fav_bar a.fav_more .at-icon-wrapper { 高度:33像素!important;宽度:35像素!important;填充:0!important;边框右侧:无!important; } .a2a_kit { 行高:24像素!important;宽度:unset!important;高度:unset!important;填充:0!important;边框右侧:unset!important;边框左侧:unset!important; } .fav_bar .a2a_kit a .a2a_svg { 左边距:7像素;上边距:4像素;填充:unset!important; }

麻省理工学院(MIT)的神经科学家研究了老鼠在学习奖励情境中的行为,旨在教会老鼠向左或向右转动方向盘以获得奖励。
在任务中,奖励的一侧在每15-25次转动后会改变。
团队意识到老鼠在每个游戏“块”中使用了多种策略。
为了解开正在使用的策略,团队利用了隐藏马尔可夫模型(HMM),该模型可以在计算上确定何时一个未见的状态产生结果与另一个未见的状态不同。
团队首先必须调整HMM以解释在块的过程中的选择转换。
使用经过调整的“blockHMM”进行计算模拟任务绩效显示,该算法能够推断出人工智能的真实隐藏状态。
作者随后利用这种技术展示了小鼠持续混合多种策略,实现了不同水平的绩效。来自麻省理工学院新闻 完整文章
摘要版权© 2023 SmithBucklin,华盛顿特区,美国 