想象一下,小鼠在空地上自由活动,它一会儿嗅嗅地面,一会儿绕圈跑,一会儿又突然停下打量四周。这些看似随意的动作,是真的“乱来”还是像搭积木一样,悄悄组合成一个个小目标?
2026年1月29日,哈佛医学院Sandeep Robert Datta研究团队在《Neuron》发表: Spontaneous behavior is a succession of self-directed tasks,揭示了自发行为是一系列自身导向任务的连续发生。
作者发现,在自由探索的小鼠中,低层次动作被分层组织成持续数秒的行为状态,这些状态对应于类似任务的行为程序。这些持续的行为状态塑造了前额叶皮层(PFC)中的神经活动:PFC优先编码这些行为状态的身份信息,而非低层次的行为特征,并且决定了在特定情境下表达哪些行为状态。这些发现表明,自发行为是以一系列自身导向任务的形式组织起来的,并揭示了结构化任务与自发探索所共用的神经控制原则。
图一 行为状态捕捉了探索行为中的高阶结构
为了探究自发行为是否由神经活动锚定的高阶“类任务状态”组织而成,作者在记录小鼠dmPFC钙信号的同时,利用深度相机结合无监督机器学习方法MoSeq对其行为进行解析。MoSeq将行为分解为72种亚秒级“音节”(如直立、转身、嗅探等)并在开放旷场(交替为空置或放入低攻击性C57同笼鼠)中发现这些音节并非随机出现,而是聚集成持续数十秒甚至近一分钟的行为片段。真实音节序列的时间可预测性远超简单马尔可夫模型所能解释,其互信息可持续数十秒,而马尔可夫合成序列仅几秒即衰减至随机水平,表明自发行为具有非马尔可夫的高阶结构。为此,作者开发了新型分层隐马尔可夫模型shMoSeq,通过三个嵌套时间尺度(毫秒级姿态、亚秒级音节、秒级行为状态)有效捕捉这一层级组织:每个高阶状态由一个独特的音节转移矩阵定义,结合共享基线与状态特异偏好生成。shMoSeq合成的序列几乎完美复现真实数据的时间相关性且推断出的状态序列本身可被简单马尔可夫过程描述,说明在小时尺度内该层级已足够。在实验中,shMoSeq识别出五种稳定状态:理毛、环境探索、社交探索及两种方向性绕场运动。值得注意的是,音节与状态并非一一对应:同一音节可出现在多个状态中,理毛音节也非仅限于理毛状态且不连续发生;状态识别通常需数秒行为积累,存在短暂不确定性,但多次拟合结果高度一致。这些结果表明,小鼠的自发探索行为在毫秒亚秒秒的时间尺度上被层级化组织,而shMoSeq为揭示大脑如何在无外部指令下生成结构化自发行为提供了有力工具。
图二 可供性塑造了行为状态的分布
shMoSeq识别的行为状态本质上是动物对环境中不同互动机会(可供性)的灵活响应。在空旷的圆形旷场中,墙壁是主要可供性,小鼠据此形成两种“探索性运动”状态:顺时针绕行(墙壁在左侧)或逆时针绕行(墙壁在右侧)。当引入一只同笼雄鼠、扩展可供性空间后,一种新的“社交状态”出现,包括静止、追逐中的互动,甚至偶发攻击;该状态在统计上表现为与同笼鼠近距离接触且双方行为音节高度同步,互信息显著升高,说明互动不仅由空间接近驱动,更涉及行为协调。为进一步验证行为状态与可供性的关联,作者在旷场中加入五种陌生物体并利用高速三维关键点追踪精细动作,包括头部、四肢姿态及鼻部振荡(作为嗅探指标)。尽管记录方式不同,shMoSeq仍识别出持续时间相似的五种行为状态,其中两种为调查模式:“嗅探”(朝向空中)和“局部调查”(朝向地面)。小鼠对新奇物体和同笼伙伴展现出不同但稳定的动作模式,说明这两类互动对象作为不同的“可供性”各自触发了特异的自发行为策略。综上,自发行为由一系列持续可达一分钟的行为状态构成,每种状态对应小鼠对特定可供性的灵活互动,而状态间的转换则反映了其从一个互动目标转向另一个的动态过程。
图四 行为状态塑造dmPFC对可供性信息的神经编码
在自发行为中,dmPFC对环境中关键可供性(如墙壁、陌生物体或同笼小鼠)的神经表征并非恒定,而是在与之最相关的行为状态中显著增强:例如,编码墙壁距离和方向的神经元在“趋壁性”探索状态中优先活跃;社交距离敏感神经元在社交互动状态中反应更强;物体相关神经元则在“局部嗅探”状态中活动最高。这种增强效应在控制了空间位置、角度和运动变量后依然存在且相应信息在对应状态下可被更准确解码。与后扣带回皮层(RSC)广泛编码空间边界不同,dmPFC更聚焦于近距离、左右侧分化的墙壁表征,凸显其对当前行为目标的特异性支持。这些结果表明,dmPFC不进行通用空间编码,而是以状态依赖的方式优先表征当前自发行为中最相关的可供性信息。
图四 神经动态滞后于行为转换
为探究dmPFC在行为调控中的因果角色,作者分析了其神经活动与行为状态转换的时间关系。
结果:
无论是通过钙成像还是Neuropixels电生理记录,dmPFC对行为状态(如社交、探索)的编码均滞后于行为的实际转变,神经活动通常在状态开始后才上升,解码也呈现系统性延迟。即使使用前瞻解码器或聚焦转换时间明确的事件,仍无法观察到可靠的神经活动领先。在社交互动中,dmPFC对自身或他人行为的表征同样延迟约1-2秒;对非状态变量(如身体高度或朝向)的响应虽略早,但仍晚于动作的起始动力学(如速度变化)。这些发现表明,dmPFC并非主动发起或实时驱动自发行为,而是反映已发生的动作和当前行为状态,从而挑战了“dmPFC持续逐刻控制自我导向行为”的传统模型。
该研究揭示了小鼠行为中多层级的时间结构并发现前额叶皮层以统一编码原则表征高阶行为状态,为理解自发行为与任务导向行为共享的认知机制提供了关键桥梁。
文章来源