Спонтанное поведение структурируется подкреплением без явного вознаграждения.

Nature, том 614, страницы 108–117 (2023 г.) Процитировать эту статью

48 тысяч доступов

10 цитат

296 Альтметрика

Подробности о метриках

Спонтанное поведение животных строится из модулей действий, которые мозг объединяет в последовательности1,2. Однако нейронные механизмы, управляющие формированием натуралистического, самомотивированного поведения, остаются неизвестными. Здесь мы показываем, что дофамин систематически колеблется в дорсолатеральном полосатом теле (DLS), поскольку мыши спонтанно выражают субсекундные поведенческие модули, несмотря на отсутствие структуры задач, сенсорных сигналов или экзогенного вознаграждения. Фотометрические записи и калиброванные оптогенетические манипуляции с обратной связью во время поведения в открытом поле демонстрируют, что колебания дофамина DLS увеличивают вариацию последовательности в течение нескольких секунд, усиливают использование связанных поведенческих модулей в течение нескольких минут и модулируют энергию, с которой экспрессируются модули, не влияя напрямую на инициацию движения или моментальная кинематика. Хотя усиливающие эффекты оптогенетических манипуляций с дофамином DLS варьируются в зависимости от поведенческих модулей и отдельных мышей, эти различия хорошо прогнозируются наблюдаемыми изменениями во взаимосвязях между эндогенным дофамином и использованием модуля. В соответствии с возможностью того, что колебания дофамина DLS действуют как обучающий сигнал, мыши выстраивают последовательности во время исследования, как будто для максимизации дофамина. В совокупности эти результаты предполагают модель, в которой те же схемы и вычисления, которые управляют выбором действий в структурированных задачах, играют ключевую роль в формировании содержания неограниченного, многомерного, спонтанного поведения.

Спонтанное поведение демонстрирует структуру. Этологи уже давно утверждают, что самомотивированное поведение животных в дикой природе гибко строится из модульных компонентов, которые с течением времени связываются друг с другом предсказуемым, но вероятностным образом1. Многие хорошо изученные лабораторные модели поведения, включая хемотаксис, уход за шерстью, поиск добычи, ухаживание, пение птиц и исследовательское передвижение, также характеризуются модульностью и предсказуемостью2,3,4,5. Однако остается неясным, как мозг регулирует выражение отдельных поведенческих модулей в любой данный момент или как он динамически объединяет эти модули в гибкое поведение, наблюдаемое, когда животные действуют по собственной воле в отсутствие экспериментальных ограничений, структуры задач или экзогенных факторов. награда.

Учитывая, что потеря дофаминергических нейронов компактной части черной субстанции (SNc) вызывает диффузный дефицит инициации и последовательности действий, вполне вероятно, что нейромодулятор дофамин влияет на архитектуру спонтанного поведения6,7,8. Однако мы мало знаем о точной взаимосвязи между дофамином и поведением животных, когда они свободно исследуют окружающую среду. Хотя считается, что дофамин мотивирует спонтанное поведение и влияет на энергичность, с которой выражаются действия, данные о том, являются ли фазовые переходные процессы дофамина разрешающими или причинными для движений, повышается или падает дофамин, когда животные инициируют движение, и являются ли колебания дофамина уточнить кинематику движений свободно ведущих себя животных6,9,10,11,12,13,14,15,16,17,18,19. Напротив, во время структурированных задач, в которых животные ищут явное и часто подсказанное вознаграждение, фазовый дофамин четко передает информацию, связанную с вознаграждением и ошибками прогнозирования вознаграждения, усиливает действия, связанные с вознаграждением, и влияет на выбор между альтернативными действиями20,21,22,23 ,24,25.

Дофамин может играть различную роль в спонтанном и целенаправленном поведении, учитывая множество различий между ними; например, спонтанное поведение обычно демонстрирует большее разнообразие выраженных поведенческих модулей, включает более сложные поведенческие последовательности и имеет тенденцию подчеркивать самоинициируемые движения, связанные с активным восприятием2,4,26. Тем не менее, как спонтанное поведение, так и структурированные задачи требуют, чтобы животные постоянно выбирали действия из распределения возможностей, что позволяет предположить, что дофамин может влиять на непрерывную сборку натуралистических последовательностей посредством механизмов, аналогичных тем, которые используются для поддержки целенаправленного выбора действий в ответ на награды.

0.05 for controls, two-sided Mann–Whitney U test comparing stimulation with catch trials). Syll, syllable. j, Sequence context changes from baseline to post-stimulation for an example mouse–target pair. Sequences proceed from left (incoming syllables) to right (outgoing syllables). Nodes are sorted by decreasing frequency at baseline. k, Average change in inbound and outbound transitions for target syllables on stimulation day sorted by the baseline rank of the transition. Traces are smoothed with a five-point rolling average. Shading indicates bootstrap s.e.m. l, Average kinematic parameters aligned to stimulation in Opto-DA mice and controls. Shading as in i. No comparisons between stimulation and catch trials in any of the mice were significant (P > 0.05, one-sided Mann–Whitney U test). m, As in l, but following 3-s-long stimulation. The solid bar indicates significance (P < 0.05, one-sided Mann–Whitney U test)./p>

6 kHz, and voltage signals driving the UV and blue LEDs were also stored for offline analysis./p>

1% of the time in an example experiment. Syllables are sorted by total usage in the experiment, with the most-used syllable at the top and least used on the bottom. The colors above each segment of the plot indicate the time intervals used to compute the transition matrices in Extended Data Fig. 2g. g) State maps computed for each colored section of the example experiment shown in Extended Data Fig. 2f, summarizing the transition statistics between behavioural syllables, and demonstrating that transitions are also non-stationary over each imaging experiment. Each node is a syllable, and each line represents the transition from one syllable to the next (whose width specifies the observed likelihood of each transition, per the legend)./p>