[会員へのお知らせ] 神経科学トピックス

うまくいっていた行動が通用しないとき:大脳基底核回路はいかにしてより望ましい結果を探し続けるか

東京科学大学 大学院医歯学総合研究科 細胞生理学分野
助教
Alain Rios (アライン リオス)
日常生活では、うまくいっていた行動が通用しなくなっても、同じやり方を続けてしまうことがあります。本研究では、望ましいはずの行動で結果が出ないとき、大脳基底核の間接路が代替案を模索し続ける役割を果たすことで柔軟な行動適応を可能にすることを実証しました。
 日常生活では、通勤ルートや問題の解き方など「うまくいきそうな」行動を何度も繰り返しています。こうした行動は効率的ですが、環境が変わって通用しなくなっても同じ行動を続けてしまいがちです。では脳はどのようにして「このやり方はもう通用しない」と気づき、別の選択肢を試させるのでしょうか。
 大脳基底核は試行錯誤による学習を支える脳回路を構成します。特に大脳基底核の線条体から出力する「直接路」は望ましい果をもたらした行動を強化し、「間接路」は望ましくない結果につながった行動を抑えることで報酬を最大化し、行動を最適化すると考えられてきました。
 今回の研究では、間接路がさらに能動的に別の選択肢を探る働きをしていることを示しました。一見「望ましい」行動方策でも、その信頼度が下がってきたときにそれを見極め、別の選択肢を探り続けるように脳を助けているのです。
 具体的には、ラットに前脚でレバーを押すか引くかを選んで報酬の水滴を得る課題を学習させました。一方の行動では高い確率で、他方では低い確率で報酬が得られ、ときどき予告なしにこの確率を入れ替えました。効率よく水を得続けるには、それまでの「望ましい」行動がもはや望ましくないことに気づき、他方へ切り替える必要があります。
 上記の行動課題を遂行中のラットから大脳基底核の直接路と間接路のニューロンを区別して発火活動を記録しました。その結果、報酬確率が高いはずの行動で得られる報酬頻度が減った場合、報酬確率が低い行動をあえて試みて報酬が得られなかったとき、間接路ニューロンは次の選択まで活動を続けることがわかりました。驚いたことに、この活動が強いほど、ラットはすぐには元の報酬確率が高いはずの行動に戻らず、しばらく元の報酬確率が低いはずの行動(代替行動)を試し続けました。
 さらに、この間接路ニューロンの、報酬非獲得試行後に音刺激(結果音)から約0.5秒以降に立ち上がり、次の試行まで続く遅い持続的な活動をオプトジェネティクスにより光照射で人為的に強めると、ラットは報酬が得られなかった後でも代替行動を試す頻度が増加しました。一方、従来の報告通り、音刺激直後0〜0.5秒に一過性に生じる早い時期の活動を強めると、次に代替行動を試す頻度が減少しました。つまり、同じ間接路が、結果直後の早い時期には報酬最大化方策を維持するモードとして、結果後半の遅い時期には方策が通用しないときに新しい選択肢を探るモードとして働く、二つの制御様式を担っていることを示すことができました。
 この成果から、大脳基底核は従来の報酬最大化機能に加えて、環境の変化に応じて行動の信頼性を評価し、行動を柔軟に、効率的に切り替える機能を担うことが示されました。本研究成果は行動の切り替えが難しい病気の理解にも役立つと期待されます。
<論文情報>
タイトル:Dorsomedial striatum monitors unreliability of current action policy and probes alternative one via the indirect pathway
著者:Alain Rios, Satoshi Nonomura, Yutaka Sakai, Kazuto Kobayashi, Shigeki Kato, Masahiko Takada, Yoshikazu Isomura, Minoru Kimura,
掲載誌:Science advances
日付:2025年10月31日
https://doi.org/10.1126/sciadv.adt4652
<図の説明>
この課題では、ラットが前脚でレバーを「押す」か「引く」かを選び、どちらの行動で報酬が得られるかを学習します(左上)。左下のグラフは、報酬が得られなかった試行のあとに、大脳基底核の背内側線条体の間接路ニューロンがどのように活動するかを示しています。線の色は「低価値探索率」(右のカラーバー)を表しており、遅い応答が強い(赤・オレンジ)ほどラットは低価値の代替行動を試し続け、弱い(緑)ほどすぐにいつもの高価値行動に戻ります。従来は、これらのニューロンは「報酬につながらなかった行動を止める」ことで、高価値の行動に戻す役割が中心だと考えられてきました(右上)。本研究の結果はそれに加えて、いつもの行動がうまくいかなくなったときに、報酬のあともしばらく続く活動が代替行動の試行を後押しし、より信頼できる新しい方略が見つかるまで探索を続けさせる役割を持つことを示しています(右下)。
<研究者の声>
本研究を通じて、大脳基底核の働きには教科書的な説明だけでは捉えきれない側面があることを改めて実感しました。数年にわたり神経活動を記録し、行動データを丁寧に見直す中で、最も重要なシグナルは、動物が「いつもの方略」でうまくいかなくなった場面で現れることが分かってきました。安定して訓練できるほどシンプルでありながら、時間とともに行動方略の変化を引き出せる課題設計が大きなチャレンジの一つでした。また、多ニューロン同時記録、オプトジェネティクス、計算モデル解析といった異なる手法を一つの枠組みとして統合するために、共同研究者との議論と再解析を何度も重ねる必要がありました。査読プロセスでは、とくに回路ダイナミクスと行動の関係を分かりやすく示す点について、多くの有益なフィードバックをいただき、解釈と説明をより洗練させることができました。
<略歴>
アライン リオスAlain Rios, MD, PhD
東京科学大学 大学院医歯学総合研究科 細胞生理学分野・助教。大脳基底核回路がどのように柔軟な意思決定を支えているかに関心を持ち、ラットの意思決定課題中の多ニューロン同時記録、オプトジェネティクス、ファイバーフォトメトリーなどを用いて研究している。現在は、報酬処理における海馬鋭波リップルの役割についても探索している。
PAGE TOP