MUMON

統合生成

人格DB:一貫性を守り続ける仕組み

パーソナリティ・ドリフトは、長期関係を築くAIにとって致命的である

ここまで見てきたのは、応答がどう立ち上がり、どう整えられるかでした。

System1 が応答の温度を起動し、System2 がそれを制約・記憶・人格に接地させる。この二段階の生成によって、Mumon の応答は「自然な立ち上がり」と「ブランドらしい一貫性」を両立できるようになりました。

しかし、その整え方の基準そのものが揺らいでしまえば、どれだけ精緻な二重過程も意味をなしません。

さっきまで穏やかに寄り添っていたAIが、次の瞬間には急にマニュアル的な説明口調に切り替わる。ある場面では「まず聴く」存在だったのに、別の場面では同じ相手に対して突然、結論を急ぐ。こうした変化は、単なる言い回しのブレではありません。人格そのものの漂流です。

長期対話におけるこの種のドリフトは、近年の研究でも繰り返し指摘されています。人格プロファイルを与えたとしても、長時間のやり取りの中で一貫性は容易に崩れ、静的なキャラクター設定だけでは十分ではないことが示されています [27][28]

システムプロンプトに「穏やかな口調で」「共感的に話すこと」と一行書くだけでは、このドリフトは防げません。問題の根本は、標準的な自己回帰生成そのものに、人格の恒常性を保証する機構が存在しないことにあります。

Chapter 1 で論じた「すべてのブランドが同じ無難なアシスタント像に収束する」問題も、突き詰めればこの延長線上にあります。人格が生成のその場しのぎに委ねられている限り、モデルは最終的に、もっとも無難で、もっとも迎合的で、もっとも平均的な応答へと引き寄せられていくからです。

したがって本節の出発点は、「人格をどう演じるか」ではありません。

人格をどう保持し続けるか です。

McAdamsの性格三層モデルを、人格DBのスキーマとして採用する

Mumon は、この構造欠陥に対して、「人格を外部化する」という設計判断を取ります。

人格を、生成の内側に一時的なお願いとして埋め込むのではなく、生成の外側に、明示的な参照構造として保持する。その際のスキーマとして採用するのが、McAdams の性格三層モデルです [43][45]

第1層は、気質的特性 です。

これは、生来的な認知・行動傾向を指します。内向か外向か、直観寄りか感覚寄りか、慎重に反応するか勢いよく出るか。こうした反射的な応答パターンの基盤になります。

第2層は、特徴的適応 です。

ここに入るのは、動機、価値の置き方、コーピング戦略です。「まず聴く」「不安には事実で応える」「沈黙を怖がらない」「すぐ励ますよりも、まず横に座るように受け止める」といった、特定の状況に対する対処方針の一貫性がここで定義されます。

第3層は、ナラティブ・アイデンティティ です。

これは、そのキャラクターが自分をどう理解しているかという、人生の物語であり、自己概念です。なぜそのように振る舞うのか。どのような価値観を大事にし、何を自分の存在意義だと感じているのか。その深層の意味づけを保持する層です。

この三層を選ぶ理由は、単に心理学的にもっともらしいからではありません。

反射的な反応、状況への対処、深層の価値観という3つを、異なる計算レイヤーへ分けて供給できるからです。

つまり、この三層構造は、人格を説明する理論であると同時に、人格を実装するための設計図にもなっています。

三層構造は、System1とSystem2に対して差分供給される

人格DB の重要なポイントは、人格を一枚岩のプロフィールとして渡さないことにあります。

System1 に注入されるのは、Level 1 と Level 2 のみです。

つまり、気質的な反射傾向と、状況への対処パターンだけで、キャラクターらしい直感的衝動を形成する。前節で、「System1 がつくるのは first answer ではなく first temperature である」と整理しましたが、その温度の色合いを決めているのが、まさにこの Level 1 と Level 2 です。

たとえば、同じ「つらい」と言われたとしても、ある人格はまず静かに沈み込むように受け止めるかもしれないし、別の人格は少し驚きをにじませながら寄り添うかもしれない。こうした反射的な差は、深い物語を全部読まなくても、気質と適応のレベルだけで十分に形作ることができます。

一方、検証を担う System2 には、Level 3 を含むすべての層 が渡されます。

System2 は、深層のナラティブまで参照しながら、「この言い方は、このキャラクターの物語に照らして妥当か」を点検します。前節で論じた人格一貫性の再審査軸は、ここで初めて具体的な参照先を得るのです。

  • 速い反応には、Level 1 と Level 2 の軽量な人格情報を。
  • 遅い検証には、Level 3 を含む全層を。

この差分供給が、応答速度と人格深度の両立を構造的に可能にしています。

System1 が温度を起動するとき、その温度にはすでに人格的な色合いが含まれている。

そして System2 がそれをブランドらしく接地させるとき、その判断基準になるのが Level 3 のナラティブ・アイデンティティです。

つまり、人格DB は前節までで設計した System1 と System2 の両方に橋を架ける構造なのです。

Level 3は記憶グラフと連動し、ユーザーの人生の物語の中にこの瞬間を位置づける

三層のうち、Level 3、つまりナラティブ・アイデンティティは、単独では力を発揮しません。

Chapter 4 で構築した GraphRAG の個人史ネットワークと接続することで、初めてその意味を持ちます。

たとえば、ユーザーが

「兄がもうすぐ卒業する」

と言ったとします。

記憶グラフは、「去年の夏、兄の試験で不安だったエピソード」を引き出し、そこからさらに、「その直後のビーチでの穏やかな夕べ」といった記憶へ連想をつなげることができる。そこに対して System2 が Level 3 のナラティブを参照すると、応答は単なる事実の再掲ではなく、その人の人生の流れの中にこの瞬間を位置づける形になります。

たとえば、

「去年の夏、お兄さんの試験のこと心配してたよね。あのビーチの夕焼け、覚えてる。
だから今、うれしさだけじゃなくて、いろんな気持ちが重なってるんだね」

といった言葉が成立する。

ここで起きているのは、事実の列挙ではありません。

ユーザーの人生の物語の中に、この瞬間を位置づける応答です。McAdams が「ナラティブ・アイデンティティ」と呼ぶ、物語を通じた自己理解の支援が、ここで初めて具体化されています [44]

Chapter 4 で、記憶は保存庫ではなく、応答条件のレイヤーだと定義しました。ここでその記憶が、Level 3 のナラティブと合流することで、「なぜこの記憶を、いま、この温度で語るのか」に人格的な理由が与えられます。

記憶と人格の合流点が、ここにあります。

この意味で、人格DB は記憶と分離した静的プロフィールではありません。

記憶グラフと環流する、人格の参照軸です。

人格は口調ではなく構造で守る

ここで明確にすべきなのは、Personality Database が守っているのは「口調の一定さ」ではないということです。

語尾のパターンや丁寧さのレベルを固定することと、振る舞いの一貫性を構造的に担保することは、まったく別の次元の問題です。

Level 1 が規定するのは認知・行動の傾向であり、Level 2 が規定するのは動機と対処の方針であり、Level 3 が規定するのはそのキャラクターの存在意義そのものです。

この三層がモデルの外部に明示的に分離・保持されていることによって、その場その場の生成に引きずられず、一貫性を保ち続けることができます。

つまり、人格を守るとは、表現の癖を固定することではありません。

判断の参照基準を外部に持つこと です。

ここでいう外部化は、単に構造化して見やすくするためではありません。

それは、基盤モデルが変わっても、更新されても、人格の核そのものは同じ基準で参照し続けられるようにするためでもあります。

この点で、人格DB は LLM アグノスティックな設計思想とも直接つながっています。人格を特定モデルの内部状態や、一回限りのプロンプト解釈に依存させない。モデル外部に保持された人格DBが基準になるからこそ、どの高性能な汎用LLMの上に載せても、同じ人格の輪郭を継承できるのです。

これによって初めて、ただ自己回帰するだけのAIでは実現しにくい、長期的にぶれないパーソナリティの永続化が可能になります。

前節の最後に残した問い、

「System2 が参照している"その人格らしさ"の基準はどこにあるのか」

への答えは、ここにあります。

それが、この Personality Database です。

人格の基準が定義されて、統合生成層は完結する

本節で、統合生成層の設計原理は一度完結します。

System1 が応答の温度を起動し、System2 がそれを制約・記憶・人格に接地させ、Personality Database がその人格の基準を外部構造として保持する。

ここまでで、Mumon の応答は、

  • 何を言うか
  • どう言うか
  • なぜそれがその人格らしいのか

のすべてにおいて、構造的な根拠を持つに至りました。

ただし、応答はテキストとして完成しただけでは終わりません。

ユーザーが受け取るのは、文章そのものだけではないからです。どのような声で届くのか。どのような存在感として見えるのか。そこまで含めて初めて、応答は「人格」として知覚されます。

次章では、ここまでに構築された人格が、声と視覚を通じてどのように体験として届けられるかを論じます。

本節は、統合生成の終点であると同時に、表現レイヤーの起点です。

ここで人格の基準が定義されて初めて、次章でその人格を、ボイスやアバターを通じて一貫して届けることが可能になります。