設計思想

Mumon：空気を読む人格OS

4つのレイヤーで、人格を構造として実装する

ここで、Mumonの全体像を俯瞰しておきます。

Mumonは、新しい基盤モデルではありません。GPT、Gemini、Claudeのような高性能LLMを知能基盤として活用し、その上に複数のレイヤーを重ねることで、ブランド固有の対話体験を構造として実装する人格OSです。

人間の構造にたとえるなら、汎用LLMが膨大な知識処理を担う「大脳新皮質」であるのに対し、Mumonは、その知能を「誰に」「いつ」「どのような文脈で」「どのような振る舞いとして」届けるべきかを判断し、記憶し、統合し、表現する層です。

つまり、Mumonの本質は、知能を再発明することではありません。

知能を、人格として成立させることです。

上図が示している通り、Mumonは単一の巨大なプロンプトや、単一のRAGモジュールではありません。

行動制御
記憶 / RAG
統合生成
表現

この4つのレイヤーが、それぞれ独立した役割を担いながら、シグナルによって接続されることで、初めて「空気を読む人格」が成立します。

行動制御レイヤー：どう振る舞うべきかを、生成前に決める

最初に動くのが、行動制御レイヤーです。

ここで問われるのは、「いま何を答えるか」ではありません。その前に、「いまどのように振る舞うべきか」を先に判定することです。

このレイヤーには、3つの独立したエージェントが置かれます。

Appraisal Agent：ユーザーの感情の温度と意図の方向を読む
Boundary Audit Agent：感情には寄り添いながらも事実は曲げず「NOと言える自我」を守る
Non-Directive Policy Agent：解決を急がず、早すぎる提案や導線の差し込みを抑える

重要なのは、これらが応答文を相談しながら一緒に作るのではないという点です。

3つのエージェントは、応答生成に先立って独立に評価を完了し、それぞれの結果を制約シグナルとして後段に渡します。

Emotional Tone
Blind Consent Block
Shallow Solution Suppression

Chapter 3で詳しく見るように、これらのシグナルは、生成に対する「お願い」ではありません。生成が始まる前に確定した前提条件です。

記憶 / RAGレイヤー：前回の続きから話せる文脈をつくる

しかし、「いまどう振る舞うか」だけでは、関係性は生まれません。

毎回初対面にリセットされるAIは、どれだけ丁寧でも、長期的な関係を築けません。ユーザーが再訪したときに必要なのは、前回と同じFAQをもう一度返してくれることではなく、「前回の続き」から自然に会話を始められることです。

その役割を担うのが、記憶 / RAGレイヤーです。

このレイヤーでは、Metacognitive Agent が、いまの対話が探索、共感、沈静化のどの局面にあるかを俯瞰し、何をどの方向から思い出すべきかを先に判断します。そのうえで Memory Agent が、過去エピソードや外部知識の中から、いま必要な文脈を引き出します。

ここで重要なのは、引かれるのが単なる事実だけではないという点です。前回の温度感、共有された迷い、少し慎重な色がついている話題、説明より先に安心が必要だった局面。そうした「関係性の履歴」そのものが、現在の応答条件として生成層へ渡されます。

その背後には、対話を感情と雰囲気を伴う「出来事」として保存するEpisode Memoryと、エピソード同士を因果や感情の関係で個人史のネットワークへ編み上げるGraphRAGの設計があります。

Chapter 4で詳述するように、Mumonの記憶は、ログの保管庫ではありません。

それは、「前回の続きから話せる」ための文脈装置です。

統合生成レイヤー：制約・記憶・人格を受けて、応答を組み上げる

行動制御と記憶によって、必要な前提条件が揃ったとしても、それだけではまだ応答は生まれません。

それらを実際の言葉へと変換するのが、統合生成レイヤーです。

ここでMumonは、1つの生成で一気に完成させるのではなく、System 1 と System 2 という二段階のパイプラインを採用します。

System 1 が担うのは、応答の立ち上がりです。感情の温度と人格の反射的傾向をもとに、まずどの温度で話し始めるべきかを決める。図の中では、これが Expression Preview として、短い予備反応のかたちを取りうる設計になっています。

そのあとで System 2 が、制約シグナル全体、引き出された記憶文脈、そして Personality Database に保持された人格の基準、すなわち気質的特性、特徴的適応、ナラティブ・アイデンティティという三層構造で定義されたブランド人格を参照しながら、応答を再審査し、最終的な言葉として仕上げます。

つまり、まず反応し、そのあとで整える。

まず温度を立ち上げ、そのあとで整合性を担保する。

この分離によって初めて、Mumonは「自然な立ち上がり」と「ブランドらしい一貫性」を同時に成立させることができます。

Chapter 5では、この統合生成レイヤーがどのように働くのかを詳しく論じます。

表現レイヤー：応答を、人格として知覚される体験へ変える

ただし、応答はテキストとして完成しただけでは終わりません。

ユーザーが受け取るのは、文章そのものだけではないからです。どのような声で届くのか。どのような存在感として見えるのか。そこまで含めて初めて、応答は「人格」として知覚されます。

その役割を担うのが、表現レイヤーです

ここでは、Original Voice が人格の音声的一貫性を担い、Avatar Persona が人格の視覚的一貫性を担います。図が示す通り、短い立ち上がりと、熟慮された最終応答は、時間差を持って表現されうる。つまりMumonは、何を言うかだけでなく、どう聞こえ、どう感じられるかまで含めて設計しています。

Chapter 6で詳しく扱うのは、まさにこの点です。

人格は、意味内容だけではなく、声と視覚を通じても一貫していなければならないのです。

4レイヤーの連動全体が、「空気を読む」を実装する

ここまでを整理しましょう。

行動制御だけでは、前回の文脈は引き継がれません
記憶だけでは、いま何を言うべきで何を言うべきでないかは決まりません
生成だけでは、人格の前提条件が不安定です
表現だけでは、内容の一貫性までは保証できません

だから必要なのは、単一の強いレイヤーではありません。

それぞれ異なる責務を担う4つのレイヤーが、接続された全体構造です。

制御が「いまどう振る舞うか」を決める
記憶が「過去から何を持ち込むか」を決める
生成が「どう言葉にするか」を整える
表現が「どう体験として届けるか」を担う

この連動全体が、Mumonのいう「空気を読む人格OS」の正体です。

Chapter 1で見てきた4つの課題は、まさにこのどこかが欠けているときに起きます。感情の温度は読めても、事実の防衛線がなければ迎合が起きる。記憶を持っていても、局面判定がなければ文脈を壊す。自然に話せても、人格の基準が外部化されていなければ、応答はぶれる。

だからMumonは、単に「賢いAI」を目指しているのではありません。

「前回の続きから、空気に合った温度で、ブランドらしく振る舞えるAI」を目指しています。

・・・・・

次章からは、この全体構造の最前線である行動制御層を見ていきます。

まず扱うのは、Chapter 1で示した4つの構造的課題を、最初に食い止めるレイヤーです。すなわち、感情の温度を読み、事実を守り、解決を急がないための設計です。