Gnosis: エージェントの「記憶」と「レビュー」を実運用に変える MCP 基盤

LLM エージェントを開発していると、同じ調査を何度も繰り返したり、過去の失敗や判断が次のタスクに活かされなかったりします。 この非効率を減らし、開発速度と品質を継続的に高めるために設計されたのが Gnosis です。

Gnosis は単なるメモ保存ツールではありません。 知識を「次の実装判断に再利用できる形」に変換し、MCP ツールとして実行フローに組み込む Agent-First な知識・レビュー基盤です。

なぜ Gnosis が必要か

多くのエージェント運用では、次の問題が繰り返し発生します。

  • 過去に解いた問題でも、再びゼロから調査してしまう
  • レビュー品質がレビュー担当者の経験に依存する
  • 会話ログは残るが、判断材料として再利用しづらい

Gnosis はこの課題に対し、検索 → レビュー → 記録 → 再利用 のループを標準化することで対応します。

Agent-First の最小ツール導線

Gnosis の公開面は、あえて最小限に絞られています。

  • initial_instructions
  • agentic_search
  • search_knowledge
  • record_task_note
  • review_task
  • doctor

ツール数を増やすのではなく、必要な知識に短距離で到達できる導線を優先しています。

主要機能

1. agentic_search: 文脈付きで「判断に効く知識」を返す

agentic_search は単語一致ベースの検索ではありません。 変更種別・意図・対象ファイルといったタスク文脈を使って、今回の実装判断に必要な知識を自然文で返します。

結果として、検索は「情報収集」から「意思決定支援」に変わります。

2. review_task: 知識注入レビューで再現性を上げる

差分レビューや実装計画レビューに、過去知識を取り込んで指摘を生成します。 これにより、レビュー品質の属人化を抑え、チームで再現可能なレビュー運用に寄せられます。

3. record_task_note: 学びを再利用可能な資産に変える

知識は次のような分類で保存できます。

  • rule
  • lesson
  • procedure
  • decision
  • risk

保存した内容は次回の検索やレビューで再利用され、過去の判断がそのまま運用資産として機能します。

4. doctor: 「動いているつもり」を防ぐ運用診断

MCP 公開状態、DB/インデックス、ランタイム整合性を診断し、実運用上のズレを可視化します。 設定だけ整っていて実際は壊れている、といった状態を早期に検出できます。

Gnosis が目指すもの

Gnosis は「一発で正解を出すエージェント」を目標にしていません。 目指しているのは、失敗や判断履歴を知識として循環させる仕組みです。

  • 検索・レビュー・記録・再利用を継続ループとして定着させる
  • ローカル中心で運用しやすい構成を維持する
  • 実装済み機能を「使える状態」まで引き上げる

つまり、PoC 止まりではなく、日々の開発フローに組み込める基盤へ寄せることが中核です。

利用シーン

Gnosis は特に次のような場面で有効です。

  • チームレビュー品質を平準化したい
  • 過去の実装判断を別案件でも活用したい
  • エージェント活用を PoC で終わらせたくない
  • 「検索できるメモ」ではなく「判断できる知識基盤」がほしい

まとめ

Gnosis は、LLM エージェント時代の開発で重要になる 「記憶の再利用性」と「レビューの実用性」 にフォーカスした MCP 基盤です。

会話ログを溜めるだけで終わらせず、知識を次の判断に接続する。 その設計と運用を現場に定着させるための実装が、Gnosis の価値です。

https://github.com/ugnoguchigxp/gnosis