AIエージェントメモリ・ステートフルエージェント基盤比較2026|Mem0・Zep・Letta・Cognee・LangMemで「忘れないAI」を構築する
Mem0・Zep・Letta(旧MemGPT)・Cognee・LangMemを徹底比較。ユーザー嗜好の長期記憶/会話履歴の階層要約/知識グラフ/プロシージャル記憶を備えた「忘れないAIエージェント」を実現する2026年最新メモリプラットフォームを、抽出方式・グラフ/ベクトル・SDK・セルフホスト・料金など9軸で解説します。
2026年、AIエージェントの差別化軸は「モデル」ではなく「メモリ」になった
2026年、AIエージェント/チャットボットの実用品質を分けるのは「どのLLMを使うか」ではなく「どのメモリ層を使うか」に移りました。GPT-4.5・Claude 4・Gemini 2はいずれも100万トークン超の長コンテキストを扱えますが、「毎回コンテキストに全履歴を詰め込む」素朴な実装ではコスト・レイテンシ・関連性の3点で破綻します。ユーザーが3カ月前に話した好み、先週合意したプロジェクトの段取り、昨日のミスから学んだ手順——これらを「正しく覚え、正しく忘れ、正しく取り出す」専用基盤こそが、2026年のAIエージェント開発の差別化要素です。
2024〜2025年にMem0が$25M Series A調達(2025年Y Combinator卒業生主導)、ZepがNeo4jのCEOら出資のSeries Aを完了、Letta(旧MemGPT)がUC Berkeley Sky LabsからスピンアウトしてSeries Aを完了、LangMemをLangChainがプラットフォーム機能として正式公開するなど、エージェントメモリ専業ベンダーが急成長。「単なるベクトル検索」ではなく、エピソード記憶・セマンティック記憶・プロシージャル記憶・ワーキングメモリを階層的に管理する人間の記憶モデルに近い設計が業界標準になりつつあります。
本記事では、2026年現在AIエンジニア・LLMアプリ開発者・PdMが選択すべき主要エージェントメモリ基盤5プラットフォーム——Mem0(OSS発・自動抽出メモリの最有力)・Zep(時間認識ナレッジグラフGraphitiで会話を可視化)・Letta(旧MemGPT発・ステートフルエージェントの研究発フレームワーク)・Cognee(オントロジー駆動のエンタープライズ知識グラフ)・LangMem(LangChain統合・既存LangGraphから即導入)——を、メモリ抽出方式・記憶種別・グラフ/ベクトル基盤・SDK/API・マルチユーザー対応・忘却(decay)/更新ロジック・セルフホスト/コンプライアンス・料金・サポート体制の9軸で比較します。「ChatGPT Memoryのようなパーソナライズ機能を自社AIに実装したい」「LangChain/LlamaIndex/CrewAIのエージェントが毎回ユーザーを忘れて困る」「企業ナレッジを蓄積するエージェント基盤を選定したい」というAIエンジニア・CTOの疑問に2026年最新情報で答えます。
2026年版 主要AIエージェントメモリ基盤の比較
Mem0|OSS発・自動抽出メモリのデファクトスタンダード(GitHub Star 30,000+)
Mem0(メムゼロ)は2023年Taranjeet SinghとDeshraj Yadavによりサンフランシスコで設立されたAIエージェント向けインテリジェントメモリレイヤーの最有力OSS/SaaSです。2025年Series Aで$24Mを Peak XV(旧Sequoia India)主導で調達、累計$30M超。GitHub Star 30,000+でエージェントメモリ分野No.1の人気。Mem0の差別化は「会話履歴をLLMで自動分析→事実・嗜好・コンテキストを構造化メモリとして抽出→ユーザー単位/エージェント単位/セッション単位で永続化」する自動抽出パイプライン。Add/Search/Get/Update/DeleteのCRUD型APIが極めてシンプルで、OpenAI/Anthropic/Cohere/Together/Groq/Ollamaなど主要LLMをバックエンドに利用可能、ベクトルストアはQdrant・Pinecone・Chroma・Milvus・Weaviate・PostgreSQL pgvector・Redisから選択可能。Python/TypeScript SDKが両言語で完備、「Mem0 Platform(クラウドSaaS)」では追加でグラフメモリ(Neo4j統合)・分析ダッシュボード・チームコラボ機能を提供。Khan Academy・Coursera・Notion・Replit・Snowflake・Cohere・Booking.comなどで採用報告。料金はFree(10,000メモリ)/Hobby $19/月/Pro $99/月/Enterprise要相談、OSS Apache 2.0で完全セルフホスト可能、SOC2 Type II対応。
Zep|時間認識ナレッジグラフGraphitiで会話を可視化する次世代メモリ
Zep(ゼップ)は2023年Daniel ChalefとPaul Paliychukにより設立されたAIエージェント向け時間認識メモリプラットフォームです。2024年Series Aを Neo4j創業者らの出資で完了、累計$2.6M+。Zepの圧倒的差別化は「Graphiti」と呼ばれる時間認識ナレッジグラフエンジンで、会話・ドキュメント・ユーザーアクションを「いつ・誰が・何を・誰に対して」のエッジ付きグラフとして動的構築。Bi-Temporal model(valid time/transaction time)により「3カ月前は独身だったが今は既婚」「先月までA社勤務、今はB社」のような時系列変化する事実関係を矛盾なく管理可能。Fact Triplets(subject-predicate-object)とEntity Edgesの二層構造で、エージェントはセマンティック検索(ベクトル)+ノード/エッジ検索(グラフ)+時間範囲フィルタを組合せて関連メモリを抽出。Graphitiは2024年OSS化されGitHub Star 4,000+を獲得、Zepクラウドはマネージドサービスとして提供。Athena Intelligence・Distyl AI・Datasaur・Stack AI・Athina AIなどエンタープライズLLMアプリで採用。料金はFree(1,000ユーザー)/Pro $300/月/Enterprise要相談、Cloud/Self-Hosted両対応、SOC2 Type II・GDPR・HIPAA Business Associate Agreement対応。
Letta(旧MemGPT)|UC Berkeley発・ステートフルエージェントの研究発フレームワーク
Letta(レッタ、旧MemGPT)は2023年UC Berkeley Sky LabsのCharles Packer・Sarah Wooders・Joseph Gonzalez教授らにより「LLMをOSと見立て、メモリを階層的に管理する」研究プロジェクトMemGPTとして開始、2024年Letta Inc.として商業化。2024年Felicis主導でSeed+Series Aで合計$10M調達。Lettaの強みは「Memory Hierarchy(コアメモリ/アーカイバルメモリ/リコールメモリ)」のOS的設計で、「コアメモリ=常にコンテキストに含む短い要約/アーカイバルメモリ=ベクトル検索可能な長期記憶/リコールメモリ=過去の対話履歴の検索可能アーカイブ」の3層を自動管理。「self-editing memory」機能でエージェント自身が「このユーザーは菜食主義=コアメモリに保存」「先月の旅行話=アーカイブへ移動」を判断するメタ認知的設計。Letta ADE(Agent Development Environment)でメモリの可視化・編集・デバッグが可能、Pythonサーバ+REST APIアーキテクチャでLangChain・LlamaIndex・CrewAI・AutoGenなど他フレームワークと併用可能。OSS Apache 2.0でセルフホスト可能、Lettaクラウド版は招待制。Anthropic・Replit・Khan Academy・Codeiumなどのリサーチチームで活用報告。料金はOSS版完全無料/Letta Cloud Beta無料/Enterprise要相談、SOC2 Type II準備中。
Cognee|オントロジー駆動のエンタープライズ知識グラフメモリ
Cognee(コグニー)は2023年Vasilije MarkovicとBoris Arzentar(元Palantir)によりベルリンで設立されたオントロジー駆動のAIエージェントメモリ+知識グラフプラットフォームです。2024年プレシードを Earlybirdおよびエンジェルで調達。Cogneeの差別化は「ECL(Extract-Cognify-Load)パイプライン」と呼ばれる3段階のメモリ構築プロセスで、(1) Extract=ドキュメント/会話からエンティティ・関係・時系列を抽出、(2) Cognify=オントロジー(業界標準スキーマ)にマッピングして意味推論を追加、(3) Load=グラフDB(Neo4j/FalkorDB)+ベクトルDB(Qdrant/LanceDB/Weaviate)に二重永続化。「DataPoint」と呼ばれる構造化データオブジェクトを単位にメモリを管理、Pydanticベースの型安全性。Streamlit製の可視化UI「Cognee Visualizer」でグラフ構造をブラウザで探索可能。金融・医療・法務など業界オントロジーが既に存在する規制業種で採用が進み、「コンプライアンス要件のあるエンタープライズLLMアプリで知識グラフをガバナンス可能な形で構築」するユースケースに最適。OSS MIT、Python SDK中心、Cognee Cloudベータ提供中。料金はOSS版完全無料/Cloud Beta無料/Enterprise要相談。
LangMem|LangChain純正・LangGraph統合の即時導入メモリAPI
LangMem(ラングメム)は2025年LangChain社がLangGraph統合のメモリ管理APIとして正式公開したLangChain純正メモリプラットフォームです。LangMemの強みは「LangChain/LangGraph/LangSmithで開発しているチームが追加学習コストゼロで導入できる」こと。(1) Semantic Memory(意味記憶)=ユーザーの嗜好・事実をJSONドキュメントとして保存、(2) Episodic Memory(エピソード記憶)=特定の出来事を例として保存し将来の Few-Shotに再利用、(3) Procedural Memory(手続き記憶)=エージェントが「うまくいった手順」をプロンプトとして自動学習・更新の3種を提供。Hot Path(リクエスト処理中に同期更新)/Background(バッチで非同期更新)の2モードで、低レイテンシ要件と高品質メモリ抽出を両立。LangGraphのStore APIに自然統合され、既存のLangGraphワークフローに1〜2行の変更でメモリ機能を追加可能。LangSmithダッシュボードでメモリの可視化・トレース・評価を統合。OpenAI/Anthropic/Google/Cohere/Togetherを含む主要LLMに対応、InMemoryStore(開発用)/PostgresStore(本番用)のバックエンド選択。料金はLangChain OSS無料/LangSmith Plus $39/月/Enterprise要相談、LangChain既存契約に統合課金、SOC2 Type II対応。
9軸で徹底比較する2026年最新スペック表
1. メモリ抽出方式(自動 vs 手動・LLM抽出 vs ルールベース)
会話・ドキュメントから「事実・嗜好・コンテキストを抽出してメモリ化」する自動抽出機能はMem0 ≒ Zep > Letta ≒ LangMem > Cognee(手動制御寄り)。Mem0は1行のadd()呼出だけでLLMが自動抽出+既存メモリとの矛盾解消+更新/削除を判断、ZepもAdd Messageでバックグラウンド抽出+Graphitiでグラフ更新まで自動、Lettaはエージェント自身がコアメモリを書換える「self-editing」設計、LangMemはHot Path/Background両モードを開発者が選択。Cogneeはオントロジー駆動のため事前スキーマ定義が必要で「適当に投げて勝手に整理してくれる」用途には不向きですが、業界スキーマがある領域では他より高品質。「とにかく早く実装したい」ならMem0、「品質を制御したい」ならCogneeが王道です。
2. 記憶の種別(セマンティック/エピソード/プロシージャル/ワーキング)
人間の記憶モデル(セマンティック=事実、エピソード=出来事、プロシージャル=手続き、ワーキング=短期)への対応はLangMem ≒ Letta > Mem0 > Zep > Cognee。LangMemは3種別をAPIで明示的に区別、LettaはMemory Hierarchyで4層を分離。Mem0は主にセマンティック+エピソードを混在管理、Zepはグラフのエンティティ/エッジで意味記憶、Cogneeはセマンティック中心。「エージェントが過去の成功パターンから学ぶ」プロシージャル記憶を実装したい場合はLangMemが最も洗練されています。
3. ナレッジグラフ/ベクトル/ハイブリッド検索基盤
検索基盤の充実度はZep(Graphiti時系列グラフ) > Cognee(オントロジー駆動グラフ+ベクトル) > Mem0(ベクトル中心+オプションでグラフ) > Letta(ベクトル中心) > LangMem(ベクトル+ストア)。Zepは時系列対応の知識グラフが最先端で「いつから」「いつまで」のクエリが可能。Cogneeはオントロジーマッピングで業界標準スキーマと整合。Mem0はGraph Memory機能(Neo4j連携)でグラフをオプションで追加可能。「複雑な関係性のあるエンタープライズ知識」ならZep/Cognee、「シンプルなユーザー嗜好メモリ」ならMem0が最適です。
4. SDK・API・主要フレームワーク統合
SDK/統合の幅はMem0 ≒ LangMem > Zep > Letta > Cognee。Mem0はPython・TypeScript・REST API+LangChain・LlamaIndex・CrewAI・AutoGen・LangGraph公式インテグレーション、LangMemはLangChain/LangGraph/LangSmith完全統合(既存ワークフローに数行で追加)。Zepは Python・TypeScript SDK+LangChain統合、LettaはPython中心+REST API、CogneeはPython中心。「Node.js/Next.js/Bunで開発」ならMem0/Zepの TypeScript SDKが必須。
5. マルチユーザー・マルチテナント対応(user_id/agent_id分離)
SaaS開発で必須の「ユーザーごとに完全分離されたメモリ空間」対応はMem0 > Zep > LangMem > Letta > Cognee。Mem0はuser_id・agent_id・run_idの3軸でメモリを完全分離、Zepはuser/sessionの2軸+複数sessionの統合検索、LangMemはnamespace分離、Lettaはagent単位、Cogneeはdataset/datapoint単位。「100,000ユーザーのチャットボットSaaS」を作るならMem0が運用シンプル。
6. 忘却・更新・矛盾解消ロジック(decay/conflict resolution)
メモリの「古い情報を忘れる/矛盾する事実を解消する/重複を統合する」ロジックはZep(Graphiti時系列推論) > Mem0(LLM judgeによる更新) > Letta(self-editing) > LangMem(プロンプトベース更新) > Cognee(オントロジー一貫性チェック)。Zepは「3カ月前の住所」と「現在の住所」を時系列で正しく扱うのが業界トップ実装。Mem0は新しい事実を追加する際に既存メモリとLLMで矛盾チェック→更新/追加/削除を自動判断。「ユーザー情報が頻繁に変わる」用途ではZep/Mem0が必須です。
7. セルフホスト・データレジデンシー・コンプライアンス
セルフホスト容易性はLetta ≒ Cognee(OSS完全自社運用標準)> Mem0(OSS+クラウド両対応)> Zep(Self-Hosted Enterprise版)> LangMem(OSS、ストアバックエンド任意)。金融・医療・公共などデータを社外に出せない業界ではLetta/Cognee/Mem0 OSS/LangMem+PostgresStoreが現実解。SOC2/HIPAA/GDPR完備のマネージドが欲しい場合はZep Cloud Enterprise/Mem0 Pro/LangSmithが選択肢。
8. 観測性・デバッグツール・メモリ可視化
メモリの「中身を確認・編集・デバッグする」UI/ツールはLetta(ADE) ≒ Zep(Web Console+Graphiti可視化) ≒ Cognee(Visualizer) > Mem0(Platform Dashboard) > LangMem(LangSmith統合)。Letta ADEはメモリの階層構造をブラウザで可視化+手動編集、Zep ConsoleはGraphitiグラフをノード/エッジ可視化、Cognee Visualizerはオントロジー構造をインタラクティブ表示。デバッグ時間を短縮したいなら可視化ツールが充実したLetta/Zep/Cogneeが優位。
9. 料金とROI(メモリ基盤導入の投資回収)
料金はOSS完全無料(Letta/Cognee/Mem0 OSS/LangMem OSS)> LangSmith Plus $39/月 > Mem0 Hobby $19/Pro $99 > Zep Pro $300/月 > Enterprise要相談。月間アクティブユーザー10,000・1ユーザーあたり平均50メッセージ規模のチャットボットで試算すると、Mem0 Pro $99/月でもメモリ層のおかげでLLMコンテキスト長を平均30%削減=LLMコスト月$3,000→$2,100と1カ月以内に回収。さらに「ユーザー満足度(CSAT)の向上による解約率低下」を加味すると、エージェントメモリ基盤のROIは導入1〜2カ月で確実にプラスに転じるのが業界標準パターンです。
業務シナリオ別おすすめ構成
パーソナライズドAIチャットボット(カスタマーサポート/個人秘書/教育チューター)
Mem0一択。最短実装+user_id分離+自動抽出+シンプルなCRUD APIが揃い、「ユーザーAは英語学習者で文法レベルB1」「ユーザーBは菜食主義」を自動記憶+次回会話で自動利用を最短数日で実装可能。Khan Academy・Coursera・Replitなど教育/コーディング支援系サービスでの採用が多く、「ChatGPT Memoryのようなパーソナライズ機能を自社プロダクトに」と考えるPdMの第一選択です。
エンタープライズLLMアプリ(複雑な関係性ある社内ナレッジ/時系列の重要な業務)
Zep+Graphiti。「組織図/プロジェクト履歴/契約変更/顧客との関係性の経時変化」を時系列ナレッジグラフで管理。Bi-Temporalモデルで「2025年Q3時点では担当だったが今は別チーム」のような時間に依存する事実を矛盾なく扱え、監査証跡・コンプライアンス・複雑な関係推論が要求されるエンタープライズLLMアプリに最適。
研究目的・自律エージェント実験(メモリ階層の細かい制御が必要)
Letta。Memory Hierarchyの細かいAPI制御+ADE可視化+OSSの自由度+研究界隈の支持が魅力。「エージェントの思考プロセスを観察したい」「自己編集メモリの効果を実験したい」研究者・LLM研究者・先進的なAIスタートアップに最適。LettaフォーラムやDiscordも活発で技術的議論が深い。
規制業種(金融/医療/法務)の知識グラフ駆動エージェント
Cognee。オントロジー駆動の構造化+セルフホスト+型安全+ガバナンス機能が、「規制要件下でAIエージェントに知識を与える」用途で他を圧倒。FIBO(金融)/HL7 FHIR(医療)/Akoma Ntoso(法務)など業界標準オントロジーをマッピングしてエージェント基盤に統合可能。
既にLangChain/LangGraphで開発しているチームの即時メモリ追加
LangMem。既存LangGraphワークフローに数行追加で導入+LangSmithでメモリトレース+セマンティック/エピソード/プロシージャルの3種別が標準。「学習コストゼロでメモリ機能を本番化」したいLangChainユーザーには圧倒的に楽。
導入失敗5パターンと回避策
失敗1: 「全履歴をベクトル化して投げる」だけで満足する
会話履歴を素朴にベクトル化して「最新N件を毎回投げる」実装は、長期会話で関連性低い断片が多数ヒット+本当に重要な事実が薄まる劣化を起こします。Mem0/Zep/LangMemのLLM抽出ベース構造化メモリを導入し、「事実の構造化>生テキスト保存」の発想に切替えてください。
失敗2: メモリの矛盾解消をエージェント側に押付ける
「住所が変わった」「離職した」など事実が更新されるたびに古いメモリと新しいメモリが衝突する事故。Mem0のLLM judge更新/Zepの時系列推論でメモリ層側に矛盾解消を任せる設計が必須。エージェントのプロンプト内で矛盾解消するのは複雑性増大の元凶です。
失敗3: マルチテナント分離をリクエストごとに手動で書く
SaaS用途で「user_idごとに別ベクトルストアを作る」場当たり的設計は数千ユーザーで破綻。Mem0のuser_id引数のようにメモリ層側でテナント分離が標準サポートされているプラットフォームを最初から選択してください。
失敗4: 個人情報を「全部」メモリに保存する
クレジットカード番号・パスワード・センシティブ医療情報まで自動抽出されてGDPR DSAR要求で全削除に手間取る事故。Mem0/LangMemの抽出フィルタ+PII検出(Presidio/Lakera)を組合せて「保存すべきメモリ」と「保存してはいけないメモリ」を明示的に分離。GDPR DSARでもユーザー単位delete()1行で完全削除可能な設計を最初に作ること。
失敗5: 「とりあえずクラウド版で本番化」してデータレジデンシー要件で詰む
金融・医療・公共のクライアントから「データを国内オンプレで保管せよ」要件が出た時に、クラウド専用メモリプラットフォームを選んでいると詰みます。OSS版(Mem0/Letta/Cognee/LangMem)でセルフホスト可能なものを最初から選定するか、Zep Self-Hosted Enterprise/Mem0 Self-Hostのように最初からエンタープライズプランを契約。
2026年以降のエージェントメモリ進化トレンド
2026年後半〜2027年に向けて「エージェントメモリは『単一ベンダー製品』から『標準仕様』へ進化」する流れが見えています。(1) MCP(Model Context Protocol)等のメモリ標準化でMem0/Zep/LettaがMCPサーバを公開、(2) マルチエージェント間メモリ共有(同じ顧客を担当するセールスエージェントとサポートエージェントが共有メモリ)、(3) メモリの自動忘却・要約圧縮(人間の記憶のように古いメモリを自然減衰)、(4) リアルタイムメモリ(音声会話の即時記憶化)、(5) メモリ評価ベンチマークの確立(LongMemBench等)。2027年にはエージェントメモリ=「LLMアプリにとってのデータベース層」として確立する見込みです。
よくある質問(FAQ)
Q1: ベクトルDB(Pinecone/Qdrant)と何が違うのか?
ベクトルDBは「ベクトルを保存・検索する低レベル基盤」。エージェントメモリ基盤は「会話/ドキュメントから事実を抽出→構造化→重複統合→矛盾解消→検索」までの上位パイプラインを提供。Mem0/Zep/Letta/Cognee/LangMemは内部でPinecone/Qdrant/pgvector等を使うことが多く、ベクトルDBの上に乗るアプリ層と理解するのが正確です。
Q2: ChatGPT MemoryやClaude Memoryと何が違うのか?
OpenAI/Anthropic純正のMemoryは「自社プロダクト(ChatGPT/Claude.ai)専用」でAPI経由の自社アプリには直接使えません。Mem0/Zep等は「自社AIエージェント/チャットボットにChatGPT Memory相当の機能を追加する」サードパーティ基盤で、すべてのLLMプロバイダで動作します。
Q3: 長コンテキストLLM(200万トークン Gemini等)が出れば不要では?
逆に重要性が増します。長コンテキストでも「100万トークン全部を毎回読ませるとコスト=レイテンシで現実的でない」+「Lost in the middle」問題(中間部分の関連情報が無視される)が長文ほど顕著になり、「必要な記憶だけを精選して投入」する役割はメモリ層が担い続けます。
Q4: 既存のRAGと併用できる?
併用が標準。RAG=「企業ドキュメント・FAQ等の静的知識を検索」、エージェントメモリ=「ユーザーごとの動的な対話履歴・嗜好を記憶」と役割が異なります。Mem0+LlamaIndex(RAG)、Zep+LangChain(RAG)など組合せが王道。
Q5: メモリ品質を評価する方法は?
業界ではLoCoMo(Long Conversation Memory)・LongMemBench・Memory Banksなどのベンチマークが整備中。Mem0は自社ベンチでGPT-4 Long Context比でメモリ精度+26%/レイテンシ-91%/トークン-90%を主張。実運用ではLangSmith/Langfuse等でメモリヒット時のユーザー満足度を継続計測するのが標準。
まとめ|「忘れないAI」が2026年エージェント体験の差別化軸
2026年のAIエージェントは「賢いLLM」より「忘れないメモリ」がユーザー体験を決める時代に入りました。Mem0(OSS発・自動抽出メモリのデファクトスタンダード)、Zep(時間認識ナレッジグラフGraphitiで会話を可視化)、Letta(旧MemGPT発・ステートフルエージェントの研究発フレームワーク)、Cognee(オントロジー駆動のエンタープライズ知識グラフ)、LangMem(LangChain統合・既存LangGraphから即導入)——5社それぞれの強みを「シンプルさ重視(Mem0)/時系列とグラフ重視(Zep)/研究・実験向け(Letta)/規制業種(Cognee)/LangChainユーザー(LangMem)」と用途別に選択。まずはMem0 Free+Mem0 OSSで個人検証→本番に向けてMem0 ProかZep Cloudを選定→規模拡大時にエンタープライズプランが最短ルート。「LLMを叩く前に必ずメモリ層を経由する」——この設計原則を2026年以降のすべてのAIエージェントに適用したチームが、ユーザー満足度・LTV・差別化の三方面で他社を圧倒します。
関連カテゴリ:開発支援ツール/AIベクトルデータベース/RAG基盤比較/AIエージェント開発フレームワーク比較/AI LLMOps・LLM観測ツール比較/AI Gateway/LLMルーティング比較。
AI Scout編集部
AIツール・SaaS専門のレビューチーム。最新のAI技術動向を追い、実際にツールを使用した上で、正確で信頼性の高い情報を提供しています。