ユーザーのメッセージが39エージェント × 6モデルで処理されるまでの全フロー
ユーザーが「競合分析してレポートをメールで送って」と入力した場合の処理フロー:
POST /chat/stream/{session_id} → 認証 → クレジット確認 → プリセットフィルタ適用
search_memories(query, user_id) → importance順 + キーワードマッチ → 最大6件取得
route_message() → 1候補route_message_tot() → 3候補比較 → 最高スコア選択エージェント固有プロンプト + プリセット指示 + 日時 + AI名前 + 言語指定notify gmail⏱️ 3.2s · 💰 $0.0023 · 📊 1,847 tokens · 🌱 CO₂ 0.37g · 💧 1.7ml
リクエストは複数のAIプロバイダーを順に試行。障害時は自動フォールバック。
APIキー無効(401)・残高不足(402/429)のプロバイダーは5分間スキップ。無駄なリトライを防止。
| エージェント | デフォルトLLM | 理由 |
|---|---|---|
| 💹 金融AI / ⚖️ 法務AI | Claude Sonnet 4.6 | 高精度な推論が必要 |
| ⚙️ コードAI / 🚀 デプロイAI / 🛠️ DevOps | Claude Haiku 4.5 | コード品質を担保 |
| 🎯 クリティックAI | GPT-4o | 異なるモデルで品質チェック |
| その他全エージェント | Qwen3-32B → Haiku | コスパ最適 + フォールバック |
ユーザーがProモードを選択すると、全エージェントが Claude Sonnet 4.6 を使用。最高品質だがコスト増。
プリセットはエージェントのフィルタリング + 固有のシステムプロンプト注入を行います。
Web・LINE・Telegram間でアカウントを統合。6文字のリンクコードで紐付け。記憶・履歴・クレジットが全チャネルで共有されます。コードはDB永続化(デプロイ後も有効)。
| コンポーネント | 技術 | 用途 |
|---|---|---|
| アプリケーション | Python / FastAPI / Uvicorn | 全APIエンドポイント |
| ホスティング | Fly.io (nrt / Tokyo) | min_machines_running=1 |
| データベース | SQLite (WAL mode) + aiosqlite | ユーザー・セッション・記憶・エージェント |
| 永続ストレージ | Fly Volumes (synapse_data) | /data にマウント |
| ブラウザ | Playwright (Chromium) | Web操作・スクリーンショット |
| コード実行 | E2B Sandbox | 安全なPython実行環境 |
| サイト公開 | Cloudflare Workers + D1 | xxx.chatweb.ai ドメイン |
| 決済 | Stripe | サブスクリプション・クレジット |
| メール | Resend / SMTP | Magic Link認証・Gmail送信 |
| 暗号化 | Fernet (AES) | ユーザーシークレット保存 |
コードエージェントなどの複雑なタスクでは、Claude Codeのようなループ実行を行います。
[[CONTINUE]] が含まれていたら「まだ途中」と判断。出力をコンテキストに追加して再度LLMを呼び出す。[[DONE]] マーカーを検出[[CONTINUE]] がない(自然完了)6時間ごとに自動で実行される品質改善サイクル。人間の介入なしにシステムが進化します。
ユーザーが回答に👍/👎を付けると、AIが品質をスコアリングし、$0〜$1/回のクレジットリワードを付与(月$10上限)。これがフィードバックループの入力データになります。