https://github.com/nlink-jp/shell-agent-v2

macOS local-first chat & agent tool with interactive data analysis (Wails v2 + React)
https://github.com/nlink-jp/shell-agent-v2

data-analysis duckdb golang llm macos react wails

Last synced: about 1 month ago
JSON representation

macOS local-first chat & agent tool with interactive data analysis (Wails v2 + React)

Host: GitHub
URL: https://github.com/nlink-jp/shell-agent-v2
Owner: nlink-jp
License: mit
Created: 2026-04-24T15:27:56.000Z (2 months ago)
Default Branch: main
Last Pushed: 2026-05-11T04:13:38.000Z (about 1 month ago)
Last Synced: 2026-05-11T05:33:47.143Z (about 1 month ago)
Topics: data-analysis, duckdb, golang, llm, macos, react, wails
Language: Go
Homepage:
Size: 32.4 MB
Stars: 0
Watchers: 0
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.ja.md
- Changelog: CHANGELOG.md
- License: LICENSE
- Agents: AGENTS.md

Awesome Lists containing this project

README

# shell-agent-v2

macOS ローカルファーストチャット & エージェントツール（対話的データ分析機能付き）。

[shell-agent](https://github.com/nlink-jp/shell-agent) v0.7.x の後継。
セッションスコープ分析、Idle/Busy エージェント実行モデル、
ハイブリッド LLM バックエンド (Local + Vertex AI) で再設計。

## 機能

- **対話的データ分析** — DuckDB 組み込みによる対話駆動型データ探索。全 analysis tool（`load-data`, `query-sql`, `describe-data`, `analyze-data` 等）を毎ラウンド LLM に公開し、ラウンド毎の発見ではなく事前計画で複数ステップワークフローを組めるようにしている。詳細は [agent-tool-visibility.ja.md](docs/ja/history/agent-tool-visibility.ja.md)。`config.json` で `tools.hide_analysis_tools_until_data_loaded: true` を設定すると v0.1.20 以前の load 後表示挙動に戻せる（弱いローカルバックエンド向け opt-in）
- **セッションスコープ分析** — 各セッションが自身のデータベースを所有、セッション間の状態リークなし
- **エージェント実行モデル** — Idle/Busy 状態による処理中 UI ロックアウト
- **ハイブリッド LLM バックエンド** — ローカル LLM (LM Studio) と Vertex AI (Gemini)、`/model` でランタイム切替
- **per-backend コンテキスト予算** — `ContextBudget` をローカルと Vertex で個別設定可（Settings → Local/Vertex AI）
- **メモリモデル (v0.2.0 で刷新)** — 4 facility 構成。**Records**（不変の会話履歴）は `chat.json`、**Session Memory** は `fact` / `context` を per-session 自動抽出、**Findings** は per-session のデータ分析発見で chat-pane 専用パネルに表示、**Global Memory** は `preference` / `decision` を跨セッション保持。auto-extraction はカテゴリで routing し、「Pin to Global Memory」操作で Session Memory / Findings を跨セッション化。コンテキスト予算は `internal/contextbuild` の summary cache で非破壊的に管理。詳細は [memory-model.md](docs/en/memory-model.md)
- **コンテナサンドボックス (opt-in)** — 8 個の `sandbox-*` ツールで shell / Python をセッション毎の `podman`/`docker` コンテナで実行、`/work` をセッションデータディレクトリからマウント、MITL 必須、ネットワーク既定 off。`sandbox-load-into-analysis`（`/work` の CSV/JSON → DuckDB）と `sandbox-export-sql`（SQL 結果 → `/work` の CSV）でクエリ結果をチャットを介さず分析エンジンと Python の間で受け渡し可能。macOS セットアップは [sandbox-execution.ja.md](docs/ja/history/sandbox-execution.ja.md) 参照
- **Findings パネル** — chat-pane の disclosure に severity フィルタ・全文検索・bulk delete・リアルタイム更新、各行に Pin-to-Global-Memory ★ ボタン
- **シェルスクリプト Tool Calling** — スクリプトをツールとして登録、write/execute は MITL 承認。per-tool `@timeout: N` ヘッダ (秒) でデフォルト 30 秒キャップを上書き可能 (実行に時間が掛かる正当な tool 向け) — 詳細は [tool-execution-timeout.ja.md](docs/ja/history/tool-execution-timeout.ja.md)。スクリプトは `$SHELL_AGENT_WORK_DIR` (sandbox が `/work` として見るのと同じ物理ディレクトリ) に成果物を書き出せる。組込みツール `register-object` で chat に `object:` として表示可能 — 詳細は [work-dir-shell-bridge.ja.md](docs/ja/history/work-dir-shell-bridge.ja.md)
- **MITL approval（全ツール統一）** — analysis / shell / sandbox / MCP の全 tool source が単一ゲートを経由。破壊的な分析ツール（`load-data`, `reset-analysis`, `promote-finding`）と SQL/analyze プロンプトはデフォルトで MITL 必須、メタデータ系（`describe-data`, `list-tables` 等）は不要。ツール毎に **Settings → Tools** で上書き可能、トグルは dispatcher の実デフォルトと一致する。詳細は [security-hardening-2.ja.md](docs/ja/history/security-hardening-2.ja.md)
- **内蔵スクリプト** — `file-info`, `preview-file`, `list-files`, `weather`, `get-location`, `write-note`。初回起動時に `go:embed` から自動インストール、ユーザーカスタマイズは保護
- **ツールコールタイムライン** — ツール開始/終了がチャット内に一時的なピル表示として並ぶ。セッション復元時はコンパクトなツール名 + ステータス（success / error）バブルとして再現される（引数と結果本文はライブ時のみ）。詳細は [tool-event-restore.ja.md](docs/ja/history/tool-event-restore.ja.md)
- **バックグラウンドタスク可視化** — 応答後のタスク（タイトル生成・メモリ抽出）が走っている間、入力ステータスバーに小さいバッジで内容を表示し、入力欄を disable に保つ。次のユーザメッセージがそれらと競合して抽出を取りこぼすことを防ぐ。詳細は [background-task-indicator.ja.md](docs/ja/history/background-task-indicator.ja.md)
- **MCP サポート** — mcp-guardian stdio プロキシ経由
- **マルチモーダル** — ドラッグ&ドロップ、ペースト、ファイルピッカーによる画像入力
- **per-session データパネル** — チャットペイン上部の折りたたみディスクロージャに、現在セッションのオブジェクト（image / report / blob をサムネイル付きカードで表示）、DuckDB テーブル（クリックで先頭 20 行プレビュー）、サンドボックス `/work` ファイルを集約。画像はライトボックス、レポートはマークダウンビューア、CSV / テキスト blob はインアプリプレビュー（CSV / TSV は HTML テーブル描画、その他テキスト MIME（JSON / plain text / HTML 等）は等幅 pre）。バルク選択 / 削除は別ボタン Yes / No 確認
- **一括選択 / 削除** — Findings / Global Memory / Session Memory エントリを個別/全選択可、2クリック確認
- **プライベートセッション (v0.3.0)** — サイドバー bottom-nav の `+ New Private Chat` で作成したセッションは、跨セッション Global Memory promotion から opt-out される。`preference` / `decision` の fact は抽出層で drop、`Pin to Global Memory` は UI 非表示 + サーバ側でも reject。サイドバー行と chat-pane バナーに 🔒 を表示。プライバシーフラグはセッション作成時に固定、`chat.json` に persistent (`omitempty` で legacy セッションは非 private として load)。[privacy-controls.ja.md](docs/ja/privacy-controls.ja.md) 参照
- **ログプライバシー制御 (v0.3.0)** — `app.log` のデフォルトレベルを `info` に変更、prompt / response / ツール引数 body のディスク漏えいを停止。Settings → Privacy → Log verbosity で診断時のみ `debug` に切替。監査ログ行 (`session created/loaded/exported/imported/deleted`) は内容を含まない
- **セッション import / export (v0.4.0)** — セッション一式 (chat、session memory、findings、サマリ、サンドボックス `work/`、analysis DuckDB、セッションが所有する全 objstore object) を 1 つの `.shellagent` ZIP bundle にパッケージし、同マシンまたは別マシンで再 import できる。サイドバー行ごとの Export アイコン、bottom-nav の Import Chat ボタン、`/export` `/import` slash command。プライバシーフラグは round-trip 保持、object ID は import 時に常に再生成し chat.json と summaries.json の参照を限定書換。[session-import-export.ja.md](docs/ja/session-import-export.ja.md) 参照
- **In-place ツール進捗 (v0.4.1)** — 長時間ツール (現在は `analyze-data`) は `tool_progress` activity event でチャットペインの単一バブルを in-place 更新する (進捗 tick ごとに新しい "running" pill を spawn しない)。バブルは `tool_call_id` でマッチするため、将来の並行ツール実行も cross-contaminate しない。[tool-progress-events.ja.md](docs/ja/tool-progress-events.ja.md) 参照
- **セッション削除 safeguards (v0.4.2)** — 行の ✕ ボタンは破壊的呼出前に 6 秒間の `Confirm` 状態 (赤強調テキスト、既存 bulk-delete パターンと一致) を armする。削除中は行が grey 化 + `↻ Deleting…` スピナー表示。Agent state machine が削除中ずっと Busy を保持するため、並行 Send / Load / Export / Import は半削除状態のセッションディレクトリと race するのではなく `ErrBusy` を返す。[session-delete-ux.ja.md](docs/ja/session-delete-ux.ja.md) 参照
- **時間コンテキスト** — 強化された日時注入 + `resolve-date` システムツール

## インストール

```bash
cd app
make build
# 出力: dist/shell-agent-v2.app
```

## 設定

設定ファイル: `~/Library/Application Support/shell-agent-v2/config.json`

### LLM バックエンド

```bash
# チャット内:
/model # 現在のエンジンを表示
/model local # ローカル LLM に切替
/model vertex # Vertex AI に切替
```

### Vertex AI セットアップ

```bash
gcloud auth application-default login
# roles/aiplatform.user が必要
```

### 設定項目リファレンス

**Settings** ダイアログから変更できる項目。per-backend 値は
レガシーなトップレベルフォールバックを上書きする。

#### Agent loop

| 項目 | JSON パス | 既定値 | 備考 |
|---|---|---|---|
| 1 メッセージあたりの最大ツールラウンド | `agent.max_tool_rounds` | 10 | 1 つの user message に対するツール呼び出しラウンド数の上限。loop-detection ring buffer（v0.1.16 の Feature 1）が同一エラー連発を早期検出するので、長い正規分析が本当にラウンド不足になった時のみ引き上げる。 |

#### per-backend コンテキスト予算（Local / Vertex AI）

| 項目 | JSON パス | Local 既定 | Vertex 既定 | 備考 |
|---|---|---|---|---|
| Hot Token Limit | `llm.{local,vertex_ai}.hot_token_limit` | 4096 | 65536 | コンパクション発火閾値。Hot 階層の総トークンがこれを超えると古い Hot レコードが Warm へ要約される。 |
| Max Context Tokens | `llm.{local,vertex_ai}.context_budget.max_context_tokens` | 16384 | 524288 | 1 コール毎にモデルへ送る総トークン予算。0 = 無制限。 |
| Max Warm Summary Tokens | `llm.{local,vertex_ai}.context_budget.max_warm_tokens` | 1024 | 16384 | warm-summary ブロックの上限。これを超えた古い summary は drop される。 |
| Max Tool-Result Tokens | `llm.{local,vertex_ai}.context_budget.max_tool_result_tokens` | 2048 | 32768 | LLM メッセージ列に投入する前にツール結果を切り詰めるサイズ。 |
| Output Reserve | `llm.{local,vertex_ai}.context_budget.output_reserve` | 4096 | 4096 | モデル応答用に確保するトークン量。コンテキスト詰め込み前に `max_context_tokens` から差し引かれ、リクエストがモデルウィンドウを超えないようにする。 |
| Per-request timeout (秒) | `llm.{local,vertex_ai}.request_timeout_seconds` | 300 | 180 | リトライ層内の per-attempt キャップ。 |
| リトライ最大回数 | `llm.{local,vertex_ai}.retry_max_attempts` | 3 | 3 | 初回を含む LLM コール総試行数（1 = リトライなし）。Settings → Local LLM / Vertex AI に露出。 |
| リトライ backoff base (秒) | `llm.{local,vertex_ai}.retry_backoff_base_seconds` | 5 | 5 | 最初のリトライ間隔。以降 2 倍ずつ伸び、下記 max でキャップ。設定ファイル直編集のみ。 |
| リトライ backoff max (秒) | `llm.{local,vertex_ai}.retry_backoff_max_seconds` | 120 | 120 | リトライ間隔の上限。設定ファイル直編集のみ。 |
| リトライ jitter (秒) | `llm.{local,vertex_ai}.retry_jitter_seconds` | 1 | 1 | 各 backoff に対し ±jitter の一様分布で揺らぎを足す。設定ファイル直編集のみ。 |

#### Sandbox (`sandbox.*`)

| 項目 | JSON パス | 既定値 | 備考 |
|---|---|---|---|
| Enabled | `sandbox.enabled` | false | マスタートグル。OFF のとき 8 個の `sandbox-*` ツールは登録されない。 |
| Engine | `sandbox.engine` | `auto` | `auto` は PATH から `podman` → `docker` の順で選択。 |
| Image | `sandbox.image` | (未設定、Build まで空) | アクティブなコンテナイメージ。ローカルビルド (`shell-agent-v2-sandbox:`) と `@sha256:` digest pin は安全とみなす。`python:3.12-slim` 等の mutable upstream tag のとき Settings → Sandbox に注意バナーが表示される。 |
| 出力上限 (バイト) | `sandbox.max_output_bytes` | `8388608` (8 MiB) | `exec` 1 回あたりの stdout / stderr 上限。超えた分は `[output truncated at N bytes]` マーカー付きで破棄。LLM が `cat /dev/zero` 等を発行してもアプリが OOM しない。設定ファイル経由のみ、UI なし。 |
| Network | `sandbox.network` | false | 外向き通信。既定は OFF。 |
| CPU limit | `sandbox.cpu_limit` | `2` | `--cpus` に渡す。 |
| Memory limit | `sandbox.memory_limit` | `1g` | `--memory` に渡す。 |
| Per-call timeout (秒) | `sandbox.timeout_seconds` | 60 | 1 回の `exec` あたりの上限。 |

### セッション横断メモリの信頼レベル

shell-agent-v2 は会話から重要事実を自動抽出する。跨セッション
エントリ（Global Memory）は将来セッションのシステムプロンプトに
権威ある context として再注入される — これは **アシスタント発話に
一度でも現れた文字列**（引用された CSV セル、MCP 応答、画像 OCR
テキスト、取得した Web ページ）が将来セッションを構造的に操舵
しうることを意味する。各エントリは provenance タグを持つ:

- **user-stated** — ユーザー発話、手動 pin、または明示的な
「Pin to Global Memory」昇格由来。権威ある情報として扱う。
- **derived** — アシスタント発話からの抽出、または LLM が
`promote-finding` で昇格した finding。低信頼 — 内容は LLM を
経由しており、攻撃者影響下のバイトを含みうる。

サイドバー (Global / Session Memory) と chat-pane の Findings
パネルに badge がインライン表示される。ある fact が変な振る舞いを
誘発し始めたら（本対策の契機となった THINK 漏えいがこのケース）、
該当リストを開き、該当 entry を選択して一括削除する。脅威モデル
全文は [docs/ja/history/memory-injection-hardening.ja.md](docs/ja/history/memory-injection-hardening.ja.md)
を参照。v0.2.0 の 4-facility 設計は
[docs/en/memory-model.md](docs/en/memory-model.md) を参照。

## 要件

- macOS 10.15+
- LM Studio (ローカルバックエンド用) — Apple Silicon M1/M2 Pro+ 推奨
- 課金有効な GCP プロジェクト (Vertex AI バックエンド用)

## ビルド

```bash
cd app
make build # .app バンドルをビルド
make dev # ホットリロードで開発
make test # テスト実行
```

## ドキュメント

現状の正準資料:

- [**アーキテクチャ概要**](docs/ja/architecture.ja.md) ⭐ ここから
- [**メモリモデル**](docs/ja/memory-model.ja.md) — 4-facility 設計
- [**データ分析**](docs/ja/data-analysis.ja.md) — DuckDB エンジン、analyze-data sliding-window、Findings ライフサイクル

最近の設計メモ (post-v0.2.0 機能):

- [**プライバシー制御 (v0.3.0)**](docs/ja/privacy-controls.ja.md) — プライベートセッション、ログレベルフィルタ、監査ログ
- [**セッション import / export (v0.4.0)**](docs/ja/session-import-export.ja.md) — `.shellagent` bundle 形式、ID 再生成、レース条件カタログ
- [**ツール進捗イベント (v0.4.1)**](docs/ja/tool-progress-events.ja.md) — `tool_progress` activity event による in-place バブル更新
- [**セッション削除 UX (v0.4.2)**](docs/ja/session-delete-ux.ja.md) — 2-click confirm、Deleting 状態、agent state-machine 統合

過去の設計メモは [`docs/ja/history/`](docs/ja/history/) に
v0.2.0 の audit trail として保存。一部は現状を反映していない —
詳細はそのディレクトリの README 参照。今も妥当な主要なもの:

- [サンドボックス実行設計 + macOS セットアップ](docs/ja/history/sandbox-execution.ja.md)
- [オブジェクトストレージ設計](docs/ja/history/object-storage.ja.md)
- [LLM バックエンド抽象化](docs/ja/history/llm-abstraction.ja.md)
- [セッション復元時のツールイベント復活](docs/ja/history/tool-event-restore.ja.md)
- [Tool-call round-trip (Vertex / Local)](docs/ja/history/tool-call-roundtrip.ja.md)
- [セキュリティ強化（第 2 ラウンド、v0.1.20）](docs/ja/history/security-hardening-2.ja.md)
- [Shell tool 実行タイムアウト (`@timeout: N`)](docs/ja/history/tool-execution-timeout.ja.md)
- [Shell tool ↔ /work ブリッジ (`SHELL_AGENT_WORK_DIR`, `register-object`)](docs/ja/history/work-dir-shell-bridge.ja.md)
- [RFP (英語)](docs/en/history/shell-agent-v2-rfp.md) · [RFP (日本語)](docs/ja/history/shell-agent-v2-rfp.ja.md)

英語ミラーは `docs/en/` 配下。

## ライセンス

MIT

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/nlink-jp/shell-agent-v2

Awesome Lists containing this project

README