https://github.com/kaikei-e/s4rciv
sentinel for civic records — a passive, read-only flight recorder for public records, plus a situation-room dashboard for citizens.
https://github.com/kaikei-e/s4rciv
civic-tech civictech docker-compose golang rust-lang
Last synced: 29 days ago
JSON representation
sentinel for civic records — a passive, read-only flight recorder for public records, plus a situation-room dashboard for citizens.
- Host: GitHub
- URL: https://github.com/kaikei-e/s4rciv
- Owner: Kaikei-e
- License: agpl-3.0
- Created: 2026-06-02T13:44:58.000Z (about 1 month ago)
- Default Branch: main
- Last Pushed: 2026-06-02T16:01:11.000Z (about 1 month ago)
- Last Synced: 2026-06-02T16:19:25.703Z (about 1 month ago)
- Topics: civic-tech, civictech, docker-compose, golang, rust-lang
- Language: PLpgSQL
- Homepage:
- Size: 200 KB
- Stars: 0
- Watchers: 0
- Forks: 0
- Open Issues: 0
-
Metadata Files:
- Readme: README.md
- License: LICENSE
Awesome Lists containing this project
README
# S4rCiv
**_sentinel for civic records_** — 公的記録の受動・読取専用フライトレコーダ + 市民のための可視化ダッシュボード
「サーシヴ」と読む。*sentinel for civic* を詰めた綴り(`4r` = "for")。g0v が "gov-zero"、Decidim が「決めよう」を名乗るのと同じく、名前そのものに趣意を込めている。
-yellow)

[](https://github.com/RichardLitt/standard-readme)
**日本語** | [English](docs/README_EN.md)
> 立法・法令・公金・調達といった日本の**公的一次データ**を継続的に観測し、その**変化(削除を含む)を改ざん耐性のある不変ログに記録**して可視化する、非党派・読取専用のシビックテック基盤。
民主主義の透明性は、「今どうなっているか」を見せるだけでは十分に機能しない。「**いつ・何が・どう変わったのか、そして何が静かに消されたのか**」を、誰もが後から辿れて初めて意味を持つ。S4rCiv は、公開されている一次情報を記録し続ける「フライトレコーダ」と、複数のソースを横断して状況を一望できる「司令室ダッシュボード」を組み合わせ、この**時系列の追跡可能性**を市民の手に届けることを目指す。
S4rCiv は権力と対立するための道具ではない。**説明責任を負う公的主体の「公的な出力」を、誰にでも検証できる形で記録する**ための情報インフラである。記録に意見や評価は加えない。残すのは、観測された事実と、原文へ遡れる出典だけ。何をどの基準で監視するかは公開し、全主体へ同一のパイプラインを適用する。
系譜としては、g0v / Audrey Tang(Plurality)が掲げる「ラディカルな透明性」と「有益な情報流通(beneficial information flows)」、そして米国 EDGI の Web Monitoring(政府ウェブページの差分監視)の現代的な後継に位置づけられる。
## 目次
- [なぜ S4rCiv か](#なぜ-s4rciv-か)
- [何をするか](#何をするか)
- [設計原則](#設計原則)
- [やらないこと](#やらないこと)
- [アーキテクチャ](#アーキテクチャ)
- [検証可能性](#検証可能性)
- [データ源](#データ源)
- [ステータスとロードマップ](#ステータスとロードマップ)
- [動かす(ローカル)](#動かすローカル)
- [関連プロジェクト](#関連プロジェクト)
- [コントリビュート](#コントリビュート)
- [ライセンス](#ライセンス)
- [クレジット・参考](#クレジット参考)
## なぜ S4rCiv か
既存の監視系シビックテックは、情報公開・投票記録・予算といった単機能サイトの縦割りで構成され、その多くが「現在値」のスナップショットしか見せてこなかった。だが公的記録の価値は、**変化の履歴**にこそ宿る。条文がいつ書き換わったのか、契約額がどう推移したのか、公開されていた文書がいつ消えたのか — これらを後から確かめられなければ、透明性は形骸化する。
S4rCiv は「現在値」ではなく「**変化そのもの**」を一次的な記録対象に据える。観測できなくなったこと(沈黙)すら情報として残す。
いま着手する意義は、制度面の追い風が重なっていることにもある:
- **e-Gov 法令API v2**(2025-03 公開、OpenAPI・法令XML/JSON、更新法令一覧あり)で法令の機械可読な差分監視が現実的になった。
- **官報の電子化**と**告示のベース・レジストリ**提供が 2026 年度中を目途に進行中。
- **政治資金収支報告書のオンライン提出・ネット公表が 2027-01 から義務化**され、機械可読化が進む。
- 先行事例である EDGI の Web Monitoring は現在休眠しており、記録・監視側の領域が相対的に空いている。
## 何をするか
S4rCiv のパイプラインは、一貫して三段に整理できる:
1. **継続収集** — 公開エンドポイントへの HTTP GET のみで一次情報を取得する。
2. **変化の記録** — 取得内容をハッシュ化し、前回との差分を append-only の不変ログに記録する(`ResourceObserved` / `ResourceChanged` / `ResourceVanished` / `ResourceRestored`)。
3. **可視化** — タイムライン・エンティティ・地図・要約として、出典と鮮度を添えて提示する。
観測の対象は、**制度・公金・公的行為**に限定される:
- 立法プロセス(本会議・委員会の議事、法案、採決、記名投票)
- 法令・告示・通達・規則の制定改廃
- 公金(予算、政治資金収支報告書、政党交付金)
- 公共調達・契約(入札・落札・随意契約)
- 公職者・政治団体の**公的な**発信・届出
## 設計原則
これらは努力目標ではなく制約である。原則に反する機能や依存は定義上「誤り」であり、実装する前に矛盾として表面化させる。詳細は [`docs/concepts/CORE_CONCEPT_0001.md`](docs/concepts/CORE_CONCEPT_0001.md) を参照。
1. **受動・読取専用** — 公開エンドポイントへの HTTP GET のみ。認証・送信・書き込み・自動アクションをしない。見張り(sentinel)であって行為者ではない。
2. **公的一次データのみ** — 出所が公的に公開済みの一次情報だけを扱う。
3. **append-only 不変ログ** — 削除・改変を含めてすべて残す。ログ自身もハッシュ連鎖で改ざん耐性を持たせる。
4. **観測面と解釈面の分離** — 改ざん耐性のある ground truth(観測面)と、再計算可能で出典・確信度付きの projection(解釈面)を物理的に分ける。
5. **標準準拠でサイロを作らない** — Akoma Ntoso(法令・議事)、Popolo(人・役職)、OCDS(調達)。
6. **AI は要約のみ・判断しない** — スコアリングや論評をせず、すべての要約は原文・差分へリンクし、確信度と出所を併記する。
7. **出典明記と利用規約の技術的内蔵** — ソース別レート制御・robots.txt 遵守・識別可能な User-Agent・全レコードへの出典/取得時刻付与・可能な場面での Internet Archive 併用。
## やらないこと
S4rCiv の信頼性は、「何をするか」と同じくらい「**何をしないか**」によって担保される。禁止事項の正本は [`DISCIPLINE.md`](DISCIPLINE.md) にある。要点:
- **私人を監視・プロファイリング・晒さない。** 監視の矛先は常に説明責任を負う公的主体(政治家・政党・政治団体・公職者)に固定する。政治資金の少額寄附者などの私人を横断名寄せしない。
- **党派的に振る舞わない。** 特定政党・思想を標的にせず、全主体へ同一基準・同一パイプラインを適用する。監視対象の選定基準は公開する。
- **脱コンテキストの差分を結論として出さない。** 差分は必ず周辺コンテキストと全文リンクを伴って提示する("gotcha" 化の防止)。
- **AI に判断・評価をさせない。** 要約・クラスタリングのみ。原文へのリンク・確信度・出所を欠いた要約を出さない。
- **自動投稿で個人を狙い撃たない。** アラートは事実・出典リンク付き・opt-in に限る。
## アーキテクチャ
自己ホスト可能な少数のサービス(収集・参照の Go、構造差分の Rust、Web の SvelteKit、Postgres)をアダプタ式に組み合わせる。新しいソースの追加は、新しいアダプタ(収集+正規化)の追加に等しい。詳細は概念ドキュメント [§8](docs/concepts/CORE_CONCEPT_0001.md) を参照。
```mermaid
flowchart TB
SRC["公開 API / ページ (+ Internet Archive)"]
subgraph OBS["観測面 — observation plane(不変・append-only・hash-chain)"]
COL["ソースアダプタ / 収集
collector(Go)
kokkai · e-Gov 法令 · 参議院記名投票 · 議員名簿"]
LOG[("イベントログ CQRS
append-only · hash-chain
ground truth")]
end
subgraph INT["解釈面 — interpretation plane(再計算可能 + provenance / confidence)"]
DIF["構造差分 differ
Rust · Connect-RPC · stateless"]
RM[("リードモデル
timeline · 記名投票 · 法令 · 選挙区地図")]
end
API["api(Go · Connect-RPC · 読取専用)"]
WEB["Web — SvelteKit 司令室ダッシュボード"]
SRC -->|HTTP GET のみ| COL --> LOG
LOG -. projection .-> DIF --> RM
LOG -. projection .-> RM
RM --> API --> WEB
```
正規化の構造差分は独立した **differ** サービス(Rust・Connect-RPC・stateless、ADR-000005)が担い、収集(`collector`)と参照(`api`)はそれぞれ別の Go バイナリ。**観測面(observation plane)** は生スナップショットとハッシュ連鎖の変化イベントからなる不変の ground truth。**解釈面(interpretation plane)** は正規化エンティティ・変化分類・要約からなり、観測面からいつでも再計算できる projection で、各フィールドが出所(provenance)と確信度(confidence)を持つ。解釈を観測面へ書き戻すことはない。
UI の規定は [`docs/design/DESIGN_LANGUAGE.md`](docs/design/DESIGN_LANGUAGE.md) にある(ダーク既定・WCAG 2.2 AA 目標・色は状態のためだけに使う)。
## 検証可能性
観測面のログは append-only で、各イベントは直前スナップショットのハッシュ(`prev_content_hash`)とログ自身のハッシュ連鎖(`log_prev_hash`)を保持する。これにより、ログは**改ざん耐性(tamper-evident)** を持つ — 改ざんが不可能なのではなく、**改ざんがあれば検出できる**。S4rCiv が自らの記録を後から書き換えていないことを、第三者が独立に検証できる。
完全性検証はレコード単位の「検証済み」バッジではなく、事案ページの端末内で**有界**に行う設計とした(直近の署名つきチェックポイントから当該区間だけ再計算する。ADR-000014)。「記録の記録」を名乗る以上、この検証可能性は機能ではなく前提である。可能な場面では Internet Archive(Memento)経由でも取得し、第三者アーカイブとの二重化で証跡を補強する。
## データ源
各ソースはアダプタとして実装し、ソース別のレート制御を既定 ON で運用する(規律の正本は [`DISCIPLINE.md`](DISCIPLINE.md))。
| ソース | 内容 | エンドポイント | ステータス |
|---|---|---|---|
| 国会会議録検索API(国立国会図書館) | 本会議・委員会の議事、発言、記名投票 | `https://kokkai.ndl.go.jp/api/` | 実装済み (M1) |
| e-Gov 法令API v2(デジタル庁) | 法令XML(憲法・法律・政令・省令等)、更新法令一覧 | `https://laws.e-gov.go.jp/api/2/` | 実装済み (M2) |
| 参議院 記名投票結果 | 参議院本会議の記名投票(議員別の賛否・選挙区地図の軸) | `https://www.sangiin.go.jp/` | 実装済み (M4) |
| 両院 公式議員名簿 | 現職議員の会派・選挙区(Popolo 同定、記名投票地図の補助) | `https://www.shugiin.go.jp/` ・ `https://www.sangiin.go.jp/` | 実装済み (M4) |
| 官報・告示 ベース・レジストリ | 告示等の機械可読構造化データ | 2026 年度中目途 | 将来 |
| 政治資金収支報告書(総務省) | 政治資金の収支 | 2027-01 ネット公表義務化 | 将来 |
| 公共調達(調達ポータル) | 入札・落札・契約(OCDS 整形) | `https://www.p-portal.go.jp/` | 将来 |
> 国会会議録は、データベースおよび国立国会図書館職員の発言の著作権が NDL に帰属するため、出典明記が必須。法令・告示・通達は著作権法 13 条により「権利の目的とならない著作物」であり、収集・差分表示・再配布の法的足場が堅い。
## ステータスとロードマップ
**開発中。M1(国会会議録)と M2(e-Gov 法令)の収集・差分・projection・参照 API が動く。** M3/M4 は一部実装、M5/M6 は未着手。公開(M6)には未到達で、運用デプロイの手順はまだ整っていない。現状はローカルの Docker Compose スタックとして動かす([動かす(ローカル)](#動かすローカル))。設計の根拠は [`docs/ADR/`](docs/ADR)(000001–000015)に記録している。
マイルストーン(概念ドキュメント §11。状態: ✓ 実装済 / ◐ 一部 / ○ 未着手):
- **✓ M0 — 骨格**: 三面スキーマ(観測/解釈/control)、append-only + hash-chain のイベントログ、アダプタ interface、観測面/解釈面の分離。
- **✓ M1 — 立法アダプタ**: 国会会議録 API から議事・発言を取得し、Popolo で議員/会派を projection、記名投票を VoteEvent 化。
- **✓ M2 — 法令アダプタ**: e-Gov「更新法令一覧」をポーリングし、独立した differ サービスで AKN の構造差分を取る(条・項・号・号の細分・用語定義まで)。
- **◐ M3 — ダッシュボード v0**: 全 Source 横断のタイムライン(双方向キーセットページング)と議員別記名投票は実装済み。ウォッチ&アラートは設計のみ(ADR-000007。サーバ push を採らずフィード+端末内保存)。
- **◐ M4 — マップ**: 参議院記名投票の選挙区 choropleth(都道府県内訳+比例パネル+coverage)を実装。衆院は個人別投票が未公開のため、軸足を参に移している(ADR-000010)。
- **○ M5 — 要約 v0**: 原文リンク必須の要約を薄く。未着手。
- **○ M6 — 公開**: ライセンス確定、自己ホスト手順、監視対象の選定基準の公開。未着手。
## 動かす(ローカル)
現状はローカルの Docker Compose スタック(プロジェクト名 `s4rciv`)として動く。前提は Docker と、テストを回すなら Go。
```sh
cp .env.example .env # POSTGRES_* / USER_AGENT を設定
# secrets/db_password.txt に DB パスワードを書く
docker compose up -d # db・migrate(Atlas)・api・collector・differ・web が起動
# web: http://127.0.0.1:3000 / api(Connect-RPC, 読取専用): 127.0.0.1:8080
cd services/api && go test ./...
```
スタックは空で起動する(監視リストは `discover` でのみ増える設計)。データ投入(`collector discover` 等の subcommand)、proto 再生成・マイグレーション・コンテナ運用の詳細は [`CLAUDE.md`](CLAUDE.md) と `docker-compose` skill を参照。
## 関連プロジェクト
S4rCiv は競合ではなく協調を志向する。標準(AKN / Popolo / OCDS)に準拠することで、これらと接続可能性を保つ。
- **デジタル民主主義2030 / 広聴AI**(参加・熟議側、非党派 OSS) — 相補的。S4rCiv の構造化記録・差分は熟議の入力コンテキストになりうる。
- **Code for Japan / Code for 選挙**(Popolo、立法トラッカー) — Popolo 相互運用で協調。
- **政治資金センター / political-finance-database** — 公金側。S4rCiv は時系列差分と横断相関で補完する。
- **mySociety**(TheyWorkForYou / WhatDoTheyKnow) / **EDGI Web Monitoring** — 海外の系譜であり先行事例。
## コントリビュート
Issue・Discussion を歓迎する。コードや収集アダプタに着手する前に、[`docs/concepts/CORE_CONCEPT_0001.md`](docs/concepts/CORE_CONCEPT_0001.md)(設計の正本)と [`DISCIPLINE.md`](DISCIPLINE.md)(禁止事項の正本)に必ず目を通してほしい。原則と矛盾する提案は、実装ではなく議論として扱う。
## ライセンス
サーバ本体(本リポジトリ)は **[AGPL-3.0](LICENSE)**(mySociety 等のシビックテック慣行に倣い、SaaS フォークもオープンに保つ)。
収集データ・スキーマのライセンス(CC0 または CC BY)と、クライアントライブラリのライセンス(Apache-2.0 / MIT)は、それぞれの成果物が生じた時点で別途決定する(本リポジトリの `LICENSE` の対象外)。
## クレジット・参考
設計思想は次の系譜に多くを負っている: g0v / Audrey Tang(Plurality)、EDGI Web Monitoring、mySociety、AI Objectives Institute の Talk to the City、そして標準仕様 Akoma Ntoso / Popolo / OCDS のコミュニティ。
主要な一次情報源とリンク:
- 国会会議録検索API 仕様 —
- e-Gov 法令API v2 — / 更新法令一覧 —
- 参議院(記名投票結果・議員名簿) —
- 政治資金収支報告書(総務省) —
- 調達ポータル —
- EDGI Web Monitoring —
- Talk to the City —
- デジタル民主主義2030 —