https://github.com/refrainit/zangetsu-data

PostgreSQL、BigQuery、Googleスプレッドシートへアクセスし、データを取得することをサポートするライブラリ
https://github.com/refrainit/zangetsu-data

bigquery pip postgresql python spreadsheet zangetsu

Last synced: about 1 month ago
JSON representation

PostgreSQL、BigQuery、Googleスプレッドシートへアクセスし、データを取得することをサポートするライブラリ

Host: GitHub
URL: https://github.com/refrainit/zangetsu-data
Owner: refrainit
License: mit
Created: 2025-03-14T09:30:47.000Z (over 1 year ago)
Default Branch: main
Last Pushed: 2025-03-16T07:18:02.000Z (over 1 year ago)
Last Synced: 2025-09-03T20:55:34.507Z (10 months ago)
Topics: bigquery, pip, postgresql, python, spreadsheet, zangetsu
Language: Python
Homepage: https://pypi.org/project/zangetsu-data/
Size: 113 KB
Stars: 0
Watchers: 1
Forks: 0
Open Issues: 0
Metadata Files:
- Readme: README.md
- Contributing: CONTRIBUTING.md
- License: LICENSE
- Code of conduct: CODE_OF_CONDUCT.md
- Security: SECURITY.md

Awesome Lists containing this project

README

          # zangetsu-data

データベース接続とデータ操作のための包括的な Python ライブラリです。複数のデータベースタイプとスプレッドシートに対する統一的なインターフェースを提供します。

## 特徴

- **多様なデータソースサポート**：PostgreSQL、BigQuery、GoogleSpreadsheet など

- **統一インターフェース**：すべてのデータソースで一貫したメソッド呼び出し

- **SQL ファイルテンプレート**：Jinja2 を使用した柔軟な SQL クエリ管理

- **Pandas 統合**：クエリ結果を直接 DataFrame として取得

- **環境変数サポート**：設定の外部化が容易

- **エラーハンドリング**：例外処理とロギング機能の統合

- **スキーマ管理**：テーブル定義の簡単な取得と管理

## インストール

```bash

pip install zangetsu-data

```

## 基本的な使い方

### データベース共通機能

```python

from zangetsu_data.common_database import Database

# データベース接続文字列を指定して接続

db = Database("postgresql://username:password@localhost:5432/mydatabase")

# 接続確立

db.connect()

# クエリの実行とデータの取得

df = db.read_sql("SELECT * FROM users WHERE age > %s", [18])

print(df)

# テーブルリストの取得

tables = db.list_tables()

print(tables)

# リソースの解放

db.close()

```

### PostgreSQL データベース接続

```python

from zangetsu_data.postgresql import Postgresql

# 接続情報を使用してインスタンス作成

db = Postgresql(

    host="localhost",

    port="5432",

    db_name="mydb",

    username="user",

    password="pass"

)

# SQLクエリの実行

df = db.read_sql("SELECT * FROM users")

print(df)

# テーブルリストの取得

tables = db.list_tables()

print(tables)

```

### Google BigQuery 接続

```python

from zangetsu_data.bigquery import BigQuery

# サービスアカウントキーファイルを使用して接続

bq = BigQuery(

    project_id="my-project",

    dataset_id="my_dataset",

    credentials_path="/path/to/service-account-key.json"

)

# クエリの実行

df = bq.read_sql("SELECT * FROM `my_dataset.my_table` LIMIT 1000")

print(df)

# データベース情報の確認

info = bq.show_database_info()

print(info)

```

### Google スプレッドシート操作

```python

from zangetsu_data.spreadsheet import GoogleSpreadsheet

# サービスアカウントキーファイルを使用して接続

gs = GoogleSpreadsheet(

    credentials_path="/path/to/service-account-key.json",

    spreadsheet_id="your_spreadsheet_id"

)

# シートからデータを読み込み

df = gs.read_sheet("Sheet1", "A1:D10")

print(df)

# DataFrameデータをシートに書き込み

import pandas as pd

data_df = pd.DataFrame({"Name": ["Alice", "Bob"], "Score": [85, 92]})

gs.write_sheet(data_df, "Sheet1", "A1", include_header=True)

# データをシートに追加

new_data_df = pd.DataFrame({"Name": ["Charlie"], "Score": [78]})

gs.append_sheet(new_data_df, "Sheet1")

# スプレッドシート内のシート一覧取得

sheets = gs.get_sheet_names()

print(sheets)

```

## SQL テンプレート機能

SQL クエリをファイルとして管理し、テンプレート変数で動的に生成できます。

### ディレクトリ構成

```

your_project/

  ├── app.py

  └── sql/

      ├── users_by_age.sql

      └── orders_summary.sql

```

### SQL ファイル例 (sql/users_by_age.sql)

```sql

SELECT

  id,

  name,

  email,

  age

FROM

  users

WHERE

  age BETWEEN {{ min_age }} AND {{ max_age }}

  {% if status %}

  AND status = '{{ status }}'

  {% endif %}

```

### Python コードでの利用

```python

from zangetsu_data.common_database import Database

db = Database("postgresql://username:password@localhost:5432/mydatabase", sql_dir="sql")

# SQLファイルを読み込み、変数を適用してクエリを取得

sql = db.get_query_from_file("users_by_age", min_age=18, max_age=30, status="active")

print(sql)

# SQLファイルを使用して直接クエリを実行

df = db.execute_query_file(

    "users_by_age",

    {"department": "sales"},  # SQLのプレースホルダに渡すパラメータ

    min_age=20,  # テンプレート変数

    max_age=40

)

print(df)

```

## データベーススキーマ管理

```python

from zangetsu_data.postgresql import Postgresql

db = Postgresql(

    host="localhost",

    port="5432",

    db_name="mydb",

    username="user",

    password="pass"

)

# 特定のテーブルのスキーマ取得

users_schema = db.get_table_schema("users")

print(users_schema)

# データベース内の全テーブルのスキーマ取得

all_schemas = db.get_tables_schema()

print(all_schemas)

# スキーマのDataFrame形式での出力

schema_df = db.export_schema_to_dataframe("users")

print(schema_df)

```

## 環境変数

`/.env`ファイルを使用して設定を外部化できます:

```

# BigQuery Configuration

GOOGLE_APPLICATION_CREDENTIALS=/path/to/your/service-account.json

```

## テーブル操作

```python

from zangetsu_data.common_database import Database

db = Database("postgresql://username:password@localhost:5432/mydatabase")

# 新しいテーブルの作成

db.create_table(

    "employees",

    {

        "id": "SERIAL PRIMARY KEY",

        "name": "VARCHAR(255) NOT NULL",

        "email": "VARCHAR(255) UNIQUE",

        "department": "VARCHAR(100)",

        "hire_date": "DATE"

    }

)

# テーブルの削除

db.delete_table("old_employees")

# トランザクション内での複数クエリの実行

db.transaction_query([

    "INSERT INTO logs (message) VALUES ('Operation started')",

    "UPDATE status SET current = 'processing'",

    "INSERT INTO logs (message) VALUES ('Status updated')"

])

```

## 貢献

1. リポジトリをフォーク

2. 機能ブランチを作成 (`git checkout -b feature/amazing-feature`)

3. 変更をコミット (`git commit -m 'Add some amazing feature'`)

4. ブランチをプッシュ (`git push origin feature/amazing-feature`)

5. プルリクエストを作成

ecosyste.ms

Data

Tools

Indexes

Applications

Experiments

Awesome

https://github.com/refrainit/zangetsu-data

Awesome Lists containing this project

README