Ecosyste.ms: Awesome

An open API service indexing awesome lists of open source software.

https://github.com/no-src/gofs

A cross-platform real-time file synchronization tool out of the box based on Golang
https://github.com/no-src/gofs

file-manager file-server file-synchronization file-system go monitor sync

Last synced: about 1 month ago
JSON representation

A cross-platform real-time file synchronization tool out of the box based on Golang

Lists

README

        

# gofs

[![Build](https://img.shields.io/github/actions/workflow/status/no-src/gofs/go.yml?branch=main)](https://github.com/no-src/gofs/actions)
[![License](https://img.shields.io/github/license/no-src/gofs)](https://github.com/no-src/gofs/blob/main/LICENSE)
[![Go Reference](https://pkg.go.dev/badge/github.com/no-src/gofs.svg)](https://pkg.go.dev/github.com/no-src/gofs)
[![Go Report Card](https://goreportcard.com/badge/github.com/no-src/gofs)](https://goreportcard.com/report/github.com/no-src/gofs)
[![codecov](https://codecov.io/gh/no-src/gofs/branch/main/graph/badge.svg?token=U5K9HV78P0)](https://codecov.io/gh/no-src/gofs)
[![Release](https://img.shields.io/github/v/release/no-src/gofs)](https://github.com/no-src/gofs/releases)
[![Mentioned in Awesome Go](https://awesome.re/mentioned-badge.svg)](https://github.com/avelino/awesome-go)

[English](README.md) | 简体中文

基于Golang开发的一款开箱即用的跨平台实时文件同步工具

## 安装

首先需要确保已经安装了[Go](https://golang.google.cn/doc/install) (**版本必须是1.20+**),
然后你就可以使用下面的命令来安装`gofs`了

```bash
go install github.com/no-src/gofs/...@latest
```

### 在Docker中运行

你可以使用[build-docker.sh](/scripts/build-docker.sh)脚本来构建docker镜像,首先你需要克隆本仓库并且`cd`到本仓库的根目录

```bash
$ ./scripts/build-docker.sh
```

或者使用以下命令直接从[DockerHub](https://hub.docker.com/r/nosrc/gofs)中拉取docker镜像

```bash
$ docker pull nosrc/gofs
```

更多关于发布与docker的脚本参见[scripts](scripts)目录

### 后台运行

在windows系统中,你可以使用下面的命令构建一个在后台运行的不带命令行界面的程序

```bash
go install -ldflags="-H windowsgui" github.com/no-src/gofs/...@latest
```

## 快速开始

### 先决条件

请确保文件同步的源目录和目标目录都已经存在,如果目录不存在,则用你实际的目录替换下面的路径进行提前创建

```bash
$ mkdir source dest
```

生成仅用于测试的证书和密钥文件,生产中请替换为正式的证书

TLS证书和密钥文件仅用于与[Web文件服务器](#web文件服务器)和[远程磁盘服务端](#远程磁盘服务端)进行安全通讯

```bash
$ go run $GOROOT/src/crypto/tls/generate_cert.go --host 127.0.0.1
2021/12/30 17:21:54 wrote cert.pem
2021/12/30 17:21:54 wrote key.pem
```

查看你的工作目录

```bash
$ ls
cert.pem key.pem source dest
```

### 使用方法

#### 在磁盘之间同步

使用[本地磁盘](#本地磁盘)在磁盘之间同步文件

```mermaid
sequenceDiagram
participant DA as DiskA
participant C as Client
participant DB as DiskB

autonumber

C ->> DA: monitor disk
DA ->> C: notify change
C ->> DA: read file
DA ->> C: return file
C ->> DB: write file
```

#### 从服务器端同步

使用[远程磁盘服务端](#远程磁盘服务端)和[远程磁盘客户端](#远程磁盘客户端)从服务端同步文件

```mermaid
sequenceDiagram
participant SD as Server Disk
participant S as Server
participant C as Client
participant CD as Client Disk

autonumber

S ->> SD: monitor disk
C ->> S: connect and auth
SD ->> S: notify change
S ->> C: notify change
C ->> S: pull file
S ->> SD: read file
SD ->> S: return file
S ->> C: send file
C ->> CD: write file
```

#### 同步到服务器端

使用[远程推送服务端](#远程推送服务端)和[远程推送客户端](#远程推送客户端)同步文件到服务端

```mermaid
sequenceDiagram
participant CD as Client Disk
participant C as Client
participant S as Server
participant SD as Server Disk

autonumber

C ->> CD: monitor disk
CD ->> C: notify change
C ->> CD: read file
CD ->> C: return file
C ->> S: push file
S ->> SD: write file
```

#### 从SFTP服务器上同步

使用[SFTP拉取客户端](#sftp拉取客户端)从SFTP服务器上同步文件

```mermaid
sequenceDiagram
participant CD as Client Disk
participant C as Client
participant SS as SFTP Server
participant SSD as SFTP Server Disk

autonumber

C ->> SS: pull file
SS ->> SSD: read file
SSD ->> SS: return file
SS ->> C: send file
C ->> CD: write file
```

#### 同步到SFTP服务器

使用[SFTP推送客户端](#sftp推送客户端)同步文件到SFTP服务器

```mermaid
sequenceDiagram
participant CD as Client Disk
participant C as Client
participant SS as SFTP Server
participant SSD as SFTP Server Disk

autonumber

C ->> CD: monitor disk
CD ->> C: notify change
C ->> CD: read file
CD ->> C: return file
C ->> SS: push file
SS ->> SSD: write file
```

#### 从MinIO服务器上同步

使用[MinIO拉取客户端](#minio拉取客户端)从MinIO服务器上同步文件

```mermaid
sequenceDiagram
participant CD as Client Disk
participant C as Client
participant MS as MinIO Server
participant MSD as MinIO Server Disk

autonumber

C ->> MS: pull file
MS ->> MSD: read file
MSD ->> MS: return file
MS ->> C: send file
C ->> CD: write file
```

#### 同步到MinIO服务器

使用[MinIO推送客户端](#minio推送客户端)同步文件到MinIO服务器

```mermaid
sequenceDiagram
participant CD as Client Disk
participant C as Client
participant MS as MinIO Server
participant MSD as MinIO Server Disk

autonumber

C ->> CD: monitor disk
CD ->> C: notify change
C ->> CD: read file
CD ->> C: return file
C ->> MS: push file
MS ->> MSD: write file
```

#### 任务模式

启动一个[任务客户端](#任务客户端)来订阅[任务服务端](#任务服务端),然后获取任务并执行它,
以[从服务器端同步](#从服务器端同步)为例

```mermaid
sequenceDiagram
participant A as Admin
participant TS as Task Server
participant SD as Server Disk
participant S as Server
participant TC as Task Client
participant CW as Client Worker
participant CD as Client Disk
participant TQ as Task Queue

autonumber

S ->> SD: monitor disk
S ->> TS: start task server
A ->> TS: create task
TC ->> TS: subscribe task
TS ->> TC: distribute task
TC ->> CW: start worker
CW ->> TQ: add to task queue
TQ ->> CW: execute task
activate CW
CW ->> S: connect and auth
loop
SD ->> S: notify change
S ->> CW: notify change
CW ->> S: pull file
S ->> SD: read file
SD ->> S: return file
S ->> CW: send file
CW ->> CD: write file
end
deactivate CW
```

## 核心功能

### 本地磁盘

监控本地源目录将变更同步到目标目录

你可以使用`logically_delete`命令行参数来启用逻辑删除,从而避免误删数据

设置`checkpoint_count`命令行参数来使用文件中的检查点来减少传输未修改的文件块,默认情况下`checkpoint_count=10`,
这意味着它最多有`10+2`个检查点。在头部和尾部还有两个额外的检查点。第一个检查点等于`chunk_size`,它是可选的。
最后一个检查点等于文件大小,这是必需的。由`checkpoint_count`设置的检查点偏移量总是大于`chunk_size`,
除非文件大小小于或等于`chunk_size`,那么`checkpoint_count`将变为`0`,所以它是可选的

默认情况下,如果源文件的大小和修改时间与目标文件相同,则忽略当前文件的传输。你可以使用`force_checksum`命令行参数强制启用校验和来比较文件是否相等

默认的校验和哈希算法为`md5`,你可以使用`checksum_algorithm`命令行参数来更改默认的哈希算法,
当前支持的算法如下:`md5`、`sha1`、`sha256`、`sha512`、`crc32`、`crc64`、`adler32`、`fnv-1-32`、`fnv-1a-32`、`fnv-1-64`、`fnv-1a-64`、`fnv-1-128`、`fnv-1a-128`

如果你想要降低同步的频率,你可以使用`sync_delay`命令行参数来启用同步延迟,
当事件数量大于等于`sync_delay_events`或者距离上次同步已经等待超过`sync_delay_time`时开始同步

另外你可以使用`progress`命令行参数来打印文件同步的进度条

```bash
$ gofs -source=./source -dest=./dest
```

### 加密

你可以使用`encrypt`命令行参数来启用加密功能,并通过`encrypt_path`命令行参数指定一个目录作为加密工作区。所有在这个目录中的文件都会被加密之后再同步到目标路径中

```bash
$ gofs -source=./source -dest=./dest -encrypt -encrypt_path=./source/encrypt -encrypt_secret=mysecret_16bytes
```

### 解密

你可以使用`decrypt`命令行参数来将加密文件解密到指定的路径中

```bash
$ gofs -decrypt -decrypt_path=./dest/encrypt -decrypt_secret=mysecret_16bytes -decrypt_out=./decrypt_out
```

### 全量同步

执行一次全量同步,直接将整个源目录同步到目标目录

```bash
$ gofs -source=./source -dest=./dest -sync_once
```

### 定时同步

定时执行全量同步,将整个源目录同步到目标目录

```bash
# 每30秒钟将源目录全量同步到目标目录
$ gofs -source=./source -dest=./dest -sync_cron="*/30 * * * * *"
```

### 守护进程模式

启动守护进程来创建一个工作进程处理实际的任务,并将相关进程的pid信息记录到pid文件中

```bash
$ gofs -source=./source -dest=./dest -daemon -daemon_pid
```

### Web文件服务器

启动一个Web文件服务器用于访问远程的源目录和目标目录

Web文件服务器默认使用HTTPS协议,使用`tls_cert_file`和`tls_key_file`命令行参数来指定相关的证书和密钥文件

如果你不需要使用TLS进行安全通讯,可以通过将`tls`命令行参数指定为`false`来禁用它

如果将`tls`设置为`true`,则服务器默认运行端口为`443`,反之默认端口为`80`,
你可以使用`server_addr`命令行参数来自定义服务器运行端口,例如`-server_addr=":443"`

如果你在服务器端启用`tls`命令行参数,可以通过`tls_insecure_skip_verify`命令行参数来控制客户端是否跳过验证服务器的证书链和主机名,
默认为`true`

如果你已经启用了`tls`命令行参数,那么你可以使用`http3`命令行参数在服务器端和客户端启用HTTP3协议

出于安全考虑,你应该设置`rand_user_count`命令行参数来随机生成指定数量的用户或者通过`users`命令行参数自定义用户信息来保证数据的访问安全,
禁止用户匿名访问数据

如果`rand_user_count`命令行参数设置大于0,则随机生成的账户密码将会打印到日志信息中,请注意查看

如果你需要启用gzip压缩响应结果,则添加`server_compress`命令行参数,但是目前gzip压缩不是很快,在局域网中可能会影响传输效率

你可以使用`session_connection`命令行参数来切换Web文件服务器的会话存储模式,当前支持memory与redis,默认为memory。
如果你想使用redis作为会话存储,这里是一个redis会话连接字符串的示例:
`redis://127.0.0.1:6379?password=redis_password&db=10&max_idle=10&secret=redis_secret`

```bash
# 启动一个Web文件服务器并随机创建3个用户
# 在生产环境中请将`tls_cert_file`和`tls_key_file`命令行参数替换为正式的证书和密钥文件
$ gofs -source=./source -dest=./dest -server -tls_cert_file=cert.pem -tls_key_file=key.pem -rand_user_count=3
```

### 速率限制

使用`max_tran_rate`命令行参数来限制服务器端和客户端的最大传输速率,这是一个期望值,而不是绝对值

例如,限制最大传输速率为1048576字节,即1MB

```bash
$ gofs -source=./source -dest=./dest -max_tran_rate=1048576
```

### 远程磁盘服务端

启动一个远程磁盘服务端作为一个远程文件数据源

`source`命令行参数详见[远程磁盘服务端数据源协议](#远程磁盘服务端数据源协议)

注意远程磁盘服务端的用户至少要拥有读权限,例如:`-users="gofs|password|r"`

你可以使用`checkpoint_count`和`sync_delay`命令行参数就跟[本地磁盘](#本地磁盘)一样

```bash
# 启动一个远程磁盘服务端
# 在生产环境中请将`tls_cert_file`和`tls_key_file`命令行参数替换为正式的证书和密钥文件
# 为了安全起见,请使用复杂的账户密码来设置`users`命令行参数
$ gofs -source="rs://127.0.0.1:8105?mode=server&local_sync_disabled=true&path=./source&fs_server=https://127.0.0.1" -dest=./dest -users="gofs|password|r" -tls_cert_file=cert.pem -tls_key_file=key.pem -token_secret=mysecret_16bytes
```

### 远程磁盘客户端

启动一个远程磁盘客户端将远程磁盘服务端的文件变更同步到本地目标目录

`source`命令行参数详见[远程磁盘服务端数据源协议](#远程磁盘服务端数据源协议)

使用`sync_once`命令行参数,可以直接将远程磁盘服务端的文件整个全量同步到本地目标目录,就跟[全量同步](#全量同步)一样

使用`sync_cron`命令行参数,可以定时将远程磁盘服务端的文件整个全量同步到本地目标目录,就跟[定时同步](#定时同步)一样

使用`force_checksum`命令行参数强制启用校验和来比较文件是否相等,就跟[本地磁盘](#本地磁盘)一样

你可以使用`sync_delay`命令行参数就跟[本地磁盘](#本地磁盘)一样

```bash
# 启动一个远程磁盘客户端
# 请将`users`命令行参数替换为上面设置的实际账户名密码
$ gofs -source="rs://127.0.0.1:8105" -dest=./dest -users="gofs|password" -tls_cert_file=cert.pem
```

### 远程推送服务端

启动一个[远程磁盘服务端](#远程磁盘服务端)作为一个远程文件数据源,并使用`push_server`命令行参数启用远程推送服务端

注意远程推送服务端的用户至少要拥有读写权限,例如:`-users="gofs|password|rw"`

```bash
# 启动一个远程磁盘服务端并启用远程推送服务端
# 在生产环境中请将`tls_cert_file`和`tls_key_file`命令行参数替换为正式的证书和密钥文件
# 为了安全起见,请使用复杂的账户密码来设置`users`命令行参数
$ gofs -source="rs://127.0.0.1:8105?mode=server&local_sync_disabled=true&path=./source&fs_server=https://127.0.0.1" -dest=./dest -users="gofs|password|rw" -tls_cert_file=cert.pem -tls_key_file=key.pem -push_server -token_secret=mysecret_16bytes
```

### 远程推送客户端

启动一个远程推送客户端将本地文件变更同步到[远程推送服务端](#远程推送服务端)

使用`chunk_size`命令行参数来设置大文件上传时切分的区块大小,默认值为`1048576`,即`1MB`

你可以使用`checkpoint_count`和`sync_delay`命令行参数就跟[本地磁盘](#本地磁盘)一样

更多命令行参数用法请参见[远程磁盘客户端](#远程磁盘客户端)

```bash
# 启动一个远程推送客户端并且启用本地磁盘同步,将source目录下的文件变更同步到本地dest目录和远程推送服务器上
# 请将`users`命令行参数替换为上面设置的实际账户名密码
$ gofs -source="./source" -dest="rs://127.0.0.1:8105?local_sync_disabled=false&path=./dest" -users="gofs|password"
```

### SFTP推送客户端

启动一个SFTP推送客户端,将发生变更的文件同步到SFTP服务器

```bash
$ gofs -source="./source" -dest="sftp://127.0.0.1:22?local_sync_disabled=false&path=./dest&remote_path=/gofs_sftp_server&ssh_user=sftp_user&ssh_pass=sftp_pwd" -tls_cert_file=cert.pem
```

### SFTP拉取客户端

启动一个SFTP拉取客户端,将文件从SFTP服务器拉到本地目标路径

```bash
$ gofs -source="sftp://127.0.0.1:22?remote_path=/gofs_sftp_server&ssh_user=sftp_user&ssh_pass=sftp_pwd" -dest="./dest" -sync_once
```

### MinIO推送客户端

启动一个MinIO推送客户端,将发生变更的文件同步到MinIO服务器

```bash
$ gofs -source="./source" -dest="minio://127.0.0.1:9000?secure=false&local_sync_disabled=false&path=./dest&remote_path=minio-bucket" -users="minio_user|minio_pwd"
```

### MinIO拉取客户端

启动一个MinIO拉取客户端,将文件从MinIO服务器拉到本地目标路径

```bash
$ gofs -source="minio://127.0.0.1:9000?secure=false&remote_path=minio-bucket" -dest="./dest" -users="minio_user|minio_pwd" -sync_once
```

### 任务服务端

启动一个任务服务器,将任务分发给客户端

以[远程磁盘服务端](#远程磁盘服务端)为例,
首先创建一个任务清单配置文件[remote-disk-task.yaml](/integration/testdata/conf/task/remote-disk-task.yaml),
这里定义了一个从服务器同步文件的任务

然后创建在上述清单配置文件中定义的任务内容配置文件[run-gofs-remote-disk-client.yaml](/integration/testdata/conf/run-gofs-remote-disk-client.yaml)
,它将会被客户端执行

最后使用`task_conf`命令行参数启动远程磁盘服务端

这里使用`conf`命令行参数来简化命令并复用集成测试的配置文件

```bash
$ cd integration
$ mkdir -p rs/source rs/dest
$ gofs -conf=./testdata/conf/run-gofs-remote-disk-server.yaml
```

### 任务客户端

启动一个任务客户端来订阅任务服务器,然后获取任务并执行它

使用`task_client`命令行参数来启动任务客户端,`task_client_max_worker`命令行参数将限制任务客户端的最大并发工作线程数

你可以使用`task_client_labels`命令行参数来定义任务客户端的标签,这些标签用于在任务服务器端匹配任务

这里使用`conf`命令行参数来简化命令并复用集成测试的配置文件

```bash
$ cd integration
$ mkdir -p rc/source rc/dest
$ gofs -conf=./testdata/conf/run-gofs-task-client.yaml
```

### 中继

如果你需要在两个无法直接相连的设备之间同步文件,可以使用反向代理作为中继服务器来实现,详情参见[中继模式](/relay/README-CN.md)

### 远程磁盘服务端数据源协议

远程磁盘服务端数据源协议基于URI基本语法,详见[RFC 3986](https://www.rfc-editor.org/rfc/rfc3986.html)

#### 方案

方案名称为`rs`

#### 主机名

远程磁盘服务端数据源在[远程磁盘服务端](#远程磁盘服务端)模式下使用`0.0.0.0`或者其他本地网卡IP地址作为主机名,
在[远程磁盘客户端](#远程磁盘客户端)模式下使用远程磁盘服务端的IP地址或者域名作为主机名

#### 端口号

远程磁盘服务端数据源端口号,默认为`8105`

#### 参数

仅在[远程磁盘服务端](#远程磁盘服务端)模式下设置以下参数

- `path` [远程磁盘服务端](#远程磁盘服务端)真实的本地源目录
- `mode` 指定运行模式,只有在[远程磁盘服务端](#远程磁盘服务端)模式下需要手动指定为`server`,
默认为[远程磁盘客户端](#远程磁盘客户端)模式
- `fs_server` [Web文件服务器](#web文件服务器)地址,例如`https://127.0.0.1`
- `local_sync_disabled` 是否将[远程磁盘服务端](#远程磁盘服务端)的文件变更同步到远程本地的目标目录,
可选值为`true`或`false`,默认值为`false`

#### 示例

[远程磁盘服务端](#远程磁盘服务端)模式下的示例

```text
rs://127.0.0.1:8105?mode=server&local_sync_disabled=true&path=./source&fs_server=https://127.0.0.1
\_/ \_______/ \__/ \____________________________________________________________________________/
| | | |
方案 主机名 端口号 参数
```

### 管理接口

基于[Web文件服务器](#web文件服务器)的应用管理接口

默认情况下,仅允许私有地址和回环地址访问管理接口的相关路由

你可以通过将`manage_private`命令行参数设置为`false`来禁用默认行为,允许公网IP访问管理接口的路由

```bash
$ gofs -source=./source -dest=./dest -server -tls_cert_file=cert.pem -tls_key_file=key.pem -rand_user_count=3 -manage
```

#### 性能分析接口

pprof访问地址如下:

```text
https://127.0.0.1/manage/pprof/
```

#### 配置接口

读取应用程序配置,默认返回`json`格式,当前支持`json`和`yaml`格式

```text
https://127.0.0.1/manage/config
```

或者使用`format`参数来指定返回的配置格式

```text
https://127.0.0.1/manage/config?format=yaml
```

#### 报告接口

使用`report`命令行参数来启用报告接口的路由并且开始收集报告数据,需要先启用`manage`命令行参数

报告接口详情参见[Report API](/server/README.md#report-api)

```text
https://127.0.0.1/manage/report
```

### 日志

默认情况下会启用文件日志与控制台日志,你可以将`log_file`命令行参数设置为`false`来禁用文件日志

使用`log_level`命令行参数设置日志的等级,默认级别是`INFO`,可选项为:`DEBUG=0` `INFO=1` `WARN=2` `ERROR=3`

使用`log_dir`命令行参数来设置日志文件目录,默认为`./logs/`

使用`log_flush`命令行参数来设置自动刷新日志到文件中,默认启用

使用`log_flush_interval`命令行参数设置自动刷新日志到文件中的频率,默认为`3s`

使用`log_event`命令行参数启用事件日志,所有事件都会记录到文件中,默认为禁用

使用`log_sample_rate`命令行参数设置采样日志的采样率,取值范围为0到1,默认值为`1`

使用`log_format`命令行参数设置日志输出格式,当前支持`text`与`json`,默认为`text`

使用`log_split_date`命令行参数来根据日期拆分日志文件,默认为禁用

```bash
# 在"本地磁盘"模式下设置日志信息
$ gofs -source=./source -dest=./dest -log_file -log_level=0 -log_dir="./logs/" -log_flush -log_flush_interval=3s -log_event
```

### 使用配置文件

如果需要的话,你可以使用配置文件来代替所有的命令行参数,当前支持`json`和`yaml`格式

所有的配置字段名称跟命令行参数一样,你可以参考[配置示例](/conf/example)或者[配置接口](#配置接口)的响应结果

```bash
$ gofs -conf=./gofs.yaml
```

### 校验和

你可以使用`checksum`命令行参数来计算并打印文件的校验和

`chunk_size`、`checkpoint_count`和`checkpoint_count`命令行参数在这里同在[本地磁盘](#本地磁盘)中一样有效

```bash
$ gofs -source=./gofs -checksum
```

## 更多信息

### 帮助信息

```bash
$ gofs -h
```

### 版本信息

```bash
$ gofs -v
```

### 关于信息

```bash
$ gofs -about
```

### Web UI

[gofs-webui](https://github.com/no-src/gofs-webui)是`gofs`的Web用户界面工具,它允许你通过Web用户界面来生成`gofs`
的配置文件,让使用`gofs`变得更加简单

## 贡献

### 如何参与贡献

```mermaid
%%{init: { "flowchart": {"htmlLabels": false}} }%%
flowchart TD
PR[pull request]
MainRepo[github.com/no-src/gofs.git] -- 1.fork --> ForkRepo[github.com/yourname/gofs.git]
ForkRepo -- 2.git clone --> LocalRepo[local repository]
LocalRepo -- 3.commit changes --> NewBranch[new branch]
NewBranch -- 4.git push --> ForkRepo
ForkRepo -- 5.create pull request --> PR
PR -- 6.merge to --> MainRepo
```

### 云开发环境

利用云开发环境快速参与贡献

#### Github Codespaces

[![Open in GitHub Codespaces](https://github.com/codespaces/badge.svg)](https://codespaces.new/no-src/gofs)

#### Gitpod

[![Open in Gitpod](https://gitpod.io/button/open-in-gitpod.svg)](https://gitpod.io/#https://github.com/no-src/gofs)