FlowDB

A high-performance time-series storage engine written in Rust, powered by an LSM-tree architecture with WAL, SSTables, and Bloom filters.

Benchmark Results

FlowDB vs RocksDB comparison (100K records, 128B values, batch=100, release build, Apple M-series):

Category	FlowDB	RocksDB	Result
Sequential Write	5.7M ops/s	3.0M ops/s	FlowDB 1.92x faster
Concurrent Write (8 threads)	6.7M ops/s	4.1M ops/s	FlowDB 1.63x faster
Point Query	6.6M ops/s	524K ops/s	FlowDB 12.7x faster
Prefix Scan (~200 recs)	71K ops/s	10.7K ops/s	FlowDB 6.6x faster
Full Scan (200K recs)	65 ops/s	39 ops/s	FlowDB 1.67x faster
Storage	1.9MB	1.8MB	~same

cargo run --release --example flowdb-vs-rocksdb

Features

LSM-tree storage with WAL (write-ahead log) for crash recovery
Lazy scan iterator (RocksDB-style ScanIterator) for bounded-memory range scans
get_latest(key) for retrieving the most recent record by key
Bloom filters for fast point query negative checks
Dual compression: lz4 for flush (speed), zstd for compaction (ratio)
Buffered WAL writes (256KB buffer) for reduced syscall overhead
WAL pre-encoding outside the write lock for better concurrency
Time-bucketed block index with binary search
LRU block cache (64 shards, powered by lru crate) with true LRU eviction
Log-based active memtable (Vec push) with on-freeze BTreeMap conversion
Hash-based memtable index (avoids key clone on insert)
Zero-copy owned write path (write_batch_owned)
Synchronous write path (write_batch_sync) for non-async callers
Size-tiered compaction with streaming heap merge (low memory footprint)
Range tombstones (delete_range) for efficient bulk key-range deletion
Garbage collection (TTL expiry), and point deletes
HTTP + UDP ingest APIs (feature-gated under server)
Admin dashboard, metrics, and stats endpoints
API key authentication
Config file support (TOML)

Cargo Features

Feature	Default	Description
`server`	Yes	HTTP/UDP servers, admin UI, auth (axum, tower-http, base64, crc16)

# Full server (default)
flowdb = "0.1"

# Embedded engine only (no HTTP/UDP/auth, smaller binary)
flowdb = { version = "0.1", default-features = false }

Quick Start

Build

cargo build --release

Run Server

# With defaults
./target/release/flowdb-server

# With CLI flags
./target/release/flowdb-server --data-dir ./data --http-addr 0.0.0.0:8080 --api-key mysecret

# With a config file
./target/release/flowdb-server --config flowdb.toml

Config File (TOML)

http_addr = "0.0.0.0:8080"
udp_addr = "0.0.0.0:9090"
api_keys = ["my-api-key"]
max_udp_packet_size = 1400

[engine]
data_dir = "./data"
memtable_size_mb = 64
block_size = 8192
zstd_level = 3
bloom_bits_per_key = 10
wal_segment_size_mb = 64
compaction_threshold = 2
max_frozen_memtables = 2
flush_interval_ms = 1000
gc_interval_secs = 3600
default_ttl_secs = 86400
time_bucket_secs = 3600
index_memory_budget_mb = 256
block_cache_capacity_mb = 128
create_if_missing = true

Configuration Reference

Server Config

Parameter	Default	Description
`http_addr`	`"0.0.0.0:8080"`	HTTP listen address
`udp_addr`	`"0.0.0.0:9090"`	UDP listen address
`api_keys`	`[]`	API keys for authentication (empty = no auth)
`udp_api_key`	`None`	Separate API key for UDP
`max_udp_packet_size`	`1400`	Maximum UDP packet size in bytes

Engine Config

Parameter	Default	Description
`data_dir`	`"./data"`	Data directory path
`create_if_missing`	`true`	Create data directory if it doesn't exist
`memtable_size_mb`	`64`	Active memtable size threshold (MB) before flush
`max_frozen_memtables`	`2`	Max frozen memtables before writes block
`block_size`	`8192`	SSTable block size in bytes (number of records per block)
`zstd_level`	`3`	Zstd compression level (1-22, higher = better compression, slower)
`bloom_bits_per_key`	`10`	Bloom filter bits per key (higher = fewer false positives, more memory)
`wal_segment_size_mb`	`64`	WAL segment file size before rotation (MB)
`compaction_threshold`	`2`	Number of SSTables to trigger compaction
`flush_interval_ms`	`1000`	Background flush interval (ms)
`gc_interval_secs`	`3600`	Garbage collection interval (seconds)
`default_ttl_secs`	`None`	Default TTL for records without explicit expiry (seconds)
`time_bucket_secs`	`3600`	Time bucket granularity for block index (seconds)
`index_memory_budget_mb`	`256`	Memory budget for block index (MB)
`block_cache_capacity_mb`	`128`	Block cache capacity (MB)

HTTP API

Write Records

# JSON write
curl -X POST http://localhost:8080/write \
  -H "Content-Type: application/json" \
  -H "Authorization: Bearer my-api-key" \
  -d '{"records": [{"key": "sensor.temp", "ts": 1700000000, "value": "22.5"}]}'

# Binary write (UDP frame format)
curl -X POST http://localhost:8080/write/binary \
  -H "Authorization: Bearer my-api-key" \
  --data-binary @frame.bin

Query Records

# Prefix query
curl "http://localhost:8080/query?prefix=sensor.temp"

# Key range query
curl "http://localhost:8080/query?key_start=sensor.temp&key_end=sensor.tempz"

# Time range query
curl "http://localhost:8080/query?ts_start=1700000000&ts_end=1700003600"

# Prefix + time range
curl "http://localhost:8080/query?prefix=sensor&ts_start=1700000000&ts_end=1700003600"

Delete / Patch

# Delete a single record
curl -X DELETE "http://localhost:8080/record?key=sensor.temp&ts=1700000000"

# Delete a key range (range tombstone, all keys in [key_start, key_end))
curl -X DELETE "http://localhost:8080/range?key_start=sensor.a&key_end=sensor.z"

curl -X PATCH http://localhost:8080/record \
  -H "Content-Type: application/json" \
  -d '{"key": "sensor.temp", "ts": 1700000000, "value": "23.1"}'

Admin & Monitoring

curl http://localhost:8080/health          # Health check
curl http://localhost:8080/stats           # Engine stats (JSON)
curl http://localhost:8080/metrics         # Prometheus-style metrics
curl http://localhost:8080/admin           # Web dashboard

curl -X POST http://localhost:8080/admin/flush     # Force memtable flush
curl -X POST http://localhost:8080/admin/compact   # Trigger compaction
curl -X POST http://localhost:8080/admin/gc        # Run garbage collection

Rust Library Usage

use flowdb::{
    Engine, Config, Record, Query, ScanRange, ScanIterator, ReadOptions,
};

let config = Config::default();
let engine = Engine::open(config).await?;

// Write
let records = vec![Record {
    key: "sensor.temp".into(),
    ts: 1700000000,
    expire_at: i64::MAX,
    value: b"22.5".to_vec(),
}];
engine.write_batch(&records).await?;

// Zero-copy write (moves key/value, no clones)
engine.write_batch_owned(records).await?;

// Delete a range of keys (range tombstone)
engine.delete_range("sensor.a", "sensor.z").await?;

// ── Eager query (returns Vec<Record>) ──
let results = engine.query_by_prefix("sensor.").await?;
let results = engine.query_prefix_time_range("sensor.", 1700000000, 1700003600).await?;

// ── Lazy scan iterator (RocksDB-style, recommended for large ranges) ──

// Prefix scan — yields records one-at-a-time, bounded memory
let iter: ScanIterator = engine.scan_prefix("sensor.")?;
for result in iter {
    let record = result?;
    println!("{} @ {} = {:?}", record.key, record.ts, record.value);
}

// Prefix + time range scan
let iter = engine.scan_prefix_time_range("sensor.", 1700000000, 1700003600)?;

// Full key+time range scan with ReadOptions
let iter = engine.scan_opt(
    ScanRange::prefix_time_range("sensor.", 1700000000, 1700003600),
    &ReadOptions { fill_cache: true, verify_checksums: true },
)?;

// Key range scan
let iter = engine.scan(ScanRange::key_range("sensor.a", "sensor.z"))?;

// Full scan
let iter = engine.scan(ScanRange::all())?;

// Take only first N records (lazy — doesn't read the rest)
let first_10: Vec<Record> = engine
    .scan_prefix("sensor.")?
    .take(10)
    .map(|r| r.unwrap())
    .collect();

// ── get_latest: retrieve the most recent record for a key ──
let latest = engine.get_latest("sensor.temp").await?; // Option<Record>

// Shutdown
engine.shutdown().await?;

ScanRange Builders

Method	Description
`ScanRange::prefix(p)`	All records with key prefix `p`
`ScanRange::time_range(t1, t2)`	All records in time range `[t1, t2]`
`ScanRange::prefix_time_range(p, t1, t2)`	Prefix + time range
`ScanRange::key_range(k1, k2)`	Key range `[k1, k2]`
`ScanRange::key_time_range(k1, k2, t1, t2)`	Key range + time range
`ScanRange::all()`	Full scan

Engine API Reference

Method	Returns	Description
`scan(range)`	`Result<ScanIterator>`	Lazy iterator scan
`scan_opt(range, opts)`	`Result<ScanIterator>`	Lazy scan with `ReadOptions`
`scan_prefix(p)`	`Result<ScanIterator>`	Prefix scan (convenience)
`scan_prefix_time_range(p, t1, t2)`	`Result<ScanIterator>`	Prefix + time scan (convenience)
`get_latest(key)`	`Result<Option<Record>>`	Latest record for key
`query(query)`	`Result<Vec<Record>>`	Eager query (backward compat)
`get(key, ts)`	`Result<Option<Record>>`	Point get by exact `(key, ts)`

Architecture

Write Path:
  Client → encode_batch() (outside lock) → WriteWorker mutex → WAL (buffered) + MemTable
                                                                          ↓ (when full)
                                                                      Flush → SSTable

Read Path:
  Query → Active MemTable → Frozen MemTables → Block Index → Bloom Filter → SSTable (LRU cached)
  Scan   → ScanIterator (lazy merge heap over memtable + SST block sources)

Background:
  Flush:    MemTable → SSTable (sorted, lz4-compressed, bloom-filtered)
  Compact:  Size-tiered merge (streaming heap merge, zstd-compressed)
  GC:       Remove fully-expired SSTables
  Delete:   Point deletes (tombstones) + Range deletes (range tombstones)

Benchmarks

# Stress test
cargo run --release --bin flowdb-stress

# FlowDB vs RocksDB comparison
cargo run --release --example flowdb-vs-rocksdb

License

MIT.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
benches		benches
examples		examples
src		src
tests		tests
.gitignore		.gitignore
Cargo.toml		Cargo.toml
README.md		README.md
upsert-demo.sh		upsert-demo.sh

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

FlowDB

Benchmark Results

Features

Cargo Features

Quick Start

Build

Run Server

Config File (TOML)

Configuration Reference

Server Config

Engine Config

HTTP API

Write Records

Query Records

Delete / Patch

Admin & Monitoring

Rust Library Usage

ScanRange Builders

Engine API Reference

Architecture

Benchmarks

License

About

Uh oh!

Releases

Packages

Uh oh!

Contributors

Uh oh!

Languages

Folders and files

Latest commit

History

Repository files navigation

FlowDB

Benchmark Results

Features

Cargo Features

Quick Start

Build

Run Server

Config File (TOML)

Configuration Reference

Server Config

Engine Config

HTTP API

Write Records

Query Records

Delete / Patch

Admin & Monitoring

Rust Library Usage

ScanRange Builders

Engine API Reference

Architecture

Benchmarks

License

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Uh oh!

Contributors

Uh oh!

Languages

Packages