Quickstart¶

One-liner¶

Convert a CSV file to quantum circuits with a single call:

import quprep

result = quprep.prepare("data.csv", encoding="angle")
print(result.circuit)   # first sample as OpenQASM 3.0 string
print(len(result.circuits))  # one circuit per row

Default framework is qasm (OpenQASM 3.0) — no optional dependencies required.

With Qiskit¶

pip install quprep[qiskit]

result = quprep.prepare("data.csv", encoding="angle", framework="qiskit")
qc = result.circuit      # qiskit.QuantumCircuit
qc.draw("mpl")

Encoding options¶

# Angle encoding — Ry rotation per qubit (default)
result = quprep.prepare("data.csv", encoding="angle", rotation="ry")

# Amplitude encoding — entire vector as quantum state amplitudes
result = quprep.prepare("data.csv", encoding="amplitude")

# Basis encoding — binary features to computational basis states
result = quprep.prepare("data.csv", encoding="basis")

# IQP — Havlíček et al. 2019 feature map (kernel methods)
result = quprep.prepare("data.csv", encoding="iqp", reps=2)

# Entangled angle — angle encoding with CNOT entangling layers
result = quprep.prepare("data.csv", encoding="entangled_angle", entanglement="circular")

# Data re-uploading — Pérez-Salinas et al. 2020 (high expressivity)
result = quprep.prepare("data.csv", encoding="reupload", layers=3)

# Hamiltonian — Trotterized time evolution (physics simulation)
result = quprep.prepare("data.csv", encoding="hamiltonian", trotter_steps=4)

Encoding recommendation¶

Not sure which encoding to use? Let QuPrep decide:

rec = quprep.recommend("data.csv", task="classification", qubits=8)
print(rec)                  # ranked table with reasoning
result = rec.apply("data.csv")

Tasks: classification, regression, kernel, qaoa, simulation.

Pipeline API¶

For more control, build a pipeline manually:

from quprep import Pipeline
from quprep.encode.angle import AngleEncoder
from quprep.export.qasm_export import QASMExporter

pipeline = Pipeline(
    encoder=AngleEncoder(rotation="ry"),
    exporter=QASMExporter(),
)

result = pipeline.fit_transform("data.csv")
print(result.circuits[0])   # QASM string for first sample
print(result.dataset)       # processed Dataset object
print(result.encoded[0].metadata)  # encoding metadata

With cleaning¶

from quprep import Pipeline
from quprep.clean.imputer import Imputer
from quprep.clean.outlier import OutlierHandler
from quprep.encode.angle import AngleEncoder
from quprep.export.qasm_export import QASMExporter

pipeline = Pipeline(
    cleaner=Imputer(strategy="knn"),
    encoder=AngleEncoder(),
    exporter=QASMExporter(),
)
result = pipeline.fit_transform("data.csv")

From a NumPy array¶

import numpy as np
from quprep import Pipeline
from quprep.encode.angle import AngleEncoder

data = np.random.rand(100, 8)

pipeline = Pipeline(encoder=AngleEncoder())
result = pipeline.fit_transform(data)
print(len(result.encoded))  # 100 EncodedResult objects

From a Pandas DataFrame¶

import pandas as pd
from quprep import Pipeline
from quprep.encode.basis import BasisEncoder

df = pd.read_csv("data.csv")

pipeline = Pipeline(encoder=BasisEncoder())
result = pipeline.fit_transform(df)

Visualization¶

# ASCII diagram — no dependencies required
print(quprep.draw_ascii(result.encoded[0]))

# matplotlib diagram
fig = quprep.draw_matplotlib(result.encoded[0])
fig.savefig("circuit.png")

# or save directly
quprep.draw_matplotlib(result.encoded[0], filename="circuit.pdf")

CLI¶

# Convert to OpenQASM 3.0 (stdout)
quprep convert data.csv

# Save to file
quprep convert data.csv --output circuit.qasm

# IQP encoding with PennyLane export
quprep convert data.csv --encoding iqp --framework pennylane

# Limit to first 5 samples
quprep convert data.csv --samples 5

# Get encoding recommendation
quprep recommend data.csv --task classification --qubits 8

# Inspect a dataset (shape, types, missing, sparsity, recommendation)
quprep inspect data.csv
quprep inspect data.csv --task kernel --no-recommend

# Benchmark all encoders — gate count, depth, and encode time
quprep benchmark data.csv --task classification
quprep benchmark data.csv --samples 10 --include angle,iqp --output bench.json

What happens automatically¶

When you call prepare() or Pipeline.fit_transform(), QuPrep automatically applies the correct normalization for your encoding:

Encoding	Auto-normalization
`angle` (Ry)	Scale features to \([0, \pi]\)
`angle` (Rx/Rz)	Scale features to \([-\pi, \pi]\)
`entangled_angle`	Same as `angle` by rotation
`amplitude`	L2-normalize each sample (\(\\|x\\|_2 = 1\))
`basis`	Binarize features to \(\{0, 1\}\)
`iqp`	Scale features to \([-\pi, \pi]\)
`reupload`	Scale features to \([-\pi, \pi]\)
`hamiltonian`	Z-score normalize

You never need to think about this unless you want to override it.