Research

Methods for reliable, verifiable AI systems

Nine focus areas spanning detection, verification, trust, and physical AI. Papers and code releasing Q1-Q2 2026.

Research Areas

Agent Reliability

Detection and verification for autonomous AI. Methods to identify when agents hallucinate, fail, or strategically underperform.

sandbagging verification

Papers Q1 2026

AI Evaluation Science

Adversarial evaluation methods that resist gaming. Benchmarks that detect hidden capabilities and strategic behavior.

benchmarks adversarial

Papers Q1 2026

Memory Systems

Field-theoretic memory treating stored information as continuous fields governed by PDEs. Semantic diffusion, thermodynamic decay, and multi-agent field coupling. arXiv 2602.21220

memory agents field theory

Published

Reasoning Verification

Verifying AI outputs without ground truth. Methods for code, plans, and decisions from reasoning models like o3 and R1.

verification reasoning

Papers Q1 2026

Interpretability

Practical interpretability for production. Not "understand the model" but "should I trust this output?"

activation probing steering

Active

Multi-Agent Trust

Trust dynamics when agents coordinate with agents. Propagation, verification, and failure modes in multi-agent systems.

multi-agent trust

Active

Adversarial Robustness for Agents

Attack taxonomies, detection methods, and defenses for agentic AI systems. Beyond prompt injection — tool poisoning, memory corruption, planning attacks, and coordination exploits in multi-agent systems.

adversarial agents security

Active

Uncertainty Quantification

Calibrated confidence for AI decision support. Activation-based uncertainty estimation, propagation through reasoning chains, and calibration methods that work without ground truth.

uncertainty calibration decision-support

Active

World Models & Physical AI

Beyond language models: AI that understands and predicts the physical world. World models, embodied reasoning, simulation, and physics-aware AI.

world models embodied AI

Active

View papers

Open Source

Tools built from our research

Every research area ships production-ready packages. AGPL-3.0 licensed, available on PyPI and npm.

12

Packages

9

Research Areas

rotalabs-probe

Sandbagging detection via activation probes and behavioral analysis.

rotalabs-fieldmem

Field-theoretic memory for AI agents with PDE-based dynamics.

rotalabs-redqueen

Evolutionary adversarial testing with quality-diversity optimization.

rotalabs-verity

Neuro-symbolic verified code synthesis with Z3 and CE2P feedback.

View all packages