animation2code benchmark

animation2code benchmark

For best compatibility, please view this dashboard in a Chrome browser.

Zero-shot video (or image-frame) → code results on the test set, across commercial and open-source models.

Each output is tagged with A = appearance similarity and T = temporal similarity; higher is better for both. Click a video to inspect its code.

33–40 of 214

ground truth

Only CSS: 3D Scan

model outputs

Gemini 3 Flash Preview

A 0.65T 0.29

Qwen3-VL-8B-Instruct

A 0.34T 0.25

GPT-5.4

A 0.79T 0.18

Claude Sonnet 4.6

A 0.76T 0.32

LLaMA 4 Scout

A 0.53T 0.27

ground truth

Only CSS: Responsive City Drone View Black

model outputs

Gemini 3 Flash Preview

A 0.65T 0.29

Qwen3-VL-8B-Instruct

A 0.57T 0.32

GPT-5.4

A 0.50T 0.43

Claude Sonnet 4.6

A 0.49T 0.27

LLaMA 4 Scout

A 0.54T 0.43

ground truth

Only CSS: Fall In Love

model outputs

Gemini 3 Flash Preview

A 0.63T 0.31

no output

Qwen3-VL-8B-Instruct

A —T —

GPT-5.4

A 0.84T 0.25

Claude Sonnet 4.6

A 0.84T 0.27

LLaMA 4 Scout

A 0.56T 0.17

ground truth

Only CSS: Truck a GO, GO! GOOOO!!

model outputs

Gemini 3 Flash Preview

A 0.69T 0.33

Qwen3-VL-8B-Instruct

A 0.43T 0.23

GPT-5.4

A 0.66T 0.63

Claude Sonnet 4.6

A 0.59T 0.33

LLaMA 4 Scout

A 0.51T 0.22

ground truth

Only CSS: Codevember #6 Money Storm

model outputs

Gemini 3 Flash Preview

A 0.62T 0.31

no output

Qwen3-VL-8B-Instruct

A —T —

GPT-5.4

A 0.56T 0.30

Claude Sonnet 4.6

A 0.77T 0.31

LLaMA 4 Scout

A 0.52T 0.21

ground truth

Only CSS: Sunset Beach

model outputs

Gemini 3 Flash Preview

A 0.87T 0.28

Qwen3-VL-8B-Instruct

A 0.87T 0.26

GPT-5.4

A 0.95T 0.27

Claude Sonnet 4.6

A 0.92T 0.20

LLaMA 4 Scout

A 0.58T 0.25

ground truth

Only CSS: Star Warp Display

model outputs

Gemini 3 Flash Preview

A 0.81T 0.32

no output

Qwen3-VL-8B-Instruct

A —T —

GPT-5.4

A 0.85T 0.29

Claude Sonnet 4.6

A 0.66T 0.27

LLaMA 4 Scout

A 0.62T 0.27

ground truth

Only CSS: Caterpillar

model outputs

Gemini 3 Flash Preview

A 0.60T 0.32

Qwen3-VL-8B-Instruct

A 0.68T 0.32

GPT-5.4

A 0.76T 0.38

Claude Sonnet 4.6

A 0.78T 0.29

LLaMA 4 Scout

A 0.71T 0.27

← Previous5 / 27Next →