animation2code benchmark

animation2code benchmark

For best compatibility, please view this dashboard in a Chrome browser.

Zero-shot video (or image-frame) → code results on the test set, across commercial and open-source models.

Each output is tagged with A = appearance similarity and T = temporal similarity; higher is better for both. Click a video to inspect its code.

49–56 of 214

ground truth

Only CSS: Milk

model outputs

Gemini 3 Flash Preview

A 0.61T 0.14

Qwen3-VL-8B-Instruct

A 0.64T 0.26

GPT-5.4

A 0.87T 0.37

Claude Sonnet 4.6

A 0.84T 0.33

LLaMA 4 Scout

A 0.57T 0.04

ground truth

Only CSS: Kirby

model outputs

Gemini 3 Flash Preview

A 0.94T 0.42

Qwen3-VL-8B-Instruct

A 0.89T 0.45

GPT-5.4

A 0.94T 0.27

Claude Sonnet 4.6

A 0.90T 0.31

no output

LLaMA 4 Scout

A —T —

ground truth

Only CSS: Bicycle

model outputs

Gemini 3 Flash Preview

A 0.87T 0.36

Qwen3-VL-8B-Instruct

A 0.43T 0.22

GPT-5.4

A 0.85T 0.36

Claude Sonnet 4.6

A 0.83T 0.25

LLaMA 4 Scout

A 0.41T 0.29

ground truth

Only CSS: Screw 2

model outputs

Gemini 3 Flash Preview

A 0.65T 0.23

Qwen3-VL-8B-Instruct

A 0.63T 0.28

GPT-5.4

A 0.70T 0.26

Claude Sonnet 4.6

A 0.57T 0.19

LLaMA 4 Scout

A 0.42T 0.00

ground truth

Only CSS: Grid Template Animation

model outputs

Gemini 3 Flash Preview

A 0.80T 0.32

no output

Qwen3-VL-8B-Instruct

A —T —

GPT-5.4

A 0.77T 0.16

Claude Sonnet 4.6

A 0.80T 0.33

LLaMA 4 Scout

A 0.36T 0.25

ground truth

Only CSS: Japanese "人力車"

model outputs

Gemini 3 Flash Preview

A 0.62T 0.36

Qwen3-VL-8B-Instruct

A 0.67T 0.42

GPT-5.4

A 0.69T 0.39

Claude Sonnet 4.6

A 0.67T 0.43

LLaMA 4 Scout

A 0.44T 0.00

ground truth

Only CSS: Porco Rosso "SAVOIA" (紅の豚)

model outputs

Gemini 3 Flash Preview

A 0.65T 0.51

Qwen3-VL-8B-Instruct

A 0.52T 0.36

GPT-5.4

A 0.72T 0.57

Claude Sonnet 4.6

A 0.75T 0.42

LLaMA 4 Scout

A 0.50T 0.49

ground truth

Only CSS: Lanthanum

model outputs

Gemini 3 Flash Preview

A 0.60T 0.20

Qwen3-VL-8B-Instruct

A 0.49T 0.23

GPT-5.4

A 0.69T 0.24

Claude Sonnet 4.6

A 0.64T 0.25

LLaMA 4 Scout

A 0.50T 0.22

← Previous7 / 27Next →