Obsługuje wprowadzanie tekstu, obrazów i wideo. Obraz musi zawierać statyczny obiekt do animacji, podczas gdy wideo referencyjne oferuje ruch, wyraz, tło lub dźwięk do przeniesienia. Jeśli chodzi o tekstowy prompt, pozwala na dostosowanie parametrów, takich jak akcje, ruchy postaci, efekty kamery i inne.