Ia menyokong input teks, imej, dan video. Imej perlu mengandungi subjek statik yang akan dianimasikan, manakala video rujukan menawarkan gerakan, ekspresi, latar belakang, atau audio yang akan dipindahkan. Bagi teks arahan, ia membolehkan anda menyesuaikan parameter seperti tindakan, pergerakan watak, kesan kamera, dan banyak lagi.