Видеогенерация видео нейросетями в Claude и Cursor
PaidГенерация видео из текста или картинки: Kling v3, Veo 3.1, Sora 2, Seedance 2, Grok Video, Wan 2.2. T2V и I2V, до 15 сек.
MCP Video — это сервер для генерации видео с помощью нейросетей прямо из Claude или Cursor. Создавайте рекламные ролики, анимированные сцены и видео из фотографий без регистрации в сторонних сервисах, всё в диалоге.
Как сгенерировать видео из текста (text-to-video)?
Опишите сцену словами, и нейросеть создаст клип от 4 до 15 секунд. Доступны разрешение до 1080p, разные соотношения сторон, ручное управление длиной или режим auto, а также кинематографические движения камеры. Модель ассистент подберёт сам или возьмёт указанную явно: под фотореализм, сложные сцены с персонажами или быстрый черновик.
- Разрешение до 1080p
- Соотношения сторон: 16:9, 9:16, 1:1, 21:9 и другие
- Управление длительностью или режим
auto(модель сама выберет длину) - Кинематографические движения камеры: pan, zoom, dolly
Veo 3.1 (Google DeepMind) даёт лучший фотореализм и физику. Sora 2 (OpenAI) тянет сложные сцены с персонажами. Seedance 2.0 Fast работает быстро и дёшево для черновиков.
Как анимировать изображение (image-to-video)?
Передайте URL фотографии, и нейросеть добавит ей движение: развевающиеся волосы, морские волны, пар от кофе. Из одного кадра получается живой клип, при этом исходная композиция и стиль сохраняются. Подходит для оживления портретов, предметной съёмки и статичных иллюстраций. Режим image-to-video поддерживают несколько моделей:
- Kling v3 — топ для портретов и персонажей, поддерживает аудио
- Seedance 2.0 Pro: высокое качество 1080p
- Wan 2.2: открытая модель, богатые цвета
Что такое reference-to-video?
Это режим, где видео собирается по нескольким референсам. Seedance 2.0 Reference принимает до 9 изображений и 3 аудио-файла. Укажите их в промпте как @Image1, @Image2, @Audio1, и модель создаст клип в заданном визуальном стиле с синхронизированным звуком. Подходит для музыкальных клипов, роликов с брендовыми элементами и анимации по нескольким концепт-артам.
Что выбрать: text-to-video, image-to-video или reference?
Три режима решают разные задачи, и переключать их вручную не нужно: ассистент включает нужный по запросу. Короткая шпаргалка, что под какую цель:
| Режим | Что на входе | Когда использовать |
|---|---|---|
| Text-to-video | Текстовый промпт | Создать сцену с нуля по описанию |
| Image-to-video | Фотография | Оживить готовый кадр движением |
| Reference-to-video | До 9 фото + аудио | Видео в заданном стиле и со звуком |
Как создать видео через Claude?
Опишите сцену и нужную длину, а ассистент выберет модель сам или возьмёт указанную явно. Команды запоминать не нужно, хватает обычной формулировки. Путь короткий:
- Опишите сцену (или приложите фото для анимации).
- При желании назовите модель и длину (
kling-v3, 10 секунд). - Ассистент сгенерирует клип и покажет его в чате.
«Через kling-v3 создай 10-секундное видео: молодая женщина смотрит на закат, кинематографичный свет, медленный dolly shot»
«Через seedance-2-ref сгенерируй клип используя @Image1 как референс стиля, музыка @Audio1, продолжительность auto»
Статичные кадры под анимацию удобно собрать в MCP генерации изображений, а готовые визуалы для маркетплейсов — в Карточках WB и Ozon. Полный список доступен в каталоге MCP.
Источники
Модели
| Модель | Вариант | Цена |
|---|---|---|
| Kling | 50 кр / сек | |
| Veo | 3.1 | 143 кр / сек |
| 3.1 Fast | 54 кр / сек | |
| Seedance 2.0 | Pro | 108 кр / сек |
| Fast | 86 кр / сек | |
| Sora | 36 кр / сек | |
| Grok | 18 кр / сек | |
| Wan | 29 кр / сек | |
| Happy Horse | 50 кр / сек | |
Цены указаны за 720p. Другое разрешение: 4k ×9, 480p ×0.45, 1080p ×2.25.
Подключение
Подключите Видео к ассистенту. Токен получите в разделе «Токены».
Инструменты
3 tool-а, каждый можно вызвать отдельно или комбинировать.