QUICK START GUIDE

Make AI shorts
in minutes

Everything you need to know to create your first viral-ready short video. Pick a style, paste your topic, hit generate. The AI handles scripting, visuals, voice, subtitles and editing. Plus — full Long Videos mode for YouTube content (5–30+ min, 16:9, AI music, ref images, multilang).

Visual styles

Languages

~5 min

Per video

9:16

Vertical MP4

1How it works

Three simple steps from idea to ready-to-publish vertical video. No editing skills required.

📝

1. Paste your text

Drop in any text — an article you found, a story idea, key facts about a topic. 200–2000 characters works best. Don't write a script. Just describe what the video should be about. AI rewrites it into a viral scenario with hooks, drama and rhythm.

🎨

2. Choose style & settings

Pick one of 15 visual styles, a narrator voice, voiceover language, video length, subtitles, motion effects. Defaults work great if you're not sure — start simple.

⚡

3. Generate & download

Click "Generate". The AI writes the script, generates 5–20 image/video scenes via Veo 3, voices over with neural TTS, burns in subtitles, and assembles everything into one MP4. Wait 3–10 minutes. Preview, download, publish.

2Writing your text

The text you paste is not the final script — it's the source material. AI rewrites it into a punchy short-form scenario. Here's how to write it well.

✓ Good — gives AI material to work with

"In 1969, Apollo 11 landed on the Moon. Neil Armstrong stepped out first, saying 'one small step for man'. The mission lasted 21 hours on the lunar surface. They brought back 22 kg of moon rocks. Six more Apollo missions followed."

✗ Bad — too vague

"Make a video about space."

✓ Good — concrete with detail

"Five mistakes beginner photographers make: 1) Always shooting in auto mode 2) Centering the subject 3) Ignoring the light direction 4) Forgetting to clean the lens 5) Not using a tripod for low light."

✗ Bad — entire article pasted

"[15,000 character article about photography]" → AI may pick wrong angles or skip key info. Trim to most important 500–1500 chars first.

💡 Sweet spot for text length

200–500 chars — for ⚡ Short videos (5 scenes)
500–1500 chars — for ▶️ Medium videos (10 scenes)
1500–3000 chars — for 📺 Long videos (20 scenes)

✓ Pro tips for great results

Use concrete facts & numbers — "1969", "22 kg", "5 mistakes" — they make the video credible and visual
Stick to one topic — don't mix "history of cars" with "best recipes"
Skip rhetorical intros — AI will write its own hook
Names matter — for biographies, name the person clearly so AI uses the right face
Action verbs — "discovered, built, fought, escaped" — give visual cues for the AI

3Visual styles — pick one of 15

Each style has its own visual DNA. Pick the one that matches your topic. Universal styles (🌟 Realistic, 🎭 Cartoon) work for most things. Specialized ones (🚗 Auto, 🖊️ Heroes, 🎙️ ASMR) give better results for their niche.

🌟 Realistic (cinematic)

Movie-quality photography with dramatic lighting. The most universal pick — works for almost any serious topic.

News · Stories · Documentary

🎭 Cartoon

Disney/Pixar inspired — bright, fun characters with thick outlines and expressive emotions.

Kids · Humor · Light topics

📊 Infographic (flat design)

Bold solid colors, geometric shapes, modern flat icons. Clean and minimalist — no shadows or gradients.

Education · Data · Tech

🌊 Watercolor

Soft hand-painted feel with pastel colors and visible paper texture. Calm, artistic, emotional.

Poetry · Art · Memories

🌑 Neon / Cyberpunk

Dark futuristic aesthetic with glowing neon, electric colors, high contrast. Synthwave vibes.

Tech · Future · Sci-fi

🚗 Auto (cinematic)

Pro automotive photography. Brand, model and year automatically become the first words in every prompt — guarantees recognizable cars.

Cars · Auto reviews · Showcases

🚗 Auto USSR

Soviet-era vintage style — film grain, retro mood, sepia tones. Specifically tuned for Russian classic cars.

Soviet cars · Retro · Vintage

📷 USSR (documentary)

Black-and-white documentary style. Historical realism, vintage Soviet atmosphere, archival feel.

Soviet history · Nostalgia · WW2

🎨 Doodle (stickman)

Simple hand-drawn stickman animation on white background. Crisp black outlines, playful educational vibe.

Tutorials · Explainers · How-to

🎨 Doodle blue BG (trend)

Whiteboard-style animation on pastel blue background. The current viral self-help / life-hacks aesthetic.

Self-help · Tips · Viral trend

🧓 Life Story (60+)

Warm nostalgic tones, elderly people POV, family moments, sentimental storytelling.

Memoirs · Family · Life lessons

📜 Yellow paper infographic

Hand-drawn ink sketch on aged parchment. Survival manual aesthetic. No text in images — purely visual.

Survival · Quick facts · Hacks

🖊️ Famous heroes (sketch)

Pencil sketch with 2-3 accent colors. Hero name automatically becomes first word — AI draws the right person.

Biographies · Celebrities · History

🎙️ ASMR (nature/hike)

Cinematic 4K nature scenes — mountains, forests, streams. No faces. Voiceover always English.

ASMR · Nature · Relaxation

🔧 ASMR Car restoration

Workshop atmosphere, mechanic hands POV, dramatic moody lighting. Voiceover always English.

ASMR · Restoration · Mechanics

💡 Style picking strategy

Universal topics? Start with 🌟 Realistic — never goes wrong
Educational/explainer? 🎨 Doodle blue BG is trending right now
Biographical? 🖊️ Heroes — automatically uses correct names
Cars-related? Use 🚗 Auto styles — they understand brands
Want relaxation/sleep niche? Pick 🎙️ ASMR — note: voice will be English regardless of your other settings

4Length & how it affects everything

Length determines scene count, generation time, and credit cost. Pick based on platform and topic depth.

Duration

Scenes

Length

Gen time

⚡ Short

5 scenes

~25 sec

2–4 min

▶️ Medium

10 scenes

~50 sec

4–7 min

📺 Long

20 scenes

~100 sec

7–12 min

📊 Which length for which platform

YouTube Shorts — Medium or Long. Algorithm rewards 30–60 sec content
TikTok — Medium. 50 sec is the sweet spot for completion rate
Instagram Reels — Short or Medium. Up to 90 seconds
Hooks & teasers — Short. 25 sec for a punchy single fact

💰 About credits

Credits are deducted only after Stage 1 (image/video generation) succeeds. If a scene fails completely and gets a placeholder, that scene is free. Final cost depends on length + number of real video clips. Check your balance and exact pricing in the dashboard.

5Voices & languages

6 narrator voices, 5 voiceover languages. Each voice supports all 5 languages.

🎤

Sawyer

M · 35 · Cool universal

⚡

Nikolay

M · 25 · Active & energetic

🎙️

Brian

M · 30 · Deep & confident

📖

Samuel

M · 50 · Wise storyteller

💪

Burt

M · 50 · Strong & mature

🌸

Alice

F · 35 · Warm & natural

Voiceover languages

🇷🇺 Russian🇬🇧 English🇪🇸 Spanish🇩🇪 German🇫🇷 French

🎙️ Voice picking guide

Storytelling / history / biographies → Samuel (calm, wise)
News / facts / energetic content → Nikolay (active)
Authority / serious topics → Brian (deep, confident)
General content / first time? → Sawyer (cool universal)
Female perspective → Alice (warm)
Older man character / wisdom → Burt (strong, mature)

⚠️ Important about ASMR styles

If you pick 🎙️ ASMR or 🔧 ASMR Car restoration — voiceover will be automatically in English regardless of your language selection. This is intentional: ASMR niche performs best with English narration.

6Subtitles & motion

Subtitles drive engagement on muted social feeds — most TikTok and Reels viewers watch with sound off. Pick a style that matches your video.

6 subtitle styles

🟡 Yellow

SAMPLE TEXT

⬜ White

SAMPLE TEXT

✨ TikTok

SAMPLE TEXT

🟨 Filled

SAMPLE TEXT

🟩 Green

SAMPLE TEXT

❌ None

no subtitles

📝 Subtitle picking guide

✨ TikTok — most viral. Black box, white text. Best for any platform
🟡 Yellow — classic, high contrast. Good for serious topics
🟨 Filled — bold karaoke style. Good for short punchy videos
🟩 Green — energetic, eye-catching. For tech/gaming
⬜ White — minimal, clean. Good for documentary
❌ None — only if you specifically want clean visuals (note: hurts engagement on muted feeds)

3 motion effects for static images

🔍

Zoom

Slow zoom-in on each static image (Ken Burns effect). Adds depth, prevents "frozen photo" feel.

🎲

Random

Mixes zoom-in, zoom-out, pan-left, pan-right between scenes. Most natural — recommended.

⏸️

No effect

Static images stay still. Use only if you have many real video clips — otherwise looks lazy.

7What happens after you click "Generate"

Behind the scenes the system runs a 6-stage pipeline. You'll see live progress on screen.

Script

AI writes the scenario — hook, structure, scenes

Visuals

Veo 3 generates 5–20 image & video scenes

Voice

Neural TTS narrates the script

Subtitles

Word-by-word timing burned in

Assembly

FFmpeg combines everything

Preview

Watch & download

🎬 The preview screen

When generation completes, you'll see a video preview player above the download button. Watch first, download second. If you don't like a specific scene — you can regenerate individual scenes (up to 3 free retries each) before exporting the final version.

✓ Free regeneration of failed scenes

If a video clip fails generation, the system places a still image in its slot and marks it "free regenerate". You can retry that scene without spending additional credits — up to 3 times per scene.

8Where to publish

Output is vertical 1080×1920 MP4 with embedded audio and subtitles — ready for direct upload.

📺 YouTube Shorts

🎵 TikTok

📷 Instagram Reels

📘 Facebook Reels

🐦 X (Twitter)

📌 Pinterest Idea Pins

💼 LinkedIn

💬 Telegram channels

📈 Tips for going viral

First 3 seconds matter most — strong hook in opening scene gets watched fully
Keep it under 60 seconds for max algorithmic reach (especially TikTok)
Post when active — check your platform analytics for peak audience time
Caption matters too — write a question or curiosity gap in the post text
Hashtags 5–10 — mix of niche and broader tags
Try variations — same topic, 3 different styles, see which performs best

9Long Videos mode — full guide

Beyond shorts, the platform has a separate Long Videos mode for creating full-length YouTube content — 5 to 30+ minutes, horizontal 16:9, with full script editing, AI music, multi-language support and reference images. Designed for serious creators making faceless YouTube channels.

📱

Shorts mode

For TikTok, Reels, YouTube Shorts

Duration 25–100 sec
Aspect ratio 9:16 vertical
Resolution 1080×1920
Scenes 5–20
Script editing auto only
Background music none
Reference images not yet
Generation time 3–10 min

🎬

Long Videos mode

For full YouTube channel content

Duration 5–30+ min
Aspect ratio 16:9 horizontal
Resolution 1920×1080
Scenes up to 200
Script editing full editor
Background music AI-generated
Reference images up to 9
Generation time 20 min – 2 hr

What makes Long Videos special

📝

Full script editor

After AI generates the initial script, you can edit every line, rewrite scenes, change order, add/remove parts. Full creative control before visuals are generated.

🖼️

Up to 9 reference images

Upload reference photos that AI uses across all scenes — keep characters consistent throughout the video, lock in a specific style, or feature recognizable people/objects.

🎵

AI background music

Auto-generated royalty-free music in 10+ genres matched to your video mood. Mixes seamlessly under voiceover. No Content ID strikes.

🌍

Multi-language regeneration

Generate once, then re-export in 5 languages without re-rendering visuals. Build a multi-lingual channel from a single source video.

⚡

Progressive scene editor

Don't wait 2 hours blindly. Watch scenes appear one by one as they generate. Skeleton placeholders fill in with actual content live. Edit ready scenes while others generate.

🔄

Per-scene regeneration

Don't like scene 47? Regenerate just that one — up to 3 free retries per scene. Edit its prompt, change style, swap from video to image. Surgical control.

🎙️

Voice retry without recharge

If TTS provider fails for your voice, you'll get a popup to pick a replacement. Stage 2 restarts free — visuals already done won't regenerate.

🎨

Reference images cascade

References work with both image and video generation. AI uses up to 3 refs per video scene for character consistency across motion clips.

🔥

2× parallel processing

Long mode runs 2 dedicated workers in parallel. While one task generates, you can submit another — 2 videos process simultaneously.

The Long Videos pipeline

Behind the scenes 4 specialized worker pools run in parallel:

📝 Script

AI generates & you edit

→

🎨 GEN pool

Visuals (Veo 3, 22 threads)

→

🎙️ VOICE pool

Multi-lang TTS

→

🎵 MUSIC pool

AI background music

→

🎬 ASSEMBLY

FFmpeg final mix

Music genres available

Pick a mood-matched genre and AI generates royalty-free background music for the entire video:

🎻 Cinematic 🎹 Ambient 🎸 Lo-fi 🥁 Epic / Trailer 🎺 Documentary ⚡ Electronic 🎷 Jazz 🎼 Orchestra 🌊 Chill / Relax 🔥 Dramatic

🎯 When to use Long Videos mode

Building a YouTube channel — algorithm prefers 8+ min content for ad revenue
Educational content — deep dives, tutorials, course material
Storytelling channels — historical events, biographies, mystery / true crime
Multi-language strategy — same video, multiple language audiences
Need consistent characters — refs ensure same look across 50+ scenes
Need background music — Long mode is the only way to get music

⚠️ Things to know about Long Videos

Generation takes longer — 30 min to 2 hr depending on video length and video clip count
Costs more credits — 50–200 scenes × video clips = significant generation cost
You can't regenerate the script alone — once visuals are made, regenerating script means regenerating scenes too
Refs work best with face/character refs — abstract scenes (landscapes, objects) don't always benefit from reference images
Music adds to file size — final MP4 will be 2–4× larger than shorts

✓ Pro workflow for YouTube channels

1) Use Long mode to generate master video in your strongest language. 2) After approval, regenerate audio in other 4 languages. 3) Upload all 5 versions as separate videos with localized titles & thumbnails. 4) Build 5 audiences from one creative effort.

10Troubleshooting

When things don't work — what to check.

⚠️ Generation got stuck or failed

Check your text — too long (>5000 chars) or too short (<50 chars) can cause issues
Avoid mixing topics — pick one subject per video
Wait and retry — AI providers occasionally have load spikes
If failure persists, try a different style — some styles are stricter on content moderation

⚠️ Some scenes look low quality / wrong subject

Use the in-app editor to regenerate that specific scene (3 free tries)
Edit the scene's prompt to be more specific about what to show
Add concrete visual details to your source text — "young man in red jacket" beats "person"

⚠️ Voiceover sounds wrong or missing words

Make sure your text is clean — no broken Unicode or weird symbols
Try a different narrator voice — some voices handle accents better than others
For non-English content, double-check the language selector matches the text

⚠️ "Voice unavailable" message

Sometimes the TTS provider is down for a specific voice. The system shows a modal letting you pick a different voice — your task continues from where it stopped, no extra credits charged.

11FAQ

How do I switch between Shorts and Long Videos modes?

From the main interface there are two separate entry points — Shorts (vertical 9:16, 25-100 sec) and Long Videos (horizontal 16:9, 5-30+ min). Each has its own dedicated form with relevant settings. Pick the mode based on your target platform.

Can long videos use the same 15 styles as shorts?

Yes — all 15 visual styles are available in both modes. The key difference is that long videos render in 16:9 aspect ratio (horizontal) instead of 9:16 vertical. Some styles (🎙️ ASMR) keep the same English-only voice rule in long mode.

How exactly does the multi-language feature work?

For long videos: 1) Generate the master video in your strongest language (visuals + voice). 2) After approval, click "Regenerate audio in [language]" — only TTS regenerates, all visuals stay. 3) Repeat for each language. Result: 5 fully localized videos from 1 generation effort. Costs only audio regeneration, not visual.

What format must reference images be in?

JPG or PNG, recommended size 1024×1024 or larger. Upload up to 9 references. AI uses them across all scenes — best results when they show clear faces, characters, or specific objects you want featured. Abstract refs (landscapes, textures) help less.

Can I use AI music separately from video?

Music is generated as part of the long video and embedded into the final MP4. There's no separate "music export" feature currently. If you need standalone royalty-free music tracks, that's a future feature.

Can I use the videos for commercial purposes?

Yes. AI-generated visuals (Veo 3) and TTS voiceovers are royalty-free. Stock fallbacks (Pexels) are also free for commercial use. You retain full rights to the videos you generate.

What's the difference between "image" and "video" scenes?

Image scenes are static AI-generated photos (~30 sec to make, animated with motion effects in final video).

Video scenes are real 8-second AI video clips (Veo 3, ~3 min to make, much more dynamic). The system mixes both for variety.

Why does generation take 5–10 minutes?

Most of the time goes to AI video generation (Veo 3 takes 30–180 sec per 8-sec clip). With 5–10 video scenes, that's the bulk of the wait. Image scenes generate in 15–30 sec each. Voiceover and assembly are fast.

Can I edit the script before generation?

Currently the AI auto-generates the script from your text. You can't edit it before scenes are generated, but you can edit individual scene prompts after generation in the editor. For long-form video mode, full script editing is available.

Can I upload my own images / reference photos?

For shorts: not yet. For long-form videos: yes, you can upload up to 9 reference images that the AI uses across all scenes for consistent characters or styles.

Can I add my own music or background sound?

Currently shorts have voiceover only. Long-form videos support AI-generated background music in multiple genres. Custom music upload is on the roadmap.

What if I don't have a topic — can AI suggest one?

Yes. You can paste a single keyword like "Roman empire" and the AI will write a viral scenario around it. The richer your text, the more controlled the output.

My video got blocked by YouTube/TikTok — why?

Possible reasons: 1) Music match — if any background sound triggered Content ID. 2) Content policy — sensitive topics (violence, drugs, adult) may be flagged. 3) Recycled content rule — too similar to existing viral videos. Always check platform guidelines before publishing.

Can I generate the same video in 5 languages?

Yes — generate once, then swap the voiceover language and regenerate audio (no need to redo visuals). This is a feature in long-form mode. For shorts, run separate generations with different language settings.

How do I download in higher quality?

Default output is 1080×1920 (Full HD vertical) — this is the best quality available for shorts mode and is already optimal for all major platforms.

How long do generated files stay available?

1 hour after generation completes. Download immediately. After that, the file is removed from servers.

Can I generate multiple videos in batch?

Currently you submit one task at a time. While one generates, you can prepare the next. Batch mode for paid plans is on the roadmap.

What's the difference between shorts and long-form mode?

Shorts mode: 25–100 sec, vertical 9:16, optimized for TikTok/Reels/Shorts.

Long-form mode: 5–30 minutes, horizontal 16:9, full script editor, scene-by-scene preview, music, multi-language. For YouTube full videos.

Why are some images/videos that look weird?

AI video generation is still imperfect — Veo 3 is state-of-the-art but occasionally produces artifacts. If a scene looks bad, regenerate it (free). Often a slight prompt tweak gives a much better result.

Is there a mobile app?

Not yet — but the website is fully mobile-responsive. You can generate, preview and download videos straight from your phone browser.

Ready to create your first short?

It takes less than a minute to set up. Pick a style, paste your topic, hit generate. The AI does the rest.

Start generating →

КРАТКОЕ РУКОВОДСТВО

AI-shorts
за пару минут

Всё что нужно знать чтобы создать первое вирусное короткое видео. Выбери стиль, вставь тему, нажми генерацию. AI сам пишет сценарий, рисует, озвучивает, ставит субтитры и собирает. Плюс — полный режим Длинных видео для YouTube (5–30+ мин, 16:9, AI музыка, ref картинки, многоязычность).

Стилей

Языков

~5 мин

На видео

9:16

Vertical MP4

1Как это работает

Три простых шага от идеи до готового вертикального видео. Без навыков монтажа.

📝

1. Вставь текст

Любой текст — статья из интернета, идея для истории, ключевые факты. Лучше всего 200–2000 символов. Не пиши сценарий — просто опиши тему. AI сам перепишет это в вирусный сценарий с хуком, драмой и ритмом.

🎨

2. Выбери стиль и настройки

Один из 15 визуальных стилей, голос диктора, язык озвучки, длину видео, субтитры, эффекты движения. Дефолтные настройки работают отлично — если не уверен, начни с них.

⚡

3. Генерация и скачивание

Жми «Generate». AI пишет сценарий, рисует 5–20 сцен через Veo 3, озвучивает нейронным TTS, добавляет субтитры и собирает в MP4. Жди 3–10 минут. Превью, скачать, публиковать.

2Какой текст вставлять

Текст который ты вставляешь — это не финальный сценарий. Это исходник. AI перепишет его в короткий захватывающий сценарий. Вот как написать его правильно.

✓ Хорошо — есть с чем работать

«В 1969 году Apollo 11 высадился на Луне. Нил Армстронг вышел первым со словами 'один маленький шаг для человека'. Миссия длилась 21 час на лунной поверхности. Привезли 22 кг лунного грунта. Затем было ещё 6 миссий Apollo.»

✗ Плохо — слишком общо

«Сделай видео про космос.»

✓ Хорошо — конкретно с деталями

«Пять ошибок начинающих фотографов: 1) Всегда снимают в авто-режиме 2) Центруют объект 3) Игнорируют направление света 4) Забывают чистить объектив 5) Не используют штатив в темноте.»

✗ Плохо — вставлена целая статья

«[15000 символов статьи о фотографии]» → AI выберет не те моменты или пропустит главное. Сначала сократи до самого важного 500–1500 символов.

💡 Идеальная длина текста

200–500 симв. — для ⚡ Коротких видео (5 сцен)
500–1500 симв. — для ▶️ Средних видео (10 сцен)
1500–3000 симв. — для 📺 Длинных видео (20 сцен)

✓ Советы для отличного результата

Используй конкретные факты и цифры — «1969», «22 кг», «5 ошибок» — делают видео достоверным и визуальным
Одна тема — одно видео — не смешивай «история автомобилей» с «лучшими рецептами»
Без риторических вступлений — AI напишет свой хук, тебе не нужно «А вы знали что...»
Имена важны — для биографий чётко назови имя — AI использует правильное лицо
Глаголы действия — «открыл, построил, сражался, сбежал» — дают визуальные подсказки

315 визуальных стилей

У каждого стиля своя визуальная ДНК. Подбирай под свою тему. Универсальные стили (🌟 Реалистик, 🎭 Мультфильм) работают почти везде. Специализированные (🚗 Авто, 🖊️ Герои, 🎙️ ASMR) дают лучший результат в своей нише.

🌟 Реалистик (cinematic)

Кино-фотография с драматичным светом и малой глубиной резкости. Самый универсальный — подходит почти под любую серьёзную тему.

Новости · Истории · Документалки

🎭 Мультфильм

В стиле Disney/Pixar — яркие персонажи с толстыми контурами и выразительными эмоциями.

Дети · Юмор · Лёгкие темы

📊 Инфографика (flat design)

Яркие плотные цвета, геометрические формы, современные плоские иконки. Чистый минимализм — без теней.

Образование · Данные · IT

🌊 Акварель

Мягкое акварельное ощущение, пастельные цвета, видимая текстура бумаги. Спокойно, художественно, эмоционально.

Поэзия · Искусство · Воспоминания

🌑 Неон / Cyberpunk

Тёмная футуристичная эстетика, светящийся неон, электрические цвета, высокий контраст. Synthwave-настроение.

Технологии · Будущее · Sci-fi

🚗 Авто (cinematic)

Профессиональная авто-фотография. Марка, модель и год автоматически идут первыми словами в каждом промпте — гарантирует узнаваемые машины.

Авто · Авто-обзоры · Презентации

🚗 Авто СССР

Советский винтажный стиль — плёночное зерно, ретро-настроение, сепия. Специально под классические советские автомобили.

Советские авто · Ретро · Винтаж

📷 СССР (документальный)

Чёрно-белый документальный стиль. Историческая правда, винтажная советская атмосфера, ощущение архивов.

Советская история · Ностальгия · ВОВ

🎨 Дудл (stickman)

Простая нарисованная анимация человечками на белом фоне. Чёткие чёрные контуры, игривое образовательное настроение.

Туториалы · Объяснения · How-to

🎨 Doodle голубой фон (тренд)

Whiteboard-анимация на пастельно-голубом фоне. Текущая вирусная эстетика саморазвития и лайфхаков.

Саморазвитие · Советы · Тренд

🧓 Life Story (60+)

Тёплые ностальгичные тона, POV пожилых людей, семейные моменты, сентиментальное повествование.

Мемуары · Семья · Жизнь

📜 Инфографика на жёлтой бумаге

Рисунок чернилами на пожелтевшем пергаменте. Эстетика руководства по выживанию. Без текста — чисто визуально.

Выживание · Факты · Лайфхаки

🖊️ Известные герои (скетч)

Карандашный скетч с 2-3 акцентными цветами. Имя героя автоматически идёт первым словом — AI рисует правильного человека.

Биографии · Знаменитости · История

🎙️ ASMR (природа / поход)

Cinematic 4K природа — горы, леса, ручьи. Без лиц. Озвучка всегда на английском.

ASMR · Природа · Релакс

🔧 ASMR Реставрация авто

Атмосфера мастерской, POV рук механика, драматичное настроенческое освещение. Озвучка всегда на английском.

ASMR · Реставрация · Механика

💡 Стратегия выбора стиля

Универсальная тема? Бери 🌟 Реалистик — никогда не подведёт
Образовательное / объяснение? 🎨 Doodle голубой фон сейчас в тренде
Биография? 🖊️ Герои — автоматически использует правильные имена
Про машины? Используй стили 🚗 Авто — они понимают марки
Хочешь нишу релакса/сна? Выбирай 🎙️ ASMR — обрати внимание: голос будет английским вне зависимости от других настроек

4Длина и как она влияет на всё

Длина определяет количество сцен, время генерации и стоимость в кредитах. Выбирай под платформу и глубину темы.

Длительность

Сцен

Длина

Время ген.

⚡ Короткое

5 сцен

~25 сек

2–4 мин

▶️ Среднее

10 сцен

~50 сек

4–7 мин

📺 Длинное

20 сцен

~100 сек

7–12 мин

📊 Какая длина под какую платформу

YouTube Shorts — Среднее или Длинное. Алгоритм любит 30–60 сек
TikTok — Среднее. 50 сек — sweet spot для досматриваемости
Instagram Reels — Короткое или Среднее. До 90 сек
Хуки и тизеры — Короткое. 25 сек на один яркий факт

💰 О кредитах

Кредиты списываются только после успешного Этапа 1 (генерация картинок/видео). Если сцена полностью упала и стоит плейсхолдер — за неё не платишь. Финальная стоимость зависит от длины + количества реальных видео-клипов. Точную цену и баланс смотри в дашборде.

5Голоса и языки

6 голосов диктора, 5 языков озвучки. Каждый голос поддерживает все 5 языков.

🎤

Sawyer

M · 35 · Универсальный

⚡

Nikolay

M · 25 · Активный

🎙️

Brian

M · 30 · Глубокий

📖

Samuel

M · 50 · Рассказчик

💪

Burt

M · 50 · Сильный

🌸

Alice

F · 35 · Тёплый

Языки озвучки

🇷🇺 Русский🇬🇧 Английский🇪🇸 Испанский🇩🇪 Немецкий🇫🇷 Французский

🎙️ Как выбрать голос

Истории / биографии / история → Samuel (спокойный, мудрый)
Новости / факты / энергичный контент → Nikolay (активный)
Авторитет / серьёзные темы → Brian (глубокий, уверенный)
Общий контент / первый раз? → Sawyer (универсальный)
Женская перспектива → Alice (тёплый)
Образ зрелого мужчины / мудрость → Burt (сильный)

⚠️ Важно про ASMR стили

Если выбираешь 🎙️ ASMR или 🔧 ASMR Реставрация — озвучка будет автоматически на английском вне зависимости от выбора языка. Это специально: ниша ASMR лучше работает с английской озвучкой.

6Субтитры и движение

Субтитры решают всё на лентах без звука — большинство зрителей TikTok и Reels смотрят на mute. Подбирай стиль под видео.

6 стилей субтитров

🟡 Жёлтые

ПРИМЕР ТЕКСТА

⬜ Белые

ПРИМЕР ТЕКСТА

✨ TikTok

ПРИМЕР ТЕКСТА

🟨 С заливкой

ПРИМЕР ТЕКСТА

🟩 Зелёные

ПРИМЕР ТЕКСТА

❌ Без

без субтитров

📝 Как выбрать субтитры

✨ TikTok — самый виральный. Чёрный фон, белый текст. Подходит везде
🟡 Жёлтые — классика, высокий контраст. Под серьёзные темы
🟨 С заливкой — жирный караоке-стиль. Под короткие яркие видео
🟩 Зелёные — энергичные, привлекают взгляд. Под IT/гейминг
⬜ Белые — минимализм. Под документалки
❌ Без — только если очень нужны чистые визуалы (учти: бьёт по удержанию на mute)

3 эффекта движения для статичных картинок

🔍

Zoom

Медленное приближение на каждой статичной картинке (эффект Кена Бёрнса). Добавляет глубину, убирает «замороженное фото».

🎲

Случайные

Чередует zoom-in, zoom-out, pan-left, pan-right между сценами. Самый натуральный — рекомендую.

⏸️

Без эффекта

Картинки стоят неподвижно. Подходит только если у тебя много реальных видео-клипов — иначе выглядит лениво.

7Что происходит после нажатия «Generate»

За кулисами система запускает 6 этапов. На экране ты увидишь живой прогресс.

Сценарий

AI пишет сценарий — хук, структура, сцены

Визуалы

Veo 3 генерит 5–20 картинок и видео

Голос

Нейронный TTS озвучивает

Субтитры

Слово-в-слово тайминги

Сборка

FFmpeg объединяет всё

Превью

Смотришь и скачиваешь

🎬 Экран превью

После окончания генерации ты увидишь видео-плеер над кнопкой скачивания. Сначала смотри, потом скачивай. Если какая-то сцена не нравится — её можно регенерировать (до 3 бесплатных попыток на сцену) до экспорта финальной версии.

✓ Бесплатная регенерация упавших сцен

Если видео-клип не сгенерировался, система ставит на его место картинку и помечает её «free regenerate». Можно перезапустить эту сцену без дополнительных кредитов — до 3 раз на сцену.

8Куда публиковать

На выходе вертикальное MP4 1080×1920 со встроенным звуком и субтитрами — готово к прямой загрузке.

📺 YouTube Shorts

🎵 TikTok

📷 Instagram Reels

📘 Facebook Reels

🐦 X (Twitter)

📌 Pinterest Idea Pins

💼 LinkedIn

💬 Telegram-каналы

📈 Советы для виральности

Первые 3 секунды решают всё — сильный хук в первой сцене = досматриваемость
Держи в пределах 60 сек для максимального охвата (особенно TikTok)
Постинг в активное время — смотри аналитику платформы для пиковой аудитории
Подпись тоже важна — вопрос или гэп любопытства в тексте поста
Хэштеги 5–10 — микс нишевых и широких
Тестируй варианты — одна тема, 3 разных стиля, смотри что зайдёт

9Длинные видео — полный гайд

Помимо шортсов на платформе есть отдельный режим Длинных видео — для создания полноценного YouTube контента. От 5 до 30+ минут, горизонталь 16:9, полный редактор сценария, AI-музыка, многоязычность и reference картинки. Сделано под серьёзных создателей faceless YouTube каналов.

📱

Shorts режим

Под TikTok, Reels, YouTube Shorts

Длительность 25–100 сек
Соотношение 9:16 верт.
Разрешение 1080×1920
Сцен 5–20
Редактор сценария только авто
Фоновая музыка нет
Reference картинки пока нет
Время генерации 3–10 мин

🎬

Длинные видео

Под полноценный YouTube канал

Длительность 5–30+ мин
Соотношение 16:9 гориз.
Разрешение 1920×1080
Сцен до 200
Редактор сценария полный
Фоновая музыка AI-генерация
Reference картинки до 9
Время генерации 20 мин – 2 ч

Что особенного в Длинных видео

📝

Полный редактор сценария

После того как AI сгенерил начальный сценарий — ты можешь редактировать каждую строчку, переписывать сцены, менять порядок, добавлять/удалять. Полный творческий контроль до генерации визуалов.

🖼️

До 9 reference картинок

Загружай референсные фото, которые AI использует во всех сценах — сохрани консистентность персонажей, зафиксируй конкретный стиль, или используй узнаваемых людей/объекты.

🎵

AI фоновая музыка

Авто-генерация royalty-free музыки в 10+ жанрах под настроение видео. Плавно микшируется под голосом. Никаких страйков по Content ID.

🌍

Многоязычная регенерация

Генерируешь раз — потом переэкспортируешь на 5 языков без рендера визуалов. Строй многоязычный канал из одного исходного видео.

⚡

Прогрессивный редактор сцен

Не жди 2 часа вслепую. Смотри как сцены появляются по одной во время генерации. Skeleton-плейсхолдеры заполняются реальным контентом в реальном времени. Редактируй готовые сцены пока другие генерятся.

🔄

Регенерация по сценам

Не понравилась сцена 47? Перегенери только её — до 3 бесплатных попыток на сцену. Поправь промпт, поменяй стиль, подмени видео на картинку. Точечный контроль.

🎙️

Voice retry без доп. оплаты

Если TTS-провайдер падает на твоём голосе — появится окно с выбором замены. Этап 2 рестартует бесплатно — визуалы (которые уже готовы) не перегенерируются.

🎨

Каскад reference картинок

Референсы работают и с картинками, и с видео-сценами. AI использует до 3 рефов на видео-сцену для консистентности персонажей в движении.

🔥

2× параллельная обработка

Long-режим запускает 2 dedicated worker'а параллельно. Пока одна задача генерится — можно отправить другую. 2 видео обрабатываются одновременно.

Pipeline длинных видео

За кулисами параллельно работают 4 специализированных воркер-пула:

📝 Сценарий

AI пишет, ты редактируешь

→

🎨 GEN пул

Визуалы (Veo 3, 22 потока)

→

🎙️ VOICE пул

Многоязычный TTS

→

🎵 MUSIC пул

AI фоновая музыка

→

🎬 СБОРКА

FFmpeg финальный микс

Доступные жанры музыки

Выбираешь жанр под настроение, AI генерирует royalty-free музыку на всё видео:

🎻 Кинематографичная 🎹 Ambient 🎸 Lo-fi 🥁 Эпическая / Трейлер 🎺 Документальная ⚡ Электронная 🎷 Джаз 🎼 Оркестр 🌊 Chill / Релакс 🔥 Драматичная

🎯 Когда использовать длинные видео

Строишь YouTube канал — алгоритм любит 8+ мин контент для рекламной выручки
Образовательный контент — глубокие разборы, туториалы, курсы
Storytelling каналы — исторические события, биографии, mystery / true crime
Многоязычная стратегия — одно видео, разные языковые аудитории
Нужны консистентные персонажи — рефы держат единый облик в 50+ сценах
Нужна фоновая музыка — Long-режим единственный способ её получить

⚠️ Что нужно знать про длинные видео

Генерация дольше — 30 мин — 2 часа в зависимости от длины и количества видео-клипов
Стоит больше кредитов — 50–200 сцен × видео-клипы = значимая стоимость
Сценарий нельзя регенерить отдельно — после генерации визуалов перегенерация сценария = перегенерация сцен
Рефы лучше всего работают с лицами/персонажами — абстрактным сценам (пейзажи, объекты) рефы не всегда помогают
Музыка увеличивает размер файла — финальный MP4 будет в 2–4 раза больше чем шортс

✓ Pro workflow для YouTube каналов

1) Используй Long-режим чтобы сделать мастер-видео на самом сильном языке. 2) После апрува регенери только аудио на 4 других языках. 3) Заливай все 5 версий как отдельные видео с локализованными названиями и обложками. 4) Строй 5 аудиторий из одного творческого усилия.

10Проблемы и решения

Когда что-то идёт не так — что проверить.

⚠️ Генерация зависла или упала

Проверь текст — слишком длинный (>5000 симв.) или короткий (<50 симв.) могут вызвать проблемы
Не смешивай темы — одна тема на видео
Подожди и попробуй снова — у AI-провайдеров бывают пики нагрузки
Если падает регулярно — попробуй другой стиль, некоторые строже к модерации

⚠️ Некоторые сцены плохого качества / не тот объект

В редакторе после генерации — регенерь конкретную сцену (3 бесплатных попытки)
Поправь промпт сцены — будь конкретнее в том что нужно показать
Добавь визуальные детали в исходный текст — «молодой парень в красной куртке» лучше чем «человек»

⚠️ Озвучка звучит странно или пропускает слова

Проверь что текст чистый — без битых символов и странных знаков
Попробуй другой голос — некоторые лучше работают с акцентами
Для не-английского контента — проверь что выбран правильный язык

⚠️ Сообщение «Voice unavailable»

Иногда TTS-провайдер недоступен для конкретного голоса. Система покажет окно с выбором другого голоса — задание продолжится с того же места, дополнительные кредиты не списываются.

11Частые вопросы

Как переключиться между Shorts и Длинными видео?

На главной странице есть две отдельные точки входа — Shorts (вертикаль 9:16, 25-100 сек) и Длинные видео (горизонталь 16:9, 5-30+ мин). У каждого режима своя форма со своими настройками. Выбирай режим под целевую платформу.

В длинных видео те же 15 стилей что и в shorts?

Да — все 15 визуальных стилей доступны в обоих режимах. Главное отличие — длинные видео рендерятся в 16:9 (горизонталь) вместо 9:16 (вертикаль). Некоторые стили (🎙️ ASMR) сохраняют то же правило «только английский голос» и в long-режиме.

Как работает многоязычная фича?

Для длинных видео: 1) Генерируешь мастер-видео на самом сильном языке (визуалы + голос). 2) После апрува жмёшь «Регенерить аудио на [язык]» — перегенерится только TTS, визуалы останутся. 3) Повторяешь для каждого языка. Итог: 5 полностью локализованных видео из 1 генерации. Платишь только за регенерацию аудио, не визуалов.

В каком формате должны быть reference картинки?

JPG или PNG, рекомендованный размер 1024×1024 или больше. Можно загрузить до 9 референсов. AI использует их во всех сценах — лучший результат когда они показывают чёткие лица, персонажей или конкретные объекты которые нужно показать. Абстрактные рефы (пейзажи, текстуры) помогают меньше.

Можно использовать AI-музыку отдельно от видео?

Музыка генерится как часть длинного видео и вшивается в финальный MP4. Сейчас отдельного экспорта музыки нет. Если нужны самостоятельные royalty-free треки — это в roadmap.

Можно использовать видео в коммерческих целях?

Да. AI-картинки (Veo 3) и TTS-озвучка — royalty-free. Сток-фото из Pexels тоже бесплатны для коммерции. Полные права на сгенерированные видео остаются за тобой.

В чём разница между «картинкой» и «видео» сценами?

Картинка-сцена — статичное AI-фото (~30 сек на генерацию, в финальном видео анимируется эффектом движения).

Видео-сцена — реальный 8-секундный AI видео-клип (Veo 3, ~3 мин на генерацию, гораздо динамичнее). Система миксует обе для разнообразия.

Почему генерация занимает 5–10 минут?

Большая часть времени уходит на AI-видео (Veo 3 делает 30–180 сек на 8-секундный клип). С 5–10 видео-сценами это и есть основное ожидание. Картинки делаются за 15–30 сек каждая. Озвучка и сборка быстрые.

Можно редактировать сценарий до генерации?

Сейчас AI автоматически генерит сценарий из текста. Изменить его до генерации сцен нельзя, но можно поправить промпт каждой сцены после генерации в редакторе. В режиме длинного видео доступно полное редактирование сценария.

Можно загружать свои картинки / референсы?

Для шортсов — пока нет. Для длинных видео — да, можно загружать до 9 reference-картинок которые AI использует во всех сценах для консистентных персонажей или стиля.

Можно добавлять свою музыку или фоновый звук?

Сейчас в шортсах только озвучка. Длинные видео поддерживают AI-генерацию фоновой музыки в разных жанрах. Загрузка собственной музыки в roadmap.

Что если у меня нет темы — AI может предложить?

Да. Можно вставить одно ключевое слово вроде «Римская империя» — AI напишет вирусный сценарий вокруг него. Чем богаче текст — тем больше контроля над выводом.

Моё видео заблокировал YouTube/TikTok — почему?

Возможные причины: 1) Совпадение по музыке — если фоновый звук триггернул Content ID. 2) Политика контента — чувствительные темы (насилие, наркотики, взрослое) могут быть отмечены. 3) Правило переработки контента — слишком похоже на существующие вирусные видео. Всегда проверяй гайдлайны платформы перед публикацией.

Можно сделать одно видео на 5 языках?

Да — генерируешь раз, потом меняешь язык озвучки и регенеришь только аудио (визуалы переделывать не нужно). Это в режиме длинных видео. Для шортсов — запускай отдельные генерации с разными языками.

Как скачать в более высоком качестве?

По умолчанию вывод 1080×1920 (Full HD vertical) — это лучшее качество для shorts-режима и оптимально для всех платформ.

Сколько хранятся файлы?

1 час после окончания генерации. Скачивай сразу. После этого файл удаляется с серверов.

Можно генерировать несколько видео в batch-режиме?

Сейчас одна задача за раз. Пока одна генерится — можно подготавливать следующую. Batch-режим для платных тарифов в roadmap.

В чём разница между шортсами и длинными видео?

Шортсы: 25–100 сек, вертикаль 9:16, оптимизированы для TikTok/Reels/Shorts.

Длинные видео: 5–30 минут, горизонталь 16:9, полный редактор сценария, scene-by-scene превью, музыка, многоязычность. Под полноценные YouTube-видео.

Почему некоторые картинки/видео выглядят странно?

AI-видео-генерация всё ещё несовершенна — Veo 3 топовая, но иногда выдаёт артефакты. Если сцена плохая — регенерь её (бесплатно). Часто небольшое изменение промпта даёт намного лучший результат.

Есть мобильное приложение?

Пока нет — но сайт полностью адаптивен. Можно генерить, смотреть превью и скачивать видео прямо со смартфона.

Готов создать первый shorts?

Настройка займёт меньше минуты. Выбери стиль, вставь тему, нажми генерацию. Остальное сделает AI.

Перейти к генерации →

Make AI shortsin minutes

1How it works

2Writing your text

3Visual styles — pick one of 15

4Length & how it affects everything

5Voices & languages

Voiceover languages

6Subtitles & motion

6 subtitle styles

3 motion effects for static images

7What happens after you click "Generate"

8Where to publish

9Long Videos mode — full guide

What makes Long Videos special

The Long Videos pipeline

Music genres available

10Troubleshooting

11FAQ

AI-shortsза пару минут

1Как это работает

2Какой текст вставлять

315 визуальных стилей

4Длина и как она влияет на всё

5Голоса и языки

Языки озвучки

6Субтитры и движение

6 стилей субтитров

3 эффекта движения для статичных картинок

7Что происходит после нажатия «Generate»

8Куда публиковать

9Длинные видео — полный гайд

Что особенного в Длинных видео

Pipeline длинных видео

Доступные жанры музыки

10Проблемы и решения

11Частые вопросы

Make AI shorts
in minutes

AI-shorts
за пару минут