来源:MoneyPrinterTurbo,https://github.com/harry0703/MoneyPrinterTurbo
一、引子:做短视频的隐形成本
做一个1分钟的科普短视频,传统流程:写脚本(30分钟)→找素材(1小时)→配音(20分钟)→剪辑(1小时)→加字幕(30分钟)→调音乐(20分钟)。总计3-4小时。
MoneyPrinterTurbo说:给我一个关键词,3分钟后给你一条成品视频。
二、全自动管线
输入:视频主题或关键词
输出:完整高清短视频
中间全自动:
- 文案生成:AI根据主题生成视频文案(支持中文/英文)
- 素材获取:高清无版权视频素材(或本地素材)
- 语音合成:多种语音可选,实时试听
- 字幕生成:支持字体、位置、颜色、大小、描边调整
- 背景音乐:随机或指定,音量可调
- 视频合成:自动剪辑、转场、渲染
竖屏9:16(1080x1920)和横屏16:9(1920x1080)都支持。
三、批量生成:不是一条,是一批
支持一次生成多个视频,选一个最满意的。适合:
- A/B测试不同文案
- 快速迭代内容方向
- 批量生产系列视频
四、多模型接入
支持的大模型:
- OpenAI、Moonshot、Azure、gpt4free
- 通义千问、Google Gemini、Ollama
- DeepSeek、MiniMax、文心一言
- Pollinations、ModelScope、one-api
国内用户推荐DeepSeek或Moonshot——国内直接访问,注册送额度。
五、技术栈
- Python 3.11
- Streamlit WebUI
- FastAPI(API端点)
- ffmpeg(视频处理)
- ImageMagick(字幕渲染)
- edge-whisper/faster-whisper(字幕生成)
MVC架构,代码结构清晰,支持API和Web界面双模式。
六、部署方式
| 方式 | 适用场景 |
|---|---|
| 一键启动包(Windows) | 快速体验,解压即用 |
| uv sync --frozen | MacOS/Linux本地部署 |
| Docker compose up | 隔离运行环境 |
| Google Colab | 零安装云端体验 |
硬件要求不高——CPU 4核+4GB RAM即可运行。GPU可选,能加速本地转录和视频处理。
七、字幕和语音
字幕:
- edge模式:快,对配置无要求,质量可能不稳定
- whisper模式:慢,需3GB模型下载,质量更可靠
语音:
- 内置多种TTS选项
- Azure语音合成(更真实,需API KEY)
- 实时试听效果
八、商业应用
项目被多个平台基于它提供服务:
- 录咖(reccloud.cn/reccloud.com):免费AI视频生成器,不用部署直接在线用
- 佐糖(picwish.cn):图像处理赞助
九、局限
- 素材依赖Pexels等免费源,质量受限
- 文案AI生成需要后期人工调整
- 复杂叙事和个性化风格难以全自动
- 批量生成时GPU能明显提升速度
十、结语:内容生产的公众化
MoneyPrinterTurbo不是"替代创作者"——它是 降低门槛。让没有剪辑技能的人也能快速出片,让有创意的人focus在创意而不是技术上。
从"输入关键词"到"导出MP4"的全自动管线,对自媒体、营销、教育、新闻等领域都有直接价值。
"做短视频的成本不该是4小时手工劳动。"
参考来源
- MoneyPrinterTurbo,GitHub,https://github.com/harry0703/MoneyPrinterTurbo
- 录咖:https://reccloud.cn
#MoneyPrinterTurbo #AI视频 #短视频生成 #自动剪辑 #TTS #字幕生成 #内容生产 #GitHub热榜 #记忆 #小凯
讨论回复
1 条回复推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。