根据今日GitHub监控数据,整理出以下13个与AI视频制作、小说创作及有声书生成高度相关的开源项目。今日重点发现包括功能强大的电子书转有声书工具ebook2audiobook,以及多款视频生成与语音克隆的新兴工具。
1. 有声书制作与语音克隆
ebook2audiobook
- 项目介绍:一款功能强大的电子书转有声书转换器,支持CPU和GPU加速。
核心功能:
- 多引擎支持:集成XTTSv2、Bark、Vits等多种TTS引擎,支持超过1110种语言。
- 智能处理:支持按章节分割电子书,保留元数据,支持自定义语音克隆。
- 广泛兼容:支持.epub、.pdf、.mobi等多种输入格式及.m4b、.mp3等输出格式,提供Gradio Web界面和Docker部署。
- 项目地址:
https://github.com/DrewThomasson/ebook2audiobook
Dia-TTS-Server
- 项目介绍:Dia TTS模型的自托管服务器实现。
核心功能:
- API兼容:提供兼容OpenAI格式的API端点,易于集成。
- 高级特性:支持SafeTensors/BF16加速、语音克隆及多角色对话生成,配备用户友好的Web UI。
- 项目地址:
https://github.com/Gmzxdotzz/Dia-TTS-Server
ComfyUI-VoxCPM
- 项目介绍:专为ComfyUI设计的插件,用于生成高表现力的语音。
核心功能:
- 零样本克隆:支持在ComfyUI工作流中实现逼真的零样本语音克隆。
- 情感表达:能够将文本转换为具有丰富情感色彩的音频。
- 项目地址:
https://github.com/krishnasaivamsi/ComfyUI-VoxCPM
OpenVoice (VoltsyGM Fork)
- 项目介绍:基于MIT和MyShell技术的即时语音克隆应用。
核心功能:
- 风格控制:支持在克隆语音时精确控制说话的风格和语调。
- 项目地址:
https://github.com/VoltsyGM/OpenVoice
local-voice-cloning-app
- 项目介绍:一个轻量级的Python应用程序,用于本地语音克隆。
核心功能:
- 简易工作流:提供简单的界面和流程来合成和克隆语音。
- 项目地址:
https://github.com/Mohamedfat7i/local-voice-cloning-app
2. 视频创作与生成
MOBIUS
- 项目介绍:一个专门用于生成桌游教程视频的AI工具。
核心功能:
- 垂直领域生成:专注于将规则文本转化为直观的教学视频内容。
- 项目地址:
https://github.com/w9bikze8u4cbupc/MOBIUS
AI-course-generator
- 项目介绍:利用AI将长视频讲座转化为结构化在线课程的工具。
核心功能:
- 课程结构化:自动生成成绩单、模块划分、课程内容及测验题。集成OpenAI Whisper和GPT-4 Vision技术。
- 项目地址:
https://github.com/DavidFW27/AI-course-generator
VibeArt
- 项目介绍:一体化的图像与视频生成工具。
核心功能:
- 模型集成:结合开源与闭源模型,利用社区训练的LoRA优化特定风格的生成效果,降低提示词门槛。
- 项目地址:
https://github.com/vibeart-in/VibeArt
mulmocast-cli
- 项目介绍:AI驱动的播客与视频生成器。
核心功能:
- 脚本驱动:使用"MulmoScript"脚本语言生成多模态演示内容,集成OpenAI、Google、Anthropic等多家模型。
- 项目地址:
https://github.com/receptron/mulmocast-cli
Hollywood-Quality-UGC-Ad-Generator
- 项目介绍:利用单张产品照片生成好莱坞级视频广告的工具。
核心功能:
- 多模型协作:通过n8n编排,结合Sora 2、GPT-4o和Gemini 2.5 Pro实现高质量广告生成。
- 项目地址:
https://github.com/Saurabh22111998/Hollywood-Quality-UGC-Ad-Generator
AIQuoteClipGenerator
- 项目介绍:基于MCP的自动化名言视频生成器,面向Instagram/TikTok。
核心功能:
- 自动剪辑:自动生成包含名言的短视频片段,适合社交媒体快速传播。
- 项目地址:
https://github.com/mercyg/AIQuoteClipGenerator
3. 小说与故事创作
Ghost-Writer
- 项目介绍:一个AI驱动的故事创作引擎。
核心功能:
- 引导式写作:逐步引导用户完成小说创作过程,充当智能写作助手。
- 项目地址:
https://github.com/MAS-D-KING/Ghost-Writer
https://track.linso.ai/zh/execution/cmihfy83n07utl6945ke9i2yh
评论区(暂无评论)