![图片[1]-VidGo本地视频智能字幕&管理平台-九零社区](https://i0.hdslb.com/bfs/openplatform/1a62cb58a5fa4b27e806a1dcabc11b1cab85fa87.png)
VidGo 项目概览
VidGo是一个专为NAS用户和小型团队设计的本地视频管理平台,提供完整的视频内容管理解决方案。
项目提供示例网站供用户测试使用。
部署和使用中的问题可参考项目文档。
核心功能
📥1.流媒体视频下载
- 支持Bilibili、YouTube、Apple Podcasts等主流平台的音视频下载
- 🔗提供外链解析和批量下载功能
🎬2.智能字幕系统
- 🎙️多引擎转录支持:Faster-Whisper本地处理、ElevenLabs、阿里巴巴DashScope、OpenAI Whisper提供的APi服务
- ✂️ 基于 LLM 的智能分割与断句,字幕阅读更自然流畅
- ⚡支持批量运行任务,提升效率
- ✏️高级字幕编辑器,支持实时预览,自定义字幕样式
- 🌊 支持音频波形展示&同步
- 🌐支持双语字幕/字幕嵌入视频导出
📚3.视频管理与组织
- 📁分类和合集管理系统
- ⚙️批量操作支持(移动、删除、字幕生成、视频合并)
- 🖼️ 缩略图管理
👥4.用户认证和权限管理
- 👤主用户/普通用户分离
- 🔐可单独为普通用户设置权限与分类展示。
▶️5.视频播放体验
- ▶️在线播放视频
- 📺集成字幕显示面板
- 🎯章节导航和时间轴跳转
- 🔄双语字幕切换和自动滚动
快速开始
项目提供示例网站,地址为https://example.vidgo.cemp.top ,需要输入用户名&密码。
用户名:user,
密码:User123.
示例网站暂不支持基于本地的字幕识别,但支持基于云端的字幕识别,此外可以体验视频观看,字幕编辑等功能。 部署和使用中的问题可以参考项目文档.
部署
项目支持以下两种方式部署:
- node + python
- Docker部署
Node + python部署
git clone https://github.com/your-org/vidgo.git
cd vidgo
# 修改 .ini 文件
cp ./backend/config/config.ini.example ./backend/config/config.ini.
# 安装前端依赖
cd frontend
npm install
npm run start # 可以调整前端运行端口,默认为4173。
# frontend/.env记录前后端交互时后端api所用端口,默认为8000,若后端因端口冲突,可以修改该文件以匹配后端。
# 另开终端运行后端
cd ../backend
conda create -n vidgo-env python=3.10
conda activate vidgo-env # 或你自定义的虚拟环境
pip install -r requirements.txt. # 安装其他依赖
pip install faster_whisper # 安装faster_whisper
bash run_all.sh # 运行后端服务
Docker快速部署
sudo docker pull jaceju68/vidgo:latest
sudo docker run -d --name vidgo \
--restart unless-stopped \
--gpus '"device=0"' \
-e CUDA_VISIBLE_DEVICES=0 \
-e WHISPER_DEVICE=cuda \
-p 8030:8000 \
-v "$(pwd)/data/videos.db:/app/database/videos.db" \
-v "$(pwd)/data/media:/app/media" \
-v "$(pwd)/data/config:/app/config" \
-v "$(pwd)/data/models:/app/models" \
jaceju68/vidgo:latest
项目同时支持采用docker-compose.yml部署,默认使用GPU,
基本配置
- LLM API 配置说明 (必选)
需要在设置中配置个人 API。支持Deepseek、阿里通义、Openai等厂商。
追求高质量可启用思考模式,使用思维链模型。 - 本地 Whisper 语音识别配置(和3可任选一项配置,隐私性强)
下载模型:Tiny, Base, Small, Medium, Large-v2, Large-v3,distilled-large-v3, 需软件内下载。
中文识别推荐使用 Medium 及以上版本,以确保识别质量。Large-v3的识别效果最佳.
- 云端语音识别配置(和2可任选一项配置)
项目支持三种不同的云服务商,包括
阿里云 DashScope(中文效果佳,成本0.012元/分钟)
ElevenLabs (极高质量转录,支持多语言,成本0.04元/分钟)
OpenAI Whisper API(OpenAI官方API,可配置国内中转url) - 字幕样式自定义
主副字幕设置:字体、大小、颜色、描边样式、行距、位置(距底边距离)、背景颜色等
排版方式:双语、仅原文、仅译文。
示例代码
version: '3.8'
services:
vidgo:
image: jaceju68/vidgo:latest
container_name: vidgo-app
restart: unless-stopped
ports:
- "8010:8000"
environment:
# VidGo Configuration
# Set your deployment URL for automatic CORS, CSRF, and host configuration
VIDGO_URL: "https://your-domain.com"
# Optional: Override individual settings if needed
# VIDGO_ALLOWED_HOSTS: "your-domain.com,localhost"
# VIDGO_CORS_ALLOWED_ORIGINS: "https://your-domain.com,https://frontend.example.com"
# VIDGO_CSRF_TRUSTED_ORIGINS: "https://your-domain.com,https://frontend.example.com"
volumes:
# 数据库文件
- ./data/videos.db:/app/database/videos.db
# 媒体文件目录
- ./data/media:/app/media
# 用户配置目录
- ./data/config:/app/config
# 模型文件目录
- ./data/models:/app/models
未来规划
- 增加模糊搜索,匹配与用户搜索内容相近的项目
- 优化字幕编辑页面的”音频展示”,使UI更现代化。
- 增加Ai生成视频笔记,视频思维导图,视频章节的功能。
- 支持更多的WSR模型,包括剪映提供的高准确度模型。
- 支持更多的LLM模型
VidGo本地视频智能字幕&管理平台
© 版权声明
1. 本主题所有言论和图片纯属会员个人意见,与本站立场无关。一切关于该内容及资源商业行为与本站无关。
2. 本站的所有内容都不保证其准确性,有效性,时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3. 本站提供的一切软件、教程和内容信息等仅限用于学习和研究目的,不得用于商业或者游戏以及其它非法用途,否则,一切后果请用户自负。
4. 本站资源均来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容,如果您喜欢该程序和内容,请支持正版。
5. 本站本着互联网分享学习精神,本站大部分内容转载于其他网站和媒体,如内容涉及版权等问题,请联系本站进行删除或修改处理,敬请谅解!
6. 如有侵犯您版权的内容,请邮件与我们取得联系删除(E-mail:283532303@qq.com)本站将及时改正。
2. 本站的所有内容都不保证其准确性,有效性,时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3. 本站提供的一切软件、教程和内容信息等仅限用于学习和研究目的,不得用于商业或者游戏以及其它非法用途,否则,一切后果请用户自负。
4. 本站资源均来自网络收集整理,版权争议与本站无关。您必须在下载后的24个小时之内,从您的电脑或手机中彻底删除上述内容,如果您喜欢该程序和内容,请支持正版。
5. 本站本着互联网分享学习精神,本站大部分内容转载于其他网站和媒体,如内容涉及版权等问题,请联系本站进行删除或修改处理,敬请谅解!
6. 如有侵犯您版权的内容,请邮件与我们取得联系删除(E-mail:283532303@qq.com)本站将及时改正。
THE END















暂无评论内容