VidGo本地视频智能字幕&管理平台-九零社区

VidGo 项目概览

VidGo是一个专为NAS用户和小型团队设计的本地视频管理平台，提供完整的视频内容管理解决方案。

项目提供示例网站供用户测试使用。

部署和使用中的问题可参考项目文档。

核心功能

📥1.流媒体视频下载

支持Bilibili、YouTube、Apple Podcasts等主流平台的音视频下载
🔗提供外链解析和批量下载功能

🎬2.智能字幕系统

🎙️多引擎转录支持：Faster-Whisper本地处理、ElevenLabs、阿里巴巴DashScope、OpenAI Whisper提供的APi服务
✂️ 基于 LLM 的智能分割与断句，字幕阅读更自然流畅
⚡支持批量运行任务，提升效率
✏️高级字幕编辑器，支持实时预览，自定义字幕样式
- 🌊 支持音频波形展示&同步
- 🌐支持双语字幕/字幕嵌入视频导出

📚3.视频管理与组织

📁分类和合集管理系统
⚙️批量操作支持（移动、删除、字幕生成、视频合并）
🖼️ 缩略图管理

👥4.用户认证和权限管理

👤主用户/普通用户分离
🔐可单独为普通用户设置权限与分类展示。

▶️5.视频播放体验

▶️在线播放视频
📺集成字幕显示面板
🎯章节导航和时间轴跳转
🔄双语字幕切换和自动滚动

快速开始

项目提供示例网站，地址为https://example.vidgo.cemp.top ，需要输入用户名&密码。

用户名:user,

密码:User123.

示例网站暂不支持基于本地的字幕识别，但支持基于云端的字幕识别，此外可以体验视频观看，字幕编辑等功能。部署和使用中的问题可以参考项目文档.

部署

项目支持以下两种方式部署：

node + python
Docker部署

Node + python部署

git clone https://github.com/your-org/vidgo.git
cd vidgo

#  修改 .ini 文件
cp ./backend/config/config.ini.example ./backend/config/config.ini.

# 安装前端依赖
cd frontend
npm install
npm run start # 可以调整前端运行端口，默认为4173。
# frontend/.env记录前后端交互时后端api所用端口，默认为8000,若后端因端口冲突，可以修改该文件以匹配后端。

# 另开终端运行后端
cd ../backend
conda create -n vidgo-env python=3.10
conda activate vidgo-env  # 或你自定义的虚拟环境
pip install -r requirements.txt. # 安装其他依赖
pip install faster_whisper # 安装faster_whisper
bash run_all.sh # 运行后端服务

Docker快速部署

sudo docker pull jaceju68/vidgo:latest

sudo docker run -d --name vidgo \
  --restart unless-stopped \
  --gpus '"device=0"' \
  -e CUDA_VISIBLE_DEVICES=0 \
  -e WHISPER_DEVICE=cuda \
  -p 8030:8000 \
  -v "$(pwd)/data/videos.db:/app/database/videos.db" \
  -v "$(pwd)/data/media:/app/media" \
  -v "$(pwd)/data/config:/app/config" \
  -v "$(pwd)/data/models:/app/models" \
  jaceju68/vidgo:latest

项目同时支持采用docker-compose.yml部署，默认使用GPU，

基本配置

LLM API 配置说明（必选）
需要在设置中配置个人 API。支持Deepseek、阿里通义、Openai等厂商。
追求高质量可启用思考模式，使用思维链模型。
本地 Whisper 语音识别配置（和3可任选一项配置，隐私性强）
下载模型：Tiny, Base, Small, Medium, Large-v2, Large-v3，distilled-large-v3, 需软件内下载。

中文识别推荐使用 Medium 及以上版本，以确保识别质量。Large-v3的识别效果最佳.

云端语音识别配置（和2可任选一项配置）
项目支持三种不同的云服务商，包括
阿里云 DashScope（中文效果佳，成本0.012元/分钟）
ElevenLabs （极高质量转录，支持多语言，成本0.04元/分钟）
OpenAI Whisper API（OpenAI官方API，可配置国内中转url）
字幕样式自定义
主副字幕设置：字体、大小、颜色、描边样式、行距、位置（距底边距离）、背景颜色等

排版方式：双语、仅原文、仅译文。

示例代码

version: '3.8'

services:
  vidgo:
    image: jaceju68/vidgo:latest
    container_name: vidgo-app
    restart: unless-stopped
    ports:
      - "8010:8000"
    environment:
      # VidGo Configuration
      # Set your deployment URL for automatic CORS, CSRF, and host configuration
      VIDGO_URL: "https://your-domain.com"

      # Optional: Override individual settings if needed
      # VIDGO_ALLOWED_HOSTS: "your-domain.com,localhost"
      # VIDGO_CORS_ALLOWED_ORIGINS: "https://your-domain.com,https://frontend.example.com"
      # VIDGO_CSRF_TRUSTED_ORIGINS: "https://your-domain.com,https://frontend.example.com"
    volumes:
      # 数据库文件
      - ./data/videos.db:/app/database/videos.db
      # 媒体文件目录
      - ./data/media:/app/media
      # 用户配置目录
      - ./data/config:/app/config
      # 模型文件目录
      - ./data/models:/app/models

未来规划

增加模糊搜索，匹配与用户搜索内容相近的项目
优化字幕编辑页面的”音频展示”，使UI更现代化。
增加Ai生成视频笔记，视频思维导图，视频章节的功能。
支持更多的WSR模型，包括剪映提供的高准确度模型。
支持更多的LLM模型

VidGo本地视频智能字幕&管理平台

下载

1. 本主题所有言论和图片纯属会员个人意见，与本站立场无关。一切关于该内容及资源商业行为与本站无关。
2. 本站的所有内容都不保证其准确性，有效性，时间性。阅读本站内容因误导等因素而造成的损失本站不承担连带责任。
3. 本站提供的一切软件、教程和内容信息等仅限用于学习和研究目的，不得用于商业或者游戏以及其它非法用途，否则，一切后果请用户自负。
4. 本站资源均来自网络收集整理，版权争议与本站无关。您必须在下载后的24个小时之内，从您的电脑或手机中彻底删除上述内容，如果您喜欢该程序和内容，请支持正版。
5. 本站本着互联网分享学习精神,本站大部分内容转载于其他网站和媒体,如内容涉及版权等问题,请联系本站进行删除或修改处理，敬请谅解！
6. 如有侵犯您版权的内容，请邮件与我们取得联系删除（E-mail：283532303@qq.com）本站将及时改正。

THE END

网站源码