VidGo本地视频智能字幕&管理平台

图片[1]-VidGo本地视频智能字幕&管理平台-九零社区

VidGo 项目概览

VidGo是一个专为NAS用户和小型团队设计的本地视频管理平台,提供完整的视频内容管理解决方案。

项目提供示例网站供用户测试使用。

部署和使用中的问题可参考项目文档

核心功能

📥1.流媒体视频下载

  • 支持Bilibili、YouTube、Apple Podcasts等主流平台的音视频下载
  • 🔗提供外链解析和批量下载功能

🎬2.智能字幕系统

  • 🎙️多引擎转录支持:Faster-Whisper本地处理、ElevenLabs、阿里巴巴DashScope、OpenAI Whisper提供的APi服务
  • ✂️ 基于 LLM 的智能分割与断句,字幕阅读更自然流畅
  • ⚡支持批量运行任务,提升效率
  • ✏️高级字幕编辑器,支持实时预览,自定义字幕样式
    • 🌊 支持音频波形展示&同步
    • 🌐支持双语字幕/字幕嵌入视频导出

📚3.视频管理与组织

  • 📁分类和合集管理系统
  • ⚙️批量操作支持(移动、删除、字幕生成、视频合并)
  • 🖼️ 缩略图管理

👥4.用户认证和权限管理

  • 👤主用户/普通用户分离
  • 🔐可单独为普通用户设置权限与分类展示。

▶️5.视频播放体验

  • ▶️在线播放视频
  • 📺集成字幕显示面板
  • 🎯章节导航和时间轴跳转
  • 🔄双语字幕切换和自动滚动

快速开始

项目提供示例网站,地址为https://example.vidgo.cemp.top ,需要输入用户名&密码。

用户名:user,

密码:User123.

示例网站暂不支持基于本地的字幕识别,但支持基于云端的字幕识别,此外可以体验视频观看,字幕编辑等功能。 部署和使用中的问题可以参考项目文档.

部署

项目支持以下两种方式部署:

  1. node + python
  2. Docker部署

Node + python部署

git clone https://github.com/your-org/vidgo.git
cd vidgo

#  修改 .ini 文件
cp ./backend/config/config.ini.example ./backend/config/config.ini.

# 安装前端依赖
cd frontend
npm install
npm run start # 可以调整前端运行端口,默认为4173。
# frontend/.env记录前后端交互时后端api所用端口,默认为8000,若后端因端口冲突,可以修改该文件以匹配后端。

# 另开终端运行后端
cd ../backend
conda create -n vidgo-env python=3.10
conda activate vidgo-env  # 或你自定义的虚拟环境
pip install -r requirements.txt. # 安装其他依赖
pip install faster_whisper # 安装faster_whisper
bash run_all.sh # 运行后端服务

Docker快速部署

sudo docker pull jaceju68/vidgo:latest

sudo docker run -d --name vidgo \
  --restart unless-stopped \
  --gpus '"device=0"' \
  -e CUDA_VISIBLE_DEVICES=0 \
  -e WHISPER_DEVICE=cuda \
  -p 8030:8000 \
  -v "$(pwd)/data/videos.db:/app/database/videos.db" \
  -v "$(pwd)/data/media:/app/media" \
  -v "$(pwd)/data/config:/app/config" \
  -v "$(pwd)/data/models:/app/models" \
  jaceju68/vidgo:latest

项目同时支持采用docker-compose.yml部署,默认使用GPU,

基本配置

  1. LLM API 配置说明 (必选)
    需要在设置中配置个人 API。支持Deepseek、阿里通义、Openai等厂商。
    追求高质量可启用思考模式,使用思维链模型。
  2. 本地 Whisper 语音识别配置(和3可任选一项配置,隐私性强)
    下载模型:Tiny, Base, Small, Medium, Large-v2, Large-v3,distilled-large-v3, 需软件内下载。

中文识别推荐使用 Medium 及以上版本,以确保识别质量。Large-v3的识别效果最佳.

  1. 云端语音识别配置(和2可任选一项配置)
    项目支持三种不同的云服务商,包括
    阿里云 DashScope(中文效果佳,成本0.012元/分钟)
    ElevenLabs (极高质量转录,支持多语言,成本0.04元/分钟)
    OpenAI Whisper API(OpenAI官方API,可配置国内中转url)
  2. 字幕样式自定义
    主副字幕设置:字体、大小、颜色、描边样式、行距、位置(距底边距离)、背景颜色等

排版方式:双语、仅原文、仅译文。

示例代码

version: '3.8'

services:
  vidgo:
    image: jaceju68/vidgo:latest
    container_name: vidgo-app
    restart: unless-stopped
    ports:
      - "8010:8000"
    environment:
      # VidGo Configuration
      # Set your deployment URL for automatic CORS, CSRF, and host configuration
      VIDGO_URL: "https://your-domain.com"

      # Optional: Override individual settings if needed
      # VIDGO_ALLOWED_HOSTS: "your-domain.com,localhost"
      # VIDGO_CORS_ALLOWED_ORIGINS: "https://your-domain.com,https://frontend.example.com"
      # VIDGO_CSRF_TRUSTED_ORIGINS: "https://your-domain.com,https://frontend.example.com"
    volumes:
      # 数据库文件
      - ./data/videos.db:/app/database/videos.db
      # 媒体文件目录
      - ./data/media:/app/media
      # 用户配置目录
      - ./data/config:/app/config
      # 模型文件目录
      - ./data/models:/app/models

未来规划

  •  增加模糊搜索,匹配与用户搜索内容相近的项目
  •  优化字幕编辑页面的”音频展示”,使UI更现代化。
  •  增加Ai生成视频笔记,视频思维导图,视频章节的功能。
  •  支持更多的WSR模型,包括剪映提供的高准确度模型。
  •  支持更多的LLM模型
VidGo本地视频智能字幕&管理平台

© 版权声明
THE END
喜欢就支持一下吧
点赞11 分享
评论 抢沙发

请登录后发表评论

    暂无评论内容