AI风向标
claude-real-video ─ 让任何大语言模型(LLM)都能观看视频
claude-real-video 是一个开源工具,让大语言模型基于视频画面而非字幕进行理解。它通过场景变化检测提取关键帧、滑动窗口去重并转录音频,生成干净的本地文件夹供模型读取。支持 YouTube 链接或本地文件,依赖 ffmpeg 和 Whisper,通过 pip 安装。全部处理在本地完成,不上传云端。
详细介绍
claude-real-video 是一个开源工具,让大语言模型基于视频画面而非字幕进行理解。它通过场景变化检测提取关键帧、滑动窗口去重并转录音频,生成干净的本地文件夹供模型读取。支持 YouTube 链接或本地文件,依赖 ffmpeg 和 Whisper,通过 pip 安装。全部处理在本地完成,不上传云端。
AI HOT 详情:https://aihot.virxact.com/items/cmr4hb6x001txsll5jfiiy9u3
原文链接:https://github.com/HUANGCHIHHUNGLeo/claude-real-video
内容信息
- 分类
- 技巧与观点
- 时间
- 2026-07-03T04:56:06.814Z
