AI风向标

claude-real-video ─ 让任何大语言模型(LLM)都能观看视频

claude-real-video 是一个开源工具,让大语言模型基于视频画面而非字幕进行理解。它通过场景变化检测提取关键帧、滑动窗口去重并转录音频,生成干净的本地文件夹供模型读取。支持 YouTube 链接或本地文件,依赖 ffmpeg 和 Whisper,通过 pip 安装。全部处理在本地完成,不上传云端。

详细介绍

claude-real-video 是一个开源工具,让大语言模型基于视频画面而非字幕进行理解。它通过场景变化检测提取关键帧、滑动窗口去重并转录音频,生成干净的本地文件夹供模型读取。支持 YouTube 链接或本地文件,依赖 ffmpeg 和 Whisper,通过 pip 安装。全部处理在本地完成,不上传云端。

AI HOT 详情:https://aihot.virxact.com/items/cmr4hb6x001txsll5jfiiy9u3

原文链接:https://github.com/HUANGCHIHHUNGLeo/claude-real-video

内容信息

分类
技巧与观点
时间
2026-07-03T04:56:06.814Z
返回列表