xiaohack's Blog

xiaohack博客专注前沿科技动态与实用技术干货分享，涵盖 AI 代理、大模型应用、编程工具、文档解析、SEO 实战、自动化部署等内容，提供开源项目教程、科技资讯日报、工具使用指南，助力开发者、AI 爱好者获取前沿技术与实战经验。

AI 开发了个《武林外传》全台词检索对应截图网站

作者: 纯情
时间: 2026-02-06
分类:

https://wulinwaizhuan.hugo2233.dpdns.org/
文本提取：PaddleOCR (PaddlePaddle 引擎) 暴力破解硬字幕。
数据归档：构建台词-时间戳-图片路径的索引。
抽帧处理：FFmpeg 获取关键帧。
图像预处理：OpenCV + NumPy 提高识别率。

难题攻克：针对 TV 录制版没有软字幕的问题，OCR 是唯一解。通过批量推理，将 80 集海量素材转化为可检索的 JSON 文件

一开始 win 直接运行代码好慢 80min 一集现在在 wsl 上运行 5-8min 一集舒服了

参考项目
github 的 Cicada000/VV
感谢指导

标签: none

AI 开发了个《武林外传》全台词检索对应截图网站

添加新评论

最新文章

最近回复

分类

归档

其它