标签 NotebookLM 下的文章

从「抄作业」到 AI 自动生成视频的完整方法论

很多创作者在做视频号时都会遇到同一个问题:
为什么看起来很努力,却始终没有稳定的高播放?

原因往往不在执行力,而在起点就错了——
从“原创灵感”开始,而不是从“成功案例”开始。

事实证明,当前阶段最容易跑通的方式不是凭空创作,而是:

先抄作业,再用 AI 把成功经验规模化复制。

下面是一套已经被反复验证、且非常适合短视频平台的完整方法。


一、核心思路:不是抄内容,而是抄「爆款结构」

这里的“抄作业”并不是搬运视频,而是反向工程爆款

  • 不关心某条视频讲了什么
  • 只关心它为什么能火
  • 把“感觉”拆成可复用的结构

整个流程可以拆成四个关键词:

采样 → 归纳 → 再创作 → 自动生成

二、为什么这个方法能跑通?

1️⃣ 爆款不是偶然,而是可重复的结构结果

绝大多数高播放视频,并不是随机出现的,而是满足了以下条件:

  • 前几秒有强烈视觉或行为异常
  • 中段存在明确冲突或失控
  • 结尾有情绪释放或反转
  • 风格高度统一,利于算法识别

单个视频看不出规律,但同一 channel 的 Top 视频几乎一定有共性


2️⃣ 从 YouTube 入手,是最稳妥的起点

YouTube 的优势在于:

  • 样本量大
  • 数据透明
  • 爆款生命周期长

选择一个已经跑通的 YouTube channel,本质是在复用:

  • 已验证的受众偏好
  • 已适配的平台算法
  • 已成熟的内容节奏

3️⃣ NotebookLM 的价值:把隐性经验变成显性规则

NotebookLM 的核心作用并不是“写文案”,而是:

从多个成功样本中,提炼共性模式。

例如:

  • 开头平均在第几秒出现刺激点
  • 冲突是否围绕“规则 / 强迫 / 对抗”
  • 情绪是逐步升级还是瞬间爆发
  • 是否存在固定角色关系(支配 / 反抗)

这一步完成后,爆款不再是“感觉”,而是结构模板


4️⃣ 文本转视频,是 AI 当前最成熟的短视频应用场景

当前 AI 在短视频领域的优势集中在:

  • 夸张动作
  • 强对比画面
  • 明确情绪
  • 简单故事线

当“创意结构”已经由 NotebookLM 给出,
AI 更适合承担的是从创意到画面的执行过程


三、完整可执行流程(SOP)

Step 1:查找 YouTube 火爆 Channel

筛选标准:

  • 同一类型内容
  • 至少 3–5 条百万播放
  • 风格高度统一

Step 2:选取 Top 10 爆款视频

重点关注:

  • 播放量
  • 明显被算法推荐的迹象
  • 评论区情绪密度

Step 3:将视频链接输入 NotebookLM 分析

分析重点放在结构层面:

  • 前 3 秒发生了什么
  • 冲突第一次出现的时间点
  • 情绪如何被放大
  • 是否存在“规则被打破”的瞬间

最终得到的是一个可复用的爆款结构模型


Step 4:让 NotebookLM 生成“类似结构”的新创意

在结构不变的前提下,替换:

  • 场景
  • 道具
  • 主题设定

NotebookLM 在这一阶段输出的,是已经符合爆款结构的新视频创意


四、演示案例:厨房灾难——机器“闹鬼”事件

根据前述步骤,选择一个由 NotebookLM 生成的视频创意,用于展示从创意到视频生成的全过程。

创意名称

厨房灾难:机器“闹鬼”事件(The Haunted Mixer Prank)

创意概念

在制作节日甜点的过程中,人为制造厨房设备故障,形成短暂混乱,再用反转完成喜剧闭环。

核心情节点

  • 设备失控
  • 人物恐慌
  • 荒诞解释
  • 快速反转恢复秩序

五、让 AI 根据该创意生成文本转视频 Prompt

在演示中,并不直接人工编写提示词,而是:

将该创意输入给视频生成模型或多模态 AI,要求其根据创意自动生成文本转视频 Prompt。

并对 AI 提出明确约束:

  • 视频总时长:20 秒
  • 镜头数量:4 个
  • 每个镜头 1 个核心事件
  • 强调视觉、动作和情绪变化

🎬 AI 生成的 Text-to-Video Prompt(20 秒)

A 20-second comedic kitchen prank video.

Scene 1 (0–4s):
Bright home kitchen.
A cheerful female character is happily making holiday desserts.
She overloads a stand mixer with too many ingredients.
The mixer begins shaking violently.

Scene 2 (4–9s):
The mixer malfunctions.
Smoke rises dramatically.
Ingredients splatter everywhere.
The character panics, shouting:
“Unplug it! Unplug it now!”

Scene 3 (9–14s):
The mixer stops.
Close-up of the burnt mixer head.
She stares at it and asks nervously:
“Did I summon a ghost?”

Scene 4 (14–20s):
Comedic reversal.
She pulls out a brand-new mixer.
Smiles calmly and continues cooking as if nothing happened.
Bright, cheerful ending.

Style:
Fast-paced, exaggerated comedy.
Strong facial expressions.
Short-form video style.
No subtitles, no text overlays, no watermarks.

然后选一个文本转视频的模型将提示词输入。


六、为什么这个演示案例具有代表性?

  • 创意来源于结构分析,而非灵感碰运气
  • Prompt 由 AI 基于创意自动生成
  • 冲突、节奏、反转完整可复用
  • 非常适合短视频平台算法偏好

这说明:
当结构正确时,AI 的执行能力已经足够支撑内容生产。


七、结语:内容创作正在进入「工程化时代」

当内容生产开始遵循:

  • 用数据筛选方向
  • 用模型总结结构
  • 用 AI 生成与执行
  • 用批量测试验证结果

创作就不再是玄学,而是一套可以被复用和放大的系统

在这个体系中,“抄作业”不是捷径,而是最低成本、最高成功率的起点
当结构被掌握,所谓的“原创”,自然会不断出现。

本文由mdnice多平台发布

各位佬好,我是 Wipely 的作者。

上周发帖后收到了很多兄弟的反馈,确实被喷得不轻(感谢大家的真实吐槽)。 大家最关心的几个问题:“识别不准”、“怕上传文件不安全”、“水印去不掉很烦”

这周我没闲着,针对这些痛点肝了一周,带来了 Wipely 的重大更新

核心更新

1. OCR 准确率大幅提升 之前的版本确实有点 “瞎”,小字、模糊字经常漏。 这次我优化了识别模型,文字捕获率显著提升(相对首发)

2. 支持「纯离线模式」 (Privacy First) 这是大家最关心的隐私问题。 现在,你可以选择离线模式。在这个模式下:

  • 所有计算(OCR、Inpainting 修复)全部在你的本地浏览器 (WebAssembly) 中完成
  • 没有任何图片数据会被上传到服务器 (不用担心你的 PPT 隐私泄漏了)
  • 拔掉网线也能跑!(当然加载网页还得联网一下)
  • 真正做到了 “你的数据只属于你”。

3. 水印不再 “Burn 死在图里” 之前擦除后的图片带的水印,是直接 burn 在图层里的。 现在的逻辑改了:水印会作为一个独立的、可编辑的对象层添加。 如果不喜欢?直接在 ppt 中选中 → Delete。 就这么简单,把选择权还给大家。


关于福利

上周的首发活动不管是骂是夸,热度都很高,感谢大家支持。

  • 永久福利: L 站用户的 每天 50 个文件 额度依然有效(多页 PDF 算 1 个文件)。

传送门

Wipely - NotebookLM2PPT Tool


📌 转载信息
转载时间:
2026/1/12 17:09:47

我推荐的食用方法:
根据 PPT/PDF 生成对应的思维导图 & 闪卡 & 测验
具体步骤为
1,先根据思维导图进行学习,不会的就点击思维导图的某个部分
2,然后再利用闪卡巩固记忆
3,在纸上记一下重点内容,消化吸收
4,做一下测验,完成最后的验收
过程大约半个小时,可以保证知识 90~100%(因人而异,我基本是 100%)的掌握
至少生物是这样的




📌 转载信息
转载时间:
2026/1/11 19:29:29

各位佬好,我是 Wipely 的作者。

最近玩 NotebookLM 确实上头,Slide 生成确实很强,但那个生成的 PDF 简直让人高血压 —— 全是死图 / PDF,想改个字、换个翻译都不行。 之前试过各种转 PPT 工具,要么跑版,要么收费死贵,最后只能对着屏幕干瞪眼。

心里想:既然你不让我改,那我就把你字全扣出来,变成没字的背景,再把字填回去变成可编辑的文本框!

于是趁着元旦假期,搓了这个在线工具。

这玩意儿能干啥?(不仅仅是擦除)

不仅仅是去水印 / 去字,更是 “复活” PPT:

  1. 智能去字 & 补全:自动识别文字区域,基于把字擦掉,并脑补背景填回去,还原一张干净的 “母版” 背景图。
  2. OCR & 还原可编辑文本:利用 OCR 识别原来的文字内容、颜色和位置,以可编辑文本框的形式重新填回 PPTX 里。
  3. 最终产物:导出的不是几张大图,而是真正的、文字可选中、可修改的 .pptx 文件
  4. 批量搞:支持整份 PDF 扔进去,批量处理导出。



L 站兄弟专属福利 (不整虚的)

新站上线,肯定是 Bug 满天飞。为了感谢各位佬帮我踩坑测试,直接上干货:

1. Pro 会员免费领 (1 年)

  • 暗号:不用绑卡!直接在升级页面选择 Pro 365 日免费试用!
  • 注意:不需要绑卡!直接 0 元购。截止到 1 月 9 号下午 5 点(首发这三天)。
  • 权益:解锁所有 Pro 功能(无限导出 PPTX),随便用。

2. 只有 L 站才有的永久特权

  • 就算不想领 Pro,也就是偶尔用用,我也把基础额度改了:永久每天免费 50 个文件
  • 重点:一个 100 页的 PDF 也只算 1 个文件。这下够用了吧?

传送门

https://www.wipelyai.cv/


最后碎碎念: OpenCV 在浏览器里跑确实吃点资源,第一次加载 opencv.js 可能会转圈几秒,我已经尽力做了缓存优化,大家体谅一下。 有任何 Bug、或者觉得识别不准、排版错乱的,直接在楼下喷,我在线修!


📌 转载信息
转载时间:
2026/1/6 11:36:28


这我可太需要了,搞不懂为什么 notebooklm 连个目录都不愿意开发

github 项目地址: GitHub - parasolente/foldLM: Seamlessly integrates with NotebookLM, offering native-like aesthetics and functionality for organizing notebooks.
reddit 原帖:https://www.reddit.com/r/notebooklm/comments/1pzsf0a/i_added_folders_to_notebooklm_because_i_couldnt/


📌 转载信息
原作者:
shan_CW
转载时间:
2026/1/4 17:23:04

简介

最近某个课程要求一个 presentation,具体来说是给定一个大的主题,自己进行文献调研。我恰好有感兴趣的方向,但是时间紧迫不可能做细致的研究一句句去读论文,所以有了用 NotebookLM 辅助的想法,事实证明效果还不错。

NotebookLM 链接:https://NotebookLM.google.com/

步骤

  1. 确定方向

    研究的 insight 这块,还是得人来,AI 不行。

    我对 CAR-T 有点了解,最近 CAR-T 做自身免疫病又是热点,于是抽签决定研究 APS(抗磷脂综合症,一种自身免疫病),主题就定为 APS 与 CAR-T 疗法。

  2. 了解 APS 与 CAR-T

    重点是建立一个基本的认知,否则后面连 AI 的报告都看不懂。可以让 Gemini 深度研究做一份报告,然后哪里不懂问哪里,也可以自己去读论文。

    做一份笔记供自己参考,AI 整理的内容毕竟还是不能完全对上个人的脑回路。

  3. 为 NotebookLM 收集资料

    我收集了三部分的资料:Gemini 的深度研究,GPT 的深度研究,以及 NotebookLM 自己的 Deep research。

  • Gemini 的深度研究:我用它补充一些重要的边角料,也就是 pre 中会提到但是主题报告可能不会详细介绍的内容。比如 APS 的发病机制研究,我感觉对如何应用 CAR-T 会很关键。 生成的报告导出到 google drive,在 NotebookLM 里面可以直接导入。

  • GPT 的深度研究:GPT 的研究胜在内容全面,缺点也是太宽泛,重点突出不足,用它可以和 Gemini 形成互补。直接让 GPT 按照主题生成就行(注意后面这个对话要继续用)。此外,边角料的 APS 发病机制也研究一份。 生成的报告导出为 docx,也添加到 NotebookLM。

  • NotebookLM 自己的 Deep research:这个功能和 gemini 里面的很像,唯一不同是它会把研究结果的引用资料也放到知识库里面去,因此也用来直接研究主题。我是让它直接研究 “CAR-T 疗法在 APS 治疗中的应用和前景”,研究完左边就会多一堆参考资料。

  1. 认真读一遍生成的研究
  • 这一步很重要,决定了汇报的上限在哪,因为方向还是得人来定。上面生成了两份主题的报告 + 两份边角料的报告,至少各读一份吧,不然真的啥也不懂,Gemini 的报告相对好读一些。

    这个主题我之前看过一些相关的论文,也听过相关的讲座,读起来会感觉轻松一些,但要是佬友对要研究的领域完全陌生的话,报告读起来还是要花点功夫的。P.S. 这样看来用 AI 入门确实不是个好主意。

    我上面专门让 GPT 生成了一篇英文报告,如果后续打算在这一领域深挖,了解英文专有名词是必不可少的,读一遍英文报告会很有帮助……. 当然前提是关掉翻译。

    过程中有什么不会的,在 NotebookLM 里面提问就好,回答很详细,还给明确的参考文献段落。

  1. 生成演讲大纲
  • 在刚才 GPT 做主题研究的那个对话里面,让 GPT 生成大纲提示词。大纲的重点是控制结构,具体内容无须太详细,可以删掉,给 Gemini 留下发挥的空间。

    修改后敲定的提示词:

    Create a speaker-facing report (script reference) for a 10–12 minute research presentation on “CAR-T (and CAR-like cellular immunotherapies) for Antiphospholipid Syndrome (APS)”. 
    
    Audience: translational immunology / immuno-engineering researchers with basic rheumatology knowledge.
    Tone: clear, research-oriented, not hype; emphasize mechanisms, evidence level, and open questions.
    
    Deliverable format:
    - Title
    - 1–2 sentence Take-home message
    - Then follow the exact section structure below with clear headers.
    - For each section: provide (a) 3–6 speaker notes bullets, (b) one suggested figure/diagram idea, and (c) 1–2 transition sentences to the next section.
    - End with a “Key uncertainties & future directions” list.
    
    SECTION STRUCTURE (follow strictly):
    
    1) Title & Take-home message (1 slide)
    
    2) APS fast refresher (2 slide)
    - Pathobiology: aPL-driven thrombo-inflammation (B2GP1, B cells, complement, NETs, endothelium/platelets).
    - Clinical manifestations: thrombosis, pregnancy morbidity, catastrophic APS.
    
    3) Current standard treatments & unmet needs (1 slide)
    
    4) Why CAR-T might work: mechanistic hypothesis (1–2 slides)
    
    5) Clinical evidence: where we are now (2 slides)
    
    6) Risks, challenges, and translational barriers (1 slide)
    
    7) Summary & outlook (1 slide)
    - 3 concise conclusions.
    - 3 key research questions that should guide the field
    
    Output requirements:
    - Keep the total report length ~900–1400 words.
    - Use precise, non-overstated language.
    - Include a short “1-minute version” at the end (5–7 bullets) that I could use as a verbal conclusion.
    - Add an appendix: “Glossary of key terms” (max 10 items) tailored to APS + CAR-T.
    
    

    使用 NotebookLM 右侧的 reports 功能生成大纲

  1. 修改大纲
  • 大纲的可用性很高,但我不太希望完全按 AI 的意思来,还是自己修改了思路。里面的文案很有用,可以直接复制粘贴,省的打字麻烦。

    不要尝试 Slide Deck 也就是直接生成 PPT 的功能,目前这个功能生成的 PPT 都是整张图片,不能编辑是个硬伤,一旦有一点错误就全废了。不过,大香蕉画出来的 PPT 非常美观,用作大众向的演讲还是可以的。

  1. 做 Slides
  • 这方面主要是利用 Infographics 这个单独的生图功能,对于一些分条列出又不太重要的内容,能生成很好的配图。提示词不需要专门写,类似:

    生成图片说明APS的临床表现
    
    | 临床分类 | 关键表现 |
    | --- | --- |
    | **血栓性APS** | 动静脉血栓事件,如深静脉血栓(DVT)、肺栓塞(PE)、缺血性卒中等。 |
    | **产科APS** | 不良妊娠结局,如复发性流产、死胎、早产等。 |
    | **灾难性APS (CAPS)** | 一种罕见但极其凶险的类型,特征为短期内广泛累及多个器官的小血管血栓形成,致死率极高。 |
    
    

    效果如下:

    可以看到审美还不错,图片内容基本准确,汉字个别不太对,所以用于简单内容还可以,复杂内容还是放文字老老实实讲吧。

    另外,Infographics 功能生成 graphic abstract 也是一绝, 做好 PPT 以后让 Gemini 写提示词。

    可以告诉它要求 Cell 系列期刊 graphic abstract 的风格,或者加上下面的风格提示词:

    Adobe Illustrator style. No shading, no gradients, no 3D effects, no background texture. Use a limited, academic color palette: Slate Blue, Muted Red, Soft Grey, and Teal. Thick, clear black outlines for all cells. Strictly White Background. --ar 16:9 --v 6.0 --style raw --no background texture, shadows, 3D render,  

    可见英文指令遵循更好一些:

总结

这次做的任务是:在有限的时间内,对一个相对陌生的领域做一份高质量的报告。结果是整个报告从无到有耗费大概 3+3=6 个小时,产出 14 张 PPT,无论是内容还是形式,质量都还可以。

NotebookLM 的优势是迅速给出可靠的回答,附加的小功能可以生成报告、音频、图片等一系列产品。但这些的前提是人对这个领域有足够的了解,知道如何提出有价值的问题,以及收集高质量的资料。AI 做杂活,人类做决策,看起来是应该这样分工。

NotebookLM 还有 Audio overview, Flashcards, Quiz 之类的功能,这次没有用上,如果是要自学某些知识,估计会有用。


📌 转载信息
原作者:
HLiny
转载时间:
2026/1/3 15:05:37

关联上一个帖子 —:
V1.1 中文字修复大幅增强!更新年终汇报救星!忍不了 NotebookLM 生成的 PPT(中文错乱 + 分辨率低)的我,搓了一个高清修复工具



修复前 (Original)

修复后 (Restored)

前几天发的那个 NotebookLM 幻灯片修复工具,很多佬友反馈说:“虽然好用,但是要自己搞 Gemini Key,重点是要绑信用卡,太麻烦了!”

必须安排啊!

熬了几个大夜,V2.1 版本终于赶在年前发出来了!这次不整虚的,直接解决大家最头疼的两大门槛

核心更新 (V2.1)

1. 免 Key、免梯子,开箱即用(最重要!) 之前的版本虽然免费,但你得自己去申请 Google 的 API Key,主要是要绑定信用卡麻烦。 这次我直接重构了后端,加了一个 “Access Code (口令)” 模式

  • 以前:找梯子 → 去 Google AI Studio → 绑定信用卡申请 Key → 填进去
  • 现在:打开网站 → 输入口令 → 直接跑
  • 后端自动走 Vercel 代理,国内网络直连,速度飞快。

2. 画质史诗级提升:

  • 分辨率:从 2K 提升到 4K
  • 工程:优化汉字修复效果,肉眼可见,比上个版本修复效果更好了!
  • 效果:那种密密麻麻的流程图文字,现在修复出来跟矢量图一样锐利。

3. 体验升级

  • 这回真不仅是修图了,把 UI 也重新撸了一遍,加了类似 Apple 的 Shimmer 扫光加载动图,等待的时候不无聊了。
  • 修正了之前有佬友反馈的 “中文引号识别错误” bug。


还是要对比一下

特性AI Studio 模式 (自己填 Key)新版 Access Code 模式
上手难度高 (需会申请 Key)极低 (填码即用)
网络要求需魔法国内直连
画质上限2K4K (独占)
隐私Key 在你本地更安全 (不用存 Key)

(我是真心推荐大家试下新模式,虽然 API 成本我得肉疼一下…)


传送门


当然,如果你还是喜欢用自己的 API Key,完全兼容,完全免费,没有任何限制!

(主要是一个人开发维护不易,如果有 bug 轻喷,欢迎 issue!)


📌 转载信息
原作者:
aonong
转载时间:
2025/12/29 12:31:24