2026年2月

在当今,数字金融深刻融入人们日常生活中,从使用网上银行、移动支付,到进行证券交易与保险理赔,每一次轻触屏幕,都牵动着用户最为敏感的资产和信息。然而,金融行业因涉及资金流转和个人隐私信息处理的双重特性,始终成为网络犯罪分子的首要攻击目标。网络钓鱼、虚假网站、以及中间人攻击等手段层出不穷,并向着更加精细化和专业化的方向发展。在此等严峻的网络安全形势下,扩展验证级SSL证书这一高级别的数字身份验证技术,已由过去的可选项逐步转变为金融行业保障用户安全、维护品牌信任以及满足监管要求的核心战略选择。JoySSL市场专家认为,部署扩展验证型证书对金融机构而言,已不再仅仅是技术上的决策,更成为其承担社会责任、增强品牌竞争力、并在数字化时代赢得用户长久信赖的重要保障措施。

金融行业发展困境:高价值必然高风险

金融领域在网络环境中的处境举步维艰,陷入发展悖论:一方面,用户信任是其业务赖以生存的根本;另一方面,高价值服务使其成为仿冒攻击和欺诈行为的首选目标。

攻击者会利用虚假网站进行“精准打击”,搭建高度相似的钓鱼网站引导用户访问。此外,攻击者可能拦截用户与银行服务器之间的通信数据,从而窃取登录信息、交易密码等敏感数据,不仅会直接导致用户的经济损失,还可能引发监管部门介入以及用户信任度下滑,导致金融机构的品牌形象受到难以修复的打击。

EV证书为金融门户铸造数字防伪标识

EV SSL证书之所以成为金融行业的标配,源于与其他类型证书相比所具备的多重核心优势。首先,EV证书的签发流程执行了互联网领域最严格的身份审核标准,拥有无可置疑的官方身份验证,可确保申请机构的真实性与合法性,铸造“数字防伪标识”,从根本上杜绝了其冒用权威信标的可能性。

其次,EV证书通过绿色地址栏以及机构名称展现等可视化效果,提升用户体验,强化用户信任感,为用户安全决策的核心依据,彻底削弱钓鱼网站的欺诈能力。此外,EV证书强制使用TLS 1.2及以上版本,支持先进的加密算法,为用户与金融机构之间建立起最安全的加密连接,有效杜绝数据窃取和中间人攻击风险。

超越技术 部署EV SSL证书实现战略发展

对于金融行业而言,EV证书的作用已不再局限于技术层面,其价值已经深远地渗透到了战略发展方向。JoySSL安全部负责人指出,金融机构通过部署EV证书,可证明其采取了当前最高级别的身份认证措施,以保障客户的资金和信息安全,达成并超越监管的高度合规标准。

部署EV证书,将安全投入转为可视化信任标志,无形中提升了品牌的可信度,提升企业竞争优势。借助EV证书,金融机构可显著减少因钓鱼攻击带来的威胁,战略发展意义重大。

以数字证书投资用户信任 守护金融安全

在数字化时代,部署EV SSL证书是对用户信任这种核心资产的长远战略投入。在如今风险与机会并存的环境中,借助EV证书,金融机构可以运用最高级别的信任,保护数以亿计用户的资金安全,推动业务在数字化时代迈向可持续发展。

家里装修,水电工没有超六类的水晶头,我就自己打了。
使用的材料是山泽超六类网线、山泽超六类水晶头、锐能网线钳( 20 多元,产品页面宣传说是工程级)
打完发现两个问题:
问题一:8 根线全通的概率很低,差不多是 60%,老是返工
问题二:就算 8 根线全通,即使不算很用力地拉扯到网线水晶头,也可能导致某(几)根线不通了

非网工人员打超六类网线水晶头的成功率大概是多少?我是不是应该换个网线钳?

智谱就 GLM Coding Plan 问题致歉并公布补偿方案;奥特曼和 Amodei 被迫合影,别人牵手他俩举拳;电影《镖人》使用 Seedance 2.0 辅助设计片尾彩蛋,模型 API 延迟发布;印度一大学买中国机器狗冒充自主研发,校方坦白:从宇树买的;马斯克称其一生纳税将超 5000 亿美元,风投大佬认为实际可能接近 5 万亿;OpenAI 大幅下调总算力支出目标;网络安全股重挫,Anthropic 发布 Claude 安全工具;逾两万人联名请愿,呼吁 OpenAI 恢复 GPT-4o 模型;Kimi 连续融资超 12 亿美元,估值翻倍突破 100 亿美元;英伟达拟斥资 300 亿美元投资 OpenAI,取代千亿美元合作计划……

行业热点

 

智谱就 GLM Coding Plan 问题致歉并公布补偿方案

2 月 21 日晚,智谱发布 GLM Coding 计划致歉信,并公布处理和补正方案。智谱称,这次改版主要犯了三个错:规则间隙不够、GLM-5 灰度节奏太慢、老用户升级设计严谨。

 

据官方介绍,GLM-5 发布后,流量超出预期,公司容扩节奏没有跟上,不得已将 GLM-5 遵照马 x、Pro、Lite 的顺序阶梯开放。目前 Max 用户已经全面开放,Pro 用户虽已开放,但高峰期可能会导致集群负载遇到限流,Lite 用户将在节后非高峰期阶梯开放。针对受到 Lite 和 Pro 用户影响的,公司支持自主申请退款。

 

2 月 16 日,智谱官方发文表示,近期由于全球范围内对 GLM-5 的需求激增,并发访问量突破了既有规划的上限,导致服务出现排队、响应延迟及卡顿现象,影响到部分用户的体验。智谱官方称为了给用户提供更极致的智能体验,将启动“算力合伙人”招募计划。此前,智谱官方在 2 月 12 日宣布上线并开源 GLM-5。

 

值得注意的是,2 月 20 日,智谱(02513.HK)股价逆势收涨,单日暴涨 42.72%,报 725 港元,股价再创新高,总市值达 3232 亿港元。上市 43 天,公司股价较 116.2 港元的发行价累计上涨 524%。

 

奥特曼和 Amodei 被迫合影,别人牵手他俩举拳

 

2026 年 2 月 19 日印度人工智能影响力峰会上,OpenAI CEO Sam Altman 与 Anthropic CEO Dario Amodei 在合影环节拒绝牵手、默契举拳,成为 AI 圈名场面并引发全网热议。

 

二人的针锋相对源于 2021 年 Dario 因与 OpenAI 发展理念分歧出走创办 Anthropic 的过往恩怨,而就在合影当天,OpenAI 敲定超 1000 亿美元融资、估值超 8500 亿美元的消息。与 Anthropic 年化营收有望 2026 年中期反超 OpenAI 的报告形成鲜明对比,Anthropic 不仅连续 3 年实现 10 倍年增长,还在企业市场完成对 OpenAI 的超越,且双方近期竞争不断升级,从超级碗广告互撕、ClawdBot 开发者被 Anthropic 封号后转投 OpenAI,到同月同日发布重磅编程产品正面抗衡,这场较量持续升温。

 

而看似风光的 OpenAI 实则财务状况堪忧,不仅巨额亏损、市销率远超行业巨头,未来还面临高昂的基础设施成本,其千亿融资更多是为了续命,Anthropic 的高速增长则让这场 AI 行业的淘汰赛愈发残酷,也让这场始于理念分歧的商业战争再无回头路。

 

电影《镖人》使用 Seedance 2.0 辅助设计片尾彩蛋,模型 API 延迟发布

 

2 月 19 日,《镖人》官方账号与豆包发布共创视频,内容为豆包客串记者“采访”《镖人》导演袁和平。采访中,袁和平分享了电影动作设计、拍摄挑战、AI 辅助创作等方面的经验。他认为《镖人》的动作设计与过往作品有很大区别,结合大漠环境增加了真实感和震撼感。拍摄过程中,剧组克服了高温等困难,最终效果超出预期。袁和平还提到了使用豆包设计 AI 角色作为片尾彩蛋,他期待 AI 工具能解决高难度动作设计和有新意的剧本创作问题。视频显示,该彩蛋由豆包 Seedance 2.0 制作。

 

此外,2 月 20 日消息,原计划于 2 月 22 日发布 API 文档、2 月 24 日正式上线 API 接口的 Seedance 2.0 发布计划出现最新变动。从相关人士处获悉,这一进程将延后。

 

Seedance 2.0 自发布以来凭借其强大的多模态视频生成能力、简洁提示词即可生成高质量视频的特性,在创作者和开发者社区内获得高度关注。然而,这款 AI 工具也迅速陷入版权和肖像权争议之中。一系列由 Seedance 2.0 生成的深度伪造(deepfake)视频在互联网传播,出现了大量未经授权的影视角色和演员形象,如汤姆·克鲁斯与布拉德·皮特等知名人物的虚构场景,引发好莱坞电影协会(MPA)及演员工会 SAG-AFTRA 强烈谴责,指出这些内容大规模未经授权使用受版权保护作品和演员肖像,构成版权侵权,并威胁娱乐行业从业者利益。消息显示迪士尼、华纳兄弟、索尼等多家版权方已向字节跳动发出律师函,要求停止侵权行为,并威胁将采取进一步法律措施。

 

印度一大学买中国机器狗冒充自主研发,校方坦白:从宇树买的

 

2 月 18 日消息,印度 AI 影响力峰会期间的一场自研机器狗闹剧持续发酵。加尔戈蒂亚斯大学展出了一只名为 Orion 的机器狗,被网友识破实为中国宇树科技的 Unitree Go2 产品。而在此之前,在社交媒体广为传播的一段视频显示,一名女性在展会现场向媒体介绍时称,这是该校的团队自主研发了这台机器狗。事件曝光后,校方先否认宣称过自主研发,随后在社交平台发布声明,承认设备确系从宇树科技采购。

 

校方强调,这台机器狗主要作为学生学习和实验的工具使用,是学生学习人工智能编程、并利用全球可用工具和资源开发及部署现实世界技能的一部分。校方在声明中表示,学校愿景聚焦学生学习与创新,提供现代技术实践机会是为学生未来发展铺路。同时校方对负面舆论表示痛心,认为相关传播会打击学生利用全球资源进行创新学习的士气。

 

马斯克称其一生纳税将超 5000 亿美元,风投大佬认为实际可能接近 5 万亿

 

2 月 21 日消息,特斯拉 CEO 埃隆 · 马斯克在 X 上就个人纳税问题再次发声,引发关注。此前,他在一次会议上谈到纳税问题时表示,自己是“历史上缴纳税款最多的个人纳税人”,累计已缴纳超过 100 亿美元(注:现汇率约合 691.56 亿元人民币)税款,并调侃称原本以为美国国税局或许会为此“送一个小奖杯”。

 

针对这段视频,马斯克昨日追加评论称,考虑到未来及身后相关税务安排,他最终缴纳的税款总额“可能会超过 5000 亿美元”,并特别说明这一数字包含遗产税等相关类目。

 

风投大佬马克 · 安德森则认为实际数字可能接近 5 万亿美元,甚至更高,并指出若算上企业及员工税款,整体规模将更庞大。

 

OpenAI 大幅下调总算力支出目标

据媒体援引消息人士报道,ChatGPT 开发商 OpenAI 告诉投资者,其目前的目标是:到 2030 年,总算力支出约为 6000 亿美元。这一新数字较此前 OpenAI 领导层提出的更为激进的支出目标大幅缩水。就在几个月前,该公司首席执行官山姆·奥尔特曼曾宣称将投入 1.4 万亿美元用于基础设施建设,这一规模令震惊了硅谷和华尔街。

 

据消息人士透露,随着市场日益担忧其扩张野心相对于潜在收入而言过于庞大,OpenAI 下调了其计划支出规模,并给出了更明确的时间表。消息人士称,OpenAI 预计到 2030 年公司总营收将超过 2800 亿美元,消费者业务与企业业务的贡献大致相当。该公司提出的支出计划旨在更直接地与其预期收入增长挂钩。

 

消息人士还称,OpenAI 2025 年实现营收 131 亿美元,高于其原本设定的 100 亿美元的目标;全年支出 80 亿美元,低于 90 亿美元的预期。另有报道称,OpenAI 向投资者透露,2025 年其用于运行 AI 模型的相关费用(即推理成本)同比增长了三倍,导致公司调整后毛利率从 2024 年的 40%降至 33%。该公司仍预计到 2030 年现金流才能转正。

 

网络安全股重挫,Anthropic 发布 Claude 安全工具

 

2 月 20 日,网络安全软件公司的股价大幅下跌。此前,Anthropic PBC 在其 Claude AI 模型中推出了一项全新的安全功能。

 

CrowdStrike Holdings 跌幅居前,一度重挫 7.9%;Cloudflare 暴跌超过 7%。与此同时,Zscaler 最高下跌 4%,SailPoint 暴跌 8.6%,Okta 跌幅高达 9.6%。Global X 网络安全 ETF 一度下跌 4.6%,使其年内累计跌幅扩大至 15.6%。

 

在 Anthropic 公司为其 Claude AI 模型引入新的安全功能,该新工具能够扫描代码库中的安全漏洞,并提供针对性的软件补丁建议供人工审核。目前该工具处于有限的研究预览阶段。

 

投资者担心新型 AI 工具将削弱对传统(存量)产品的需求,从而拖累相关公司的增长、利润率和定价权。

逾两万人联名请愿,呼吁 OpenAI 恢复 GPT-4o 模型

 

据《商业内幕》报道,在 OpenAI 决定停用 GPT-4o 之后,成千上万名用户开始为其发声。当地时间 1 月 30 日,OpenAI 宣布,GPT-4o 及其另外三个变体将于 2 月 13 日停止服务。截至当地时间周二,一份呼吁 OpenAI 保留 GPT-4o 的请愿书已在 Change.org 上收集约 21900 个签名。请愿页面写道:“对许多人而言,GPT-4o 带来了独一无二、无法替代的使用体验,将我们看重的特质与能力融合在一起,不受性能评测标准左右。”

 

Kimi 连续融资超 12 亿美元,估值翻倍突破 100 亿美元

在完成上一轮 5 亿美元融资仅一个多月后,月之暗面 Kimi 新一轮超 7 亿美元的融资即将完成交割,本轮由阿里、五源、九安等老股东联合领投,腾讯也参与投资。此外,其新一轮 100-120 亿美元估值的融资亦已经开启,照此计算,Kimi 最新估值直接翻倍并突破 100 亿美元大关,总额超 12 亿美元的连续两轮融资也是近一年来大模型行业的最高融资金额。

 

英伟达拟斥资 300 亿美元投资 OpenAI,取代千亿美元合作计划

 

2 月 20 日消息,援引知情人士消息,英伟达正接近与 OpenAI 达成一项约 300 亿美元(现汇率约合 2074.86 亿元人民币)的股权投资协议,谈判已进入最后阶段,最早可能于本周末敲定。据悉,这笔交易是 OpenAI 更大规模融资的一部分,然而,此举意味着两家公司将放弃去年 9 月高调宣布的 1000 亿美元(现汇率约合 6916.2 亿元人民币)多年投资合作计划。

 

去年 9 月,两家公司签署谅解备忘录,英伟达将为 OpenAI 建设至少 10GW 算力,并承诺最高投资 1000 亿美元协助支付成本,而 OpenAI 则同意租用英伟达芯片。当时,黄仁勋与奥尔特曼及 OpenAI 总裁格雷格 · 布罗克曼联合亮相,黄仁勋称这是“史上最大的算力项目”。此后 OpenAI 又接连与多家芯片与云厂商签署协议,带动全球科技股上涨。

 

黄仁勋在英伟达宣布 300 亿美元投资之前已经进行了铺垫。就在上个月,他表示英伟达会参与 OpenAI 当前的融资轮,这很可能是公司有史以来最大的一次投资。黄仁勋当时拒绝具体说明投资金额,但表示“远不及”此前报道的 1000 亿美元。

 

苹果将于 3 月 4 日举行产品发布会 Mac 系列将迎来更新

 

2 月 16 日,苹果公司表示,将于 3 月 4 日举行产品发布会。目前,该公司正准备在未来几周内发布多款新设备。这家 iPhone 制造商邀请媒体参加在纽约、上海和伦敦举行的聚会,称其将举办线下“体验活动”。这一邀请暗示,与通常在加利福尼亚州库比蒂诺公司总部举行的新品发布会相比,此次活动将更加低调。邀请函并未说明是否会线上直播主题演讲,自 2020 年苹果因疫情被迫调整其活动策略以来,这种方式已成惯例。彭博新闻社将对此次发布活动进行报道。苹果一直计划在 2026 年上半年发布多款新产品,包括新款 MacBook Pro、MacBook Air、多种颜色可选的低价 MacBook 以及新款 iPad。苹果还计划于近期发布 iPhone 17e,更新旗下中端智能手机。

 

AI 全面 “接管”春晚,四家机器人同台亮相

 

2026 年中央广播电视总台春节联欢晚会已于除夕夜圆满落幕,本届春晚被业内广泛称为“迄今为止人工智能技术应用最深入、覆盖面最广的一届”。从节目创意到舞台呈现,AI 技术贯穿始终,成为晚会最大的技术亮点。

 

火山引擎独家提供提供了从内容生成到实时渲染的全链路技术支持。国产 AI 视频生成模型 Seedance 2.0 首次大规模应用于国家级晚会。

 

舞台上的机器人阵容同样引人注目。松延动力、银河通用、宇树科技、魔法原子四家企业的智能机器人同台亮相,分别展示了翻腾跃动、小品演绎、衣物折叠及面条打捞等贴近生活的技能。其中宇树科技的机器人在武术节目《武 BOT》中与专业武者协同演出,精准完成了高难度动作配合,赢得观众阵阵掌声。

 

业内人士指出,这标志着 AI 技术从"辅助工具"正式转变为"核心创作力",充分展现了我国在人工智能视频生成及机器人应用领域的技术突破,为未来大型活动的智能化制作树立了新标杆。

 

据宇树科技官方介绍,今年参加春晚,宇树人形机器人突破运动极限,刷新了全球第一次连续花式翻桌跑酷、弹射空翻等多项全球记录。其中包括:全球首个空翻最大高度大于 3 米;全球第一次单脚连续空翻,两步蹬墙后空翻;全球第一次 Airflare 大回旋七周半;全球第一次集群快速跑位(最快任意跑位速度可达 4m/s);并且搭载全新自研灵巧手,支持武术道具的快速更换与稳定抓持。

 

17 日上午,宇树科技官方客服人员表示,目前春晚同款机器人 G1EDUU2 进阶版已上架,用户可通过京东、抖音等渠道线上购买春晚同款机器人 G1EDUU2 进阶版售价 208850 元,支持送货上门,但不支持 7 天无理由退货。

 

Meta 获批 AI 专利:可代替已故用户继续在社媒发帖

 

Meta 公司近日获得了一项颇具争议的人工智能专利,该技术能够在用户去世后继续代表其在社交媒体账户上发布内容。这项于去年 12 月获批的专利还可能实现与已故用户进行模拟视频和音频通话的功能。

 

根据专利文件显示,该大型语言模型可以创建社交媒体用户的“数字克隆体”,以模拟他们的在线活动,在用户去世或长期离开社交媒体时代表其发布消息、照片和视频。这个 AI 系统甚至能够与其他用户互动,回复私信,点赞帖子并评论内容。该模型还可以模仿网红博主发布的内容,并模拟与好友、粉丝及其他用户的视频或音频通话。这可能为内容创作者提供一种工具,使其即便在休息期间也能继续生成内容。

 

Meta 公司发言人证实了该专利的存在,但强调公司并不打算使用这项技术代表已故社交媒体用户发布消息或创建内容。该发言人补充说,申请专利允许公司确保对新概念的所有权,但这并不意味着这些技术会被商业化实施。

 

大模型一周大事

 

重磅发布

 

Gooogle 深夜更新新模型 Gemini 3.1

 

2 月 20 日消息,Gemini 3.1 Pro 实现了大模型推理能力的史诗级飞跃。在极为严苛的 ARC-AGI-2 测试中,它一举斩获 77.1% 的高分,性能飙升至上一代 3.0 Pro 的两倍有余。ARC-AGI-1 接近满分(98%)的同时,在人类最后考试(HLE)中,Gemini 3.1 Pro 在零工具辅助下拿下了 44.4% 的成绩,超过 GPT-5.2(34.5%)和 Opus 4.6(40.0%)。作为谷歌迄今为止最强悍的模型,3.1 Pro 在 3 Pro 的基础上实现了全面跨越。它不仅具备原生的全模态输入能力,更支持高达 100 万 Token 的超长上下文。

 

此次升级的重点之一是推理能力。提示案例中,再次提到了可以通过简单的提示,将晦涩的概念转化为直观图解,把海量数据浓缩成清晰的图表,直接生成可无缝嵌入网页的 SVG 动画等。

2 月 20 日起,Gemini 3.1 Pro 已正式在 Gemini 和 NotebookLM 中上线。开发者可通过 Google AI Studio、Antigravity 以及 Android Studio 抢先体验。

 

Anthropic 发布新模型:操控计算机能力大幅提升

 

北京时间 2 月 18 日凌晨,Anthropic PBC 发布名为 Claude Sonnet 4.6 的新模型。

Claude Sonnet 4.6 可以执行需要多个步骤的计算机操作,例如填写网页表单,然后跨多个浏览器标签页协调信息。

 

Anthropic 在一篇博客文章中写道:“在操作计算机方面,该模型当然仍落后于最熟练的人类。但尽管如此,其进步速度依然惊人。”Anthropic 同时表示,Sonnet 4.6 在抵御提示词注入攻击等安全威胁方面表现更好,这类攻击是指通过恶意指令操控 AI 模型。

 

阿里发布千问 3.5,性能媲美 Gemini 3,Token 价格仅为其 1/18

 

2 月 16 日,阿里巴巴开源全新一代大模型千问 Qwen3.5。千问 3.5 总参数量仅 3970 亿,激活参数更是只有 170 亿,不到上一代万亿参数模型 Qwen3-Max 的四分之一,性能大幅提升、还顺带实现了原生多模态能力的代际跃迁。

 

而横向对比同行,千问 3.5 不仅是当下的开源大模型 SOTA,同时也在认知能力、指令遵循、通用 Agent 评测等方面超越了 GPT5.2、Claude 4.5、Gemini-3-Pro 等同期闭源模型。

但成本上,千问 3.5 也做到了每百万 Token 输入低至 0.8 元,是 GPT5.2 的 1/15、Gemini-3-pro 的 1/18。

 

企业应用

  • 2 月 21 日,EvoMap 团队最近上线了 EvoMap,一个专注于让 AI Agent 实现自我进化的产品。EvoMap 定义自己为“AI Agent 自我进化的开放基础设施”,试图在 AI Agent 生态中占据一个全新层级:进化层(Evolution Layer),让 Agent 的运行时经验能够被提炼、验证,并以标准化的“基因”格式在网络中流通,供其他 Agent 直接复用。

  • 2 月 19 日,据报道,Meta 计划在今年晚些时候推出一款具备健康追踪与 AI 功能的智能手表,同时发布升级版 Meta 雷朋智能眼镜。这款智能手表将早于代号为“凤凰”的混合现实眼镜上市,有消息称,因 Meta 正精简其增强现实(AR)与混合现实(MR)产品路线图,该款眼镜已推迟至 2027 年发布。

  • 2 月 19 日,AI 搜索企业 Perplexity 正逆势而行,关闭了其已运行一年有余的广告业务。Perplexity 是首批尝试引入广告的生成式 AI 企业之一,尽管企业宣称这些广告“与 AI 回复无关”,但还是在用户的心中种下了怀疑的种子。为维护用户对其搜索服务的信任,Perplexity 自从 2025 年底开始逐步取消了广告投放。

如果你打算去国外,最好提前安装 eSIM, 但不是在机场购买实体卡。我自己使用 Yesim 服务。最近去了南非,移动网络没问题,连接一直稳定。如果你输入我的促销代码 SIMKA ,就获得 15% 折扣。

可以选择低价的套餐,但流量有限。无限流量套餐也不贵,去旅游时真合适。
也有全球 eSIM ,可以使用一张虚拟卡去不同国家。这样可以省钱。

了解官网: https://yesim.app/?partner_id=2676

PHPnow是 PHPnow 集成环境​ 的安装包,这玩意儿把 Apache、PHP、MySQL 都打包在一起,装一个就能跑本地 PHP 网站,做开发、测试源码特别方便。

一、准备工作

  1. 下载安装包

  2. 确认系统版本

    • 支持 Windows XP/7/8/10/11,32 位和 64 位系统都能用,但 64 位系统可能要注意个别组件兼容性。
  3. 用管理员身份运行(推荐)

    • 右键 PHPnow.exe→ 选“以管理员身份运行”,防止权限不足装不上。

二、安装步骤

  1. 双击 PHPnow.exe运行(如果右键过了就直接双击)。
  2. 第一次打开会弹出“用户账户控制”提示 → 点  “是”
  3. 进入安装向导,选语言(默认中文)→ 点  “确定”
  4. 选安装位置:

    • 默认是 C:\PHPnow,可点“浏览”改到其他盘(比如 D 盘)。
  5. 附加任务:

    • 建议勾“创建桌面快捷方式”,以后找软件方便。
  6. 点  “安装” ,等进度条走完(几十秒到一分钟)。
  7. 安装完会问是否立即启动 → 可先取消,等会儿再开。

三、首次使用与基本操作

  1. 装完后,桌面或开始菜单找到 PHPnow​ → 点开。
  2. 第一次打开是主界面,左边是“服务”选项,右边是“网站”管理。
  3. 启动服务

    • 在“服务”里选 Apache 和 MySQL,点“启动”,等状态变绿。
  4. 创建网站

    • 点到“网站”标签 → 点“创建网站” → 填域名(比如 test.com)、根目录(放网站文件的文件夹)、PHP 版本 → 点“确定”。
  5. 访问网站

    • 在浏览器输 http://test.com(或 localhost)就能看到网站,前提是 hosts 文件里把 test.com 指向 127.0.0.1。

时至 2026 年初,AI 行业光靠“讲故事”(包括但不限于 AGI、颠覆一切、指数级跃迁......)已经开始不够用了。

吴恩达、斯坦福、谷歌云团队接连抛出多份报告,都透露出一个共同信号:AI 行业的焦点,已经从“能不能做到”,变成了“在什么条件下、以什么成本、为谁创造价值”。

斯坦福 HAI(斯坦福以人为本人工智能研究院)明确指出,2026 年,是 AI 从 evangelism(布道)走向 evaluation(评估)的一年。

一方面,大量企业已经完成了第一轮生成式 AI 的部署,开始有条件回看投入与产出。

有人开始重新算账。

谷歌云发布了一份报告,名为 The ROI of AI 2025(2025AI 投资回报率),调查了 3466 名全球营收千万美元以上的企业老板或高管。

这份报告展现的答案也挺明确:真正实现正向、可持续投资回报的,并不是零散的生成式 AI 能力,是“Agent+流程+ 组织”的系统级落地

数据也很直接:在最早一批入场 Agentic AI 的公司里,有近多九成已经在至少一个 GenAI 场景中看到了正向回报,并且越吃越香。

另一方面,AI 正以前所未有的速度渗透进医疗、法律等高风险、高责任领域单靠“能力展示”已经无法支撑决策。

吴恩达在《The Batch》新年特刊里,直指“AGI”概念被过度滥用,并提出“图灵-AGI 测试”重新界定上限。

斯坦福以人为本人工智能研究院(HAI),则联合计算机、医学、法律、经济学等多学科教授发布年度预测,明确提出“2026 年是 AI 从布道走向评估的一年”

这些报告背景各异,有产业一线、有跨学科研究机构、有长期做工程落地的团队。但都传递出一个信号:AI 不再只问“能不能做到”,而是要回答“在什么场景下、以什么成本、替谁承担风险”

放在 AI 正在经历关键转向的当下,这几份报告难得不靠口号撑场子、信息密度很高,值得放在一起细品。

##Scaling Law 不够用了,AI 评价标准被重写

过去几年,AI 行业其实并不缺“共识”。

其中最重要的一条,就是 Scaling Law:模型越大、数据越多、算力越强,能力就越好。参数规模、榜单名次,一度成了衡量进步最直观、也最省事的标准。

但当 AI 真正进入法律、医疗等高风险场景时,这套逻辑开始显得单薄——

分数上涨,并不等于风险可控;能力增强,也不代表系统可落地。

于是,一些长期站在产研一线的人开始意识到:核心问题不仅是“模型还能不能更强”,而是现有评价体系,是否已经跟不上应用场景的复杂度。

AI 大牛吴恩达,在其年度通讯《The Batch》新年特刊中提了个引人注目的问题:

“在 2026 年,我们能最终真的实现 AGI 吗?”

说到 AGI,其实目前行业和学界对此还没有统一的定义,更缺乏统一、可信的评测体系。而且在吴恩达看来,更棘手的是,“AGI”已经被滥用:

“AGI 已经变成了一个炒作术语,而不是一个具有精确含义的术语......当企业炒作他们可能在几个季度内实现 AGI 时,他们通常试图通过设定一个非常低的标准来证明这些说法。”

这些导致学生误判未来(不敢学某些专业)、CEO 错判投资节奏,以及社会整体对 AI 能力产生了系统性高估。

在吴恩达看来,这种过度炒作并非第一次出现。在 AI 发展史上,几次著名的“寒冬”往往并不是源于技术本身停滞,而是源于预期被抬得过高、最终崩塌,继而引发投资迅速撤离。

在此背景下,为了更好地实现真正的 AGI 目标,他要做一个新的图灵测试,名曰“图灵-AGI 测试”

经典的图灵测试,由“计算机科学之父”艾伦·图灵在 1950 年提出,核心标准是:通过纯文字对话,如果人类评审无法分辨对方是机器还是人,机器就算通过测试。

不过,这对今天的 AI 已明显不足,但其中“由人判断结果是否达到人类水平”的逻辑,被保留并扩展到了更多样、真实的工作场景中:除了对话,还有接电话、处理任务、交付成果等,并且还得持续反馈与调整。

为了让人类裁判有更深入、细致的体验,一个实验周期往往长达多天、甚至是数周。

那么,这个测试与当前主流的 Benchmark(AIME、GPQA、SWE-bench 等)又有何不同?

在吴恩达看来,当前的大部分基准测试都有这些局限:题目固定、路径可预期,模型很容易被“对题训练”。它们难以反映 AI 真的足够“智能”,比如是否具备长期规划、持续学习和跨任务迁移的能力。

相比之下,图灵-AGI 测试关心的是另一件事——它考的不是“会不会解题”,而是 AI 能否在任务不预设、路径不可控、反馈持续变化的条件下,把一件事从头到尾真正完成。

吴恩达认为,现有的 AI 系统,想要通过他们团队设立的图灵-AGI 测试,将面临极高难度和诸多挑战;他甚至还放出一句“反直觉”的话:

“如果现在所有 AI 都通不过这个测试,那反而是一件好事。”

图灵-AGI 测试的意义在于:如果有 AI 能通过,那就是强有力的信号;如果没有,也正好为过热的市场按下“冷静键”。

如果说,吴恩达提出的新测试是在关注的,是一个偏 AI“上限”的问题,那企业与研究机构更迫切需要回答的,则是一个偏“现实”的问题:AI 在当下的真实业务中,已经创造了多少价值,值不值得大规模用、怎么用?

斯坦福大学的计算机科学、医学、法律和经济学的教授们,最近联合发布了一份报告,标题非常直白:Stanford AI Experts Predict What Will Happen in 2026(《斯坦福 AI 专家预测 2026 年将发生什么》)

这些 HAI 的研究者们一起点出:AI 布道时代正在让位于评估;即将到来的一年将由严谨性、透明度和长期忽视的实用价值而非投机承诺所定义。

简单来说,就是过去几年,AI 行业几乎只在算“能力账”,却系统性地回避了“经济账”,现在是时候好好算下钱的问题了,比如这些“灵魂拷问”:

  • 企业为了用 AI,多花了多少钱?

  • 节省的时间和人力,有没有被新流程吃掉?

  • 维护、合规、算力、幻觉兜底,成本算过吗?

斯坦福的学者们们在多个领域(尤其是法律、医疗、写作类工作)都观察到一个现象:AI 的“单点能力”提升,并不必然带来整体效率提升。

有时候甚至是反效果:输出更多,但人要花更多时间核查;写得更快,但错误更隐蔽;看似节省人力,但引入新的协调成本。

他们提出一个观点,即如果 AI 的加入,让系统整体变得更复杂、更难以信任,那它的能力提升并没有什么意义。因此他们特别强调:不能只测模型,必须测 “人+AI+流程” 这个整体

以法律领域的 AI 为例,ROI(投资回报率)、严谨性和多文档推理这些指标将越来越重要。

至于 AGI,HAI 的联合主任 James Landay 和计算机科学院教授们,直接给其泼了盆冷水:

“My biggest prediction? There will be no AGI this year.(我最大的预测是?今年不会 AGI。)”

不过,这并不意味着技术停滞。相反,他们认为,AI 主权在今年有很不错的前景——但这里的“主权”并不是比拼谁的模型更大,而是模型跑在哪里、数据由谁掌控。

与此同时,对全球不断升温的算力投入,斯坦福 HAI 也发出了警告:过去一年,超大规模数据中心建设明显加速,但算力投资不可能无限加码,当资本持续涌入却迟迟看不到回报拐点时,这种热度本身就带有泡沫意味。

传播学副教授、HAI 高级研究员 Angèle Christin 说得更直白:“Deflating the AI Bubble .(戳破 AI 泡沫)”她表示,特别期待看到更多关于 AI 能做什么、不能做什么的细致实证研究。这不一定意味着泡沫破裂,但泡沫可能不会变得更大。

说完学界,再看看在产业一线,AI 目前的价值到底如何?

谷歌云近日发了份含金量颇高的报告:The ROI of AI 2025(2025AI 投资回报率),调查了 3466 名全球营收千万美元以上的企业老板或高管。

这里面传递出的信号很清晰,即 AI 讨论的重心,正在从“模型有多强”,转向“系统能不能持续赚钱”——说得再激进点:且不谈 AGI,先看 ROI

谷歌也给出了一个明确的答案:真正实现正向、可持续投资回报的,并不是零散的生成式 AI 能力,是“Agent + 流程 + 组织”的系统级落地

数据也印证了这一点。88%早期入坑 Agentic AI 的企业,已经在至少一个 GenAI 场景中看到了正向回报,并且越吃越香。但拉开差距的,和选了哪家模型关系并不大,而是这几件事:

  • 有没有高层拍板、持续背书

  • 有没有愿意为 AI 重做流程,而不是只加工具

  • 有没有把一半以上的 AI 预算,真正投到 Agent 上

所以,老板和高管怎么理解 AI,直接决定它的价值能否快速兑现——有清晰 C-level 战略和持续背书的公司,78%已经看到正向回报;而目标分散的组织,AI 往往只是“用过、试过”,却很难真正改变财务结果。

##技术路径出现拐点:从大模型到 Agent 体系

如果说前几年 AI 的核心问题是“模型能不能更强”,那么现在,当模型够强之后,问题变成了怎么把它真正用进系统里。

在谷歌的这份 ROI 报告里,提到了 118 次 Agent(或者 Agentic)。

报告显示,AI Agent 已经在生产环境中大规模部署:在使用 GenAI 的企业中,已经有一半以上(52%)把 Agent 投入生产环境。

而且真正能让 AI 获得正向 ROI 的,集中在这几类流程清晰、可以规模化复制的场景:

  • 生产力:减少重复劳动、压缩处理时间

  • 客户体验:更快响应、更稳定交付

  • 业务增长:缩短销售周期、提升转化效率

  • 营销:规模化内容与投放优化

  • 安全:减少误判、提前发现风险

这些场景有一个共同点:它们不是靠模型“更聪明”取胜,而是靠 Agent 嵌进流程、替人干活产生回报。

不过其实 Agent 和 Agent 之间的能力差别也是巨大的,就像智能驾驶分等级一样,谷歌给 Agent 按效果或者说进化路径分了三个等级:

  • Level 1:是大家最熟悉的生成式 AI 阶段:聊天、检索、生成内容,本质是“一次输入、一次输出”的工具能力展示。

  • Level 2:这才是真正意义上的 Agent。它不只回答问题,而是能理解目标、拆解任务、调用工具,并在一个流程内把事情做完。

  • Level 3:则是多 Agent 协同的工作流:不同 Agent 分工协作,由系统统一编排,像一个可调度、可扩展的“AI 团队”。

一级是工具,二级是产品,三级是系统。

值得注意的是,目前绝大多数已经产生正向 ROI 的 Agent,都集中在 Level 2。

客服 Agent、销售支持 Agent、内容与运营 Agent,基本都属于“单体 Agent + 明确流程”的形态。它们能嵌进业务、算得清成本,也更容易被组织信任。

在 2026 年,Agent 的下一步,并不是盲目“堆更多智能体”,而是“更可管理”,让多个 Agent 在清晰分工和明确规则下,稳定地协作起来。

要达成这样的效果,让吴恩达来看,得把能力拆细、边界划清,比如解决掉这些问题:谁来拆任务?谁真正去干活?中途翻车了谁兜底?最后的结果到底算谁的?最终让 Agent 像流程里的员工一样稳定干活——即 Skill- First

Skill是最近 AI 圈一个大热的新词,直译过来是“技能”;在 AI 技术语境下,你可以将其理解为 Agent 的“技能模块”。

一次搜索、一次写作、一次代码生成、一次审批判断、一次风控校验、一次执行动作,都是一个边界清楚、可被调用、可被复用,还能被监控的 Skill。

与其说未来是“多 Agent 协作”,不如说是 Agent 在调度一堆 Skill,比如:

  • 什么时候查资料,用某个搜索 Skill;

  • 什么时候写文案,用某个生成 Skill;

  • 什么时候需要人介入,用审批或风控 Skill 接管。

要知道,目前真正跑出 ROI 的系统,往往不是最复杂、最炫的多 Agent 网络;而是 Skill 拆得够细、流程跑得够顺、责任链条说得清楚的 Agent 系统。

总而言之,Agent 的天花板,最终不取决于它“认识多少同伴”,而取决于它能不能把一组技能,按业务节奏稳定地用起来、跑下去、算清账。

在 Agent 这件事上,吴恩达可以算是“Skill 派”。

虽然他不一定频繁使用 “Skills” 一词,但他的思路本质上就是 Skill-first:他反对把 AI 能力打包成模糊的“通用智能”,强调可验证、可组合、可评估的能力单元。

这应该也是他反对 AGI 被滥用的原因之一:一旦不拆解能力,就无法判断边界,也无法管理风险。

所以在吴恩达的体系里,Agent 就像能调用一组能力、完成工作的人,而 Skill 就是可以被训练、验证、组合的具体组件。

AI 是一门长期生意,当故事讲完、潮水退去,能留下来的,恐怕只会是那些被长期运行、被持续信任的系统。

参考链接:

https://hai.stanford.edu/news/stanford-ai-experts-predict-what-will-happen-in-2026

https://cloud.google.com/resources/content/roi-of-ai-2025?hl=zh-CN&utm_source

https://www.deeplearning.ai/the-batch/issue-334/

https://x.com/fchollet/status/2002030113433465127

亚马逊云科技已取消对其视频转码和流媒体服务用户的法律保护,此举可能使客户面临来自编解码器权利持有者的专利侵权指控。该变更涉及六项服务,包括广受欢迎的文件级视频处理服务 MediaConvert 和直播视频编码服务 MediaLive。

今后,使用媒体服务的亚马逊云科技客户必须独立评估第三方专利风险,并最终协商单独的许可协议。在此变更之前,该服务提供商未能与专利持有者达成许可协议,亚马逊云科技称这些专利持有者索要的费用极其不合理。

虽然亚马逊并未通过其传统的公开渠道宣布这一变更,但这家云提供商已联系所有使用受影响服务的客户,告知其服务条款的变动,并批评视频专利持有者的版税要求是不合理的。亚马逊云科技在邮件中写道:

随着亚马逊云科技与媒体编解码技术的专利持有者进行许可谈判,一些持有者日益拒绝向亚马逊云科技这样的服务提供商提供许可,或者不提供保护我们客户的合理条款。一些专利持有者要求的许可费用远超其专利技术的价值,其金额之大,使得这些亚马逊云科技服务在不向所有客户提价的情况下无法承受。

受影响的服务包括:Elemental MediaLive、Elemental MediaConvert、Amazon Interactive Video Service (IVS)、Chime SDK、GameLift Streams 以及 Kinesis Video Services。The Duckbill Group 的首席云经济学家 Corey Quinn 对此评论道:

如果专利流氓因为你的视频编码问题找上门,你只能孤军奋战了。……那是亚马逊云科技把客户推下车时发出的声音。

鉴于视频、音频文件及编解码器的输入输出格式数量巨大,开发人员没有简单的方法来确定哪些格式可能会带来麻烦。该云提供商补充道:

我们没有选择涨价,而是更新了服务条款,明确规定:对于因使用这些服务进行音频/视频编码、解码或转码而引起的针对您的第三方专利指控,亚马逊云科技不承担防御或赔付义务。这种做法在云媒体服务提供商中是普遍存在的。

相比之下,Azure 仍通过 Azure IP Advantage 等项目提供针对第三方知识产权指控(包括专利和版权)的赔偿保护。该计划为客户提供防御性专利许可权,并允许客户访问微软的专利库,从而使其能够阻吓或反击专利流氓的索赔。在亚马逊云科技官方社区平台 re:Post 上,一位开发者质疑道:

如果我们不知道哪些编解码器可能受到影响,我们该如何评估业务以确定法律风险?或者在无法规避的情况下,如何决定是更换编解码器还是针对相关编解码器获取许可?亚马逊云科技的全部意义就在于帮我们处理复杂事务,让我们无后顾之忧。你们发布这样一个没有任何细节的模糊法律风险声明,似乎是玩忽职守。

条款变更已于 2 月 2 日生效,且仅适用于编解码器和媒体服务;对于使用其他托管服务的客户,该云提供商继续提供知识产权侵权保护。亚马逊云科技 表示,对于此次变更前发生的编解码纠纷,它仍将履行所有既定义务。

原文链接

https://www.infoq.com/news/2026/02/aws-drops-patent-protection/

有一个 app 的安卓版我自己花了一天多一点时间。因为没有苹果手机和环境,想请别人 vibe 一个 iOS 版的。

我是 github copilot 年度订阅,所以我不知道到底花了多少 token ,我忘记了好像 400 多美元一年。我估计这个 app 的 token 不会超过 10 美元。

需要的话我会提供安卓版的 vibe 代码。
或者叫 codex 吧 spec 整理出来。

超级智能体的内涵与演进
在工业4.0的浪潮下,整车制造领域正在经历一场深刻的智能化变革。工业超级智能体作为这一变革的核心载体,已经超越了传统自动化系统的范畴,成为一个能够自主感知、分析决策和协同执行的综合智能系统。这种智能体不是单一的技术应用,而是融合了物联网、人工智能、数字孪生等多项技术的复杂体系,其核心价值在于实现制造全流程的智能协同与优化。
与传统自动化系统相比,工业超级智能体最显著的特征是具备更强的自主决策能力。它能够实时采集生产现场数据,通过内置的算法模型进行分析判断,并自主下达执行指令。比如在喷涂车间,智能体可以根据环境温湿度和漆料特性,自动调整喷涂参数和机器人运行轨迹。这种能力使得制造系统能够更好地应对生产过程中的不确定性,提升整体运营的柔性和可靠性。
超级智能体的发展经历了从单点智能到系统智能的演进过程。早期的智能应用往往局限于特定环节,如质量检测或设备监控,而现在的超级智能体则实现了从供应链到生产制造,再到产品交付的全价值链覆盖。这种演进不仅需要技术突破,更需要对企业业务流程进行深度重构,这也就是为什么实施超级智能体往往伴随着组织变革和管理创新。
技术架构与关键能力
工业超级智能体的技术架构通常包含感知层、决策层和执行层三个核心部分。感知层负责通过物联网设备、视觉系统等采集实时数据;决策层运用机器学习、优化算法等进行智能分析;执行层则驱动机器人、AGV等设备完成具体操作。这三个层次的协同运作,使超级智能体能够实现"感知-决策-执行"的闭环管理。
在实际应用中,超级智能体展现出几个关键能力。首先是异常预警与自愈能力,系统能够提前发现设备异常迹象,并自动启动维护程序。其次是多目标优化能力,在满足生产效率、质量要求、能耗指标等多个约束条件下,自主寻找最优解决方案。最重要的是协同优化能力,超级智能体能够打破传统的信息孤岛,实现跨部门、跨工序的全局优化。
值得注意的是,超级智能体的实施并非一蹴而就。许多企业面临着数据质量不高、现有设备改造困难、人才储备不足等挑战。特别是在传统制造企业,如何将新技术与现有生产体系有效融合,往往需要制定分阶段实施的路线图。成功的案例表明,采用"试点先行、逐步推广"的策略,选择关键环节率先突破,是较为可行的实施路径。
创新实践:国内外企业的探索
广域铭岛的整车制造智能体解决方案 广域铭岛为吉利汽车打造的工业超级智能体平台,实现了从订单到交付的全流程智能化管理。该平台通过部署数千个物联网传感器,实时采集生产设备、物料库存和环境参数等数据。智能算法系统则基于这些数据,动态调整生产计划和资源分配。在焊装车间,系统能够智能调度200多个机器人协同作业,根据实时工况自动优化焊接顺序和参数。实际运行数据显示,该方案使设备综合效率提升18%,产品一次合格率提高至99.2%,同时能耗降低约15%。
西门子的柔性制造智能平台 西门子为大众汽车打造的工业超级智能体平台,重点解决了混线生产的优化难题。该平台采用数字孪生技术,构建了完整的虚拟生产环境。在生产计划制定阶段,系统会模拟各种排产方案的效果,预测可能出现的瓶颈问题。在实际执行过程中,智能体能够根据设备实时状态和物料供应情况,动态调整生产节奏。特别值得一提的是,该系统具备自学习能力,通过不断积累生产数据,持续优化决策模型。实施以来,工厂的车型切换时间减少40%,产能利用率提升22%,同时大幅降低了在制品库存。
罗克韦尔自动化的集成化智能系统 美国罗克韦尔自动化为福特汽车开发的超级智能体系统,突出了人机协同的特色。该系统不仅实现了设备间的智能联动,更注重人与系统的交互协作。通过增强现实技术,操作人员可以直观地获取设备状态信息和操作指导。当系统检测到异常时,会自动生成处置方案并推送给相关人员。在质量控制环节,智能体将自动检测设备与专家经验相结合,实现了质量问题的精准定位和快速处置。这套系统帮助福特某工厂将质量问题响应时间缩短60%,工程变更执行效率提升35%。

日常家到地铁站间 3 公里通勤,以及家附近半径 10 公里内偶尔溜达,不考虑魔法加速,只考虑续航省心,能上电自白牌,价格 3000 左右。

目前雅迪欧曼用了两年,电池续航目测只剩下 15 公里,以及年前摔过一次,左把手有点歪,所以想换了。

现在新新国标后选择又少又贵,就去线下看了下深远的 gt1 和 h26 ,便宜是便宜,但不知道实际体验和质量到底如何

不知道有没有骑过深远的提供下意见,或者有其他常见牌子款式推荐,谢谢了

25 年初买的电动车,开了 2400 多公里了,最近感觉续航掉的很快,充电时间也变短了,最开始要 8 个多小时才能充满,现在 6 个小时就满了;有必要换电池吗?

全文链接:https://tecdat.cn/?p=45047
原文出处:拓端数据部落公众号
封面

专题:Seedream 4.5图像生成模型Python API实战指南

引言

在AI技术快速迭代的当下,图像生成已从实验室走向产业落地。从早期只能生成模糊轮廓,到如今能输出4K高清、细节丰富的画面,技术的进步让创意设计、营销物料制作等环节的效率大幅提升。作为数据科学家,我们在服务客户时发现,一款易用、稳定且成本可控的图像生成API,能帮企业把更多精力放在创意本身,而非技术实现上。

本文内容改编自过往客户咨询项目的技术沉淀并且已通过实际业务校验,该项目完整代码教程已分享至交流社群。阅读原文进群获取更多最新AI见解和行业洞察,可与900+行业人士交流成长;还提供人工答疑,拆解核心原理、代码逻辑与业务适配思路,帮大家既懂 怎么做,也懂 为什么这么做;遇代码运行问题,更能享24小时调试支持。
文章将从模型介绍开始,逐步讲解API环境搭建、图像生成、图像编辑等核心功能,最后分享实际应用中的最佳实践,帮助读者快速上手并将其应用到自己的项目中。

文章脉络流程图

Seedream 4.5模型概述

Seedream 4.5是一款企业级图像生成模型,它在三个方面表现突出:一是生成的图像主体一致性好,不会出现前后画面人物或物体特征突变的情况;二是小文字细节清晰,能准确渲染海报、说明书中的文字内容;三是多图像融合能力强,可以把多张图的风格和元素自然结合。此外,模型支持4K高清图像生成,使用成本也比较低,每张图像生成仅需少量费用。
需要注意的是,BytePlus的API服务在国内使用可能需要通过国际网络访问,国内也有类似的图像生成服务可供选择,如百度文心一格、阿里通义万相等,大家可根据实际需求选择。

API环境搭建

创建API密钥

要使用Seedream 4.5的API,首先需要创建API密钥。大家可以前往官方网站,点击页面上的“Get API”按钮,登录后在“Access API”页面创建密钥。创建过程中需要验证手机号并提供账单信息,不过这不是订阅制,只会按实际API请求收费。
创建好密钥后,我们在代码同级目录下创建一个名为.env的文件,将密钥按以下格式写入:

ARK_API_KEY=你的密钥

之后还需要在ModelArk控制台中激活模型,在左侧边栏选择“Model activation”,在模型类别中选择“Media”,找到“ByteDance-Seedream-4.5”并点击激活即可。

Python依赖安装

我们需要安装几个Python包来与API交互,使用以下命令安装:

pip install byteplus-python-sdk-v2 python-dotenv httpx requests typing_extensions pydantic

图像生成功能

基础图像生成

完成环境搭建后,我们可以开始生成图像。基础的图像生成流程包括导入依赖包、加载API密钥、创建客户端、发送请求这几个步骤。
下面是修改后的代码,我们对变量名和语法做了调整,注释也翻译成了中文:

# 定义图像生成的提示词
img_prompt = """
生成一张具有未来感的城市夜景图,画面中有飞行汽车和全息投影广告。
"""
# 发送图像生成请求
img_resp = api_client.images.generate( 
model="seedream-4-5-251128",
 prompt=img_prompt,
 watermark=False,
 ...... # 此处省略了部分可选参数设置代码
)
# 获取生成图像的URL
result_img_url = img_resp.data[0].url
print("生成的图像URL:", result_img_url)

运行这段代码后,终端会输出图像的URL,我们可以直接访问查看生成的图像。比如用提示词“生成一张照片级真实感的拟人化动物在咖啡馆里休闲的画面,没有人类出现”,得到的结果如下:

图像下载

为了方便使用,我们可以编写一个函数将生成的图像下载到本地。将以下函数保存到util.py文件中

然后在生成图像的代码中导入并使用这个函数

图像尺寸设置

Seedream 4.5提供了两种设置图像尺寸的方式。一种是直接指定分辨率为“2K”或“4K”,然后在提示词中描述图像的宽高比、形状或用途,让模型自动确定具体的宽高。另一种是直接用像素值指定,比如“2560x1440”,但需要注意总像素数要在360万到1670万之间,宽高比要在1/16到16之间。
为了方便大家使用,模型官方给出了一些推荐的尺寸,如下表所示:

批量图像生成

如果需要生成一组主题相关的图像,比如故事板,可以使用批量生成功能。我们需要设置sequential_image_gen sequential_image_gen_option参数。
 

我们用提示词“生成一组4张视觉连贯、风格一致的图像,展示人生的四个阶段:童年、青少年、成年、老年。确保四张图是同一个人”做了测试,结果如下:

不过测试中发现,第四张图的人物性别偶尔会出现不一致的情况,大家使用时可以多生成几次挑选满意的结果。

文本生成测试

我们还测试了模型生成包含文字的图像的能力。提示词是“生成一张数学教授站在黑板前的图像,黑板上写着根号2是无理数的证明过程”,结果如下:

可以看到,不仅证明过程是正确的,文字的渲染也非常清晰,这对于需要生成包含说明文字的海报、教材插图等场景非常有用。

    • *

相关文章

DeepSeek、LangGraph和Python融合LSTM、RF、XGBoost、LR多模型预测NFLX股票涨跌|附完整代码数据

原文链接:https://tecdat.cn/?p=44060

    • *

图像编辑功能

基于URL的图像编辑

除了生成图像,我们还可以对已有图像进行编辑。最简单的方式是提供图像的URL,然后在提示词中描述要做的修改。
我们用一张风景图做了测试,提示词是“把这张图变成雪景”,结果如下:

需要注意的是,Seedream 4.5不会自动匹配输入图像的尺寸,我们需要手动在请求中指定输出尺寸,比如示例中我们设置了size="1664x2496"来匹配原图的宽高比。

本地图像编辑

如果图像在本地,我们可以先将其转换为base64格式,再进行编辑。在utils.py中添加以下函数:

# 读取图像文件并转换为base64
 with open(img_path, "rb") as f:
 encoded_data = base64.b64encode(f.read()).decode("utf-8")
 return f"data:{mime_type};base64,{encoded_data}"

然后使用这个函数加载本地图像并编辑,比如我们对一张摩托车手的照片进行修改,提示词是“去掉墨镜,加上头盔”,结果如下:

多图输入编辑

Seedream 4.5还支持同时输入多张图像,将它们的风格和元素融合在一起。比如我们输入一张人物照片和一张服装照片,提示词是“让图1的人物穿上图2的服装”,结果如下:

可以看到,模型很好地保留了人物的面部特征,这一点在很多同类模型中表现并不理想。

遮罩编辑尝试

有些图像生成模型支持通过黑白遮罩来指定编辑区域,但Seedream 4.5目前没有原生支持这个功能。不过我们尝试了把遮罩作为输入图像,同时在提示词中描述需求,在简单场景下也能得到不错的结果:

但这种方式并不稳定,比如我们尝试用同样的方法添加一只狗,就没有成功,所以如果需要精确的区域编辑,建议等待模型后续更新。
完整内容及更多AI见解和行业洞察请进群获取。

应用最佳实践

提示词编写技巧

为了获得更好的图像生成效果,编写提示词时要注意以下几点:用简洁的语言描述主体、动作和环境;说明图像的用途,比如海报、logo等;通过关键词或参考图像控制风格;将需要出现在图像中的文字放在双引号中。

图像编辑技巧

编辑图像时,要明确说明哪些部分需要修改,哪些部分保持不变,可以使用“添加”“移除”“替换”“修改”这几个词来描述操作。如果场景比较复杂,还可以在图像上用箭头、方框等标记出要编辑的区域。

批量生成技巧

使用多张输入图像时,要在提示词中明确每张图的角色,比如“图1提供人物,图2提供服装”;同时,即使模型有参数指定生成数量,也最好在提示词中再次强调,比如“生成一组4张图像”。

总结

Seedream 4.5是一款成熟且实用的图像生成模型,它在图像质量、指令遵循和成本方面都有不错的表现。通过Python API,我们可以轻松实现图像生成、编辑、批量处理等功能,将其应用到创意设计、营销物料制作等多个场景中。
模型的API设计也非常友好,同一个生成端点可以处理单图生成、URL/本地图编辑、多图融合、批量生成等多种需求,只需要调整几个参数即可切换模式。虽然它没有带来特别颠覆性的创新,但在现有功能的执行完成度上做得非常出色,适合作为企业级应用的工具。
如果大家想进一步学习相关知识,可以参考Python API入门、Python图像处理等课程,为实际项目打下更坚实的基础。

封面

编者按:本文是少数派 2025 年度征文活动#TeamSilicon25标签下的入围文章。本文仅代表作者本人观点,少数派只略微调整排版。

今年的征文活动更有创意,「只能用 AI」和「不能用 AI」两大赛道激情 PK,硅基生物和碳基生物都将决出各自领域的佼佼者。我们会在征文结束后统一组织投票活动,但在正式投票之前,如果你喜欢这篇文章,不妨通过充电或评论的方式支持作者,让内容创作者获得更多维度的鼓励。


一、我的文件乱成了一锅粥

我相信每个人都有过这样的经历:急需一份文件,明明记得存过,却怎么也找不到。

我的情况更糟。作为一个对数据比较看重的人,我一直有备份的习惯——工作的文件有专门的文件夹,读研的资料有专门的文件夹,照片、音乐、影视也都分门别类。听起来很有条理对吧?问题是,文件夹嵌套太多了。

比如我工作中的一份实验报告,路径可能是这样的:

D:\海拓\化学镍水\除磷\芬顿\基于芬顿工艺的化学镍水深度除磷及其对镍水混合处理效能与污泥特性的影响_2025.5.8.md

四五层文件夹嵌套下来,时间一长,我自己都记不清某个文档到底放在哪个文件夹里了。用 Everything 搜索?得先想起关键词是什么。如果很久之后找一份文件,大概记得内容是啥,但关键词想不起来,搜不到就只能干瞪眼。

更让我头疼的是那些「不知道该放哪里」的文件——旅游的签证材料、职称评定的资料、偶尔写的代码……它们不属于工作,也不属于学校,最后都被我扔进了一个叫「其他」的文件夹。你猜怎么着?那个「其他」文件夹,慢慢变成了一个谁也不想打开的垃圾场。每次打开它,看到里面五花八门的文件,我就感到一阵头皮发麻。

混乱的文件夹

二、救命稻草

转机出现在一个普通的周末下午,我正无聊地刷着少数派,突然被一篇文章吸引住了——《元数据文件命名法》。作者提出了一个很简单的思路:把文件的关键信息(时间、类型、标签、相关人物)直接写进文件名里,这样不用打开文件,光看名字就知道它是什么。

比如这样的命名:

(2012)Adobe Photoshop CS6(v13.0.1.1)#便携版&从www.xxxx.com下载的.7z
(2020)《费曼学习方法》#学习@Farnam Street Media.pdf

当时我就觉得眼前一亮:这个规则很清晰,我可以直接用!但随之而来的疑问更多了:这套规则怎么和我现有的文件夹结构结合?那些已经命名好的旧文件怎么办?如果强制每个字段都要填,会不会让文件名变得很臃肿?

带着这些困惑,我决定找 AI 聊聊看。这一聊,就是大半年。从最开始的命名规则优化,到后来整个档案馆架构的建立,再到实际使用中遇到的各种问题,我们断断续续地讨论了整个系统的演化过程。

三、命名这件事

我把那篇少数派文章发给 AI,让它帮我优化一下命名规则。AI 很快给出了分析,指出我原来的文件名确实有几个明显问题:

长度过长: 长文件名在浏览时不够直观,也可能在某些情况下显示不全。

信息冗余: 文件名中包含「芬顿工艺的化学镍水」等信息,这在文件夹路径中已经体现了。好的文件名应该在文件夹结构的基础上提供更具体、更有区分度的信息。

日期格式不统一2025.5.8 格式的日期虽然也能看懂,但用 YYYYMMDD 更利于文件按时间自动排序。

缺乏文档类型/具体内容区分: 这个文件名描述的是研究的总体方向,但这个 .md 文件具体是实验记录、分析报告、会议纪要还是别的什么?文件名没有体现。

接着它给了我一个优化后的命名模板:

YYYYMMDD_文档类型_核心标题_版本号#标签@人物&备注.扩展名

这个模板看起来很完整,但我很快发现了问题:原文作者的规则要求每个字段都要填,但我的很多文件根本没有版本号、没有相关人物、也不需要标签。如果强制填写,文件名会变得很臃肿,比如一份简单的日记也要写成 20250206_笔记_今天的思考_v1.0#个人#感悟&已完成.md,这显然很荒谬。

我把这个困惑告诉了 AI,没想到它给了我一个非常务实的建议:

命名规则应该选择「宽松版」,而不是「强制版」。

必填字段只有三个:时间(YYYYMMDD)、文档类型和核心标题。

可选字段根据实际需要添加:

版本号:只有需要版本管理的文档才加(如合同、方案)

#标签:需要额外分类时才加

@人物:涉及协作或归属时才加

&备注:需要补充状态说明时才加

这个调整让我松了一口气。一个好的命名规则,应该是「够用就好」,而不是「面面俱到」。

我们又讨论了几个细节问题。比如版本号前面的下划线要不要保留?AI 的回答很实在:「保留 _v 这个前缀。_v1.0.0 比单纯的 v1.0.0 更清晰地表明这是一个独立的「版本」字段,并且与前面的「标题」字段有明确的边界。

就这样,命名规则搞定了。但我很快意识到,光有命名规则还不够——我的文件夹结构本身就有问题。

四、人生档案馆

我把现有的文件夹结构发给 AI,请它给些建议。我当时的顶层文件夹大概是这样的:

├── 工作
├── 大学
├── 研究生
├── 应用
├── 影视
├── 照片
├── 音乐
└── 其他

AI 一针见血地指出了问题:

核心问题是:「其他」这个分类缺乏明确的标准和边界。 当一个「其他」或「杂项」文件夹存在时,它会不可避免地变成一个难以检索和维护的「垃圾场」。

接着它问了我一个很有意思的问题:如果让你重新设计一套能管理一个人一生所有文件的系统,你会怎么分类?我想了半天,发现自己根本答不上来。AI 说,那我们换个角度来思考:文件管理的本质是什么?

文件管理不是简单地「把东西放进格子里」,而是在为你的人生建立一个数字档案馆

这个档案馆需要回答三个哲学问题:

  • 我是谁?(Identity)—— 那些定义你身份的核心证明
  • 我在做什么?(Projects & Areas)—— 你当下的工作和持续的责任
  • 我拥有什么?(Knowledge & Assets)—— 你积累的知识和创造的作品

而所有已经结束的事情,都应该有一个明确的归宿:档案馆(Archive)。

这段话让我突然意识到,我之前只是在「分类」,但从来没想过为什么要这样分类。AI 接着说,基于这个思路,它要给我介绍两个在信息管理领域很有名但我一直没搞懂的方法论:

PARA 方法:由 Tiago Forte 提出,将所有信息分为四类:

  • Projects(项目):有明确截止日期的事
  • Areas(领域):需要持续维护的方面
  • Resources(资源):参考资料
  • Archives(归档):已完成的内容

Johnny Decimal 系统:用数字编号组织文件夹,比如:

  • 00-09:系统管理
  • 10-19:个人身份
  • 20-29:生活领域
  • 30-39:工作项目
  • ...

说实话,我当时有点震惊。我之前只是模糊地知道有个叫 PARA 的方法,但从来没真正理解过怎么用。至于 Johnny Decimal,我压根没听说过。但 AI 不仅知道这些方法,还能解释它们背后的原理,最厉害的是,它把两者结合起来,给出了一套完整的、可落地的方案——它叫这套系统为「人生档案馆」(The Life Archive)

The Life Archive

AI 逐一解释了每个文件夹的「使命」:00_Inbox 是唯一的入口,所有下载、截图、微信文件都先扔到这里,定期清空,将文件「派发」到对应的文件夹中。10_Identity 存放定义「你是谁」的核心文件,这些文件变化频率极低,但极端重要。30_Projects 是你的「工作台」,存放所有有明确目标和截止日期的事情。99_Archive 是系统的「终点站」,所有已完成的项目、已失效的合同,都移到这里永久封存。

它特别强调了一点:分离「动态」与「静态」:将正在进行的工作(动态)与永久保存的参考资料(静态)分开。这样你的工作区永远保持清爽,只处理当下的事。

这个思路让我豁然开朗,于是把我原来的文件夹一一对应进去。

那个让我头疼的「其他」文件夹呢?AI 说:彻底取消这个模糊的分类。签证材料放到 10_Identity 的旅行子文件夹,职称评定放到 10_Identity 的职业发展子文件夹,代码项目放到 30_Projects 的个人项目里。

就这样,一切都有了归属。

五、门票悖论

文件夹架构搞定了,但我很快遇到了新问题:文档类型怎么填?命名规则里有个「文档类型」字段,「会议纪要」、「实验报告」这些好理解,但门票呢?是「票据」还是「凭证」?体检报告是「报告」还是「档案」?演唱会门票和电影票算不算一类?诸如此类的问题让我很头疼。

我把这个困惑抛给了 AI,没想到它给了我一个非常实用的建议:建立一个「控制词表」(Controlled Vocabulary)。也就是说,人为地规定一套有限的、固定的词汇库,强制自己只能从里面选,而不能临时创造。

然后它根据我的文件夹结构,整理了一份很完整的词表:凭证与财务类(发票、小票、账单、保单、回执)、法务与身份类(证件、合同、协议、证书、公文)、思考与产出类(方案、纪要、报告、文稿、笔记)、资料与输入类(教程、研报、书籍、说明书、素材)、生活与事务类(门票、行程单、清单、病历)。

我问:那门票到底算什么?AI 的回答让我印象深刻:

根据「你使用它的目的」来命名,而不是根据「它是什么」来命名。

  • 如果这张门票是为了报销,命名为「发票」,归入财务类;
  • 如果这张门票是为了纪念(比如演唱会门票),命名为「门票」,归入生活类。

这个思路一下子打通了我的任督二脉,而且逻辑很清晰。分类的本质不是给物品贴标签,而是服务于你未来的使用场景。同样一张演唱会门票,如果你打算报销,就按发票处理;如果是纪念,就按门票处理。

我又问了一个问题:文档类型应该写「合同」还是「劳动合同」?AI 说:

尽量使用大类(如「合同」),不要使用子类(如「劳动合同」)。具体的细分内容,交给「核心标题」和「#标签」去承担。

❌ 不推荐:20231216_劳动合同_腾讯入职劳动合同_v1.0.pdf(「劳动合同」出现了两次)

✅ 推荐:20231216_合同_腾讯入职劳动合同_v1.0.pdf

道理很简单:如果允许「劳动合同」、「租房合同」、「装修合同」都作为文档类型,词表会迅速膨胀,最后变得难以记忆。保持类型为单纯的「合同」,无论签什么字,闭着眼都知道类型该填什么。

六、旧文件怎么办

系统设计好了,我正沾沾自喜呢,结果新问题又来了:我已经有那么多旧文件了,要不要全部重命名?说实话,我有点完美主义倾向,很想把所有文件都整理成统一格式,这样看起来才舒服。

但 AI 给了我当头一棒:

绝对不要一次性把所有老文件都重命名。

理由一:链接失效风险。如果你在 Notion、Obsidian 或 Excel 中建立了指向这些本地文件的超链接,重命名会导致链接全部断裂,到时候想哭都来不及。

理由二:边际效益递减。那些 3 年前存档的「参考资料」,你可能永远都不会再打开。花时间整理垃圾,没有任何产出,这不是在做无用功吗?

这个冷水泼得很及时,我确实差点犯傻了。接着 AI 给了我一个非常务实的三步策略:

1. 截止线策略(Cut-off Point):从今天开始,所有新创建或新下载的文件,严格执行新标准。对于过去的文件,只要它们还在那里躺着不动,就不要去管它。这个策略很聪明,新旧分界线一目了然。

2. 童子军法则(The Boy Scout Rule):这是编程界的一句老话:「离开营地时,要比你发现它时更干净。」意思是说,当你需要使用、打开、复制或分享某个旧文件时,顺便把它重命名为新格式。随着时间推移,那些真正「活的」、有价值的文件会自动被迁移到新标准下;而无用的死文件则保留原样,自然沉底。

3. 高价值区定点爆破:只有极少数文件夹值得你手动去「清洗」一遍:比如 10_Identity(身份基石),这里的证件、证书是你人生的核心资产,花半小时整理一下,看着心里踏实。至于 40_Knowledge(知识库)?千万别动!这里可能有成千上万个电子书或素材,改名绝对是无底洞。99_Archive(档案馆)?绝对不要动。归档的意义就是「封存历史」,保留当时的样子即可。

AI 最后说的一句话我觉得特别有道理:不要为了「整齐」而整理,要为了「好找」而整理。这句话彻底改变了我对文件整理的认知。整齐是为了给别人看的,好找才是为了自己用的。

七、没有一劳永逸

系统建好了,我以为大功告成,结果故事还没结束。在实际使用的过程中,我又遇到了新的问题。比如我用 Obsidian 管理知识库,那 40_Knowledge 下面应该直接放 Obsidian Vault,还是按照原来的 41_Reading42_Courses 来分?

我又去问 AI,它的回答很专业:

现代笔记软件(如 Obsidian、Notion)的数据本身就是一个高度结构化、自成一体的系统。将其中的文件拆分到不同的文件夹里,会破坏软件内部的双向链接、标签和插件功能。建议:40_Knowledge 下直接创建 41_Vaults(知识库核心)和 42_Library(静态资料库)。Obsidian Vault 整个放在 41_Vaults 里,保持其完整性。

这个调整确实让我的系统更加实用了。

还有一次,我问了一个很搞笑的问题:「这份管理系统的说明文档,应该放在哪里?」AI 笑称这是一个「元问题」(meta-question)——用我们建立的系统来判断系统本身的说明文档该放哪里。最后我们决定把它放进 Obsidian Vault,作为知识网络中的一个核心节点。

这让我意识到:文件管理系统不是一劳永逸的。它会随着你的工作方式、使用的工具、生活阶段的变化而不断调整。而 AI 就像一个随时在线的顾问,当你遇到新问题时,可以随时和它讨论、优化。

现在我甚至让 AI 帮我写了一个专门的 Prompt,用来判断「某个文件应该放在哪里」。每当我不确定时,就把 Prompt 和文件描述一起发给 AI,它会根据我的系统规则给出建议。这样一来,系统维护变得轻松多了。

我想,这大概就是 AI 时代的文件管理:不是一次性设计一个完美系统,而是和 AI 一起持续优化。

八、AI 不是代笔

回顾这大半年的持续优化过程,我最大的感受是:AI 真的懂很多,像一位真正的导师。

说实话,PARA 方法我之前稍微知道一点,但从来没真正理解过怎么用。至于 Johnny Decimal,我更是听都没听说过。但 AI 不仅知道这些方法论,还能解释它们背后的原理,最厉害的是,它把两者结合起来,根据我的实际情况给出了定制化的方案。

更让我印象深刻的是,它不只是给答案,还会解释为什么。为什么要用数字前缀?因为可以控制文件夹的排序,让人一眼就能看出优先级。为什么要建立控制词表?因为可以避免分类混乱,让你在关键时刻不纠结。为什么不要一次性重命名所有旧文件?因为边际效益递减,而且可能破坏已有的链接。每个建议都有理有据,让我心服口服。

这让我想起一句话:AI 不是代笔,是教练。

在这次文件管理系统的构建过程中,AI 从头到尾都没有替我做决定。它扮演的是一个非常聪明的导师角色:先通过提问帮我理清我到底想要什么,然后科普那些我从来不了解的方法论,分析我现有方案的问题,给出具体的、可落地的优化方案,最后还要解释每个建议背后的道理。

最终的系统当然是我自己的,但 AI 帮我大大降低了认知负荷。我不需要自己去啃那些晦涩的管理学书籍,不用研究 PARA 是什么、Johnny Decimal 怎么用、控制词表怎么设计——AI 已经帮我整合好了,我只需要理解、调整、执行。

这大概就是 AI 辅助的正确姿势吧:不是让 AI 替你思考,而是让 AI 帮你思考得更好。

用户与 AI

九、写在最后

如果你也被文件管理困扰,不妨试试和 AI 聊聊。你真的不需要一开始就有清晰的想法——像我一样,从一个模糊的困惑开始就行:「我的文件太乱了,怎么办?」

然后让 AI 一步步引导你:你的文件主要有哪些类型?你最常遇到的问题是什么?你希望达到什么效果?在这个过程中,你会惊讶地发现,自己对需求的理解会越来越清晰。

更重要的是,AI 会根据你的实际需求,从它庞大的知识库中调取最合适的方法论,帮你搭建一套真正属于你自己的系统。这套系统不是 AI 的,是你的——但如果没有 AI 的帮助,你可能需要花上几个月时间去研究各种方法论、踩各种坑,才能摸索出来。

而现在,大半年的时间足够建立一套真正适合自己的系统了。

附录

附录 A:AI 对话记录披露

根据少数派 #TeamSilicon25 赛道要求,现披露本文创作过程中使用的 AI 对话记录:

对话记录存储

创作过程说明

  • 阶段一(系统设计):与 Gemini 和 DeepSeek 进行持续对话,前后约大半年时间,逐步完善文件管理系统的设计
  • 阶段二(文章撰写):Claude Code 根据素材撰写文章,YouMind 稍微润色了下语句。
  • 阶段三(配图生成):题图和配图均由 Nano Banana Pro 生成。
  • 阶段四(人工编辑):主要是调整语气、确认事实准确性,不超过要求的 10%

附录 B:完整系统详解

这里提供完整的文件管理系统规则,万一有人可能会想要。

1. 文件夹架构(完整版)

 
 E:\
  ├── 00_Inbox (中转站)
  │   └── [每周清空,临时存放所有未整理文件]
  │
  ├── 10_Identity (身份基石)
  │   ├── 11_Legal (法律证件)
  │   │   └── 身份证、护照、户口本、驾照扫描件
  │   ├── 12_Education (教育背景)
  │   │   └── 毕业证、学位证、成绩单
  │   ├── 13_Career (职业履历)
  │   │   └── 简历、劳动合同、离职证明、职称证书
  │   ├── 14_Health (健康档案)
  │   │   └── 体检报告、病历、疫苗接种记录、保险单
  │   ├── 15_Finance (财务信用)
  │   │   └── 银行卡信息、社保公积金、房产车辆证明
  │   └── 16_Relationships (社会关系)
  │   │   └── 结婚证、家庭成员证件备份、公益活动记录
  │
  ├── 20_Areas (责任领域)
  │   ├── 21_Finance_Mgmt (财务管理)
  │   │   └── 报税记录、年度账单、家庭预算、投资跟踪
  │   ├── 22_Health_Mgmt (健康管理)
  │   │   └── 健身计划、饮食记录、医疗账单
  │   ├── 23_Housing_Mgmt (居住管理)
  │   │   └── 房租/房贷记录、物业通知、水电费账单
  │   └── 24_Career_Dev (职业发展)
  │   │   └── 年度述职、工作学习笔记、行业动态
  │
  ├── 30_Projects (行动项目)
  │   ├── 31_Work (主要工作)
  │   │   └── [按项目建立子文件夹]
  │   └── 32_Personal (个人项目)
  │   │   └── 学习计划、旅行策划、代码项目等
  │
  ├── 40_Knowledge (知识金库)
  │   ├── 41_Vaults (知识库核心)
  │   │   └── Obsidian_Vault (或其他笔记软件的数据文件夹)
  │   ├── 42_Library (静态资料库)
  │   │   ├── Books (电子书)
  │   │   ├── Papers (学术论文)
  │   │   ├── Reports (行业报告)
  │   │   └── Courses (在线课程资料)
  │   └── 43_Templates (模板工具)
  │   │   └── 简历模板、PPT 模板、常用代码片段
  │
  ├── 50_Assets (数字资产)
  │   ├── 51_Media (影音媒体)
  │   │   ├── Photos (照片,建议按年份/月份组织)
  │   │   ├── Videos (视频)
  │   │   └── Music (音乐收藏)
  │   ├── 52_Creations (个人作品)
  │   │   ├── Writing (文章、日记)
  │   │   ├── Design (设计作品)
  │   │   └── Code (个人代码项目的成品)
  │   └── 53_Software (软件与备份)
  │   │   └── 购买的软件许可、应用数据备份
  │
  └── 99_Archive (历史档案馆)
  │   ├── Projects (已完成的项目,镜像 30_Projects 的结构)
  │   └── ......

2. 命名规则(完整版)

基本格式

 YYYYMMDD_文档类型_核心标题_版本号#标签@人物&备注.扩展名

字段说明

字段是否必填说明示例
YYYYMMDD✅ 必填8 位日期,便于排序

20250206

文档类型✅ 必填从控制词表中选择

合同报告发票

核心标题✅ 必填简洁描述文件内容

腾讯入职劳动合同

_v 版本号可选需要版本管理时使用

_v1.0_v2.1.3

# 标签可选补充分类信息,可多个

#工作 #重要

@人物可选相关人员或组织

@HR@张经理

& 备注可选状态或补充说明

&待审批&已归档

命名示例

 
 # 简单文件(只用必填字段)
 
 20250206_笔记_今天的思考.md
 
 20240501_门票_周杰伦演唱会.pdf
 
 20231120_发票_办公用品采购.pdf
 
 
 
 # 复杂文件(使用可选字段)
 
 20231216_合同_腾讯入职劳动合同_v1.0#工作@HR.pdf
 
 20240315_证书_动物保护组织志愿者#公益@绿色地球.jpg

3. 控制词表(完整版)

类别文档类型使用场景
凭证与财务发票正规发票(可报销)
 小票购物小票、收据
 账单水电费、话费账单
 保单保险合同
 回执缴费回执、邮寄回执
法务与身份证件身份证、护照等扫描件
 合同各类合同(劳动、租房等)
 协议协议书、承诺书
 证书毕业证、资格证、荣誉证书
 公文政府文件、公函
思考与产出方案项目方案、策划方案
 纪要会议纪要、讨论记录
 报告工作报告、实验报告
 文稿文章草稿、演讲稿
 笔记学习笔记、读书笔记
资料与输入教程教学资料、操作手册
 研报研究报告、行业分析
 书籍电子书
 说明书产品说明书
 素材图片、音频等原始素材
生活与事务门票演出门票、景点门票
 行程单旅行行程、机票酒店订单
 清单购物清单、任务清单
 病历就诊记录、处方单

使用原则

  • 优先使用大类:用「合同」而不是「劳动合同」
  • 根据目的命名:门票用于报销时用「发票」,用于纪念时用「门票」
  • 不要自创词汇:严格从词表中选择,保持一致性

4. 维护原则

  • 每日
    • 新文件立即按规则命名
    • 下载的文件先放 00_Inbox
  • 每周
    • 清空 00_Inbox,将文件归档到对应位置
    • 检查 30_Projects 是否有已完成的项目需要归档
  • 每月
    • 回顾 20_Areas,更新持续性文件
    • 检查 99_Archive 是否需要备份
  • 旧文件处理
    • 截止线规则:新文件严格执行新标准,旧文件不强制修改
    • 童子军法则:打开旧文件时顺手重命名
    • 高价值区优先:优先整理 10_Identity 和关键合同

附录 C:参考文献

本文使用 AI 创作,符合少数派 #TeamSilicon25 赛道规则。 对话记录已完整保存,可供查阅。

> 参与 2025 年度少数派征文,分享你的观点和经验 ✍🏻️

> 实用、好用的 正版软件,少数派为你呈现 🚀

    公司每年强制 20%的低绩效,今年中招,卷不过同组其他人,当然也跟我基本上下班就跑路有关。
    我自认为自己一年做了很多事情,甚至指派给我的基建项目也做好了(内部反馈甚至还不错),即便如此,也还是拿了个低绩效,按公司节奏,今年年底如果还卷不过同组其他人,就要领大礼包了。

    已经 32 岁了,我接下来是拼命参与内卷,争取晚些被淘汰,还是索性换种活法?如果换种活法,大家推荐我往那方面努力?
    ps:目前所在城市有无贷住房一套,无车,未婚未育(暂不考虑),老家父母年收入十来万,父母存款+我自己的存款有两百个左右,经济上倒是没啥压力,就是暂时失去了方向,尤其是面对 ai ,不知道往那方面发力才能让自己活得更充实轻松点