最近写代码拉满了,Cursor 有时候抽疯回答不是很好。去看了下 cc 的用法隔壁 v 站也推荐 cc 写代码质量很高,就找了很多 cc 的中转站试用下来推荐。

  1. https://aicoding.sh/i/VqUqnn (评分 5,最近一周开始用没有挂过,自认为很稳定。注册送 3000 积分大概半天的量吧)
  2. https://www.88code.org/register?ref=33STTY (评分 3,注册当天就挂了大概第二天恢复,但是注册可以找 QQ 群客服送一个月限额)
  3. https://privnode.com/ (评分 4,也比较稳定没遇到挂过。但是速度没第一个快,注册送 $3 差不多也是半天的量)
  4. https://cubence.com/signup?code=SC436OLS (评分 ----,正在试用中,大概率和第一个有得一拼,注册也是送 $3)

最后搭配 cc-switch 无缝切换很好,价格上来说第一个应该是最贵的。其他的貌似可以买额度不用包月,但是不稳定。

如果大家还有其他中转站也可以推荐下,试用完了后续就准备买额度用着了。重要是稳定!!!

aff 大家如果要试用可以用下我的哈哈,这样我还能在试用一段时间 🤔

这几天突然被告知有直系亲属患了肺癌,然后又被告知之前已经有亲属因为肺癌去世。

这两天的陪护经历,医院医生也直言他就是基因不好,比常人更易患癌。

一开始很焦虑,老想着做一个癌症易感基因检测,但是转念一想,自己有这个易感基因基本上是板上钉钉的,就算每有,也不可能放弃每年主动去做早筛了,换句话说,无论结果出来有没有肺癌易感基因,以后都必然是防范到死的。

这么一想,感觉这种检测不做也行。

想咨询下 V 友这块,我该不该去做,基因检测费用也挺高的,和遗传病基因检测还不同,这个相当于只是易感筛查,专业一次的检测据说起码 5000 多的专项检测,全面的要上万多。

如果你是把 Dokploy 装在自己的服务器上,用了一段时间,大概率会遇到一个问题:
它要怎么升级,才不折腾?

答案其实很简单。

Dokploy 官方已经把升级流程写进了安装脚本里,不用拉代码,也不用自己停服务。一行命令就够了:

curl -sSL https://dokploy.com/install.sh | sh -s update

image.png

我自己升级时的体验是:配置没丢,服务照常起来,过程也没什么存在感。对已经在跑项目的机器来说,这点很重要。

当然,有个前提。
如果你和当前版本差得太远,或者这次升级涉及结构性改动,最好先扫一眼文档,看看有没有明确提到需要手动处理的地方。否则大多数情况下,直接跑就行。

官方对这个升级方式的说明在这里:
https://docs.dokploy.com/docs/core/manual-installation#manual-upgrade

自部署用 Dokploy,本来就是图一个省心。升级这件事,它现在确实做到了,越来越喜欢 Dokploy 了,哈哈哈。

image.png

Casibase ( https://github.com/casibase/casibase )是一套开源的基于 Web 的 AI 知识数据库,适合个人或者组织作为自己的专属内部 AI 知识库来使用。GitHub 已达到 1600+ stars ,欢迎体验~

主要功能如下:

  • 支持 OpenAI GPT-4 模型、GPT Vision 图片解析、DALL-E 画图等功能;
  • 支持最新的 Claude 3 Opus 、Sonnet 等模型,超越 GPT-4 ;
  • 国际模型支持:Azure OpenAI 、Google Gemini Pro 、HuggingFace 、Cohere 等;
  • 国内模型支持:文心一言、通义千问、ChatGLM 、Minimax 、讯飞星火等;
  • 支持多种 Embedding 嵌入 API 接口,如 OpenAI V3, Ada V2, 百度文心一言等;
  • 支持多种通用文档格式:TXT, Markdown, Docx, PDF 等,支持 PDF 文件智能解析;
  • 支持以会话或消息为单位,计算所有大模型 API 的 Token 数和价格(美元或人民币),方便管理员进行 API 成本统计;
  • 支持 AI 小助手通过右下角弹框嵌入到应用网站,进行在线实时聊天,支持聊天会话人工接入;
  • 知识库文档存储支持本地存储,或云端存储(阿里云 OSS 、Amazon S3 、群晖 NAS 等几乎所有主流云存储都有支持);
  • 支持多用户、多租户,支持管理员进行用户管理、角色管理、权限管理,既适合个人使用,也适合组织使用;
  • 支持 QQ 、微信、企业微信、钉钉、Google 、GitHub 等多种第三方登录,支持短信登录、邮箱验证码登录登;
  • 支持谷歌 reCAPTCHA 、hCaptcha 、阿里云、GEETEST 极验、Cloudflare Turnstile 等多种人机验证方式,专业防盗刷;
  • 聊天会话云端存储,所有设备实时消息同步,随时可查看,不会丢失;
  • 支持中文、英文等在内的十几种界面语言。

在线体验:

源码:

社区反馈:

电脑 C 盘空间一直在减少,问题是我所有文件都没放 C 盘,除了系统本身自带的文件。估计是 edge 浏览器更新占用空间。一直找不到文件更新到哪里去,求助一下,谁知道啊。

做了几个 APP 以后发现截图好痛苦

不做截图转化率很低
做截图真的太烦了
一次要花费大半天的时间来做很多语言的截图

还有隐私协议的托管,虽然能搞定但是也是很花时间和精力的东西.
我自己搞了一个工具把这些大大简化了

https://www.makeapp.work/zh

另外录制了一个视频讲述了一下如何使用这个工具:


新工具上线预计一个月内提供 1 美元购买 1 年会员的活动,几乎就是白送了.

试试看,如果有啥使用问题欢迎留言

网站名

www.repothread.com

先说重点

  1. 听取 V 友的建议,添加了 AI 聊天功能,目前用户比较少,所以用的 GLM-4.7 模型,欢迎体验(求大佬憋刷我 API ,小本买卖)
  2. 感觉 deepwiki 的聊天和文档太割裂了,所以抄了 google 的布局方案
  3. 还开发了一些支付和专业版报告里的功能,目前还没放开,放开后给 V 友们详细介绍,会在 V 站发放专业版的免费邀请码

下面是照本宣科的项目简介

厌倦了接手项目时面对一堆没有文档的代码? RepoThread 来帮你。

它能做什么?

只需输入 GitHub 仓库地址,AI 自动分析代码结构,生成交互式项目文档,包括架构图、模块说明、调用关系等。还能直接和 AI 对话,问它"这个函数是干嘛的"、"数据流是怎么走的"。

核心亮点:

  • 📊 自动生成 Mermaid 架构图和流程图
  • 🌍 3 种语言界面,中英日,后期会扩展更多语言,有特殊语言要求的 V 友评论区提,优先支持
  • 💬 AI 对话功能,边看文档边提问

适合场景:新人 onboarding 、代码审查、技术调研、遗留系统梳理。

【Unity Shader Graph 使用与特效实现】专栏-直达

在Unity的Shader Graph中,NormalVector节点是一个基础且重要的工具,它允许着色器访问网格的法线矢量信息。法线矢量在计算机图形学中扮演着关键角色,它定义了表面的朝向,是光照计算、材质表现和各种视觉效果的基础。

节点概述

NormalVector节点为着色器编写者提供了获取网格法线数据的便捷途径。无论是顶点法线还是片元法线,这个节点都能让开发者轻松地在不同的坐标空间中操作这些数据。通过简单的参数设置,就可以将法线矢量转换到所需的坐标空间,大大简化了复杂着色器的开发过程。

法线矢量的本质是垂直于表面的单位向量,在三维空间中表示为(x, y, z)坐标。在Shader Graph中,这些数据通常来自3D模型的顶点数据,或者通过法线贴图等技术进行修改和增强。

参数详解

Space参数

Space参数决定了法线矢量输出的坐标空间,这是NormalVector节点最核心的功能。不同的坐标空间适用于不同的着色场景和计算需求。

  • Object空间:也称为模型空间,这是法线数据最原始的存储空间。在Object空间中,法线相对于模型本身的坐标系定义,不考虑模型的旋转、缩放或平移变换。当模型发生变换时,Object空间中的法线不会自动更新,需要手动进行相应的变换计算。
  • View空间:也称为相机空间或眼睛空间,在这个空间中,所有坐标都是相对于相机的位置和方向定义的。View空间的原点通常是相机的位置,Z轴指向相机的观察方向。这个空间特别适合与视角相关的效果,如边缘光、反射和折射。
  • World空间:World空间中的坐标是相对于场景的世界坐标系定义的。无论模型如何移动或旋转,World空间提供了统一的参考框架。这个空间常用于光照计算、阴影生成和全局效果。
  • Tangent空间:这是一个特殊的局部空间,主要用于法线贴图。在Tangent空间中,法线是相对于表面本身定义的,Z轴与表面法线对齐,X轴与切向量对齐,Y轴与副法线对齐。这种表示方法使得法线贴图可以在不同朝向的表面上重复使用。

选择正确的坐标空间对着色器的正确性和性能至关重要。错误的空间选择可能导致光照计算错误、视觉效果异常或性能下降。

端口信息

NormalVector节点只有一个输出端口:

  • Out:输出类型为Vector 3,表示三维矢量。这个端口输出的是根据Space参数选择在对应坐标空间中的法线矢量。输出值通常是归一化的单位矢量,但在某些情况下(如使用非统一缩放时)可能需要重新归一化。

使用场景与示例

基础光照计算

法线矢量的一个主要应用是光照计算。在Lambert光照模型中,表面亮度取决于光线方向与表面法线之间的夹角。

HLSL

// 简化的Lambert光照计算
float3 lightDir = normalize(_WorldSpaceLightPos0.xyz);
float3 worldNormal = NormalVector节点输出(World空间);
float NdotL = max(0, dot(worldNormal, lightDir));
float3 diffuse = _LightColor0 * NdotL;

在这个示例中,我们首先获取世界空间中的法线矢量和光线方向,然后计算它们的点积。点积结果决定了表面接收到的光照强度,这是大多数基础光照模型的核心计算。

法线贴图应用

法线贴图是现代实时渲染中增强表面细节的关键技术。NormalVector节点在应用法线贴图时起着桥梁作用。

HLSL

// 法线贴图应用流程
float3 tangentNormal = tex2D(_NormalMap, uv).xyz * 2 - 1; // 从[0,1]转换到[-1,1]
float3 worldNormal = NormalVector节点输出(World空间);
// 使用TBN矩阵将切线空间法线转换到世界空间
float3x3 TBN = float3x3(
    IN.tangent.xyz,
    cross(IN.normal, IN.tangent.xyz) * IN.tangent.w,
    IN.normal
);
float3 mappedNormal = mul(TBN, tangentNormal);

这个示例展示了如何将切线空间中的法线贴图数据转换到世界空间。首先从法线贴图中采样并调整数值范围,然后使用TBN(切线-副切线-法线)矩阵进行空间转换。

边缘检测与轮廓光

利用View空间中的法线可以创建各种与视角相关的效果,如边缘光和轮廓检测。

HLSL

// 边缘光效果
float3 viewNormal = normalize(mul((float3x3)UNITY_MATRIX_V, NormalVector节点输出(World空间)));
float3 viewDir = normalize(UnityWorldToViewPos(IN.worldPos));
float rim = 1 - abs(dot(viewNormal, viewDir));
float rimLight = pow(rim, _RimPower) * _RimIntensity;

在这个示例中,我们首先将世界空间法线转换到View空间,然后计算法线与视角方向的点积。当表面几乎垂直于视角方向时(即边缘处),点积接近0,从而产生边缘光效果。

环境遮挡与全局光照

法线信息对于环境遮挡和全局光照计算也至关重要。

HLSL

// 简化的环境遮挡
float3 worldNormal = NormalVector节点输出(World空间);
float ambientOcclusion = 1.0;

// 基于法线方向的简单环境光遮蔽
// 这里可以使用更复杂的算法,如SSAO或烘焙的AO贴图
ambientOcclusion *= (worldNormal.y * 0.5 + 0.5); // 模拟顶部光照更多

// 应用环境光
float3 ambient = UNITY_LIGHTMODEL_AMBIENT * ambientOcclusion;

这个简单的示例展示了如何用法线方向来模拟环境光遮蔽效果。在实际项目中,通常会结合更复杂的算法或预计算的数据。

高级应用技巧

法线重定向与混合

在某些情况下,需要将法线从一个表面重定向到另一个表面,或者在不同法线源之间进行混合。

HLSL

// 法线混合示例
float3 normalA = tex2D(_NormalMapA, uv).xyz;
float3 normalB = tex2D(_NormalMapB, uv).xyz;
float blendFactor = _BlendFactor;

// 使用线性插值混合法线
float3 blendedNormal = lerp(normalA, normalB, blendFactor);

// 或者使用更精确的球面线性插值
// float3 blendedNormal = normalize(lerp(normalA, normalB, blendFactor));

法线混合是一个复杂的话题,因为简单的线性插值可能不会保持法线的单位长度。在实际应用中,可能需要重新归一化或使用更高级的插值方法。

法线空间转换优化

在性能关键的场景中,法线空间转换可能需要优化。

HLSL

// 优化的世界空间法线计算
// 传统方法
float3 worldNormal = normalize(mul(IN.normal, (float3x3)unity_WorldToObject));

// 优化方法 - 使用逆转置矩阵(处理非统一缩放)
float3 worldNormal = normalize(mul(transpose((float3x3)unity_WorldToObject), IN.normal));

当模型应用了非统一缩放时,直接使用模型矩阵变换法线会导致错误的结果。在这种情况下,需要使用模型矩阵的逆转置矩阵来正确变换法线。

法线可视化与调试

在开发过程中,可视化法线矢量对于调试着色器非常有用。

HLSL

// 法线可视化
float3 worldNormal = NormalVector节点输出(World空间);
// 将法线从[-1,1]范围映射到[0,1]范围以便可视化
float3 normalColor = worldNormal * 0.5 + 0.5;
return float4(normalColor, 1.0);

这个简单的着色器将法线矢量的各个分量映射到颜色通道,从而可以直观地查看法线的方向和分布。

常见问题与解决方案

法线不连续问题

当使用低多边形模型或不当的UV展开时,可能会遇到法线不连续的问题。

  • 问题表现:表面出现不自然的硬边或接缝
  • 解决方案

    • 确保模型有适当的平滑组设置
    • 检查UV展开是否导致法线贴图采样错误
    • 考虑使用更高精度的模型或细分表面

性能考量

法线计算可能会成为性能瓶颈,特别是在移动设备或复杂场景中。

  • 优化策略

    • 在顶点着色器中计算法线,而不是片元着色器
    • 使用更简单的法线计算,如省略归一化步骤(如果对视觉效果影响不大)
    • 考虑使用法线贴图的压缩格式以减少内存带宽

法线精度问题

在特定情况下,法线计算可能会遇到精度问题,导致视觉瑕疵。

  • 问题表现:闪烁的表面、带状伪影或不准确的光照
  • 解决方案

    • 使用更高精度的数据类型(如half改为float)
    • 确保法线贴图使用适当的格式和压缩
    • 检查法线变换矩阵的精度和正确性

与其他节点的配合使用

NormalVector节点很少单独使用,通常与其他Shader Graph节点结合以实现复杂的效果。

  • 与Dot Product节点结合:用于计算光照强度、菲涅尔效应等
  • 与Transform节点结合:在不同坐标空间之间转换法线
  • 与Normalize节点结合:确保法线保持单位长度
  • 与Sample Texture 2D节点结合:应用法线贴图
  • 与Fresnel Effect节点结合:创建基于视角的效果

最佳实践

为了确保NormalVector节点的正确使用和最佳性能,建议遵循以下最佳实践:

  • 始终考虑法线是否需要归一化,特别是在进行数学运算或空间变换后
  • 选择最适合当前计算任务的坐标空间,避免不必要的空间转换
  • 在性能敏感的场景中,尽可能在顶点着色器中计算法线相关数据
  • 使用适当的数据类型平衡精度和性能
  • 定期验证法线计算的正确性,特别是在使用复杂变换或混合时

【Unity Shader Graph 使用与特效实现】专栏-直达
(欢迎

点赞留言

探讨,更多人加入进来能更加完善这个探索的过程,🙏)

https://szfilehelper.weixin.qq.com/

这个网页很简单, 就能传文字和文件, 不知道有没有人做了相关工具的?

如果没有微信这方面的工具, 大家都是怎么在不同手机和电脑上互传文件的?
听闻 apple 生态很方便, 可是我主要用 windows, 手机是一加和 iPhone.

之前本来是搞了几个微信号来互传, 现在 google voice 注册的微信号啥也没干就给封号了.
Edge 的 drop 也用了好一阵, 最近老是无响应, 也很不好用了.
邮件又稍微有点麻烦, 没好的办法的话就只能用邮件了.

因为封锁 + 懒得折腾,现在个人的 AI 开发套件是 TRAE 国际版 + GLM 4.7 coding plan 。

目前个人体验是 GLM 4.7 已经基本满足全部开发需求了,TRAE SOLE 模式用完 GPT 5.2 或者 gemini 的额度就切到 GLM 4.7 ,感受不到落差。目前不尽如人意的地方是任务大一点(包含几个可能存在交叉依赖的小任务),这三个模型基本都挂挂,我现在都是尽可能将任务拆成小的原子任务,一次只做一件事,然后 plan -> 执行 -> 验收 -> 让 AI 调整这一套流程走一轮,无论哪个模型都完成的不错。

现在非常好奇的是如果换 Claude opus 4.5 效果会怎么样,是不是大任务它也可以一次性完成,达到满意的效果?网上看了一些评测,要么就是“Claude 无敌,用了你就回不去了,GPT/GEMINI 反复搞了几个小时,换 Claude 几分钟搞定”这种无意义的评论,要么就是“用 Claude/GPT/GEMINI/GLM 生成一个美观高级的网站”这种无意义的评测,很好奇这些模型在实际开发中到底存在多大的差距。

如果是 iPhone 和国产安卓旗舰的差异,那我感觉 GLM / MiniMax 之类的国产模型也完全足够日常使用,毕竟这些国产模型对我来说近乎无限量了( GLM 5 小时限额窗口内很少用超 50%),现在每天绞尽脑汁怎么多烧点 token 。而如果是 iPhone 和诺基亚的差异,那应该突破一切封锁去使用 Claude 模型,毕竟时间也是金钱。

后续我想计划在实际开发场景下对比测试 GLM/MiniMax/Doubao 和 Claude 模型。想听听大家的看法,或者分享分享在实际开发场景下的对比。

如题,现在美国梯子开了,vscode 以代理方式打开的,然后 claude 插件在验证后还是一直提示需要验证,请大佬指导下

今日速览

  1. Humans in the Loop:免费社区,AI 编程爱好者一起加速交付。
  2. BrainLoom:PDF 秒变闪卡,本地优先的学习操作系统。
  3. GetThis:说话或截图就能生成任务,AI 帮你整理清单。
  4. Sometimes: A Poem Arrives:不期而遇的诗意,根据时间天气匹配心情。
  5. Youtube Custom Playback:轻量扩展,原生控制最高 16 倍速播放。
  6. Meal Planner:饮食计划模板,告别心算卡路里的混乱。
  7. TrendEdge:零售交易者也能用上对冲基金级别的数据信号。
  8. PainPoints.fast:用真实痛点验证 SaaS 创意,避免盲目投入。
  9. Contractso:现代电子签名平台,互动合同提升签署效率。
  10. Whisk Automation:批量 AI 图像生成,让 Google Whisk 变高速生产线。


1. Humans in the Loop

一个专为 AI 编程爱好者打造的免费社区,大家聚在一起分享 Claude Code、Cursor 等工具的最佳实践,加速项目交付。

  • 免费加入,讨论代理编程和 AI 相关话题
  • 聚焦 Claude Code、Cursor、MCP 服务器等热门工具
  • 分享 AI 代码审查的见解和实用技巧
  • 社区氛围友好,适合学习和协作

热度:🔺424

Humans in the Loop
访问官网 Product Hunt 详情


2. BrainLoom

别再为学习切换各种应用了,这款本地优先的学习操作系统能统一你的流程,把 PDF 高亮内容瞬间变成关联原文的闪卡。

  • 本地优先设计,保护隐私和数据安全
  • PDF 高亮内容一键转换为闪卡,保持深度上下文
  • 智能粘贴功能,在无限画布上视觉化组织想法
  • 支持 Windows v1.0,Mac 版即将上线
  • 限时优惠:终身许可$29(前 150 名用户)

热度:🔺257

BrainLoom
访问官网 Product Hunt 详情


3. GetThis

懒得打字?直接说话或截个聊天截图,AI 就能帮你整理想法,快速生成购物清单和分类任务。

  • 支持语音、文本或截图输入生成任务
  • AI 自动整理和分类任务内容
  • 简化任务管理流程,提升效率
  • 适合日常购物清单和待办事项规划

热度:🔺223

GetThis
访问官网 Product Hunt 详情


4. Sometimes: A Poem Arrives

最美好的诗意总在不经意间降临,这款 iOS 应用根据时间、天气和季节,为你匹配当下心情的诗歌。

  • 基于时间、天气和季节推荐诗歌
  • 意外时刻发现匹配心情的作品
  • 专为 iOS 设计,体验流畅自然
  • 营造不期而遇的阅读惊喜

热度:🔺179

Sometimes: A Poem Arrives
访问官网 Product Hunt 详情


5. Youtube Custom Playback

学习党或专业分析人士的福音,这个轻量级扩展让你在原生设置菜单中直接选择 0.25 倍到 16 倍的播放速度。

  • 原生风格控制,无缝集成 YouTube 界面
  • 播放速度范围从 0.25 倍到 16 倍
  • 轻量设计,不拖慢浏览器性能
  • 适合观看讲座或逐帧分析视频内容

热度:🔺164

Youtube Custom Playback
访问官网 Product Hunt 详情


6. Meal Planner

坚持健康饮食总是很难?这个模板帮你告别心算卡路里的混乱,无论记录饮食还是设定目标,都能清晰推进。

  • 模板化设计,减少饮食计划的不确定性
  • 支持记录饮食、坚持计划或设定体重目标
  • 简化卡路里追踪,避免长期计算困扰
  • 适合想建立健康习惯的任何人

热度:🔺30

Meal Planner
访问官网 Product Hunt 详情


7. TrendEdge

零售交易者也能用上对冲基金级别的工具,通过替代数据信号、实时提醒和模拟交易,帮你真正做到自律投资。

  • 提供机构级别的替代数据信号和实时提醒
  • 模拟交易功能帮助建立交易纪律
  • 自动记录交易日志,分析输赢原因
  • 完整历史信号支持更明智决策

热度:🔺27

TrendEdge
访问官网 Product Hunt 详情


8. PainPoints.fast

创始人验证 SaaS 创意的利器,分析 Reddit、X 等平台的真实对话,提炼痛点、支付意愿,帮你决定是否投入开发。

  • 输入想法,自动分析公开渠道的客户反馈
  • 提炼反复出现的痛点和紧迫感
  • 报告包含评分、真实引用和竞争对手信号
  • 结论建议:构建、考虑或跳过,避免盲目投入

热度:🔺23

PainPoints.fast
访问官网 Product Hunt 详情


9. Contractso

下一代电子签名平台,把静态文件变成互动合同,嵌入复选框收集数据,让签署过程既快速又安全合规。

  • 互动合同设计,支持嵌入复选框和单选框
  • 银行级审计追踪和短信双重身份验证
  • 自定义界面提升客户信任感
  • 加密二维码验证系统确保文件真实性

热度:🔺17

Contractso
访问官网 Product Hunt 详情


10. Whisk Automation

告别手动点击,这款工具将 Google Whisk AI 变成高速生产线,支持 CSV 批量生成图像,自动下载并导出多种格式。

  • 通过 CSV 批量生成 AI 图像,提升处理效率
  • 自动下载资源,导出为 PNG、JPG 或 WebP
  • 人类模拟时机功能,确保账户安全
  • 后台恢复让工作流程更顺畅,适合电商创作者
  • 30 天免费试用,从 Chrome 应用商店安装

热度:🔺17

Whisk Automation
访问官网 Product Hunt 详情

项目介绍

智能水果图像识别系统,旨在为用户提供快速、准确的水果识别服务。系统集成了深度学习图像识别技术,支持用户上传水果图片进行自动识别,并提供识别历史记录管理功能。

系统主要功能包括:用户注册与登录、个人信息管理、水果图像识别、识别历史查询与删除、公告管理等。用户可以通过简单的操作上传图片,系统将自动分析并返回识别结果,包含水果名称和识别置信度。同时,系统支持分页查询识别历史,并提供公告功能,方便管理员发布系统通知和使用说明。
图片
图片
图片

选题背景与意义

随着人工智能技术的快速发展,图像识别技术在农业、零售业等领域的应用越来越广泛。水果作为人们日常生活中不可或缺的食品,其识别和分类在水果销售、库存管理、营养分析等方面具有重要意义。

传统的水果识别主要依赖人工判断,效率低且容易出错。而基于深度学习的图像识别技术能够快速、准确地识别水果种类,提高工作效率。本项目的选题背景正是基于这一需求,旨在开发一个简单易用的水果图像识别系统,为用户提供便捷的识别服务。

该系统的开发具有以下意义:

  1. 提高水果识别效率,减少人工成本
  2. 为水果销售和库存管理提供技术支持
  3. 促进深度学习技术在农业领域的应用
  4. 为用户提供便捷的水果识别工具,帮助用户更好地了解水果信息

关键技术栈:ResNet50

本项目采用 ResNet50 作为核心图像识别模型。ResNet(Residual Network)是由 Microsoft Research 提出的深度残差网络,ResNet50 是其中包含 50 层卷积层的版本。

ResNet50 的核心创新是引入了残差连接(Residual Connection),解决了深度神经网络中的梯度消失问题,使得训练更深层次的网络成为可能。残差连接通过在网络中添加跨层连接,允许信息直接从一层传递到另一层,从而避免了梯度在反向传播过程中的衰减。

在本项目中,ResNet50 被用作水果图像识别的预训练模型。我们在预训练模型的基础上,根据水果图像数据集进行了微调,使得模型能够更准确地识别水果种类。系统集成了 TensorFlow 深度学习框架,通过加载预训练的 ResNet50 模型,对用户上传的水果图片进行分类识别。

ResNet50 的优点包括:

  1. 深度网络结构,具有强大的特征提取能力
  2. 残差连接设计,解决了梯度消失问题
  3. 预训练模型在图像识别任务上表现出色
  4. 可扩展性强,可根据需求进行微调

技术架构图

图片

系统功能模块图(MindMap)

图片

演示视频 and 完整代码 and 安装

地址:https://www.yuque.com/ziwu/qkqzd2/yeehu520t5qyr2qy