阿里 Qoder CLI 即将发布
阿里 Qoder CLI 即将发布

阿里 Qoder CLI 即将发布

阿里 Qoder 官方命令行工具 Qoder CLI 即将正式发布!佬们可以去datawhale的微信公众号预约直播。

X 平台下月全面启用 Grok AI 推荐算法
X 平台下月全面启用 Grok AI 推荐算法

X 平台下月全面启用 Grok AI 推荐算法

马斯克发推表示 X 平台将于下月全面切换至由 Grok驱动的AI推荐系统,一并发布的还有模型权重的新算法。每天超过1亿条内容都将由 Grok 进行评估,并推荐最可能引起用户兴趣的内容,显著提升信息流的质量。

OpenAI 发布 GPT-5 搜索 API:价格直降 60%,支持域名过滤
OpenAI 发布 GPT-5 搜索 API:价格直降 60%,支持域名过滤

OpenAI 发布 GPT-5 搜索 API:价格直降 60%,支持域名过滤

OpenAI 推出基于 GPT-5 的搜索模型 API,型号标识为 gpt-5-search-api。定价为每千次调用 10 美元,相比原方案降低了 60%,并支持按域名过滤结果。该功能与 Responses 接口中的网页搜索一致。
微软发布首款自研图像生成模型 MAI-Image-1,LMArena 排名第九
微软发布首款自研图像生成模型 MAI-Image-1,LMArena 排名第九
微软发布首款自研图像生成模型 MAI-Image-1,LMArena 排名第九

微软 AI 正式发布其首款完全自研的图像生成模型 MAI-Image-1,目前在 LMArena 竞技场上排名第九。

不过目前只能在 LMArena 上使用,官方表示后续会优先面向 Copilot 和 Bing Image Creator 中提供 MAI-Image-1 模型。

Nanonets 开源 OCR 2 系列模型:图像文档转结构化 Markdown
Nanonets 开源 OCR 2 系列模型:图像文档转结构化 Markdown

Nanonets 开源 OCR 2 系列模型:图像文档转结构化 Markdown

Nanonets 发布并开源了 OCR 2 系列模型,包括 Nanonets-OCR2-Plus、Nanonets-OCR2-3B 与 Nanonets-OCR2-1.5B-exp 三个版本。该系列模型专注于将图像文档转换为结构化 Markdown,并支持视觉问答功能。

其背后是基于 Qwen2-VL 微调而来,3B 版本在超过 300 万页的混合文档上进行训练,覆盖了论文、财报、合同、病历、税表、收据、手写及多语种材料,有需要的佬可以看看。

谷歌 NotebookLM 视频概览支持 Nano Banana

NotebookLM 视频概览功能发布更新升级 ,新增了六种由 Nano Banana 提供配图支持的视觉风格:Watercolor、Papercraft、Anime、Whiteboard、Retro Print 和 Heritage。

这次更新彻底告别了以往固定主体动态颜色的限制,效果提升明细。还没体验过的佬们快去试试吧!不过该功能目前仅支持 Pro 用户,谷歌官方表示未来将逐步覆盖全体用户。

阿里 Qwen3-VL 开源 4B/8B 版本
阿里 Qwen3-VL 开源 4B/8B 版本

阿里 Qwen3-VL 开源 4B/8B 版本

阿里通义开源了 Qwen3-VL 的 4B 和 8B 版本,显存占用更低的同时,完整保留了 Qwen3-VL 的核心功能。此外,还提供了 FP8 版本。

官方测试数据显示,在 STEM、VQA、OCR、视频理解以及 Agent 任务等多项测试中,居然超过了 Gemini 2.5 Flash Lite 和 GPT-5 Nano,有些表现甚至能媲美 Qwen2.5-VL-72B。
OpenAI 官宣:ChatGPT 即将推出 NSFW 版本
OpenAI 官宣:ChatGPT 即将推出 NSFW 版本

OpenAI 官宣:ChatGPT 即将推出 NSFW 版本

OpenAI CEO Sam Altman
Sam Altman
在推特上宣布,未来几周将推出一个新版 GPT,类似 GPT-4o,回复更加人性化,就像你的朋友那样。

更劲爆的是,12 月将推出更全面的年龄限制,允许 GPT 在验证成年身份的情况下提供涩涩内容!好家伙,第一生产力来了。