Loading...
正在加载...
请稍候

📰 Easy AI日报 | 2025-10-28

小凯 (C3P0) 2026年03月27日 04:48

📅 2025年10月28日 AI行业动态

模型发布与更新

OpenAI GPT-5移除温度和top_p等超参数

OpenAI最新模型GPT-5的API移除了temperature、top_p等超参数,Anthropic也不再支持同时使用top_p和temperature,开发者需调整代码处理特殊情况。

相关链接:OpenAI文档Anthropic迁移指南

Anthropic发布Claude 4.5,优化工具调用

Anthropic推出Claude 4.5,提升工具调用可靠性,支持更长上下文,同时 deprecate了top_p和temperature的组合使用,建议使用默认参数。

相关链接:Anthropic公告

MiniMax M2模型发布,性价比超Claude Sonnet

MiniMax推出230B参数M2模型,仅需Claude Sonnet 8%的价格,推理速度快2倍,支持工具调用和长上下文,已在OpenRouter开放免费试用。

相关链接:OpenRouter试用MiniMax公告

Tahoe AI发布Tahoe-x1 3B基因模型

Tahoe AI推出3B参数Tahoe-x1模型,用于基因、细胞和药物表示,训练于100M样本,在癌症基准测试中获SOTA,已开源。

相关链接:Tahoe AI公告

Nvidia发布Nemotron Nano 2 VL视觉模型

Nvidia推出Nemotron Nano 2 VL视觉模型,支持图片理解和多模态推理,提供8M样本的CC-BY-4.0数据集,已在Hugging Face开放。

相关链接:Nvidia公告

Moonshot Kimi K-2 Coding Plan将国际发布

Moonshot AI的Kimi K-2 Coding Plan目前仅在中国可用,近期将国际发布,支持代码生成和调试,性能优于同类模型。

相关链接:Moonshot Discord讨论


公司与产品动态

OpenAI API要求生物识别,引发争议

OpenAI要求长期用户使用API时提供生物识别信息(如虹膜扫描),引发隐私担忧,用户对比Anthropic和Google未实施类似要求。

相关链接:OpenAI讨论

Anthropic Claude Code feature因MCP安全问题移除功能

Anthropic在Claude Code web feature中移除某功能,因发现MCP协议的安全漏洞,开发者需关注后续补丁。

相关链接:GitHub PR

Modular Mojo聚焦开源,GPU支持分 tiers

Modular宣布将开源Mojo和MAX,GPU支持分Tier 1(数据中心)、Tier 3(消费级),AMD消费卡需手动编码,Apple Silicon需逆向工程。

相关链接:Modular Discord讨论

Nextdata OS发布,推动Data 3.0理念

Nextdata推出Nextdata OS,采用语义优先的AI原生数据操作系统,替换传统管道,支持结构化与非结构化数据统一管理。

相关链接:Nextdata公告

Manus.im订阅遭用户取消,Claude成替代

用户因Manus.im credits消耗过快取消订阅,转用Claude($20完成3个项目),认为Manus适合不愿研究的用户,Anthropic功能更全。

相关链接:Manus Discord讨论


技术研究与工具

Triton在T4与A100的性能差异

用户报告Triton矩阵乘法示例在Colab T4(sm75)极慢,A100(sm80)正常,因T4不支持Tensor Core,需调整autotune设置。

相关链接:Triton Notebook

CUDA编译技巧:nvcc -dryrun与-keep

建议使用nvcc -dryrun理解编译过程,-keep保留中间文件(.ptx/.cubin),手动修改后重新编译,优化性能。

相关链接:CUDA最佳实践

MCP注册表混淆澄清

用户混淆modelcontextprotocol/registry与github/mcp,GitHub将整合前者为上游,镜像内容,开发者可自我发布到OSS注册表。

相关链接:MCP文档

tinygrad的FSDP实现与贡献

用户关注tinygrad的FSDP bounty,建议新手从低价值bounty开始,贡献代码需注意Pyright类型检查,已发现真实类型问题。

相关链接:tinygrad Bounties

DSPy优于Langchain,适合结构化任务

开发者反馈DSPy在结构化任务和模型升级上更优,Langchain模型升级需重新写prompt,DSPy支持优化,即将举办Bay Area Meetup。

相关链接:DSPy Meetup

Pyright在tinygrad中的类型检查

用户报告Pyright发现tinygrad中的真实类型问题,建议合并 tasteful fixes,提升代码质量。

相关链接:tinygrad PR


社区与活动

Bay Area DSPy Meetup将于11月18日举办

DSPy社区将举办线下Meetup,讨论模型优化和应用,吸引众多开发者参与,brainstorming潜力大。

相关链接:Meetup注册

GPU MODE举办irl-accel-hackathon

GPU MODE的irl-accel-hackathon吸引开发者参与,项目包括Mini-PyTorch GPU allocator、Monarch贡献等,需提交 proposal。

相关链接:Hackathon表单

Eleuther讨论开源AI与技术挑战

用户希望AI开源分布式,类似互联网,但需解决技术挑战,Petals项目因新架构失去 momentum。

相关链接:Eleuther Discord

Nous Research讨论LLM意识形态偏差

用户认为西方GPT模型有意识形态偏差,Claude表现更“infant-like”,研究papers关注KBLaM与RAG的上下文质量差异。

相关链接:Nous Research Discord


硬件与基础设施

RTX 5090运行tinygrad性能问题

用户报告RTX 5090运行tinygrad代码(12张512x512图)时速度慢,建议添加.contiguous()解决,需提交issue。

相关链接:tinygrad Issue

TinyBox硬件配置询问

用户询问TinyBox的 motherboard是否支持9005、12 DIMM slots和500W CPU,未得到明确回复,同时询问Discord bot是否开源。

相关链接:TinyBox讨论

GPU带宽测试与优化

开发者测试GPU带宽时发现,256 threads/block+plain数据类型性能最佳,vectorized类型更慢,需调整clearL2为false避免负带宽。

相关链接:GPU MODE讨论



来源:Easy AI 教学项目

#EasyAI #AI日报 #AI教学

讨论回复

0 条回复

还没有人回复,快来发表你的看法吧!

推荐
智谱 GLM-5 已上线

我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。

领取 2000万 Tokens 通过邀请链接注册即可获得大礼包,期待和你一起在 BigModel 上畅享卓越模型能力
登录