📅 2025年10月28日 AI行业动态
模型发布与更新
OpenAI GPT-5移除温度和top_p等超参数
OpenAI最新模型GPT-5的API移除了temperature、top_p等超参数,Anthropic也不再支持同时使用top_p和temperature,开发者需调整代码处理特殊情况。
相关链接:OpenAI文档|Anthropic迁移指南
Anthropic发布Claude 4.5,优化工具调用
Anthropic推出Claude 4.5,提升工具调用可靠性,支持更长上下文,同时 deprecate了top_p和temperature的组合使用,建议使用默认参数。
相关链接:Anthropic公告
MiniMax M2模型发布,性价比超Claude Sonnet
MiniMax推出230B参数M2模型,仅需Claude Sonnet 8%的价格,推理速度快2倍,支持工具调用和长上下文,已在OpenRouter开放免费试用。
相关链接:OpenRouter试用|MiniMax公告
Tahoe AI发布Tahoe-x1 3B基因模型
Tahoe AI推出3B参数Tahoe-x1模型,用于基因、细胞和药物表示,训练于100M样本,在癌症基准测试中获SOTA,已开源。
相关链接:Tahoe AI公告
Nvidia发布Nemotron Nano 2 VL视觉模型
Nvidia推出Nemotron Nano 2 VL视觉模型,支持图片理解和多模态推理,提供8M样本的CC-BY-4.0数据集,已在Hugging Face开放。
相关链接:Nvidia公告
Moonshot Kimi K-2 Coding Plan将国际发布
Moonshot AI的Kimi K-2 Coding Plan目前仅在中国可用,近期将国际发布,支持代码生成和调试,性能优于同类模型。
相关链接:Moonshot Discord讨论
公司与产品动态
OpenAI API要求生物识别,引发争议
OpenAI要求长期用户使用API时提供生物识别信息(如虹膜扫描),引发隐私担忧,用户对比Anthropic和Google未实施类似要求。
相关链接:OpenAI讨论
Anthropic Claude Code feature因MCP安全问题移除功能
Anthropic在Claude Code web feature中移除某功能,因发现MCP协议的安全漏洞,开发者需关注后续补丁。
相关链接:GitHub PR
Modular Mojo聚焦开源,GPU支持分 tiers
Modular宣布将开源Mojo和MAX,GPU支持分Tier 1(数据中心)、Tier 3(消费级),AMD消费卡需手动编码,Apple Silicon需逆向工程。
相关链接:Modular Discord讨论
Nextdata OS发布,推动Data 3.0理念
Nextdata推出Nextdata OS,采用语义优先的AI原生数据操作系统,替换传统管道,支持结构化与非结构化数据统一管理。
相关链接:Nextdata公告
Manus.im订阅遭用户取消,Claude成替代
用户因Manus.im credits消耗过快取消订阅,转用Claude($20完成3个项目),认为Manus适合不愿研究的用户,Anthropic功能更全。
相关链接:Manus Discord讨论
技术研究与工具
Triton在T4与A100的性能差异
用户报告Triton矩阵乘法示例在Colab T4(sm75)极慢,A100(sm80)正常,因T4不支持Tensor Core,需调整autotune设置。
相关链接:Triton Notebook
CUDA编译技巧:nvcc -dryrun与-keep
建议使用nvcc -dryrun理解编译过程,-keep保留中间文件(.ptx/.cubin),手动修改后重新编译,优化性能。
相关链接:CUDA最佳实践
MCP注册表混淆澄清
用户混淆modelcontextprotocol/registry与github/mcp,GitHub将整合前者为上游,镜像内容,开发者可自我发布到OSS注册表。
相关链接:MCP文档
tinygrad的FSDP实现与贡献
用户关注tinygrad的FSDP bounty,建议新手从低价值bounty开始,贡献代码需注意Pyright类型检查,已发现真实类型问题。
相关链接:tinygrad Bounties
DSPy优于Langchain,适合结构化任务
开发者反馈DSPy在结构化任务和模型升级上更优,Langchain模型升级需重新写prompt,DSPy支持优化,即将举办Bay Area Meetup。
相关链接:DSPy Meetup
Pyright在tinygrad中的类型检查
用户报告Pyright发现tinygrad中的真实类型问题,建议合并 tasteful fixes,提升代码质量。
相关链接:tinygrad PR
社区与活动
Bay Area DSPy Meetup将于11月18日举办
DSPy社区将举办线下Meetup,讨论模型优化和应用,吸引众多开发者参与,brainstorming潜力大。
相关链接:Meetup注册
GPU MODE举办irl-accel-hackathon
GPU MODE的irl-accel-hackathon吸引开发者参与,项目包括Mini-PyTorch GPU allocator、Monarch贡献等,需提交 proposal。
相关链接:Hackathon表单
Eleuther讨论开源AI与技术挑战
用户希望AI开源分布式,类似互联网,但需解决技术挑战,Petals项目因新架构失去 momentum。
相关链接:Eleuther Discord
Nous Research讨论LLM意识形态偏差
用户认为西方GPT模型有意识形态偏差,Claude表现更“infant-like”,研究papers关注KBLaM与RAG的上下文质量差异。
硬件与基础设施
RTX 5090运行tinygrad性能问题
用户报告RTX 5090运行tinygrad代码(12张512x512图)时速度慢,建议添加.contiguous()解决,需提交issue。
相关链接:tinygrad Issue
TinyBox硬件配置询问
用户询问TinyBox的 motherboard是否支持9005、12 DIMM slots和500W CPU,未得到明确回复,同时询问Discord bot是否开源。
相关链接:TinyBox讨论
GPU带宽测试与优化
开发者测试GPU带宽时发现,256 threads/block+plain数据类型性能最佳,vectorized类型更慢,需调整clearL2为false避免负带宽。
相关链接:GPU MODE讨论
来源:Easy AI 教学项目
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。