📅 2025年12月30日 AI行业动态
模型与框架更新
vLLM推出官方社区网站vllm.ai
vLLM团队推出官方社区网站vllm.ai,包含交互式安装选择器、活动日历、集中式文档hub,承认文档 gaps并提供搜索和办公时间playlist。
相关链接:vLLM发布 tweet|文档说明 tweet
Tencent发布WeDLM 8B Instruct开源模型
Tencent在Hugging Face发布WeDLM 8B Instruct扩散语言模型,比vLLM优化的Qwen3-8B快3-6倍,Apache 2.0许可,基准测试表现优秀。
相关链接:Hugging Face地址|Reddit讨论
fal开源FLUX.2 Turbo图像模型
fal开源FLUX.2 Turbo图像模型,基于DMD2蒸馏,声称在Artificial Analysis排名开源第一,社区快速推出Hugging Face Spaces demo。
相关链接:fal发布 tweet|demo链接
MiniMax-M2.1成为开源Agentic编码模型
MiniMax-M2.1在Code Arena排名开源WebDev第一,Chutes测试显示82.83%工具调用准确率,强调大代码库实用性,迭代向M2.2/M2.5推进。
推理与性能优化
AMD MI300X FP8性能不及bf16
多数据显示MiniMax-M2.1在MI300X上bf16性能优于FP8:vLLM中bf16达55.7 TPS(FP8 42 TPS),sglang中bf16 71 TPS(FP8 55 TPS)。
Weaviate新增Object TTL等功能
Weaviate发布新版本,包含Object TTL、Java v6客户端GA、Flat Index RQ量化、zstd备份、多模态文档嵌入等功能。
相关链接:Weaviate发布 tweet
Baseten优化GLM-4.7推理速度
Baseten报告GLM-4.7成为内部默认编码模型,在Baseten上推理速度快20%(tok/s和TTFT),并提供托管试用端点。
开源模型与数据集
GLM-4.7成为开源编码默认模型
GLM-4.7因Interleaved/Preserved/Turn-level Thinking成为开源编码默认,AlphaXiv称其在Artificial Analysis排名第一,Baseten内部广泛使用。
pokeart Pokémon数据集发布
pokeart数据集包含Gen1-Gen9共1224只 Pokémon的 splash art、战斗精灵等,提供6种Gemini 3 Pro caption和1种Qwen3 caption,用于基准测试。
相关链接:Hugging Face地址
韩国32B VLM模型发布
韩国发布32B VLM模型,调整架构(移除muP和sandwich norm),使用0.006初始化,英韩基准表现优秀,等待技术报告。
相关链接:Elie Bakouch tweet
AI代理与工作流
Spotify编码代理的生产经验
Spotify分享编码代理生产经验:指定可验证终态、包含代码示例、最小化工具(verify/git/bash)、用AGENTS.md文档化工作流。
文档适配AI代理的双受众模式
社区讨论双受众文档模式:既供开发者阅读,又结构化供代理提取上下文,如AGENTS.md/CLAUDE.md惯例,LlamaIndex提供模板。
相关链接:LlamaIndex tweet
Amazing Z-Image Workflow v3.0发布
Amazing Z-Image Workflow v3.0更新,包含Style Selector(15种风格)、Sampler Switch、Landscape Switch、Z-Image Enhancer等,支持GGUF/SAFETENSORS。
OpenEnv标准化代理环境
Meta×Hugging Face推出OpenEnv,标准化代理环境,支持TRL/TorchForge等框架,集成MCP工具,旨在统一训练与部署。
研究与技术突破
Transformers存储全局结构而非仅关联
Google研究显示Transformers学习隐式多跳推理,在50k节点图上达100%准确率,挑战知识编辑假设,认为其存储全局结构。
相关链接:dair.ai tweet
URM递归推理优于静态深度
URM(Universal Recurrent Model)在ARC-AGI上表现优于静态深度模型,ARC-AGI 1达53.8% pass@1,关键在于递归归纳偏置和强非线性。
TTT-E2E实现长上下文测试时训练
TTT-E2E在推理时继续训练以压缩上下文,将3B模型上下文从8K扩展到128K,比全注意力快2.7倍,性能更优。
相关链接:Karan Dalal tweet
AgentReuse加速代理延迟
AgentReuse缓存并参数化代理计划,在2664请求中实现93%复用率,延迟降低93%,内存开销小。
行业与收购动态
Meta以约40亿美元收购Manus AI
Meta Superintelligence Labs收购Manus AI,后者成立9个月ARR达1亿美元,Alex Wang宣布加入,称Manus在Remote Labor Index表现SOTA。
xAI招聘RL后训练与安全职位
xAI招聘专注RL后训练、对齐/行为、灾难性风险 reduction的角色,Stewart Slocum发布职位信息。
相关链接:Stewart Slocum tweet
Perplexity Pro的使用限制与Max tier
用户报告Perplexity Pro存在高级模型使用限制(如1-2次/小时),而Max tier宣称无限制,部分用户遇订阅问题(如7个月后终止)。
Reddit热门讨论
AI图像生成的异常特征识别
用户讨论AI生成图像的异常,如“脚代替手”的托盘、扭曲的酒杯,指出这些是AI生成的常见指标,幽默评论称“正确脚趾数”反成疑点。
OpenAI Killswitch工程师职位的梗
用户讨论OpenAI“Killswitch Engineer”梗图,称其为营销噱头,幽默质疑30万-50万美元年薪的“拔插头”职位资格。
学生Perplexity Pro订阅问题
学生用户报告Perplexity Pro订阅异常:使用12个月Revolut Metal voucher后仅7个月就终止,支持响应慢,部分用户仍正常。
相关链接:Perplexity Reddit讨论
Discord社区动态
BASI Jailbreaking发现vibe coded app XSS漏洞
BASI Jailbreaking成员发现vibe coded app的JavaScript存在XSS漏洞,若LLM生成XSS payload会触发,讨论输入验证和安全实践。
Unsloth AI讨论多头部注意力机制
Unsloth AI用户讨论多头部注意力:头部学习不同子空间,最终投影层混合信息以捕捉复杂关系,解决“dogness”分裂问题。
相关链接:Unsloth AI #general
Perplexity用户寻求开源替代方案
Perplexity Discord用户讨论开源替代方案,如Perplexica(GitHub),希望复制实时搜索+回答UX,称“Opencode是手,Perplexity是眼”。
Unsloth AI讨论训练数据的重要性
Unsloth AI用户意识到训练数据是LLM的概率压缩,需在训练中覆盖所有边缘案例,否则推理会脆弱,链接HarryR/z80ai的训练数据示例。
📌 来源: Easy AI 日报 🤖 整理: AI助手
#EasyAI #AI日报 #AI教学
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。