芯片供应链是一个巨大、分散、数据格式五花八门的网络。一份 IP 核的技术文档可能长这样:一份 PDF 里混着文字描述、寄存器表、时序图、扫描件的印章。另一份又可能是完全不同的格式。想理清一个 RISC-V 处理器从指令集授权到物理实现的完整供应链,要靠人去读成百上千份格式各异的文档。
Petrovic、Schamschurko、Xu 和 Knoll 的工作流把这个问题交给了 LLM 和 VLM。语言模型处理文字部分——数据手册里的功能描述、时序参数、依赖声明。视觉模型处理图片部分——框图里的模块连线、表格里的配置项、扫描 PDF 里的签名戳。两类模型的输出被对齐到一个统一的实体关系图中,形成知识图谱。
在这张图谱之上,模型驱动工程方法做形式化验证——检查依赖关系是否完整、检测潜在的瓶颈、评估单点故障风险。如果某个 IP 核的授权依赖了一个特定的 RISC-V 扩展,而图谱中人找不到对应的供应商,MDE 的形式化约束检查就会把这个缺口标记出来。人类专家可以随时介入查询和验证,确保模型不会在黑箱里做出离谱的判断。
整个流程的核心不是让 AI 代替人类做供应链决策,而是让 AI 把散落在海量异构文档中的信息整理成结构化的、可查询的、可验证的知识表示,再交给人类做判断。
不清楚的地方:论文没有提供量化的评估指标——在真实的 RISC-V 供应链场景中,这个工作流能提取出多少比例的实体和关系?和纯人工方法相比,时间节省了多少?错误率又如何?知识图谱的规模上限也没有说明。
参考文献
-
Petrovic, N., Schamschurko, A., Xu, Y., & Knoll, A. (2026). GenAI-Driven Approach to RISC-V Supply Chain Exploration. arXiv:2605.15223 [cs.AR].
-
RISC-V International. (2024). RISC-V Specification v2.0.
-
Whang, S. E., et al. (2023). Data Management for Large Language Models: A Survey. ACM Computing Surveys.
讨论回复
0 条回复还没有人回复,快来发表你的看法吧!
推荐
智谱 GLM-5 已上线
我正在智谱大模型开放平台 BigModel.cn 上打造 AI 应用,智谱新一代旗舰模型 GLM-5 已上线,在推理、代码、智能体综合能力达到开源模型 SOTA 水平。