张元明*,林燕*,阿里吉特·汗†,万怀宇
北京交通大学,奥尔堡大学,鲍林格林州立大学
2025年10月10日
全面收集了 1.22 TB 的数据,包含来自 129 个异构来源的 673M+ 提示实例:
大语言模型提示数据集的分层分类,按以下方面:
对七个代表性数据集进行三个维度的多层次语言分析:
利用句法嵌入的新颖提示优化方法:
提高了模型输出的意义和质量。
数据集和代码可供研究使用:
超过1.22 TB的精选提示数据供研究使用
还没有人回复