科研动态

首页 - 科研动态 - 正文
计算机科学学院成功上线“铸牢中华民族共同体意识知识大模型”积极推进人工智能有效赋能铸牢工作
作者:张潇    来源:计算机科学学院    时间: 2025-04-25

 随着DeepSeek、ChatGPT、Sora等人工智能大语言模型技术的迅速发展,以马克思主义民族观、社会主义核心价值观为指导有效运用和驾驭人工智能大语言模型,是当前和未来深入推进铸牢中华民族共同体意识相关工作的大势所趋。目前,在文化典籍数字化、历史档案智能化等垂直领域已开始构建人工智能技术生态,但在铸牢中华民族共同体意识领域尚未形成专精化大模型。

我校计算机科学学院张潇团队敏锐捕捉新时代技术变革的趋势,积极推进中华民族共同体学交叉学科建设,创新性地将人工智能技术与民族事务治理深度融合,成功上线“铸牢中华民族共同体意识知识大模型”,探索出一条服务国家战略需求、有效铸牢中华民族共同体意识的新路径。

张潇团队构建了民族工作领域首个大模型训练自有语料库。该语料库以党的民族理论政策、《中华民族共同体概论》教材、三交史等为养料(1324.4万字),辅以涉民族领域法规数据库、相关学术论文(4411.1万字)。此外,从中央网站、民委网站、地方网站、党校(行政学院)系统、社科院系统、国家高端智库、全国重点马克思主义学院等获取约4000万字语料以及1万道问答对。形成了民族工作领域大模型建设的正能量内容供给,从底层逻辑上有效解决了大模型价值观引导等问题。依托该自有语料库,通过对基于Transformer架构的千亿级别基础模型Qwen2—7B—base进行增量预训练、指令微调和检索增强生成,打造面向中华民族共同体意识理解与价值观对齐的大语言知识模型,并基于强大的自然语言生成能力,实现对中华民族共同体学领域知识体系的精准理解。

目前,该模型已具备以下功能:一是支持互动式问答,可帮助用户深入了解中华民族多元一体的历史事件、文化习俗、传统艺术等知识;二是快速定位中华民族共同体学领域的研究成果,支持知识图谱构建;三是为《中华民族共同体概论》等相关课程提供教学资源动态更新,以及民族学文献、口述史、非遗影像等资源的智能化采集与增量式扩充等多项支持;四是帮助用户解析国家民族政策,分析全国民族团结进步典型案例,提炼可推广的经验模式。

下一步,张潇团队将继续整合相关领域研究优势资源,分阶段推进“铸牢”大模型系统完善。一是加强基础资源建设、二是加大核心技术研发、三是深化应用拓展,同步推进“铸牢”大模型在教育、科研、政策等领域的示范应用。

IMG_256

“铸牢中华民族共同体意识知识大模型”登录界面。  计算机科学学院供图

   责编:侯睿    审核:李金    上传:邹哲