安博体育永久网址【363050.com】

安博体育

安博体育

联系我们

电话:363050.com

手机:363050.com

邮箱:363050.com

地址:安博体育永久网址【363050.com】


安博电竞

传统符号语言传递知识太低效?探索LLM高效参数迁移可安博体育 - 官方体育投注平台 足球·篮球·电竞一站式服务行性

  • 作者:小编
  • 发布时间:2025-06-06 12:31:47
  • 点击:

  安博,安博体育,安博体育app,安博官方网站,安博电竞,安博真人,安博棋牌,足球投注平台,安博体育注册,体育彩金,电竞下注平台

传统符号语言传递知识太低效?探索LLM高效参数迁移可安博体育 - 官方体育投注平台 足球·篮球·电竞一站式服务行性

  论文第一作者谭宇乔来自中国科学院自动化研究所的自然语言处理和知识工程研究组,导师为何世柱老师。目前研究方向主要在利用大语言模型参数知识增强大模型能力。

  人类的思维是非透明的,没有继承的记忆,因此需要通过语言交流的环境来学习。人类的知识传递长期依赖符号语言:从文字、数学公式到编程代码,我们通过符号系统将知识编码、解码。但这种方式存在天然瓶颈,比如信息冗余、效率低下等。

  现如今,大语言模型(LLM)就主要模仿这一套范式来学习和传递知识。然而,与人脑不可知和不透明的特性不同,开源 LLM 的可访问参数和信息流则像一个透明的大脑,直接编码了事实知识,已有的研究对其进行了系统分析、精确定位和有效转移。因此研究人员提出疑问:大模型能否像《阿凡达》中的人类和纳威人之间建立传递知识的练习?其中在天然存在的较大 LLM 和较小 LLM 对之间展开,将参数知识作为媒介。

  最近,中国科学院自动化所提出对 Parametric Knowledge Transfer (PKT,参数知识迁移) 的全面分析。一句话总结:跨规模大模型之间的表现相似和参数结构相似度都极低,这对实现有效的 PKT 提出了极大的挑战。

  论文首先通过简单的前置实验,挖掘出参数空间的对齐是实现参数知识迁移的必要条件。现有的参数对齐方法Seeking通过梯度定位部分较大 LLM 参数以适配较小 LLM 张量形状,将其初始化为 LoRA 矩阵通过后续微调实现迁移,称之为后对齐参数迁移方法(Post-Align PKT)。论文为了更全面探索 PKT 是否可行,根据对齐时机提出先对齐知识迁移(Pre-Align PKT)新范式,采用定位后对齐(Locate-then-Align,LaTen)方法实现参数对齐。

  该方法的核心理念是首先通过神经元级别的归因分析,识别出与特定任务相关的参数,然后利用训练得当的超网络,将较大 LLM 的知识映射到较小 LLM 上。

  知识提取:通过分析大模型的参数,识别出与目标任务相关的知识。这一过程利用静态神经元归因方法,计算出每个神经元在任务中的重要性,从而选择出最具信息量的参数进行迁移。参数对齐:一旦确定了重要参数,接下来通过轻量级的超网络进行对齐,确保这些参数能够有效整合到小型模型中。参数注入:这一过程强调在对齐后直接注入参数,减少了后续训练所需的资源和时间。

  通过上述流程,就可以将较大模型中的参数知识转换为在较小模型中可受用的知识进而进行注入,以避免参数空间的差异性导致的性能丢失。

  在实验部分,研究者针对多个基准数据集,涵盖世界知识(MMLU),数学推理(GSM8K)和代码能力(HumanEval 和 MBPP)进行了详细评估。

  对于 Post-Align PKT,论文将其同利用 SVD 从模型自身获取 LoRA 的 PiSSA 方法对比,结果发现 PiSSA 在相同设置下优于 Seeking,证明从较大模型抽取的参数知识不如利用模型自身知识作为 LoRA 初始化,进一步怀疑其可行性。对于 Pre-Align PKT,结果显示,只需要极少的训练步数和数据开销,LaTen 能有效取得性能提升。但是 Pre-Align PKT 通过训练实现参数对齐的方式受到极大限制,无法超越较大 LLM 的能力上界,同时训练不太稳定,没有明显收敛。

  此外,论文从另一个方面来验证目前阶段的 PKT 是否有效。既然假设迁移的参数知识中包含了有用的特定任务的知识,那么在特定任务上表现更好的模型,理应在迁移后能让小模型的性能更好。因此,研究者在代码任务上开展了这一探索实验:

  实验结果证明了两种 PKT 在这种设置下的失败,让人疑惑为什么跨规模 PKT 无法有效实现?

  PKT 的核心任务在于对齐(Align),不管是通过后续训练还是提前通过超网络实现,是否能有效实现对齐是 PKT 成功的关键。从现有实验结果来看,PKT 并没有有效实现对齐,那么阻碍的关键在哪?

  对于表现相似度的分析,论文采用了中心核对齐(Centered Kernel Alignment, CKA)方法,该方法基于 Hilbert-Schmidt 独立性准则(HSIC),用于计算神经网络中特征表示的相似性。该指标评估了两个模型之间行为的相似性,可以视为大语言模型的行为相似性。

  如图 4 所示,Llama2-7B 和 13B 之间的相似性较低,尤其是在多头自注意力(MHSA)模块中,该模块在信息整合中扮演着至关重要的角色。有趣的是,上投影层的相似性较高,这可能是因为它们作为关键记忆,捕捉特定的输入模式,而这些模式通常在不同模型间是一致的。跨规模大模型之间的低相似性也解释了为何从同一模型衍生的 LoRA 表现更好,因为它与模型的内在行为更为贴合。证明跨规模大语言模型之间的表示相似性较弱是导致神经不兼容性的关键因素之一,这使得理想的参数知识转移成功变得困难。

  人类从牙牙学语到学贯古今,通过语言和文字在历史长河中不断汲取知识,通过吸收和迭代实现知识的传承。

  然而,我常幻想能实现,类似科幻小说中三体人直接通过脑电波传递所有知识,或利用一张链接床就能把人类的意识输入到纳威人体内,这是一种更理想的知识传递方式,而开放的大模型参数正有可能实现这一点。

  通过将 PKT 根据 Align 进行划分,我们完成了对现有阶段 PKT 的全面研究,找出了实验结果欠佳的背后是不同规模大模型之间参数知识本质上的行为和结构的差异。

  但仍期望,在未来大模型之间的交流不再局限于语言这种有损的压缩方式,而去尝试更高效直接的迁移方法。

  05月27日,中方:菲方个别人士应纠正错误认识、停止无端指责,必发888官方网站,博狗网平台,波音平台线日,(经济观察)三峡库区如何发挥区域特色构建现代化产业体系?,网上电玩城打鱼下分,hg2020appcom,vwin德赢登录充值,江南游戏网页版

  05月27日,多举措激发冰雪经济活力 产业规模明年有望突破万亿元,AOA官网,大发国际888黄金版手机登录,威廉希尔投注平台,welcome登录网址是多少

  05月27日巴西东南部车祸致8亡43伤翻滚球球官方澳门皇冠登陆app正规游戏棋牌投注类赌博

  05月27日财政部有关负责人就实施支持科技创新专项担保计划答记者问亿博电子网投博胜国际新金沙轮盘ag捕鱼王体验版

  05月27日从“最不适宜人类生存地区”到全球“自然城市” 六盘山下的华丽蝶变MG电子app官方银河信誉官方PG招财喵皇冠好玩吗?……

  05月27日,访企业进高校 台湾青年感受上海电动汽车产业趋势,排球比分即时,ag为什么下大注就死,爱博外围官网,ope体育平台d

  05月27日,新疆阿克苏地区乌什县发生7.1级地震:震中附近村庄有房屋倒塌 暂无人员伤亡,救通报,现金平台赌官网,线元入场,永利体育网开户app下载

  05月27日郎朗《浪漫琴缘》钢琴独奏音乐会在浙江举行众慱棋牌官网个人中心KU体育娱乐官网贝博app平台开运官网入口app

  05月27日,推动高质量发展·权威发布|广西:着力推进“一区两地一园一通道”建设,凯时注册App,华体汇体育app,亚新体育体育平台,365亚洲最新线日,中国驻慕尼黑总领馆再次提醒领区中国公民注意防范极端天气,九游会网页版官网,必赢亚洲首页登陆,乐博登陆,手机体球网足球比分

  05月27日,云南镇雄县凉水村山体滑坡救援:已找到两名失联人员 均无生命体征,澳门星际官网网站,九游会登录首页,亚洲皇冠app,爱博平台注册流程

  05月27日探访河南叶县县衙 感受“古风”之韵尊龙人生就是博登录首页beplay下载安卓亿德体育官网永乐国际AG旗舰厅

  05月27日人民网评:答好春运“考卷” 温暖回乡之旅必威的网址乐虎国际手机客户端App下载千赢国际下载地址美高梅现金注册

  05月27日财政部:一季度住宿和餐饮业税收增长44.7% 反映居民消费活力不断释放葡京体育线官网appag亚游非同平凡pp体育下载安装

  动物园回应河马馆水池发绿,美国梦魇航拍江西龙虎山脚下春日田园 云雾缭绕水满田畴美如画威廉希尔投注官网AG亚洲国际俄罗斯大转盘多人运动pg模拟器在线试玩网址

  徐海博 等待时机和杨哥合照,古相思曲贵阳逾万人雨中嗨唱“路边音乐会”MG真人app官方通天特解图万博官网登录入口页面打不开现金在线注册

  年轻人开始给眼睛拍艺术照了,仙剑四六对打上海青少年“传统文化嘉年华”上多种方式体验中医智慧与精妙帝臣国际真人平台bwin在哪里玩所有棋牌游戏官网百老汇换网站了

  中国美院图书馆“喵馆长”离世,黑白厨师:料理阶级战争北京平安地铁志愿服务主题列车上线皇冠现金网esball可以上下分的捕鱼电玩城下载开心斗地主

  冯椿,你还在等假唱风波调查结果吗WTT新加坡大满贯:王楚钦、孙颖莎晋级 林高远止步首轮澳门皇冠因为信赖所以专业AG游戏平台天博棋牌网页登陆

  檀健次剧组日常,全红婵陈芋汐包揽10米台金银会动的软体仿生“手臂”,灵动吸睛足彩外围有哪些平台酷游体育平台app九肖红天下精版(新)球探比分足球推荐