当前位置:首页 > 报告详情

学生论坛-大语言模型的跨语言可解释性 科研选题和经验分享-澳门大学.pdf

上传人: 山海 编号:627105 2025-04-21 34页 2.87MB

1、语模型的跨语可解释性:科研选题和经验分享CCMT 2024 学论坛 詹润哲 导师:輝副教授 Prof.Derek F.Wong 澳学 科技学院 然语与中葡机器翻译实验室2024/11/102Outline Research Workflow,Dilemma Regarding MT/LLMs(8 mins)Identifying Research Directions Addressing Research Dilemma in the era of LLM Notable examples of MT-related Research practices My Research Method

2、ology&Practices(5 mins)My routines in cross-lingual/multilingual research Brief introduction to two research projects Possible Research Directions(2 mins)3Common Research WorkflowQuestions/ObservationResearch Topic IdeaForm HypothesisTest with ExperimentsAnalyze DataReport ConclusionsConcepts Adapte

3、d From Wikipedia.Application-driven(Top-down)Be the first to 1+1,Make models/systems better Release models/benchmarksIdentifying Research Directions 3Common Research WorkflowQuestions/ObservationResearch Topic IdeaForm HypothesisTest with ExperimentsAnalyze DataReport ConclusionsConcepts Adapted Fro

4、m Wikipedia.Application-driven(Top-down)Be the first to 1+1,Make models/systems better Release models/benchmarks Curiosity-driven(Bottom-up)Why does work?How can we achieve?Identifying Research Directions 4Common Research WorkflowXu,H.,Kim,Y.J.,Sharaf,A.,&Awadalla,H.H.(2023).A paradigm shift in mach

5、ine translation:Boosting translation performance of large language models.ICLR 2023.Alves,D.M.,Pombal,J.,Guerreiro,N.M.,Martins,P.H.,Alves,J.,Farajian,A.,.&Martins,A.F.(2024).Tower:An open multilingual large language model for translation-related tasks.COLM 2024.Identifying Research Directions ALMA

6、continual pre-training and then fine-tune on MT instruction data.Application-driven research(Top-down)Representative machine translation papers:ALMA(ICLR23),Tower(COLM24).4Common Research WorkflowXu,H.,Kim,Y.J.,Sharaf,A.,&Awadalla,H.H.(2023).A paradigm shift in machine translation:Boosting translati

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
本文主要探讨了大型语言模型在跨语言可解释性方面的研究选题和经验分享。文章指出,当前的多语种LLM模型通常是基于英语的,数据和能力都是英语主导的。因此,研究的关键问题是如何实现跨语言转移(或非英语对齐)。文章提出了两种研究方法:应用驱动(自上而下)和好奇心驱动(自下而上)。应用驱动的研究注重于实际问题的解决,而好奇心驱动的研究则注重于对现象背后的原因和机制的探索。文章还提到了一些核心数据,如ALMA和Tower等代表机器翻译的论文,以及Scaling Laws for Neural Language Models和o1’s Performance Improves with Test-time Compute等研究。最后,文章分享了一些研究实践和方法,包括如何设计有效的非英语转移技术和如何进行好奇心驱动的发现。
如何实现?" "在LLM时代,如何解决资源密集型研究的困境?" 如何平衡?"
客服
商务合作
小程序
服务号
折叠