当前位置:首页 > 报告详情

欧洲人工智能的语言数据:双线作战.pdf

上传人: 新** 编号:937392 2025-10-15 10页 1.61MB

1、Christos EllinidesDirector-General Directorate-General for Translation,European CommissionLanguage Data for European AI:Striking on Two FrontsLanguage Data for European AI:Striking on Two FrontsStriking on Two FrontsStriking on Two Fronts1.Modern and technologically revamped Public Administrations2.

2、EU digital and technical sovereignty People are at the heart of translationOver 70-year historyDGT translates into and out of 24 official EU languagesCurrent output:2.5 million pages per yearIntroduction to DGTLanguage Data for European AI:Striking on Two FrontsLanguage Data for European AI:Striking

3、 on Two FrontsEU Collaboration on AI European sovereignty&wealth of languages25+Years of Data Translation archivesAI-based services and Machine Translation Evolution of data usageMultilingual Dataset Includes low-resource languagesDGTs Role in AI&Language DataDGTs translations throughout the yearsMa

4、chine translation and AI based multilingual servicesEuropean AI developmentFrom Translations to AI-based servicesLinguistic data assets:(Euramis and DGT-TM)2 billion sentences 300 000 a dayDGT-TMLaunched in 2007 used by research,business,freelance translators and moreEuramis data repositoryLaunched

5、in 1995Language Data for European AI:Striking on Two FrontsExpanding into language technologiesMachine translation MTEC-eTranslationELRC Data Collection(2016-2020)special support for low-resource languagesBroadening reach(expansion into non-translation applications:AI services)Language Data for Euro

6、pean AI:Striking on Two FrontsEuropean HPC Joint UndertakingEuropean Language Data Space European marketplace for language data supporting Europes digital sovereignty MeluXina and Leonardo supercomputers EU institutional LLMmade in Europeop

word格式文档无特别注明外均可编辑修改,预览文件经过压缩,下载原文更清晰!
三个皮匠报告文库所有资源均是客户上传分享,仅供网友学习交流,未经上传用户书面授权,请勿作商用。
根据标记内容,全文主要内容概括如下: 1. 欧洲委员会翻译总司(DGT)在翻译和语言数据处理方面发挥着关键作用,拥有超过70年的历史,翻译涵盖24种官方欧盟语言。 2. DGT的翻译输出量约为每年±2.5百万页。 3. DGT在AI和语言数据方面的角色包括:翻译档案、机器翻译服务、多语言数据集,包括低资源语言。 4. DGT的数据资产包括Euramis和DGT-TM,拥有超过20亿句子,每日新增超过30万句。 5. DGT-TM自2007年推出,被研究、商业、自由职业翻译者等多方使用。 6. 欧洲语言数据空间旨在成为欧洲语言数据市场,支持欧洲的数字主权。 7. 未来路线图包括政治背景下的欧盟AI法案、2024-2029年欧洲委员会政治指导方针以及2025年2月的AI行动峰会。
翻译与数据双管齐下?" 翻译档案如何助力?" 数字主权新引擎?"
客服
商务合作
小程序
服务号
折叠