揭秘Artificial-Intelligence-Terminology-Database:周志华、李航等权威专家如何统一术语翻译?
Artificial-Intelligence-Terminology-Database是一个全面的人工智能领域中英文技术词汇映射数据库,目前拥有约2442个专业术语和2篇专项领域篇,主要涵盖人工智能领域的基础概念和术语。该项目旨在为社区提供具有统一性的AI及相关领域中英术语翻译对照参考,解决AI术语翻译混乱的问题。## 🌟 术语库的诞生:从日常积累到专家参与### 🔍 术语库的发展历
揭秘Artificial-Intelligence-Terminology-Database:周志华、李航等权威专家如何统一术语翻译?
Artificial-Intelligence-Terminology-Database是一个全面的人工智能领域中英文技术词汇映射数据库,目前拥有约2442个专业术语和2篇专项领域篇,主要涵盖人工智能领域的基础概念和术语。该项目旨在为社区提供具有统一性的AI及相关领域中英术语翻译对照参考,解决AI术语翻译混乱的问题。
🌟 术语库的诞生:从日常积累到专家参与
🔍 术语库的发展历程
机器之心在编译技术文章和论文的过程中,积累了大量的专业术语,这成为了术语库的最初来源。前两版术语库主要记录了这些日常遇到的术语,希望能为大家查阅和翻译提供帮助。而自第三版起,项目进入了新的阶段。
除了日常编译工作的积累,机器之心开始逐领域基于权威教科书及文献,并联合领域专家进一步扩展和完善仓库。这一转变使得术语库的专业性和权威性得到了极大的提升。
🤝 专家参与的重要性
专项领域专家的参与是确保术语库质量的关键。以机器学习(Machine Learning)篇为例,在周志华教授、李航博士、邱锡鹏教授、李沐博士、Aston Zhang博士等该领域权威专家及经典教科书作者的指导下,不仅完成了对该领域术语收录覆盖度的提升,还提高了术语中文翻译用法的准确性、专业性及公信力,为社区构建了一套具有公信力的领域术语统一中文翻译用法参考资料。
📚 术语库的构建:多阶段推进与权威来源
🚀 三阶段完善计划
机器之心从三个方面持续完善术语的收录和扩展阅读的构建:
第一阶段,继续完善基础术语的构建,通过权威教科书或其它有公信力的资料抽取常见术语。
第二阶段,持续性地把编译论文或其他资料中所出现的非常见术语更新到术语表中。
第三阶段,联合更多的领域专家,构建专项领域的术语表。
📖 基于权威资料源提取术语
机器之心搜集自权威教科书、论文等具有公信力的资料源中的术语表进行校验汇总,并从中筛选出一些具有争议、没有翻译等情况的术语给到领域专家进行集中讨论以确认翻译、统一翻译。
💡 专家们的智慧:争议术语的统一
在与专家讨论的过程中,不同的专家对同一个词的翻译可能会有分歧。在这种情况下,专家们会从自身经验、理解出发,帮助其余专家理解自己这样翻译的背景知识。经过不断讨论,对于一个词的翻译最终会接近或达到一个共识。
在此过程中,有一些有趣的结果:
例如“Robust”经常会被翻译为“鲁棒性”,专家们认为这个翻译缺少了中文的美感。此外,在控制论中有将“Robust”翻译成“强健性”,经过专家讨论之后,将“稳健性”作为“Robust”的推荐翻译。
“Dropout”一直没有较好的翻译,几位专家根据 Dropout 原文中“temporarily removing”的表述,一致认为“暂退法”是较为合适的翻译。
“Zero/Few/One-shot Learning”一般翻译为“零/少/单样本学习”,但专家们认为“样本”不严谨,因为它并不是真的“零/少/单”样本,而是在建立一个映射之后,再利用少量样本进行迁移。翻译成样本的话,很容易跟学习理论中真正的“小样本学习”混淆。尤其是“shot”本身并没有“样本”的含义,而是“快照”的含义更接近,在确定中文翻译时,联想到“have a shot”的意思是“试一试”,于是专家们倾向翻译为“零/少/单试学习”。
📑 术语库的组织形式
读者可通过字母表盘或不同领域查看想要了解的专业术语。其中,术语的组织形式为:
- 索引编号:使用「Artificial-Intelligence-Terminology-Database」的缩写 AITD 并加上数字作为术语的编号,根据当前术语库的首字母顺序进行标注,索引编号从 AITD-00000 开始。
- 英文术语:英文术语。
- 中文翻译:该英文术语目前推荐的中文翻译。
- 常用缩写:该英文术语常用的缩写形式。
- 来源&扩展:来源&扩展是对该术语的注解,在前两版中的内容为机器之心往期的相关文章。从第三版起,将关联更多的资源内容,包括但不限于教科书、论文等来源。
- 备注:关于该术语的一些注解。
📊 专项领域篇:更专业的术语集合
除了基础术语库之外,本项目还包含了来自专项领域的术语,专项领域篇的质量更高。目前已有的专项领域篇包括机器学习(Machine Learning)篇和 AI for Science 篇。
机器学习篇包含了726个术语,如AITD-00011的“Action”译为“动作”,AITD-00015的“Activation Function”译为“激活函数”等。这些术语都经过了专家的严格审定,确保了翻译的准确性和专业性。
🤝 参与贡献:共同完善术语库
在使用术语表的过程中若发现错误、想要扩展术语库内容、讨论特定术语的翻译等,非常欢迎大家提 Issue 与项目团队以及各位读者进行讨论。同时也非常欢迎读者们进行 Fork、提 Pull Request,共同加强术语的编译质量以及扩充术语库的规模。
读者的反馈意见和更新建议将贯穿整个阶段,项目致谢页中会展示对该项目起积极作用的读者。为了使术语的更新更具准确度和置信度,希望读者能附上该术语的来源地址与扩展地址,以便更客观地更新术语,并附上可信的来源与扩展。
📝 许可证
本作品采用知识共享署名-非商业性使用-相同方式共享 4.0 国际许可协议进行许可。
如果你想获取该术语库,可以通过以下方式 clone 仓库:
git clone https://gitcode.com/gh_mirrors/ar/Artificial-Intelligence-Terminology-Database
更多推荐




所有评论(0)