复制成功

分享至

主页 > 比特币 >

AI 大语言模型 LLM,为啥老被翻译成「法学硕士」?!

2023.11.05

文章来源:极客公园

作者:靖宇

用不了多久,就是法学硕士抱怨自己头衔被翻译成「大语言模型」了。
AI 大语言模型 LLM,为啥老被翻译成「法学硕士」?!

图片来源:由无界 AI生成

但凡偷懒一点,喜欢用浏览器或者翻译插件来看英语新闻的同学,估计都免不了在 AI 大模型火热的当下,被满篇的「法学硕士」晃得眼瞎不已。

并不是大语言模型 LLM(Large Language Model)真的和法学有强关联,而只是一个缩写词的歧义解释而已。

为什么大模型掀起的新一波 AI 浪潮已如此汹涌,而浏览器和翻译软件,还是坚持将 LLM 翻译成「法学硕士」?大模型这「硕士帽」什么时候能摘掉?


01 论「LLM 浓度」,大模型还是弟弟 


首先需要说明的是,「LLM」这个缩写,在英文中既可以指代现在火热的「大语言模型 Large Language Model」;同时,在教育领域,它通常指的是「Legum Magister」或「Master of Laws」,即法学硕士。

而对于像 Google 浏览器配备的机器翻译功能,最常见的难题就是歧义和对上下文的理解。

机器翻译通常依赖大量的文本数据来学习如何翻译词语和短语。如果大多数 「LLM」出现在与法律相关的上下文中,翻译系统可能会学习到 「LLM」通常指的是 「法学硕士」。除非系统能够识别出特定的技术上下文,否则它可能不会选择 「大型语言模型」作为翻译。

即便现在大语言模型带动的生成式 AI 如此火热,但其实像 LLM 这类词汇在非技术人群中的普及度不高,这意味着翻译系统在其训练数据中,可能没有足够的实例来学习这种特定的上下文使用。

也就是说,LLM 作为「大语言模型」在机器翻译中的重要程度,还没有其作为「法学硕士」的程度高。

有图为证。

AI 大语言模型 LLM,为啥老被翻译成「法学硕士」?!

过去一年 AI LLM 和 Law LLM 关键词热度对比|Google Trends

以「AI LLM」(人工智能,大语言模型)和「Law LLM」(法律,法学硕士)为关键词,截取两个关键词过去一年 Google Trends 的对比图,可以轻易看出,AI LLM 这一词从去年 11 月 ChatGPT 推出后才开始逐渐升温,而此时代表真正的法学硕士的 Law LLM 热度一直在「50 分」左右。

而在 2023 年 3 月中旬,AI LLM 迎来了自己的第一波热度高潮,当时发生了什么?答案是美国当地时间 3 月 14 日,OpenAI 正式推出了 ChatGPT-4,彻底引爆了 AI 市场。

AI 大语言模型 LLM,为啥老被翻译成「法学硕士」?!

到今年 5 月末,AI 在热度上彻底战胜 Law|Google Trends

可以看到此后,只用了 2 个月时间,到 5 月末、 6 月初,代表 AI LLM 的曲线不断上扬,彻底在搜索热度上超过 Law LLM,并且趋势一直延续到现在。

AI 大语言模型 LLM,为啥老被翻译成「法学硕士」?!

关于 AI 的关键词都处于飙升的状态|Google Trends

通过全球热力图可以看到,对于 AI LLM 的关注,中国网友是相当热情的——生成式 AI 、 OpenAI 和 ChatGPT 等关键词一直处于「飙升」状态。

虽然在近期热度上,AI 压制了「法学高材生」,但由于「大语言模型」在绝对数量级上处于下风,依然是「弟弟」,所以机器翻译中还是默认 LLM 为「法学硕士」。


02 还能改吗?怎么改? 


所以,LLM 大语言模型这个「法学硕士」的帽子,就没办法摘下来了?

那倒也未必,不过确实需要一些时日,其中一些关键因素,可能会加快澄清误会的速度:

技术术语的普及度

如果「大型语言模型」(Large Language Model)这一术语在网页、学术论文、新闻报道和社交媒体中的使用频率显著增加,搜索引擎更有可能学习到这一含义。

搜索引擎算法的改进

随着搜索引擎算法的不断优化,它们在理解上下文和消除歧义方面的能力也在提高。这可能会加快正确翻译「LLM」这一术语的过程。

用户反馈和行为

用户在使用搜索引擎时的行为和反馈也会影响算法。如果用户经常搜索与大型语言模型相关的内容,并在搜索结果中选择与之相关的链接,搜索引擎会逐渐学习并调整其算法。

技术领域的发展

随着大型语言模型在技术领域的应用越来越广泛,与之相关的内容和讨论也会增加,这有助于提高搜索引擎对这一术语的识别能力。

AI 大语言模型 LLM,为啥老被翻译成「法学硕士」?!

Techmeme 上的赞助商广告 LLM 被直接翻译成法学硕士|Techmeme

以目前 AI 的热度来看,LLM 被统一翻译成「大语言模型」的未来,可能不会太久就会到来。而时间和进度,很可能就掌握在所有网友手中。

免责声明:数字资产交易涉及重大风险,本资料不应作为投资决策依据,亦不应被解释为从事投资交易的建议。请确保充分了解所涉及的风险并谨慎投资。OKEx学院仅提供信息参考,不构成任何投资建议,用户一切投资行为与本站无关。

加⼊OKEx全球社群

和全球数字资产投资者交流讨论

扫码加入OKEx社群

相关推荐

industry-frontier