
NLP巨变:大型语言模型与伦理挑战
NLP巨变:Transformer模型与BERT引发LLM热潮,ChatGPT问世冲击业界,伦理争议与学术工业分歧加剧,AI时代机遇与挑战并存。
- NLP 领域巨变: 自然语言处理 (NLP) 领域发生了重大变化,对行业从业者和整个社会都产生了深远影响。
- NLP 的目标: 让计算机能够理解和处理人类语言的复杂性,起源于 20 世纪 40 年代,最初应用于语音助手、广告推荐等。
- 大型语言模型(LLM)的兴起:
- 2019 年 Quanta 杂志报道 BERT 时,还未使用 “大型语言模型” 这一术语。
- 短短五年半后,LLM 迅速发展,对各科学领域产生颠覆性影响,首当其冲的是 NLP。
- Transformer 模型的出现:
- 2017 年,Google 提出的 Transformer 模型(“Attention Is All You Need”论文)彻底改变了 NLP 领域的格局。
- 起初,学界对此持怀疑态度,认为只是“hack”,但后来发现其在大量数据上训练后效果惊人。
- BERT 的影响:
- 2018 年 Google 开源 BERT 模型后,NLP 领域掀起了一股 “BERTology” 热潮。
- 研究人员争相研究 BERT 的原理,并在各种基准测试中相互竞争,许多项目因此被搁置。
- 规模化(Scaling)的重要性: 随着模型规模的扩大,其在基准测试中的表现也越来越好,这使得研究人员开始关注规模化带来的潜力。
- 关于“理解”的争论:
- LLM 在 NLP 基准测试中超越人类水平后,引发了关于模型是否真正“理解”语言的争论。
- Emily M. Bender 等人提出了 “章鱼测试”,认为仅通过统计模式模仿语言形式的模型永远无法真正理解其含义。
- GPT-3 的发布:
- 2020 年 OpenAI 发布 GPT-3,其规模和能力远超以往模型,许多 NLP 研究人员认为这是一个转折点。
- GPT-3 展现出在少量样本下完成新任务的能力,令人震惊。
- 但 OpenAI 未公开 GPT-3 的源代码,其商业化模式也引发了一些争议。
- NLP 领域的内战:
- 围绕 LLM 的伦理和社会影响,NLP 领域出现严重分歧,形成了 “亲 LLM” 和 “反 LLM” 两派。
- Bender 等人发表的论文《随机鹦鹉的危险:语言模型会过大吗?》引发了关于形式与意义、方法与规模的激烈辩论。
- ChatGPT 的问世:
- 2022 年 11 月 30 日,OpenAI 发布 ChatGPT,对 NLP 领域产生了巨大冲击。
- 许多研究人员面临研究方向被淘汰的危机,对 NLP 的未来感到迷茫。
- EMNLP 会议上甚至有人提问:“这会是最后一届 NLP 会议吗?”
- 学术界与工业界的差距: ChatGPT 的出现加剧了学术界和工业界在 NLP 研究方向上的分歧。
- 范式转变?:
- LLM 的出现是否代表 NLP 领域发生范式转变,业内存在不同看法。
- 一些人认为 LLM 改变了研究方向,使得过去关注的问题不再重要。
- 另一些人则认为,这只是规模更大、数据集更大的神经网络而已。
- 伦理与影响: LLM 的强大能力引发了关于人类在 AI 时代的角色、教育影响以及潜在风险的深刻思考。
- 机遇与挑战: LLM 为 NLP 领域带来了前所未有的机遇,但也带来了伦理、偏见和对社会潜在影响的挑战。