Question 1

NLP、NLU 和 NLG 有什么区别？

Accepted Answer

NLP（自然语言处理）是涵盖所有处理人类语言的计算方法的广泛领域。NLU（自然语言理解）是专注于理解和解释文本的子集——提取含义、意图和实体。NLG（自然语言生成）是另一个专注于从结构化数据或其他输入生成人类可读文本的子集。现代系统通常结合 NLU 和 NLG 能力。

Question 2

NLP 中的基础任务有哪些？

Accepted Answer

基础 NLP 任务包括：分词（将文本分割成单词/词元）、词性标注（识别名词、动词等）、命名实体识别（识别人物、地点、组织）、情感分析（确定情感基调）、机器翻译（语言之间转换）、文本摘要（压缩长文本）、问答和文本分类。这些任务构成了更复杂 NLP 应用的基础模块。

Question 3

深度学习如何改变了 NLP？

Accepted Answer

深度学习通过使模型能够自动从数据中学习表示而不是依赖手工设计的特征，彻底改变了 NLP。词嵌入（Word2Vec、GloVe）的引入，随后是上下文嵌入（ELMo），然后是 Transformer（BERT、GPT）极大地提高了几乎所有 NLP 任务的性能。大型语言模型现在展示了以前不可能的能力，如少样本学习和复杂推理。

Question 4

什么是分词，为什么它很重要？

Accepted Answer

分词是将文本分解成更小单元（词元）进行处理的过程。它至关重要，因为计算机无法直接理解原始文本。现代分词方法包括词级（按空格分割）、子词级（BPE、WordPiece - 大多数 LLM 使用）和字符级方法。子词分词在词汇量大小和处理罕见词能力之间取得平衡，是 GPT 和 BERT 等模型的标准。

Question 5

NLP 的主要挑战是什么？

Accepted Answer

主要挑战包括：歧义性（词语和句子可能有多重含义）、上下文依赖性（含义根据周围文本变化）、讽刺和反语检测、处理多种语言和语码转换、处理非正式文本（俚语、错别字）、保持生成文本的事实准确性、理解隐含知识，以及确保模型不会延续训练数据中存在的偏见。

创建时间	1950 年代（起源于计算语言学）
规范文档	官方规范

什么是自然语言处理？

快速了解

工作原理

主要特点

常见用途

示例

常见问题

NLP、NLU 和 NLG 有什么区别？

NLP 中的基础任务有哪些？

深度学习如何改变了 NLP？

什么是分词，为什么它很重要？

NLP 的主要挑战是什么？

相关工具

JSON 格式化

文本分析器

相关术语

人工智能

机器学习

大语言模型

Transformer模型

相关文章

NLP自然语言处理完全指南：从分词到大语言模型

注意力机制完全指南：从直觉理解到Transformer核心原理与代码实现

Transformer架构完全指南：自注意力机制、编码器-解码器与现代大模型原理