在本节中,我们将重点介绍使用神经网络处理与自然语言处理 (NLP) 相关的任务。我们希望计算机能够解决许多 NLP 问题,例如:
文本分类是一个典型的文本序列分类问题。例如,将电子邮件消息分类为垃圾邮件与非垃圾邮件,或将文章分类为体育、商业、政治等。此外,在开发聊天机器人时,我们经常需要理解用户想要表达的意思,这种情况下我们处理的是意图分类。通常,在意图分类中,我们需要处理许多类别。
情感分析是一个典型的回归问题,我们需要为句子的意义归属一个数字(情感),表示其积极/消极程度。情感分析的更高级版本是基于方面的情感分析(ABSA),其中我们将情感归属于句子的不同部分(方面),例如“在这家餐厅,我喜欢菜肴,但氛围很糟糕”。
命名实体识别(NER)是指从文本中提取特定实体的问题。例如,我们可能需要理解在短语 “I need to fly to Paris tomorrow” 中,“tomorrow” 是指日期,“Paris” 是指位置。
关键词提取类似于 NER,但我们需要自动提取对句子意义重要的单词,而不需要预先针对特定实体类型进行训练。
文本聚类在我们想要将类似的句子分组在一起时非常有用,例如技术支持对话中的相似请求。
问答是指模型回答特定问题的能力。模型接收文本段落和问题作为输入,并需要提供包含问题答案的文本位置(有时需要生成答案文本)。
文本生成是模型生成新文本的能力。它可以被视为分类任务,根据某些文本提示预测下一个字/单词。高级文本生成模型,例如 GPT-3,能够使用称为 prompt programming 或 prompt engineering 的技术解决其他 NLP 任务。
文本摘要是一种技术,当我们想要计算机“阅读”长文本并在几句话中概括它时使用。
机器翻译可以被视为在一种语言中进行文本理解和在另一种语言中进行文本生成的组合。
最初,大多数 NLP 任务都是使用传统方法(例如语法)解决的。例如,在机器翻译中,解析器用于将初始句子转换为语法树,然后提取更高级别的语义结构以表示句子的含义,并基于此含义和目标语言的语法生成结果。如今,许多 NLP 任务使用神经网络更有效地解决。
文本分类是一个典型的文本序列分类问题。例如,将电子邮件消息分类为垃圾邮件与非垃圾邮件,或将文章分类为体育、商业、政治等。此外,在开发聊天机器人时,我们经常需要理解用户想要表达的意思,这种情况下我们处理的是意图分类。通常,在意图分类中,我们需要处理许多类别。
情感分析是一个典型的回归问题,我们需要为句子的意义归属一个数字(情感),表示其积极/消极程度。情感分析的更高级版本是基于方面的情感分析(ABSA),其中我们将情感归属于句子的不同部分(方面),例如“在这家餐厅,我喜欢菜肴,但氛围很糟糕”。
命名实体识别(NER)是指从文本中提取特定实体的问题。例如,我们可能需要理解在短语 “I need to fly to Paris tomorrow” 中,“tomorrow” 是指日期,“Paris” 是指位置。
关键词提取类似于 NER,但我们需要自动提取对句子意义重要的单词,而不需要预先针对特定实体类型进行训练。
文本聚类在我们想要将类似的句子分组在一起时非常有用,例如技术支持对话中的相似请求。
问答是指模型回答特定问题的能力。模型接收文本段落和问题作为输入,并需要提供包含问题答案的文本位置(有时需要生成答案文本)。
文本生成是模型生成新文本的能力。它可以被视为分类任务,根据某些文本提示预测下一个字/单词。高级文本生成模型,例如 GPT-3,能够使用称为 prompt programming 或 prompt engineering 的技术解决其他 NLP 任务。
文本摘要是一种技术,当我们想要计算机“阅读”长文本并在几句话中概括它时使用。
机器翻译可以被视为在一种语言中进行文本理解和在另一种语言中进行文本生成的组合。
最初,大多数 NLP 任务都是使用传统方法(例如语法)解决的。例如,在机器翻译中,解析器用于将初始句子转换为语法树,然后提取更高级别的语义结构以表示句子的含义,并基于此含义和目标语言的语法生成结果。如今,许多 NLP 任务使用神经网络更有效地解决。
