使用 Hugging Face 进行零样本文本分类
在本教程中,我们将实现 Hugging Face 运行零样本文本分类的流程。
作者:Prakhar Mishra
零样本学习(ZSL)是一种机器学习范例,它引入了使用在初始训练阶段未观察到的类标签测试样本的想法。这类似于我们人类根据我们随着时间积累的现有知识推断新概念的方式。ZSL 范式最近变得更加流行,这在很大程度上是因为获取任何特定领域的标记数据是一个相当昂贵和耗时的过程。根据您想要优化的成本,您可以让主题专家(SME)标记每个输入样本,或者在编写任务和特定领域的手工制作规则方面寻求他们的帮助,以以弱监督方式启动训练阶段。在机器学习的各个垂直领域中都有许多 ZSL 应用,其中一些流行和有趣的应用包括文本分类、图像分类、文本到图像生成、语音翻译等。
文本分类是将一组预定义类别分配给给定文本片段的任务。它通常在监督设置中建模,其中您具有特定领域文本的标记数据及其相关的类别标签。然后学习一些映射函数 X->Y;其中,X:输入样本,Y:类别。文本分类的一些示例包括-情感分析、电子邮件垃圾邮件分类、新闻分类等。请随意查看此博客,了解使用 Transformers 进行文本分类的快速教程。
因此,zero-shot 文本分类是将给定的文本片段分类到一些预定义的组或类别标签,而不需要在包含文本和标签映射的下游数据集上显式训练专用的机器学习模型。
如果您不经常练习NLP,可能还没有听说过 Hugging Face
在本教程中,我们将实现 Hugging Face 运行零样本文本分类的流程。
作者:Prakhar Mishra
零样本学习(ZSL)是一种机器学习范例,它引入了使用在初始训练阶段未观察到的类标签测试样本的想法。这类似于我们人类根据我们随着时间积累的现有知识推断新概念的方式。ZSL 范式最近变得更加流行,这在很大程度上是因为获取任何特定领域的标记数据是一个相当昂贵和耗时的过程。根据您想要优化的成本,您可以让主题专家(SME)标记每个输入样本,或者在编写任务和特定领域的手工制作规则方面寻求他们的帮助,以以弱监督方式启动训练阶段。在机器学习的各个垂直领域中都有许多 ZSL 应用,其中一些流行和有趣的应用包括文本分类、图像分类、文本到图像生成、语音翻译等。
文本分类是将一组预定义类别分配给给定文本片段的任务。它通常在监督设置中建模,其中您具有特定领域文本的标记数据及其相关的类别标签。然后学习一些映射函数 X->Y;其中,X:输入样本,Y:类别。文本分类的一些示例包括-情感分析、电子邮件垃圾邮件分类、新闻分类等。请随意查看此博客,了解使用 Transformers 进行文本分类的快速教程。
因此,zero-shot 文本分类是将给定的文本片段分类到一些预定义的组或类别标签,而不需要在包含文本和标签映射的下游数据集上显式训练专用的机器学习模型。
如果您不经常练习NLP,可能还没有听说过 Hugging Face
