分类目录归档：自然语言处理(NLP)

文本分类经典模型（三）

1355 views

文本分类是自然语言处理中最基本、最经典的任务，大部分自然语言处理任务都可以看作是分类任务。近年来，深度学习在众多研究领域中获得了巨大的成功，如今，也成为了 NLP 领域的标配技术，广泛渗透入文本分类任务中。

与数字、图像不同，对文本的处理强调精细化的处理能力。传统的文本分类方法一般需要对输入模型的文本数据进行预处理，此外还需要通过人工标注的方法来获得良好的样本特征，然后使用经典的机器学习算法对其进行分类。类似的方法包括 NaiveBayes（NB）、K 近邻（KNN）、支持向量机 SVM 等。特征提取的水平对文本分类效果的影响甚至高于图像分类，而文本分类中的特征工程往往非常耗时且计算成本高。2

文本分类经典模型（二）

发表评论

690 views

文本分类经典模型（一）

发表评论

869 views

21个经典深度学习句间关系模型｜代码&技巧

发表评论

1060 views

句间关系的输入是一对文本，输出是文本间的关系。常用的判别有语义相似度、语义关系推理（蕴含/中立/矛盾）、问答对等，拿GLUE榜单来说，其中有6个（QQP/MNLI/QNLI/STS/RTE/MRPC）都是句间关系任务。这个任务的应用场景也很广泛，比如搜索推荐的语义相关性、智能问答中的问题-问题、问题-答案匹配、知识图谱中的实体链接、关系识别等，是成为NLPer必须卷的一个方向。在深度学习中，文本匹配模型可以分为两种结构：双塔式和交互式。双塔式模型也称孪生网络、Representation-based，就是用一个编码器分别给两个文本编码出句向量，然后把两个向量融合过一个浅层的分类器；交互是也

深度学习文本分类模型综述+代码+技巧

发表评论

1369 views

文本分类是NLP的必备入门任务，在搜索、推荐、对话等场景中随处可见，并有情感分析、新闻分类、标签分类等成熟的研究分支和数据集。本文主要介绍深度学习文本分类的常用模型原理、优缺点以及技巧。

Fasttext

论文：https://arxiv.org/abs/1607.01759 代码：https://github.com/facebookresearch/fastText

Fasttext是Facebook推出的一个便捷的工具，包含文本分类和词向量训练两个功能。 Fasttext的分类实现很简单：把输入转化为词向量，取平均，再经过线性分类器得到类别。输入的词向量可以是预先训练好的，也可以随机初

预训练时代下的文本生成｜模型&技巧

发表评论

1164 views

最近没看到啥好玩的NLP文章，于是开始读综述了。今天推荐一篇人大出品的37页文本生成综述： A Survey of Pretrained Language Models Based Text Generation https://arxiv.org/abs/2201.05273 虽然综述读起来累些，但多读综述有利于知识体系的梳理。而且NLP领域的综述读多了会发现，很多优化方法都是相通的，也能提供一些新的思路。这篇文章从把文本生成的方法分成了三类：输入编码、模型设计、优化方法。同时也从数据、模型、优化层面给出了下面我们就顺着文章的思路，梳理一下最近几年文本生成领域的进展。

如何编码输入

这

哈工大｜15种NLP数据增强方法总结与对比

发表评论

999 views

这篇40多页的综述出自哈工大车万翔老师的团队，一共总结了15种NLP可以用到的数据增强方法、优缺点，还有一些使用技巧，十分良心。下面就速读一下，如果要使用的话还是建议参考原文以及其他文献的应用细节。论文：Data Augmentation Approaches in Natural Language Processing: A Survey 地址：https://arxiv.org/abs/2110.01852

数据增强方法

数据增强（Data Augmentation，简称DA），是指根据现有数据，合成新数据的一类方法。毕竟数据才是真正的效果天花板，有了更多数据后可以提升效果、增强模型泛化

文本语义相似度脉络

发表评论

1656 views

本文旨在帮大家快速了解文本语义相似度领域的研究脉络和进展，其中包含了文本语义相似度任务的处理步骤，文本相似度模型发展历程，相关数据集，以及重要论文分享。

文本相似度任务处理步骤

通过该领域的大量论文阅读，我认为处理文本相似度任务时可以分为一下三个步骤：预处理：如数据清洗等。此步骤旨在对文本做一些规范化操作，筛选有用特征，去除噪音。文本表示：当数据被预处理完成后，就可以送入模型了。在文本相似度任务中，需要有一个模块用于对文本的向量化表示，从而为下一步相似度比较做准备。这个部分一般会选用一些 backbone 模型，如 LSTM，BERT 等。学习范式的选择：这个步骤也是文本相似度任务中最

SimCSE详解

发表评论

748 views

「句向量表征技术」一直都是NLP领域的热门话题，在BERT前时代，一般都采用word2vec训练出的word-embedding结合pooling策略进行句向量表征，或者在有训练数据情况下，采用TextCNN/BiLSTM结合Siamese network策略进行句向量表征。在BERT时代，人们借助预训练语言模型的固有优势，一般采用BERT模型的[CLS]向量作为句向量表征；Sentence-Bert诠释了在存在训练数据的情况下，如何在BERT模型上获取更好的句向量表征。后面又有了「BERT-Flow」、「BERT-Whitenning」、「ConSERT」、「SimCSE」、「R-Drop」

Sentence-BERT详解

发表评论

786 views

Sentence-BERT: Sentence Embeddings using Siamese BERT-Networks；论文地址：https://arxiv.org/abs/1908.10084；论文代码：https://github.com/UKPLab/ sentence-transformers。

Introduction

Bert模型已经在NLP各大任务中都展现出了强者的姿态。在语义相似度计算（semantic textual similarity）任务上也不例外，但是，由于bert模型规定，在计算语义相似度时，需要将两个句子同时进入模型，进行信息交互，这造成大量的计算开销。

AIStation

AI站长的个人学习笔记

文本分类经典模型（三）

文本分类经典模型（二）

文本分类经典模型（一）

21个经典深度学习句间关系模型｜代码&技巧

深度学习文本分类模型综述+代码+技巧

Fasttext

预训练时代下的文本生成｜模型&技巧

如何编码输入

哈工大｜15种NLP数据增强方法总结与对比

数据增强方法

文本语义相似度脉络

文本相似度任务处理步骤

SimCSE详解

Sentence-BERT详解

Introduction