当前位置: 开发笔记 > 后端 > 正文

ALBERT中文实战之文本相似度

作者：btsk@163.com | 来源：互联网 | 2023-07-05 14:56

ALBERT是一个比BERT要轻量，效果更好的模型，本篇实践介绍如何用ALBERT计算两个文本的相似度。ALBERT利用词嵌入参数因式分解和隐藏层间参

ALBERT是一个比BERT要轻量&＃xff0c;效果更好的模型&＃xff0c;本篇实践介绍如何用ALBERT计算两个文本的相似度。

ALBERT利用词嵌入参数因式分解和隐藏层间参数共享两种手段&＃xff0c;显著减少了模型的参数量的同时&＃xff0c;基本没有损失模型的性能。笔者在下面的文章中详细介绍了ALBERT的理论&＃xff0c;感兴趣的同学可以戳进去了解&＃xff1a;《解读ALBERT》。

github地址

使用孪生ALBERT网络生成句子的嵌入表示&＃xff1a;

Pooling方法&＃xff1a;

a. CLS:直接使用CLS的输出作为Embedding

b.MEAN: 平均所有token的输出作为Embedding

c. MAX:取每一维输出向量的最大值

目标函数&＃xff1a;

a. 分类目标函数&＃xff1a;

640?wx_fmt&＃61;png

其中 u 和 v 为两个句子的 Embedding&＃xff0c;Wt为变换矩阵&＃xff0c;最终的维度为3n*k&＃xff0c;该目标函数可用于预训练Sentence Embedding

b. 回归目标函数&＃xff1a;

该目标函数直接计算u和v的cosine相似度&＃xff0c;将之均方误差作为loss。另外结构也是预测时候的计算方式

c. 三胞胎目标函数&＃xff1a;

640?wx_fmt&＃61;png

其中Sa为句子a的Embedding&＃xff0c;Sp则为句子p&＃xff0c;句子p是跟a属于同一类型的正例句子&＃xff0c;n 则是一个反例&＃xff0c;三胞胎网络和孪生网络类似&＃xff0c;这个目标函数是为了让正例距离尽量近而反例尽量远

git
token

推荐阅读

token
Yii2 GridView 实现列表页数据直接编辑的完整指南

本文详细介绍了如何使用 Yii2 的 GridView 组件在列表页面实现数据的直接编辑功能。通过具体的代码示例和步骤，帮助开发者快速掌握这一实用技巧。 ... [详细]

蜡笔小新 2024-12-27 16:27:52
token
毕业设计：基于机器学习与深度学习的垃圾邮件（短信）分类算法实现

本文详细介绍了如何使用机器学习和深度学习技术对垃圾邮件和短信进行分类。内容涵盖从数据集介绍、预处理、特征提取到模型训练与评估的完整流程，并提供了具体的代码示例和实验结果。 ... [详细]

蜡笔小新 2024-12-25 17:38:50
token
使用 GitHub、JSDelivr、PicGo 和 Typora 构建高效的图床解决方案

本文详细介绍了如何利用 GitHub 仓库、JSDelivr CDN、PicGo 图床工具和 Typora 编辑器，搭建一个高效且免费的图床系统。通过此方案，用户可以轻松管理和上传图片，并在 Markdown 文档中快速插入高质量的图片链接。 ... [详细]

蜡笔小新 2024-12-24 12:54:21
token
使用 Azure Service Principal 和 Microsoft Graph API 获取 AAD 用户列表

本文介绍了一段通用代码示例，该代码不仅能够操作 Azure Active Directory (AAD)，还可以通过 Azure Service Principal 的授权访问和管理 Azure 订阅资源。Azure 的架构可以分为两个层级：AAD 和 Subscription。 ... [详细]

蜡笔小新 2024-12-27 16:07:12
token
ASP.NET MVC中Area机制的实现与优化

本文探讨了在ASP.NET MVC框架中，如何通过Area机制有效地组织和管理大规模应用程序的不同功能模块。通过合理的文件夹结构和命名规则，开发人员可以更高效地管理和扩展项目。 ... [详细]

蜡笔小新 2024-12-25 22:53:48
token
解析猫鼬 findOne 方法返回 null 的原因

本文探讨了在通过 API 端点调用时，使用猫鼬（Mongoose）的 findOne 方法总是返回 null 的问题，并提供了详细的解决方案和建议。 ... [详细]

蜡笔小新 2024-12-25 17:40:33
token
深入解析 Spring Security 用户认证机制

本文将详细介绍 Spring Security 中用户登录认证的核心流程，重点分析 AbstractAuthenticationProcessingFilter 和 AuthenticationManager 的工作原理。通过理解这些组件的实现，读者可以更好地掌握 Spring Security 的认证机制。 ... [详细]

蜡笔小新 2024-12-25 16:00:21
token
Vue 2.0 中使用 Axios 获取数据时遇到错误的解决方案

本文探讨了在 Vue 2.0 项目中使用 Axios 获取数据时可能出现的错误，并提供详细的解决方案和最佳实践。 ... [详细]

蜡笔小新 2024-12-25 14:02:12
token
TCP长连接设备管理平台：架构与功能概览

本文介绍了基于TCP长连接的设备管理平台的设计理念、技术选型及主要功能模块。最初，项目旨在实现简单的协议测试，但随着需求扩展，逐步演变为一个完整的前后端分离系统。 ... [详细]

蜡笔小新 2024-12-25 09:07:38
token
深入剖析 DEX 赛道：从 60 大头部项目看五大趋势

本文通过分析 60 大头部去中心化交易平台（DEX），揭示了当前 DEX 赛道的五大发展趋势，包括市场集中度、跨链协议、AMM+NFT 结合、新公链崛起以及稳定币和衍生品交易的增长潜力。 ... [详细]

蜡笔小新 2024-12-24 14:51:19
token
2018 区块链技术峰会：专家深度解析核心技术与应用前景

2018年3月31日，CSDN、火星财经联合中关村区块链产业联盟等机构举办的2018区块链技术及应用峰会（BTA）核心分会场圆满举行。多位业内顶尖专家深入探讨了区块链的核心技术原理及其在实际业务中的应用。 ... [详细]

蜡笔小新 2024-12-24 10:56:15
token
提升网站安全性：隐藏Apache、Nginx和PHP版本号的详细指南

本文详细介绍如何通过修改配置文件来隐藏Apache、Nginx和PHP的版本号，从而增强网站的安全性。我们将提供具体的配置步骤，并解释这些设置的重要性。 ... [详细]

蜡笔小新 2024-12-24 10:21:12
token
DCG 股东信：解答关键问题与未来展望

DCG 创始人兼首席执行官 Barry Silbert 发布致股东信，详细解答了 19 个核心问题，并分享了公司未来的发展方向。 ... [详细]

蜡笔小新 2024-12-23 11:00:58
token
Hadoop发行版本选择指南：技术解析与应用实践

本文详细介绍了Hadoop的不同发行版本及其特点，帮助读者根据实际需求选择最合适的Hadoop版本。内容涵盖Apache Hadoop、Cloudera CDH等主流版本的特性及应用场景。 ... [详细]

蜡笔小新 2024-12-22 20:38:12
token
2018-2019学年第六周《Java数据结构与算法》学习总结

本文总结了2018-2019学年第六周在《Java数据结构与算法》课程中的学习内容，重点介绍了非线性数据结构——树的相关知识及其应用。 ... [详细]

蜡笔小新 2024-12-22 16:43:19

btsk@163.com

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章