asp.NET脏字过滤算法

作者：呼吸的雨儿作_741 | 来源：互联网 | 2022-01-22 05:44

asp.NET脏字过滤算法,需要参考上一篇文章，大家可以比较下。

原文见https://www.jb51.net/article/20575.htm
但在我这里测试的时候，RegEx要快一倍左右。但是还是不太满意，因为我们网站上脏字过滤用的相当多，对效率已经有了一些影响，经过一番思考后，自己做了一个算法。在自己的机器上测试了一下，使用原文中的脏字库，0x19c的字符串长度，1000次循环，文本查找耗时1933.47ms，RegEx用了1216.719ms，而我的算法只用了244.125ms.
更新：新增一个BitArray，用于判断某char是否在所有脏字中出现过。总时间由244ms降到了34ms.
主要算法如代码所示

代码如下:

 
private static Dictionary dic = new Dictionary(); 
private static BitArray fastcheck = new BitArray(char.MaxValue); 
static void Prepare() 
{ 
string[] badwords = // read from file 
foreach (string word in badwords) 
{ 
if (!dic.ContainsKey(word)) 
{ 
dic.Add(word, null); 
maxlength = Math.Max(maxlength, word.Length); 
fastcheck[word[0]] = true; 
} 
} 
} 

使用的时候

代码如下:

 
int index = 0; 
while (index { 
if (!fastcheck[target[index]]) 
{ 
while (index } 
for (int j = 0; j { 
string sub = target.Substring(index, j); 
if (dic.ContainsKey(sub)) 
{ 
sb.Replace(sub, "***", index, j); 
index += j; 
break; 
} 
} 
index++; 
} 

https
算法

推荐阅读

算法
双指针法高效解决七道链表问题

双指针法在链表问题中应用广泛，能够高效解决多种经典问题，如合并两个有序链表、合并多个有序链表、查找倒数第k个节点等。本文将详细介绍这些应用场景及其解决方案。 ... [详细]

蜡笔小新 2024-11-13 13:16:55
算法
图像相似度对比的多种方法

本文介绍了几种常用的图像相似度对比方法，包括直方图方法、图像模板匹配、PSNR峰值信噪比、SSIM结构相似性和感知哈希算法。每种方法都有其优缺点，适用于不同的应用场景。 ... [详细]

蜡笔小新 2024-11-13 11:04:56
算法
MATLAB实现Sobel边缘检测算法

图像边缘是指图像中灰度值发生显著变化的区域。Sobel算子是一种常用的边缘检测方法，通过计算图像灰度值的梯度来检测边缘。本文介绍了Sobel算子的基本原理，并提供了基于MATLAB的实现代码。 ... [详细]

蜡笔小新 2024-11-13 10:13:04
算法
《程序员的数学》：一本适合初学者的数学指南

结城浩（1963年7月出生），日本资深程序员和技术作家，居住在东京武藏野市。他开发了著名的YukiWiki软件，并在杂志上发表了大量程序入门文章和技术翻译作品。结城浩著有30多本关于编程和数学的书籍，其中许多被翻译成英文和韩文。 ... [详细]

蜡笔小新 2024-11-12 21:47:50
算法
LintCode 1218. 计算补数的 JavaScript 算法

本题要求给定一个正整数，计算其补数。补数是指将该数字的二进制表示逐位取反，然后转换回十进制得到的新数。 ... [详细]

蜡笔小新 2024-11-13 10:59:10
算法
主要社交平台及电商平台推出算法关闭功能

根据经济日报的报道，截至3月15日，包括抖音、今日头条、微信、淘宝、百度、大众点评、微博和小红书在内的多个主流App已经上线了算法关闭功能，用户可以在后台一键关闭“个性化推荐”。 ... [详细]

蜡笔小新 2024-11-13 10:14:53
算法
使用OpenSSL自建CA证书（实测有效）

本文详细介绍了如何使用OpenSSL自建CA证书的步骤，包括准备工作、生成CA证书、生成服务器待签证书以及证书签名等过程。 ... [详细]

蜡笔小新 2024-11-13 09:55:03
算法
在范围[0..n-1]中产生m个不同的随机数 - Generating m distinct random numbers in the range [0..n-1]

Ihavetwomethodsofgeneratingmdistinctrandomnumbersintherange[0..n-1]我有两种方法在范围[0.n-1]中生 ... [详细]

蜡笔小新 2024-11-13 09:49:14
算法
解决 Ubuntu 环境下 Hadoop 集群 SSH 密钥认证问题

本文详细介绍了在 Ubuntu 系统上搭建 Hadoop 集群时遇到的 SSH 密钥认证问题及其解决方案。通过本文，读者可以了解如何在多台虚拟机之间实现无密码 SSH 登录，从而顺利启动 Hadoop 集群。 ... [详细]

蜡笔小新 2024-11-13 09:14:02
算法
深入理解ASCII、ANSI、GB2312、UNICODE及UTF-8、UTF-16编码

本文回顾了作者初次接触Unicode编码时的经历，并详细探讨了ASCII、ANSI、GB2312、UNICODE以及UTF-8和UTF-16编码的区别和应用场景。通过实例分析，帮助读者更好地理解和使用这些编码。 ... [详细]

蜡笔小新 2024-11-13 07:33:27
机器学习
Python 数据可视化实战指南

本文详细介绍如何使用 Python 进行数据可视化，涵盖从环境搭建到具体实例的全过程。 ... [详细]

蜡笔小新 2024-11-13 06:03:30
算法
拼多多的崛起之路

随着4G通信技术的发展，互联网产品从PC端转向移动端，图像传输速度更快、更清晰，智能设备的应用提升了用户体验。移动互联网的普及为拼多多的崛起提供了时代背景。 ... [详细]

蜡笔小新 2024-11-13 00:53:05
算法
使用 SourceTree 管理 SVN 代码仓库的详细指南

SourceTree 是一款功能强大的 Git 管理工具，但很多人不知道它同样支持管理 SVN 代码仓库。本文将详细介绍如何使用 SourceTree 来管理和操作 SVN 代码仓库。 ... [详细]

蜡笔小新 2024-11-12 19:15:29
算法
小程序与小视频：创业公司的左右抉择

对于众多创业公司而言，选择小程序或小视频的发展方向至关重要。本文将深入分析小程序和小视频的特点、优势及局限，帮助创业者做出更明智的选择。 ... [详细]

蜡笔小新 2024-11-12 18:48:34
机器学习
如何撰写数据分析师（包括转行者）的面试简历？

CDA数据分析师团队出品，作者：徐杨老师，编辑：Mika。本文将帮助您了解如何撰写一份高质量的数据分析师简历，特别是对于转行者。 ... [详细]

蜡笔小新 2024-11-12 18:20:52

呼吸的雨儿作_741

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章