作者:忽而今秋_丶 | 来源:互联网 | 2024-12-22 00:08
字符串中特定字符的移除方法
在处理文本数据时,有时需要对字符串进行清理,移除其中的大写、小写、特殊、数字和非数字字符。本文将详细介绍这一过程,并提供 C++、Java 和 Python 的代码实现。
问题描述
给定一个长度为 N 的字符串 str,任务是从该字符串中移除指定类型的字符,并输出修改后的结果。
示例
输入: str = "gfg fg 123 $%"
输出:
移除大写字符后: gfg123$%
移除小写字符后: GFG123$%
移除特殊字符后: GFGgfg123
移除数字字符后: GFGgfg$%
移除非数字字符后: 123
输入: str = "J@va12"
输出:
移除大写字符后: @va12
移除小写字符后: J@12
移除特殊字符后: Java12
移除数字字符后: J@va
移除非数字字符后: 12
方法一:逐字符遍历法
最简单的方法是遍历字符串中的每个字符,并根据其 ASCII 值判断是否需要移除:
- 如果 ASCII 值在 [65, 90] 范围内,则为大写字符,跳过这些字符。
- 如果 ASCII 值在 [97, 122] 范围内,则为小写字符,跳过这些字符。
- 如果 ASCII 值在 [32, 47]、[58, 64]、[91, 96] 或 [123, 126] 范围内,则为特殊字符,跳过这些字符。
- 如果 ASCII 值在 [48, 57] 范围内,则为数字字符,跳过这些字符。
- 否则为非数字字符,跳过这些字符。
时间复杂度: O(N)
辅助空间: O(1)
方法二:正则表达式法
使用正则表达式可以更简洁地实现字符移除。以下是具体步骤:
- 创建正则表达式来匹配需要移除的字符类型。
- 编译正则表达式以创建模式对象。
- 使用模式对象匹配字符串并替换匹配项为空字符串。
下面是 C++、Java 和 Python 的实现代码:
C++ 实现
#include
#include
using namespace std;
string removingUpperCaseCharacters(string str) {
const regex pattern("[A-Z]");
return regex_replace(str, pattern, "");
}
string removingLowerCaseCharacters(string str) {
const regex pattern("[a-z]");
return regex_replace(str, pattern, "");
}
string removingSpecialCharacters(string str) {
const regex pattern("[^A-Za-z0-9]");
return regex_replace(str, pattern, "");
}
string removingNumericCharacters(string str) {
const regex pattern("[0-9]");
return regex_replace(str, pattern, "");
}
string removingNonNumericCharacters(string str) {
const regex pattern("[^0-9]");
return regex_replace(str, pattern, "");
}
int main() {
string str = "GFGgfg123$%";
cout <<"移除大写字符后: " < cout <<"移除小写字符后: " < cout <<"移除特殊字符后: " < cout <<"移除数字字符后: " < cout <<"移除非数字字符后: " < return 0;
}
Java 实现
import java.util.regex.Matcher;
import java.util.regex.Pattern;
class GFG {
public static String removingUpperCaseCharacters(String str) {
String regex = "[A-Z]";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
return matcher.replaceAll("");
}
public static String removingLowerCaseCharacters(String str) {
String regex = "[a-z]";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
return matcher.replaceAll("");
}
public static String removingSpecialCharacters(String str) {
String regex = "[^A-Za-z0-9]";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
return matcher.replaceAll("");
}
public static String removingNumericCharacters(String str) {
String regex = "[0-9]";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
return matcher.replaceAll("");
}
public static String removingNonNumericCharacters(String str) {
String regex = "[^0-9]";
Pattern pattern = Pattern.compile(regex);
Matcher matcher = pattern.matcher(str);
return matcher.replaceAll("");
}
public static void main(String[] args) {
String str = "GFGgfg123$%";
System.out.println("移除大写字符后: " + removingUpperCaseCharacters(str));
System.out.println("移除小写字符后: " + removingLowerCaseCharacters(str));
System.out.println("移除特殊字符后: " + removingSpecialCharacters(str));
System.out.println("移除数字字符后: " + removingNumericCharacters(str));
System.out.println("移除非数字字符后: " + removingNonNumericCharacters(str));
}
}
Python 实现
import re
def removingUpperCaseCharacters(s):
regex = "[A-Z]"
return re.sub(regex, "", s)
def removingLowerCaseCharacters(s):
regex = "[a-z]"
return re.sub(regex, "", s)
def removingSpecialCharacters(s):
regex = "[^A-Za-z0-9]"
return re.sub(regex, "", s)
def removingNumericCharacters(s):
regex = "[0-9]"
return re.sub(regex, "", s)
def removingNonNumericCharacters(s):
regex = "[^0-9]"
return re.sub(regex, "", s)
s = "GFGgfg123$%"
print("移除大写字符后:", removingUpperCaseCharacters(s))
print("移除小写字符后:", removingLowerCaseCharacters(s))
print("移除特殊字符后:", removingSpecialCharacters(s))
print("移除数字字符后:", removingNumericCharacters(s))
print("移除非数字字符后:", removingNonNumericCharacters(s))