当前位置: 开发笔记 > 编程语言 > 正文

NLP入门文本分类|paddle

作者： | 来源：互联网 | 2023-08-23 12:52

文本分类：自然语言处理领域中的一个经典问题，文本分类是利用电脑对文本按照一定的分类体系进行自动分类标记。数据来源：从网站上爬取56821条

文本分类&＃xff1a;自然语言处理领域中的一个经典问题&＃xff0c;文本分类是利用电脑对文本按照一定的分类体系进行自动分类标记。

数据来源&＃xff1a;从网站上爬取56821条数据中文新闻摘要
数据内容&＃xff1a;包含10种类别&＃xff0c;国际、文化、娱乐、体育、财经、汽车、教育、科技、房产、证券

严格意义上来说这个新闻的数据集不是太好&＃xff0c;每个类目的新闻数目不是一致的&＃xff0c;一个好的数据集对于各个类别分布是比较均匀的。

1、准备数据:

数据进行预处理创建数据集和数据字典创建数据读取器train_reader 和test_reader
2、配置网络

定义网络

定义损失函数&＃xff1a;交叉熵损失函数

定义优化算法&＃xff1a;选择优化器&＃xff0c;adam&＃xff0c;SGD等等

3、训练网络

需要对网络进行训练&＃xff0c;丢入训练集&＃xff0c;去训练我们的模型

4、模型评估
5、模型预测

# 查看当前挂载的数据集目录 !ls /home/aistudio/data/ #将数据移动到 /home/aistudio/data/ 目录下 !cp data/data6825/news_classify_data.txt data/

data6825

# 导入必要的包 import os #系统操作包 from multiprocessing import cpu_count import numpy as np #计算包 import shutil import paddle #paddle的工具包 import paddle.fluid as fluid

# 创建数据集和数据字典data_root_path&＃61;&＃39;/home/aistudio/data/&＃39; #选择数据路径 #对我们读取出来的路径创建数据词典 def create_data_list(data_root_path):with open(data_root_path &＃43; &＃39;test_list.txt&＃39;, &＃39;w&＃39;) as f:passwith open(data_root_path &＃43; &＃39;train_list.txt&＃39;, &＃39;w&＃39;) as f:passwith open(os.path.join(data_root_path, &＃39;dict_txt.txt&＃39;), &＃39;r&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f_data:dict_txt &＃61; eval(f_data.readlines()[0])with open(os.path.join(data_root_path, &＃39;news_classify_data.txt&＃39;), &＃39;r&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f_data:lines &＃61; f_data.readlines()i &＃61; 0for line in lines:title &＃61; line.split(&＃39;_!_&＃39;)[-1].replace(&＃39;\n&＃39;, &＃39;&＃39;)l &＃61; line.split(&＃39;_!_&＃39;)[1]labs &＃61; ""if i % 10 &＃61;&＃61; 0:with open(os.path.join(data_root_path, &＃39;test_list.txt&＃39;), &＃39;a&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f_test:for s in title:lab &＃61; str(dict_txt[s])labs &＃61; labs &＃43; lab &＃43; &＃39;,&＃39;labs &＃61; labs[:-1]labs &＃61; labs &＃43; &＃39;\t&＃39; &＃43; l &＃43; &＃39;\n&＃39;f_test.write(labs)else:with open(os.path.join(data_root_path, &＃39;train_list.txt&＃39;), &＃39;a&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f_train:for s in title:lab &＃61; str(dict_txt[s])labs &＃61; labs &＃43; lab &＃43; &＃39;,&＃39;labs &＃61; labs[:-1]labs &＃61; labs &＃43; &＃39;\t&＃39; &＃43; l &＃43; &＃39;\n&＃39;f_train.write(labs)i &＃43;&＃61; 1print("数据列表生成完成&＃xff01;")# 把下载得数据生成一个字典 #将每一个文本每一个子映射到词典得到一个数字ID&＃xff0c;因为输入到模型里面的不是汉字&＃xff0c;是一个数字ID def create_dict(data_path, dict_path):dict_set &＃61; set()# 读取已经下载得数据with open(data_path, &＃39;r&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f:lines &＃61; f.readlines()# 把数据生成一个元组for line in lines:title &＃61; line.split(&＃39;_!_&＃39;)[-1].replace(&＃39;\n&＃39;, &＃39;&＃39;)for s in title:dict_set.add(s)# 把元组转换成字典&＃xff0c;一个字对应一个数字dict_list &＃61; []i &＃61; 0for s in dict_set:dict_list.append([s, i])i &＃43;&＃61; 1# 添加未知字符dict_txt &＃61; dict(dict_list)end_dict &＃61; {"": i}dict_txt.update(end_dict)# 把这些字典保存到本地中with open(dict_path, &＃39;w&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f:f.write(str(dict_txt))print("数据字典生成完成&＃xff01;")# 获取字典的长度 def get_dict_len(dict_path):with open(dict_path, &＃39;r&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f:line &＃61; eval(f.readlines()[0])return len(line.keys())if __name__ &＃61;&＃61; &＃39;__main__&＃39;:# 把生产的数据列表都放在自己的总类别文件夹中data_root_path &＃61; "/home/aistudio/data/"data_path &＃61; os.path.join(data_root_path, &＃39;news_classify_data.txt&＃39;)dict_path &＃61; os.path.join(data_root_path, "dict_txt.txt")# 创建数据字典create_dict(data_path, dict_path)# 创建数据列表create_data_list(data_root_path)

数据字典生成完成&＃xff01; 数据列表生成完成&＃xff01;

创建好的字典&＃xff1a;每一个字会对应一个数字ID

创建好的数据列表&＃xff1a;文本转化为序列化的表示

每一行代表一句新闻&＃xff0c;就是一个样本。

paddle.reader.xmap_readers():通过多线程方式&＃xff0c;通过用户自定义的映射器mapper来映射reader返回的样本&＃xff08;到输出队列)。

# 创建数据读取器train_reader 和test_reader # 训练/测试数据的预处理 def data_mapper(sample):data, label &＃61; sampledata &＃61; [int(data) for data in data.split(&＃39;,&＃39;)]return data, int(label)# 创建数据读取器train_reader def train_reader(train_list_path):def reader():with open(train_list_path, &＃39;r&＃39;) as f:lines &＃61; f.readlines()# 打乱数据np.random.shuffle(lines)# 开始获取每张图像和标签for line in lines:data, label &＃61; line.split(&＃39;\t&＃39;)yield data, labelreturn paddle.reader.xmap_readers(data_mapper, reader, cpu_count(), 1024) # 创建数据读取器test_reader def test_reader(test_list_path):def reader():with open(test_list_path, &＃39;r&＃39;) as f:lines &＃61; f.readlines()for line in lines:data, label &＃61; line.split(&＃39;\t&＃39;)yield data, labelreturn paddle.reader.xmap_readers(data_mapper, reader, cpu_count(), 1024)

至此&＃xff0c;数据准备工作已经完成了。

卷积神经网络&＃xff08;Convolutional Neural Networks, CNN&＃xff09;

输入词向量序列&＃xff0c;产生一个特征图&＃xff08;feature map&＃xff09;&＃xff0c;对特征图采用时间维度上的最大池化&＃xff08;max pooling over time&＃xff09;操作得到此卷积核对应的整句话的特征&＃xff0c;最后&＃xff0c;将所有卷积核得到的特征拼接起来即为文本的定长向量表示&＃xff0c;对于文本分类问题&＃xff0c;将其连接至softmax即构建出完整的模型。

在实际应用中&＃xff0c;我们会使用多个卷积核来处理句子&＃xff0c;窗口大小相同的卷积核堆叠起来形成一个矩阵&＃xff0c;这样可以更高效的完成运算。

另外&＃xff0c;我们也可使用窗口大小不同的卷积核来处理句子.

# 创建CNN网络def CNN_net(data,dict_dim, class_dim&＃61;10, emb_dim&＃61;128, hid_dim&＃61;128,hid_dim2&＃61;98):emb &＃61; fluid.layers.embedding(input&＃61;data,#进模型之前需要得到一个emb词嵌入&＃xff0c;得到一个矩阵的编码size&＃61;[dict_dim, emb_dim])conv_3 &＃61; fluid.nets.sequence_conv_pool(input&＃61;emb,num_filters&＃61;hid_dim,filter_size&＃61;3,#卷积核act&＃61;"tanh",pool_type&＃61;"sqrt")conv_4 &＃61; fluid.nets.sequence_conv_pool(input&＃61;emb,num_filters&＃61;hid_dim2,filter_size&＃61;4,act&＃61;"tanh",pool_type&＃61;"sqrt")output &＃61; fluid.layers.fc(input&＃61;[conv_3, conv_4], size&＃61;class_dim, act&＃61;&＃39;softmax&＃39;)#经过全连接层&＃xff0c;将两个cnn的结果拼接起来return output#1x10的概率分布的矩阵&＃xff0c;10个数&＃xff0c;概率最大的数就是当前模型的预测结果

# 定义输入数据&＃xff0c; lod_level不为0指定输入数据为序列数据 words &＃61; fluid.layers.data(name&＃61;&＃39;words&＃39;, shape&＃61;[1], dtype&＃61;&＃39;int64&＃39;, lod_level&＃61;1)#lod_level 处理变长序列&＃xff0c;paddle官网的文档中LoDtensor lodlayer的索引定长的数据不需要考虑这个问题 label &＃61; fluid.layers.data(name&＃61;&＃39;label&＃39;, shape&＃61;[1], dtype&＃61;&＃39;int64&＃39;) # 获取数据字典长度 dict_dim &＃61; get_dict_len(&＃39;/home/aistudio/data/dict_txt.txt&＃39;) # 获取卷积神经网络 # model &＃61; CNN_net(words, dict_dim, 15) # 获取分类器 model &＃61; CNN_net(words, dict_dim) # 获取损失函数和准确率 cost &＃61; fluid.layers.cross_entropy(input&＃61;model, label&＃61;label)#损失函数 avg_cost &＃61; fluid.layers.mean(cost)#每次训练都是一个batch&＃xff0c;求一个平均 acc &＃61; fluid.layers.accuracy(input&＃61;model, label&＃61;label)# 获取预测程序 test_program &＃61; fluid.default_main_program().clone(for_test&＃61;True)#clone克隆函数# 定义优化方法 optimizer &＃61; fluid.optimizer.AdagradOptimizer(learning_rate&＃61;0.002) opt &＃61; optimizer.minimize(avg_cost)# 创建一个执行器&＃xff0c;CPU训练速度比较慢 #place &＃61; fluid.CPUPlace() place &＃61; fluid.CUDAPlace(0)#GPU执行 exe &＃61; fluid.Executor(place) # 进行参数初始化 exe.run(fluid.default_startup_program())

[]

# 获取训练数据读取器和测试数据读取器 train_reader &＃61; paddle.batch(reader&＃61;train_reader(&＃39;/home/aistudio/data/train_list.txt&＃39;), batch_size&＃61;128) test_reader &＃61; paddle.batch(reader&＃61;test_reader(&＃39;/home/aistudio/data/test_list.txt&＃39;), batch_size&＃61;128)

# 定义数据映射器 feeder &＃61; fluid.DataFeeder(place&＃61;place, feed_list&＃61;[words, label])

EPOCH_NUM&＃61;20#迭代次数 model_save_dir &＃61; &＃39;/home/aistudio/work/infer_model/&＃39; # 开始训练for pass_id in range(EPOCH_NUM):# 进行训练for batch_id, data in enumerate(train_reader()):train_cost, train_acc &＃61; exe.run(program&＃61;fluid.default_main_program(),feed&＃61;feeder.feed(data),fetch_list&＃61;[avg_cost, acc])if batch_id % 100 &＃61;&＃61; 0:#每执行100次&＃xff0c;打印一次print(&＃39;Pass:%d, Batch:%d, Cost:%0.5f, Acc:%0.5f&＃39; % (pass_id, batch_id, train_cost[0], train_acc[0]))# 进行测试&＃xff0c;读入一批陌生的数据&＃xff0c;模型没有见过的数据&＃xff0c;test_costs &＃61; []test_accs &＃61; []for batch_id, data in enumerate(test_reader()):test_cost, test_acc &＃61; exe.run(program&＃61;test_program,feed&＃61;feeder.feed(data),fetch_list&＃61;[avg_cost, acc])test_costs.append(test_cost[0])test_accs.append(test_acc[0])# 计算平均预测损失在和准确率test_cost &＃61; (sum(test_costs) / len(test_costs))test_acc &＃61; (sum(test_accs) / len(test_accs))print(&＃39;Test:%d, Cost:%0.5f, ACC:%0.5f&＃39; % (pass_id, test_cost, test_acc))# 保存预测模型&＃xff0c;可以考虑将这段保存模型的代码放到for循环里面&＃xff0c;将每一轮的模型都保存起来 if not os.path.exists(model_save_dir): os.makedirs(model_save_dir) fluid.io.save_inference_model(model_save_dir, feeded_var_names&＃61;[words.name], target_vars&＃61;[model], executor&＃61;exe) print(&＃39;训练模型保存完成&＃xff01;&＃39;)

Pass:0, Batch:0, Cost:2.30681, Acc:0.09375 Pass:0, Batch:100, Cost:0.99743, Acc:0.68750 Pass:0, Batch:200, Cost:0.89360, Acc:0.76562 Pass:0, Batch:300, Cost:0.92248, Acc:0.70312 Test:0, Cost:0.81883, ACC:0.73921 Pass:1, Batch:0, Cost:0.90457, Acc:0.67969 Pass:1, Batch:100, Cost:0.67305, Acc:0.83594 Pass:1, Batch:200, Cost:0.63098, Acc:0.80469 Pass:1, Batch:300, Cost:0.76019, Acc:0.77344 Test:1, Cost:0.75819, ACC:0.75909 Pass:2, Batch:0, Cost:0.73232, Acc:0.76562 Pass:2, Batch:100, Cost:0.70476, Acc:0.77344 Pass:2, Batch:200, Cost:0.71542, Acc:0.75781 Pass:2, Batch:300, Cost:0.63258, Acc:0.78125 Test:2, Cost:0.73717, ACC:0.76160 Pass:3, Batch:0, Cost:0.56025, Acc:0.82812 Pass:3, Batch:100, Cost:0.48580, Acc:0.86719 Pass:3, Batch:200, Cost:0.54991, Acc:0.84375 Pass:3, Batch:300, Cost:0.67272, Acc:0.78906 Test:3, Cost:0.72726, ACC:0.76317 Pass:4, Batch:0, Cost:0.53660, Acc:0.82812 Pass:4, Batch:100, Cost:0.73550, Acc:0.78906 Pass:4, Batch:200, Cost:0.53774, Acc:0.80469 Pass:4, Batch:300, Cost:0.46155, Acc:0.85156 Test:4, Cost:0.72185, ACC:0.76169 Pass:5, Batch:0, Cost:0.65421, Acc:0.78906 Pass:5, Batch:100, Cost:0.59889, Acc:0.80469 Pass:5, Batch:200, Cost:0.71301, Acc:0.79688 Pass:5, Batch:300, Cost:0.69682, Acc:0.81250 Test:5, Cost:0.71626, ACC:0.76525 Pass:6, Batch:0, Cost:0.72434, Acc:0.75000 Pass:6, Batch:100, Cost:0.59109, Acc:0.77344 Pass:6, Batch:200, Cost:0.48783, Acc:0.81250 Pass:6, Batch:300, Cost:0.57463, Acc:0.81250 Test:6, Cost:0.71520, ACC:0.76447 Pass:7, Batch:0, Cost:0.50502, Acc:0.84375 Pass:7, Batch:100, Cost:0.62133, Acc:0.79688 Pass:7, Batch:200, Cost:0.68593, Acc:0.76562 Pass:7, Batch:300, Cost:0.55528, Acc:0.80469 Test:7, Cost:0.71300, ACC:0.76769 Pass:8, Batch:0, Cost:0.60046, Acc:0.76562 Pass:8, Batch:100, Cost:0.47617, Acc:0.82812 Pass:8, Batch:200, Cost:0.59591, Acc:0.79688 Pass:8, Batch:300, Cost:0.66050, Acc:0.76562 Test:8, Cost:0.71475, ACC:0.76594 Pass:9, Batch:0, Cost:0.40968, Acc:0.84375 Pass:9, Batch:100, Cost:0.50980, Acc:0.81250 Pass:9, Batch:200, Cost:0.55923, Acc:0.85156 Pass:9, Batch:300, Cost:0.42255, Acc:0.87500 Test:9, Cost:0.71282, ACC:0.76717 Pass:10, Batch:0, Cost:0.44147, Acc:0.88281 Pass:10, Batch:100, Cost:0.55140, Acc:0.85938 Pass:10, Batch:200, Cost:0.50935, Acc:0.84375 Pass:10, Batch:300, Cost:0.56366, Acc:0.83594 Test:10, Cost:0.71520, ACC:0.76586 Pass:11, Batch:0, Cost:0.55133, Acc:0.79688 Pass:11, Batch:100, Cost:0.45308, Acc:0.80469 Pass:11, Batch:200, Cost:0.63471, Acc:0.78125 Pass:11, Batch:300, Cost:0.52810, Acc:0.80469 Test:11, Cost:0.71511, ACC:0.76673 Pass:12, Batch:0, Cost:0.51947, Acc:0.83594 Pass:12, Batch:100, Cost:0.63086, Acc:0.80469 Pass:12, Batch:200, Cost:0.57166, Acc:0.82812 Pass:12, Batch:300, Cost:0.59658, Acc:0.75781 Test:12, Cost:0.71533, ACC:0.76673 Pass:13, Batch:0, Cost:0.34512, Acc:0.89062 Pass:13, Batch:100, Cost:0.47249, Acc:0.82812 Pass:13, Batch:200, Cost:0.51224, Acc:0.85156 Pass:13, Batch:300, Cost:0.45350, Acc:0.84375 Test:13, Cost:0.71736, ACC:0.76647 Pass:14, Batch:0, Cost:0.45494, Acc:0.85156 Pass:14, Batch:100, Cost:0.68085, Acc:0.78125 Pass:14, Batch:200, Cost:0.48124, Acc:0.83594 Pass:14, Batch:300, Cost:0.47296, Acc:0.85938 Test:14, Cost:0.71745, ACC:0.76760 Pass:15, Batch:0, Cost:0.73750, Acc:0.77344 Pass:15, Batch:100, Cost:0.55038, Acc:0.83594 Pass:15, Batch:200, Cost:0.59775, Acc:0.74219 Pass:15, Batch:300, Cost:0.47932, Acc:0.82812 Test:15, Cost:0.72163, ACC:0.76673 Pass:16, Batch:0, Cost:0.31890, Acc:0.90625 Pass:16, Batch:100, Cost:0.38017, Acc:0.85156 Pass:16, Batch:200, Cost:0.57517, Acc:0.79688 Pass:16, Batch:300, Cost:0.44878, Acc:0.87500 Test:16, Cost:0.72158, ACC:0.76786 Pass:17, Batch:0, Cost:0.43048, Acc:0.88281 Pass:17, Batch:100, Cost:0.47145, Acc:0.82031 Pass:17, Batch:200, Cost:0.47934, Acc:0.82812 Pass:17, Batch:300, Cost:0.36709, Acc:0.89062 Test:17, Cost:0.72381, ACC:0.76647 Pass:18, Batch:0, Cost:0.35568, Acc:0.88281 Pass:18, Batch:100, Cost:0.61057, Acc:0.82031 Pass:18, Batch:200, Cost:0.40052, Acc:0.88281 Pass:18, Batch:300, Cost:0.45469, Acc:0.83594 Test:18, Cost:0.72549, ACC:0.76743 Pass:19, Batch:0, Cost:0.41658, Acc:0.86719 Pass:19, Batch:100, Cost:0.48703, Acc:0.86719 Pass:19, Batch:200, Cost:0.47010, Acc:0.83594 Pass:19, Batch:300, Cost:0.35333, Acc:0.84375 Test:19, Cost:0.72887, ACC:0.76690 训练模型保存完成&＃xff01;

# 用训练好的模型进行预测并输出预测结果 # 创建执行器 #place &＃61; fluid.CPUPlace() place &＃61; fluid.CUDAPlace(0) exe &＃61; fluid.Executor(place) exe.run(fluid.default_startup_program())save_path &＃61; &＃39;/home/aistudio/work/infer_model/&＃39;# 从模型中获取预测程序、输入数据名称列表、分类器 [infer_program, feeded_var_names, target_var] &＃61; fluid.io.load_inference_model(dirname&＃61;save_path, executor&＃61;exe)# 获取数据 def get_data(sentence):# 读取数据字典with open(&＃39;/home/aistudio/data/dict_txt.txt&＃39;, &＃39;r&＃39;, encoding&＃61;&＃39;utf-8&＃39;) as f_data:dict_txt &＃61; eval(f_data.readlines()[0])dict_txt &＃61; dict(dict_txt)# 把字符串数据转换成列表数据keys &＃61; dict_txt.keys()data &＃61; []for s in sentence:# 判断是否存在未知字符if not s in keys:s &＃61; &＃39;&＃39;data.append(int(dict_txt[s]))return datadata &＃61; [] # 获取图片数据 data1 &＃61; get_data(&＃39;在获得诺贝尔文学奖7年之后&＃xff0c;莫言15日晚间在山西汾阳贾家庄如是说&＃39;) data2 &＃61; get_data(&＃39;综合“今日美国”、《世界日报》等当地媒体报道&＃xff0c;芝加哥河滨警察局表示&＃xff0c;&＃39;) data.append(data1) data.append(data2)# 获取每句话的单词数量 base_shape &＃61; [[len(c) for c in data]]# 生成预测数据 tensor_words &＃61; fluid.create_lod_tensor(data, base_shape, place)# 执行预测 result &＃61; exe.run(program&＃61;infer_program,feed&＃61;{feeded_var_names[0]: tensor_words},fetch_list&＃61;target_var)# 分类名称 names &＃61; [ &＃39;文化&＃39;, &＃39;娱乐&＃39;, &＃39;体育&＃39;, &＃39;财经&＃39;,&＃39;房产&＃39;, &＃39;汽车&＃39;, &＃39;教育&＃39;, &＃39;科技&＃39;, &＃39;国际&＃39;, &＃39;证券&＃39;]# 获取结果概率最大的label for i in range(len(data)):lab &＃61; np.argsort(result)[0][i][-1]#10个概率值&＃xff0c;对其进行排序&＃xff0c;选择最大的那个概率&＃xff0c;(-1)print(&＃39;预测结果标签为&＃xff1a;%d&＃xff0c; 名称为&＃xff1a;%s&＃xff0c; 概率为&＃xff1a;%f&＃39; % (lab, names[lab], result[0][i][lab]))

预测结果标签为&＃xff1a;0&＃xff0c; 名称为&＃xff1a;文化&＃xff0c; 概率为&＃xff1a;0.949490 预测结果标签为&＃xff1a;8&＃xff0c; 名称为&＃xff1a;国际&＃xff0c; 概率为&＃xff1a;0.472569

推荐阅读

join
进程管理：并发、并行、子进程启动与进程池应用

本文介绍了进程的基本概念及其在操作系统中的重要性，探讨了进程与程序的区别，以及如何通过多进程实现并发和并行。文章还详细讲解了Python中的multiprocessing模块，包括Process类的使用方法、进程间的同步与异步调用、阻塞与非阻塞操作，并通过实例演示了进程池的应用。 ... [详细]

蜡笔小新 2024-11-25 16:40:13
join
构建Python自助式数据查询系统

在现代数据密集型环境中，业务团队频繁需要从数据库中提取特定信息。为了提高效率并减少IT部门的工作负担，本文探讨了一种利用Python语言实现的自助数据查询工具的设计与实现。 ... [详细]

蜡笔小新 2024-11-25 17:55:33
sum
Java线程停止策略详解

本文探讨了Java中有效停止线程的多种方法，包括使用标志位、中断机制及处理阻塞I/O操作等，旨在帮助开发者避免使用已废弃的危险方法，确保线程安全和程序稳定性。 ... [详细]

蜡笔小新 2024-11-25 19:16:54
sum
Python脚本实现批量删除多种类型文件的扩展名

本文介绍了一个Python脚本，用于批量处理并移除指定目录下不同格式文件（如png、jpg、xml、json、txt、gt等）的文件扩展名。该方法通过递归遍历文件夹中的所有文件，并对每个文件执行重命名操作。 ... [详细]

蜡笔小新 2024-11-25 16:01:13
sum
解决MenuItem中通过app:actionLayout使用Switch时出现的空指针异常问题

在Android应用开发中，当在MenuItem中通过app:actionLayout属性使用Switch控件时，可能会遇到空指针异常的问题。本文将探讨该问题的原因及解决方案。 ... [详细]

蜡笔小新 2024-11-25 21:37:06
sum
深入解析C++ Atomic编程中的内存顺序

在多线程环境中，为了防止多个线程同时修改同一数据导致的竞争条件，通常会使用内核级同步对象，如事件、互斥锁和信号量等。然而，这些方法往往伴随着高昂的上下文切换成本。本文将探讨如何利用C++11中的原子操作和内存顺序来优化多线程编程，减少不必要的开销。 ... [详细]

蜡笔小新 2024-11-25 15:41:01
spring
SpringBoot底层注解用法及原理

2.1、组件添加1、Configuration基本使用Full模式与Lite模式示例最佳实战配置类组件之间无依赖关系用Lite模式加速容器启动过程，减少判断配置类组 ... [详细]

蜡笔小新 2024-11-25 09:48:01
hash
Python - 合并具有相同值的字典键

本文介绍如何使用Python编程语言合并字典中具有相同集合值的键，并提供两种实现方法。 ... [详细]

蜡笔小新 2024-11-26 16:26:06
buffer
深入浅出：Hadoop架构详解

Hadoop作为大数据处理的核心技术，包含了一系列组件如HDFS（分布式文件系统）、YARN（资源管理框架）和MapReduce（并行计算模型）。本文将通过实例解析Hadoop的工作原理及其优势。 ... [详细]

蜡笔小新 2024-11-26 13:26:40
buffer
深入理解Java中的OutputStream与InputStream及序列化实现

本文详细解析了Java中流的概念，特别是OutputStream和InputStream的区别，并通过实际案例介绍了如何实现Java对象的序列化。文章不仅解释了流的基本概念，还探讨了序列化的重要性和具体实现步骤。 ... [详细]

蜡笔小新 2024-11-26 12:15:58
express
深入解析Spring AOP注解及其应用

本文详细介绍了Spring AOP注解的基本概念及其实现方式，并通过实例演示了如何在项目中使用这些注解进行面向切面的编程。旨在帮助开发者更好地理解和运用Spring AOP功能。 ... [详细]

蜡笔小新 2024-11-26 11:56:03
char
深入解析 cache-content-type 和 mime-types 的应用与优化

本文介绍了两个重要的Node.js库——cache-content-type和mime-types，它们在处理HTTP响应头时非常有用。cache-content-type是基于mime-types构建的，并且实现了缓存机制以提高性能。 ... [详细]

蜡笔小新 2024-11-25 16:51:02
sum
利用 Python 和 Scapy 实施 DNS 欺骗攻击的技术解析

本文详细介绍了如何使用 Python 编程语言中的 Scapy 库执行 DNS 欺骗攻击，包括必要的软件安装、攻击流程及代码示例。 ... [详细]

蜡笔小新 2024-11-25 15:52:30
数组
Objective-C 面向对象编程：类的深入解析

本文详细介绍了Objective-C中的面向对象编程概念，重点探讨了类的定义、方法的实现、对象的创建与销毁等内容，旨在帮助开发者更好地理解和应用Objective-C的面向对象特性。 ... [详细]

蜡笔小新 2024-11-25 13:15:10
hash
Java 实体对象转 Map 工具类实现

本文介绍了一个将 Java 实体对象转换为 Map 的工具类，通过反射机制获取实体类的字段并将其值映射到 Map 中，适用于需要将对象数据结构化处理的场景。 ... [详细]

蜡笔小新 2024-11-25 12:24:09

Tags | 热门标签

RankList | 热门文章