当前位置: 开发笔记 > 编程语言 > 正文

2020华为软挑总结

作者：挽木城祠_ | 来源：互联网 | 2023-08-23 19:53

文章目录一、热身赛编程闯关：评价标准：问题分析二、初赛问题描述评价标准：问题分析思路一：思路二：思路三

文章目录

- 一、热身赛
- - - 编程闯关：
    - 评价标准：
    - 问题分析
- 二、初赛
- - - 问题描述
    - 评价标准：
    - 问题分析
    - - 思路一：
        思路二：
        思路三：
        针对思路三的提速：
    - 最终结果：
- 三、code记录
- 初赛两篇不错的总结
- 三、复活赛
- - - 线上结果：
    - 算法思路：
- 四、复活赛其他组共享代码
- 五、民间数据集

一、热身赛

编程闯关：

用户贷款风险预测。要求参赛者建立准确的风控模型，预测用户是否会逾期还款。

评价标准：

速度为王，只要速度够快，准确率可以忽略不计。
在这里插入图片描述

问题分析

二分类问题：采用logistic回归算法对用户类型进行分类。
在此分类算法上依次采用L2正则化、影子滑动平均、学习衰减率、随机梯度下降、自适应梯度下降等优化策略。以提高收敛速度，保证泛化能力。
最终结果:不堪入目。
在这里插入图片描述

二、初赛

问题描述

通过金融风控的资金流水分析，可有效识别循环转账，辅助公安挖掘洗钱组织，帮助银行预防信用卡诈骗。基于给定的资金流水，检测并输出指定约束条件的所有循环转账。

评价标准：

在保证准确率的基础之上，速度为王！
结果一定要100%正确，否则无法参与评分。

问题分析

在有向图结构中找出所有长度在[3,7]的简单环，并按规则输出。详细规则 gitee链接-coding记录 中有记录。

思路一：

采用vector储存所有顶点信息，list存储所有边结构信息。采用深度优先搜索+破环边结构的方法搜索所有简单环。在官方给的56环数据中，该思路能正确运行；但在线上运行失败。故此路不通。

思路二：

先采用tarjan算法找出图中所有强连通子图；其后在各强连通子图采用johnson算法中寻找所有简单环。
此算法适用于强连通子图比较多的图结构。大赛线上表现一般。
推荐一位小哥的视频，该视频很好地讲诉了该算法的思路。
johnson找环算法视频

思路三：

暴力找环法。依次针对每个节点递归7层结构，只找以此节点为开头的环。该法能确保结果正确，但存在大量重复查找的过程。

针对思路三的提速：

提速一：改变图的存储结构，使用二维数组储存邻接表结构的图，提高访问速度。针对文件的输入，有两种方式。
一种是有序的图结构（按id大小排序）：采用set记录所有顶点，并按顶点id大小排序。采用unordered_multimap储存所有边结构。采用unordered_map绑定顶点id与索引号。最终使得图结构按 ID升序排列。顶点ID+边顶点索引号。
一种是无序结构：采用unordered_map绑定顶点与其索引号，将边结构顶点的索引号（按查找的方式，从unordered_map对象中获得。顶点ID顺序与其添加顺序有关。顶点ID+边顶点索引号。
提速二：每个起始结点只找比自己id号大的环结构，这样可保证输出的排序规则。
提速三：采用四线程，将数据分成4部分分别查找，最终将所有结果综合排序。

//定义一个计时器类 class Timer { public:Timer() : beg_(clock_::now()) {}void reset() { beg_ = clock_::now(); }double elapsed() const {return std::chrono::duration_cast<second_>(clock_::now() - beg_).count();}void out(std::string message = "") {double t = elapsed();std::cout << message << " elasped time:" << t << "s" << std::endl;reset();} private:typedef std::chrono::high_resolution_clock clock_;typedef std::chrono::duration<double, std::ratio<1> > second_;std::chrono::time_point<clock_> beg_; };Timer t; t.out("Tatal");//开启线程的两种方式 #include #include //#include #include//多线程找环//std::future m1 = std::async(FFCC1, std::ref(g)); //线程一//std::thread t1(FFCC1, std::ref(g)); //线程一//std::thread t2(FFCC2, std::ref(g)); //线程二//std::thread t3(FFCC3, std::ref(g)); //线程三std::future <void> m1 = std::async(FFCC1, std::ref(g)); //线程一std::future <void> m2 = std::async(FFCC2, std::ref(g)); //线程一std::future <void> m3 = std::async(FFCC3, std::ref(g)); //线程一g.FC(); //主线程m1.wait();//线程一m2.wait();//线程一m3.wait();//线程一//t1.join(); //线程一//t2.join(); //线程二//t3.join(); //线程三

提速四：一个剪枝的方法。递归消除所有出度为0的结点。

最终结果：

效果一般、牛人太多
团队最优成绩：4.9s
个人最好成绩：5.1s

三、code记录

gitee链接-coding记录

//编译命令 g++ -O3 baseline.cpp -o test -lpthread //执行命令、并分析用时 perf stat ./test

推荐操纵服务器的两款不错的工具：
往服务器传送文件：WinSCP、Xftp6
命令行操纵服务器：Xshell6、putty
分享一个能找出所有环的baseline.cpp代码（待优化）。比赛结束了我才发现。。。。。
baseline.cpp

初赛两篇不错的总结

知乎大佬：图中所有简单环查找算法研究总结
知乎大佬删除了好多内容，可惜了。
CSDN大佬：深度遍历暴力求解所有简单环

三、复活赛

与初赛的差异：

转账记录 28W -> 200W
环个数 2914186 -> 2000W
转账金额比例约束：如[A,B,X]，[B,C,Y]，要满足0.2 <= Y/X <= 3

算法策略：负三步标记剪枝，正七步找环，其中后三步只在有标记的结点中寻找。
优化策略：mmap读入，写出；双vector存图改为动态二维数组存图；四线程交替分配数据。递归改七层迭代循环。

线上结果：

算法思路：

建图部分：（1936万环，1s）
1、mmap映射读入，将数据暂存在一个xxxx*3的二维数组中，同时vector记录所有第一个顶点。
2、使用sort为vector排序；使用unique去除重复元素。
3、unordered_map绑定顶点id值与其序号，按顺序依次加入各顶点信息。
4、借组unordered_map和xxxx*3二维数组绑定各边与顶点。建立子图与父图（正向图与反向图）。
5、正向图需对各边顶点序号排序。

找环部分：（1936万环，14s）（直接用动态二维数组可达8s，但对菊花图易造成空间不够。）
a、针对所有顶点均运行一遍找环程序。顶点分配原则为四线程交替分配。有更好的分配方法，（不要预先给各个线程分配任务，这样可能导致任务分配不均匀。使用动态分配策略：维护一个队列，如果一个线程完成了一个任务，那么就去队列里去取下一个任务。），碍于时间有限，未能实现。
b、每次找环，均只找以该顶点为起点的环。

1、反向迭代三层，标记该顶点的负三邻域。迭代时只遍历结点号比自己大的结点。
2、正向迭代前四层正常逻辑，后三层只遍历有标记的结点。
3、找到环时将环变成字符串类型。且3、4、5、6、7各环存在不同的容器中，以保证环有序。

文件写入部分：（1936万环，0.8s）
1、建立mmap映射。
2、各环容器，各线程交替输出。可保证输出有序。

代码可维护性差，仅供参考。
方案一code

方案二code

其中方案一和二，算法思路一样。但实现方式略有不同。

四、复活赛其他组共享代码

1、ddd2020大佬
2、京津东北赛区 A 榜 rank1
3、粤港澳复赛A榜第2
4、2020华为软挑初赛上合赛区第一，复赛A榜总榜第一，B榜GG
5、2020华为软挑初赛武长赛区第一，复赛武长赛区A榜第二解决方案
6、最终成绩杭厦赛区第6

五、民间数据集

民间数据集
知乎评价

推荐阅读

merge
教你从写一个迷你koarouter到阅读koarouter源码

本打算教一步步实现koa-router，因为要解释的太多了，所以先简化成mini版本，从实现部分功能到阅读源码，希望能让你好理解一些。希望你之前有读过koa源码，没有的话，给你链接 ... [详细]

蜡笔小新 2024-11-17 13:09:46
io
Java 网站开发指南

本文详细介绍了 Java 网站开发的相关资源和步骤，包括常用网站、开发环境和框架选择。 ... [详细]

蜡笔小新 2024-11-14 22:39:58
io
深入解析 C++ 中的 String 和 Vector

本文详细介绍了 C++ 编程语言中 String 和 Vector 的使用方法及特性，旨在帮助开发者更好地理解和应用这两个重要的容器。 ... [详细]

蜡笔小新 2024-11-22 17:01:09
io
深入Luat OS：C与Lua混合编程指南

本文详细介绍了在Luat OS中如何实现C与Lua的混合编程，包括在C环境中运行Lua脚本、封装可被Lua调用的C语言库，以及C与Lua之间的数据交互方法。 ... [详细]

蜡笔小新 2024-11-22 15:52:23
io
MySQL InnoDB 存储引擎索引机制详解

本文深入探讨了MySQL InnoDB存储引擎中的索引技术，包括索引的基本概念、数据结构与算法、B+树的特性及其在数据库中的应用，以及索引优化策略。 ... [详细]

蜡笔小新 2024-11-21 12:41:51
command
UE4 中的距离场技术详解

本文将深入探讨 Unreal Engine 4 (UE4) 中的距离场技术，包括其原理、实现细节以及在渲染中的应用。距离场技术在现代游戏引擎中用于提高光照和阴影的效果，尤其是在处理复杂几何形状时。文章将结合具体代码示例，帮助读者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-11-19 18:21:03
io
Java中字符串截取方法详解

本文详细介绍了Java中常用的字符串截取方法及其应用场景，帮助开发者更好地理解和使用这些方法。 ... [详细]

蜡笔小新 2024-11-17 18:10:47
io
PHP函数的工作原理与性能分析

在编程语言中，函数是最基本的组成单元。本文将探讨PHP函数的特点、调用机制以及性能表现，并通过实际测试给出优化建议。 ... [详细]

蜡笔小新 2024-11-16 19:21:45
header
深入解析 Redis 的数据结构与对象系统

Redis 是一个高性能的开源键值存储系统，支持多种数据结构。本文将详细介绍 Redis 中的六种底层数据结构及其在对象系统中的应用，包括字符串对象、列表对象、哈希对象、集合对象和有序集合对象。通过12张图解，帮助读者全面理解 Redis 的数据结构和对象系统。 ... [详细]

蜡笔小新 2024-11-16 17:48:35
io
LeetCode 实战：寻找三数之和为零的组合

给定一个包含 n 个整数的数组，判断该数组中是否存在三个元素 a、b、c，使得 a + b + c = 0。找出所有满足条件且不重复的三元组。 ... [详细]

蜡笔小新 2024-11-15 18:39:48
io
Go从入门到精通系列视频之go编程语言密码学哈希算法（二）

Go从入门到精通系列视频之go编程语言密码学哈希算法（二） ... [详细]

蜡笔小新 2024-11-21 10:55:36
ip
PHP 基础与数据库操作

本文介绍了 PHP 的基本概念、服务器与客户端的工作原理，以及 PHP 如何与数据库交互。同时，还涵盖了常见的数据库操作和安全性问题。 ... [详细]

蜡笔小新 2024-11-17 15:45:08
io
通用代码 js获取URL参数

URL参数格式http:localhos:8080demo?ab&cd&ef匹配参数a对应的表达式为^a([^&]*)&匹配参数b对应的表达式为&b([^&]*)&匹配参数c对应 ... [详细]

蜡笔小新 2024-11-17 10:56:19
io
岭回归及其应用

本文介绍了岭回归的基本原理，并通过Python中的sklearn库实现了岭回归模型。岭回归通过在代价函数中加入L2正则项，有效解决了多重共线性问题。 ... [详细]

蜡笔小新 2024-11-16 06:54:42
io
Go语言中正则表达式的简易应用

本文介绍了Go语言中正则表达式的基本使用方法，并提供了一些实用的示例代码。 ... [详细]

蜡笔小新 2024-11-14 20:27:47

挽木城祠_

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章