热门标签 | HotTags
当前位置:  开发笔记 > 编程语言 > 正文

CCCCGPLTL2005:集合相似度计算的双指针算法优化

两个集合A,B的相似度定义为n(A∩B)/n(A∪B),n()表示集合大小. 给出n(50)个集合,每个集合给出一个大小M(1e4),然后是M个数(1e9) 给出k(2000)次查询,每次查询两个

两个集合A,B的相似度定义为n(A∩B)/n(A∪B),n()表示集合大小.
给出n(50)个集合,每个集合给出一个大小M(1e4),然后是M个数(1e9)
给出k(2000)次查询,每次查询两个集合的相似度.

做这道题之前,stl了解一下;
bool includes()判断一个集合是否为一个集合的子集
set_difference() 返回两个集合的差集合
set_intersection() 返回两个集合的交集
set_symmetric_difference() 返回两个集合的对称差集合
set_union() 返回两个集合的并集
参数均为4个iterator

好了,此题跟set关系不大.
理论上来说2000*1e4是会超时的,但是手写了一个获得交集的方法就过了,pat评测果然6(也许)
注意消除重复的值

获得交集大小使用的是双指针扫描.并集大小由容斥原理可得.

/* LittleFall : Hello! */
#include
#define ll long long
using namespace std;
inline int read();
inline void write(int x);
const int M = 100016;
vector save[64];
int main(void)
{
#ifdef _LITTLEFALL_
freopen("in.txt", "r", stdin);
#endif
//std::cin.sync_with_stdio(false);
int n = read();
for(int i &#61; 1; i <&#61; n; i&#43;&#43;)
{
int m &#61; read();
for(int j &#61; 0; j save[i].push_back(read());
sort(save[i].begin(), save[i].end());
save[i].erase(unique(save[i].begin(), save[i].end()), save[i].end());
}
int k &#61; read();
while(k--)
{
int ta &#61; read(), tb &#61; read();
int ln &#61; 0, lu &#61; save[ta].size() &#43; save[tb].size(); //并数,交数
for(int i &#61; 0, j &#61; 0;
i <(int)save[ta].size() && j <(int)save[tb].size();
i&#43;&#43;, j&#43;&#43;)
{
if(save[ta][i] j--; //i&#43;&#43;
else if(save[ta][i] > save[tb][j])
i--; //j&#43;&#43;
else
ln&#43;&#43;;
}
printf("%.2f%%\n", 100.0 * ln / (lu-ln));
}
return 0;
}
inline int read()
{
int x &#61; 0, f &#61; 1;
char ch &#61; getchar();
while(ch <&#39;0&#39; || ch > &#39;9&#39;)
{
if(ch &#61;&#61; &#39;-&#39;)f &#61; -1;
ch &#61; getchar();
}
while(ch >&#61; &#39;0&#39; && ch <&#61; &#39;9&#39;)
{
x &#61; x * 10 &#43; ch - &#39;0&#39;;
ch &#61; getchar();
}
return x * f;
}
inline void write(int x)
{
if(x <0) putchar(&#39;-&#39;), x &#61; -x;
if(x > 9) write(x / 10);
putchar(x % 10 &#43; &#39;0&#39;);
}

推荐阅读
  • 本题探讨了在大数据结构背景下,如何通过整体二分和CDQ分治等高级算法优化处理复杂的时间序列问题。题目设定包括节点数量、查询次数和权重限制,并详细分析了解决方案中的关键步骤。 ... [详细]
  • 本文探讨了在C++中如何有效地清空输入缓冲区,确保程序只处理最近的输入并丢弃多余的输入。我们将介绍一种不阻塞的方法,并提供一个具体的实现方案。 ... [详细]
  • 树链问题的优化解法:深度优先搜索与质因数分解
    本文介绍了一种通过深度优先搜索(DFS)和质因数分解来解决最长树链问题的方法。我们通过枚举树链上的最大公约数(GCD),将所有节点按其质因子分类,并计算每个类别的最长链,最终求得全局最长链。 ... [详细]
  • 本题来自WC2014,题目编号为BZOJ3435、洛谷P3920和UOJ55。该问题描述了一棵不断生长的带权树及其节点上小精灵之间的友谊关系,要求实时计算每次新增节点后树上所有可能的朋友对数。 ... [详细]
  • 本文介绍如何从字符串中移除大写、小写、特殊、数字和非数字字符,并提供了多种编程语言的实现示例。 ... [详细]
  • 在高并发需求的C++项目中,我们最初选择了JsonCpp进行JSON解析和序列化。然而,在处理大数据量时,JsonCpp频繁抛出异常,尤其是在多线程环境下问题更为突出。通过分析发现,旧版本的JsonCpp存在多线程安全性和性能瓶颈。经过评估,我们最终选择了RapidJSON作为替代方案,并实现了显著的性能提升。 ... [详细]
  • 反向投影技术主要用于在大型输入图像中定位特定的小型模板图像。通过直方图对比,它能够识别出最匹配的区域或点,从而确定模板图像在输入图像中的位置。 ... [详细]
  • JSOI2010 蔬菜庆典:树结构中的无限大权值问题
    本文探讨了 JSOI2010 的蔬菜庆典问题,主要关注如何处理非根非叶子节点的无限大权值情况。通过分析根节点及其子树的特性,提出了有效的解决方案,并详细解释了算法的实现过程。 ... [详细]
  • 主板IO用W83627THG,用VC如何取得CPU温度,系统温度,CPU风扇转速,VBat的电压. ... [详细]
  • 本文探讨了如何通过预处理器开关选择不同的类实现,并解决在特定情况下遇到的链接器错误。 ... [详细]
  • 本文介绍如何利用栈数据结构在C++中判断字符串中的括号是否匹配。通过顺序栈和链栈两种方式实现,并详细解释了算法的核心思想和具体实现步骤。 ... [详细]
  • 本文详细介绍了 org.apache.commons.io.IOCase 类中的 checkCompareTo() 方法,通过多个代码示例展示其在不同场景下的使用方法。 ... [详细]
  • 丽江客栈选择问题
    本文介绍了一道经典的算法题,题目涉及在丽江河边的n家特色客栈中选择住宿方案。两位游客希望住在色调相同的两家客栈,并在晚上选择一家最低消费不超过p元的咖啡店小聚。我们将详细探讨如何计算满足条件的住宿方案总数。 ... [详细]
  • 在尝试使用C# Windows Forms客户端通过SignalR连接到ASP.NET服务器时,遇到了内部服务器错误(500)。本文将详细探讨问题的原因及解决方案。 ... [详细]
  • ElasticSearch 集群监控与优化
    本文详细介绍了如何有效地监控 ElasticSearch 集群,涵盖了关键性能指标、集群健康状况、统计信息以及内存和垃圾回收的监控方法。 ... [详细]
author-avatar
假爱多慌乱
这个家伙很懒,什么也没留下!
PHP1.CN | 中国最专业的PHP中文社区 | DevBox开发工具箱 | json解析格式化 |PHP资讯 | PHP教程 | 数据库技术 | 服务器技术 | 前端开发技术 | PHP框架 | 开发工具 | 在线工具
Copyright © 1998 - 2020 PHP1.CN. All Rights Reserved | 京公网安备 11010802041100号 | 京ICP备19059560号-4 | PHP1.CN 第一PHP社区 版权所有