当前位置: 开发笔记 > 编程语言 > 正文

二分查找（BinarySearch）常见问题解决方法总结

作者：双语的家_352 | 来源：互联网 | 2023-10-16 09:22

缘由今天浏览何登成的技术博客无意中发现了写的blog，二分查找(BinarySearch)需要注意的问题，以及在数据库内核中的实现。随想总结下二分查找的

缘由

今天浏览何登成的技术博客无意中发现了写的blog&＃xff0c;二分查找(Binary Search)需要注意的问题&＃xff0c;以及在数据库内核中的实现。

随想总结下二分查找的常见问题。

问题背景

今年的实习生招聘考试&＃xff0c;我出了一道二分查找(Binary Search)的题目。题目大意如下&＃xff1a;

给定一个升序排列的自然数数组&＃xff0c;数组中包含重复数字&＃xff0c;例如&＃xff1a;[1,2,2,3,4,4,4,5,6,7,7]。

问题&＃xff1a;给定任意自然数&＃xff0c;对数组进行二分查找&＃xff0c;返回数组正确的位置&＃xff0c;给出函数实现。

注&＃xff1a;连续相同的数字&＃xff0c;返回第一个匹配位置还是最后一个匹配位置&＃xff0c;由函数传入参数决定。

在这片博客中作者也详细说明了&＃xff0c;二分查找的重要性&＃xff0c;比如在数据库的内核实现中&＃xff0c;二分查找是一个非常重要的逻辑&＃xff0c;几乎99%以上的

SQL语句(所有索引上的范围扫描/等值查询/Unique查询等)&＃xff0c;都会使用到二分查找进行数据的定位。可以看到二分查找在现实的重要性。

二分查找算法的思想

二分查找法主要是解决在“一堆数中找出指定的数”这类问题。

而想要应用二分查找法&＃xff0c;这“一堆数”必须有一下特征&＃xff1a;

存储在数组中
有序排列

所以如果是用
链表
存储的&＃xff0c;就无法在其上应用
二分查找法
了。

其实二分查找算法的思想很简单&＃xff0c;在《编程珠玑》一书中的描述&＃xff1a;

在一个包含x的数组内&＃xff0c;二分查找通过对范围的跟综来解决问题。开始时&＃xff0c;范围就是整个数组。通过将范围中间的元素

与x比较并丢弃一半范围&＃xff0c;范围就被缩小。这个过程一直持续&＃xff0c;直到在x被发现&＃xff0c;或者那个能够包含t的范围已成为空。

Donald Knuth在他的《Sorting and Searching》一书中指出&＃xff0c;尽管第一个二分查找算法早在1946年就被发表&＃xff0c;但第一个

没有bug的二分查找算法却是在12年后才被发表出来。

注意中间值下标的计算&＃xff0c;如果写成(low&＃43;high)/2&＃xff0c;low&＃43;high可能会溢出&＃xff0c;从而导致数组访问出错。改进的方法是将计算方式

写成如下形式&＃xff1a;low&＃43; ( (high-low) >>1)。

常见问题解决

在何登成的技术博客中的问题四 “如何查找第一个/最后一个等值”&＃xff0c;这个大牛只是简单的说明了下&＃xff0c;并没有详细说明怎么解决

这个问题&＃xff0c;下面来探讨怎么解决当所给有序重复数组中查找某个值出现的第一个和最后一个位置。

主要是下面三个问题&＃xff1a;

1&＃xff09;二分查找元素x的下标&＃xff0c;如无 return -1

2&＃xff09;二分查找返回x(可能有重复)第一次出现的下标&＃xff0c;如无return -1

3&＃xff09;二分查找返回x(可能有重复)最后一次出现的下标&＃xff0c;如无return -1

对于问题1 我们只需要利用最原始的的二分查找即可。

代码如下&＃xff1a;

[cpp] view plaincopy

/*
bin_search 二分查找元素x的下标&＃xff0c;如无 return -1
low,high 分别为待查元素的区间的上下界(包含边界).
x为待查元素.
注意 low <&＃61; high
*/
int bin_search(int *a, int low, int high, int x)
{
if(NULL &＃61;&＃61; a || low > high)
return -1;
int mid;
while(low<&＃61;high)//注意是<&＃61;&＃xff0c;若是<会找不到边界值情况
{
mid &＃61; low &＃43; ((high-low)>>1);
if(x
high &＃61; mid-1;
else if(x>a[mid])
low &＃61; mid &＃43;1;
else
return mid;
}
return -1;
}

对于问题2&＃xff0c;二分查找返回x(可能有重复
)第一次出现的下标
&＃xff0c;如无return -1。

我们只需找到x重复出现情况下的第一次出现的下标。则我们只需用a[mid]和元素x进行比较&＃xff0c;当a[mid]

此时待查元素肯定在待查区间的右半部分显然此时不包括 mid 所以有 low &＃61; mid&＃43;1, 若a[mid]>&＃61;x时, 因为我

们查找的是x第一次出现的位置,我们不关心x最后出现的位置,所以此时high下标为mid,直到 low &＃61;&＃61; high 终止

循环&＃xff0c;并且比较a[low]是否为x,若是则找到。

总的思路是&＃xff1a;

把有序序列分成2个序列:[first,mid][mid&＃43;1,last) 当 a[mid]

当 a[mid]>&＃61;x 时使用序列[first,mid]。

还是看代码吧。

[cpp] view plaincopy

/*
binS_first二分查找返回x(可能有重复)第一次出现的下标&＃xff0c;如无return -1
low,high 分别为待查元素的区间的上下界(包含边界).
//分成2个序列:[first,mid][mid&＃43;1,last)
x为待查元素.注意循环结束条件&＃xff0c;low &＃61;&＃61; high */
int binS_first(int *a, int low, int high, int x)
{
if(NULL &＃61;&＃61; a || low > high)return -1;
int mid;
while(low
{
mid&＃61;low&＃43;((high-low)>>1);//计算中点
if(a[mid]//
low&＃61;mid&＃43;1;
else // >&＃61;x
high&＃61;mid;
}
if(a[low] &＃61;&＃61; x)
return low;
return -1;
}

对于问题3&＃xff0c;二分查找返回x(可能有重复)最后一次出现的下标&＃xff0c;如无return -1

其实和问题2的思路差不多。

只是在 while中我们假定 low&＃43;1

接下来的while 情况和问题2等价。我们现在关心的是 x(可能有重复)最后一次出现的下标&＃xff0c;所以现在我们不关心他

第一次出现下标的位置, 当 a[mid]<&＃61;x 时 low &＃61; mid, 否则 a[mid] >x 此时 high &＃61; mid -1. 代码如下&＃xff1a;

[cpp] view plaincopy

/*
binS_last二分查找返回x(可能有重复)最后一次出现的下标,如无return -1
low,high 分别为待查元素的区间的上下界(包含边界).
x为待查元素.
注意循环结束条件&＃xff0c;low&＃43;1 &＃61;&＃61; high
*/
int binS_last(int *a, int low, int high, int x)
{
if(NULL &＃61;&＃61; a || low > high)
return -1;
int mid;
while(low&＃43;1//**
{
mid&＃61;low&＃43;((high-low)>>1);
if(a[mid]<&＃61;x) // <&＃61;x
low &＃61; mid;
else // >x
high&＃61;mid-1;
}
if(a[high] &＃61;&＃61; x)//先判断high
return high;
else if(a[low] &＃61;&＃61; x)
return low;
return -1;
}

查找重复元素出现的第一次最后一次位置总结如下&＃xff1a;

二分查找返回x(可能有重复)第一次(最后一次)出现的下标找最小的等号放>&＃61;x位置(high),找最大的等号放<&＃61;x的位置(low)。
其中a[mid]在和待查找元素x比较中带 &＃61; 的&＃xff0c;在对low 或者high赋值时一定为 mid&＃xff0c;其它情况(<或>)则为mid&＃43;(-)1.

总的测试程序。

[cpp] view plaincopy

#include
/*
bin_search 二分查找元素x的下标&＃xff0c;如无 return -1
low,high 分别为待查元素的区间的上下界(包含边界).
x为待查元素.
注意 low <&＃61; high
*/
int bin_search(int *a, int low, int high, int x)
{
if(NULL &＃61;&＃61; a || low > high)
return -1;
int mid;
while(low<&＃61;high)//注意是<&＃61;&＃xff0c;若是<会找不到边界值情况
{
mid &＃61; low &＃43; ((high-low)>>1);
if(x
high &＃61; mid-1;
else if(x>a[mid])
low &＃61; mid &＃43;1;
else
return mid;
}
return -1;
}
/*
binS_first二分查找返回x(可能有重复)第一次出现的下标,如无return -1
low,high 分别为待查元素的区间的上下界(包含边界).
//分成2个序列:[first,mid][mid&＃43;1,last)
x为待查元素.
注意循环结束条件&＃xff0c;low &＃61;&＃61; high */
int binS_first(int *a, int low, int high, int x)
{
if(NULL &＃61;&＃61; a || low > high)return -1;
int mid;
while(low//<
{
mid&＃61;low&＃43;((high-low)>>1);
if(a[mid]//
low&＃61;mid&＃43;1;
else // >&＃61;x
high&＃61;mid;
}
if(a[low] &＃61;&＃61; x)
return low;
return -1;
}
/*
binS_last二分查找返回x(可能有重复)最后一次出现的下标,
如无return -1
low,high 分别为待查元素的区间的上下界(包含边界).
x为待查元素.注意循环结束条件&＃xff0c;low&＃43;1 &＃61;&＃61; high */
int binS_last(int *a, int low, int high, int x)
{
if(NULL &＃61;&＃61; a || low > high)
return -1;
int mid;
while(low&＃43;1//**
{
mid&＃61;low&＃43;((high-low)>>1);
if(a[mid]<&＃61;x) // <&＃61;x
low &＃61; mid;
else // >x
high&＃61;mid-1;
}
if(a[high] &＃61;&＃61; x)//先判断high
return high;
else if(a[low] &＃61;&＃61;x)return low;
return -1;
}
int main()
{
int a[]&＃61; {-1,1,2,2,2,4,4,4,4,4,4,4}; //0-11
printf("-1: %d\n", bin_search(a, 0, 11, -1));
printf(" 4 fisrt: %d\n", binS_first(a, 0, 11, 4));
printf(" 4 last: %d\n", binS_last(a, 0, 11, 4));
printf("\n");
int b[]&＃61; {-2,-2,0,5,5,7,7}; //0-6
printf("-2 fisrt: %d\n", binS_first(b, 0, 6, -2));
printf("-2 last: %d\n", binS_last(b, 0, 6, -2));
printf(" 5 fisrt: %d\n", binS_first(b, 0, 6, 5));
printf(" 5 last: %d\n", binS_last(b, 0, 6, 5));
return 0;
}

运行结果截图&＃xff1a;

此外对于像&＃xff0c;二分查找返回刚好小于x的元素下标&＃xff0c;二分查找返回刚好大于x的元素下标&＃xff0c; 返回有序数列某一个元素重复出现的次数等问题&＃xff0c;可以根据上面

的寻找重复元素出现第一次最后一次位置的方法进行问题求解。对于这类问题也可以参考 STL 中关于 lower_bound与upper_bound的实现。STL算法库

中已经有相关实现。

参考&＃xff1a;

http://hedengcheng.com/?p&＃61;595

编程珠玑

http://blog.csdn.net/daniel_ustc/article/details/17307937

推荐阅读

object
编写有趣的VBScript恶作剧脚本

本文将介绍如何编写一些有趣的VBScript脚本，这些脚本可以在朋友之间进行无害的恶作剧。通过简单的代码示例，帮助您了解VBScript的基本语法和功能。 ... [详细]

蜡笔小新 2024-12-28 09:46:23
main
深入理解KMP算法中的next数组：北大OJ 2406题解

本文详细探讨了KMP算法中next数组的构建及其应用，重点分析了未改良和改良后的next数组在字符串匹配中的作用。通过具体实例和代码实现，帮助读者更好地理解KMP算法的核心原理。 ... [详细]

蜡笔小新 2024-12-28 11:30:01
ip
优化ListView性能

本文深入探讨了如何通过多种技术手段优化ListView的性能，包括视图复用、ViewHolder模式、分批加载数据、图片优化及内存管理等。这些方法能够显著提升应用的响应速度和用户体验。 ... [详细]

蜡笔小新 2024-12-28 10:36:30
object
新浪笔试题

1:有如下一段程序：packagea.b.c;publicclassTest{privatestaticinti0;publicintgetNext(){return ... [详细]

蜡笔小新 2024-12-27 19:32:17
ip
网络链路质量监控：Smokeping部署与配置

本文详细介绍了如何在Linux系统上安装和配置Smokeping，以实现对网络链路质量的实时监控。通过详细的步骤和必要的依赖包安装，确保用户能够顺利完成部署并优化其网络性能监控。 ... [详细]

蜡笔小新 2024-12-27 19:31:05
main
C++实现经典排序算法

本文详细介绍了七种经典的排序算法及其性能分析。每种算法的平均、最坏和最好情况的时间复杂度、辅助空间需求以及稳定性都被列出，帮助读者全面了解这些排序方法的特点。 ... [详细]

蜡笔小新 2024-12-27 19:25:14
main
Java并发编程：LinkedBlockingQueue的实际应用

本文介绍了Java并发库中的阻塞队列（BlockingQueue）及其典型应用场景。通过具体实例，展示了如何利用LinkedBlockingQueue实现线程间高效、安全的数据传递，并结合线程池和原子类优化性能。 ... [详细]

蜡笔小新 2024-12-27 18:51:49
const
USACO 2014 Jan - Moolympics区间记录优化算法

题目描述：给定n个半开区间[a, b)，要求使用两个互不重叠的记录器，求最多可以记录多少个区间。解决方案采用贪心算法，通过排序和遍历实现最优解。 ... [详细]

蜡笔小新 2024-12-27 18:14:31
main
数据库内核开发入门 | 搭建研发环境的初步指南

本课程将带你从零开始，逐步掌握数据库内核开发的基础知识和实践技能，重点介绍如何搭建OceanBase的开发环境。 ... [详细]

蜡笔小新 2024-12-27 16:38:48
ip
寻找满足特定条件的整数N的最大和(a+b)

本文探讨了如何在给定整数N的情况下，找到两个不同的整数a和b，使得它们的和最大，并且满足特定的数学条件。 ... [详细]

蜡笔小新 2024-12-26 19:26:18
window
如何使用JavaScript或jQuery检测文本框焦点状态和鼠标悬停事件

本文介绍了如何利用JavaScript或jQuery来判断网页中的文本框是否处于焦点状态，以及如何检测鼠标是否悬停在指定的HTML元素上。 ... [详细]

蜡笔小新 2024-12-27 21:33:33
window
MyBatis 动态 SQL 详解与应用

本文深入探讨 MyBatis 中动态 SQL 的使用方法，包括 if/where、trim 自定义字符串截取规则、choose 分支选择、封装查询和修改条件的 where/set 标签、批量处理的 foreach 标签以及内置参数和 bind 的用法。 ... [详细]

蜡笔小新 2024-12-27 16:20:10
window
使用C#开发SQL Server存储过程的指南

本文介绍如何利用C#在SQL Server中创建存储过程，涵盖背景、步骤和应用场景，旨在帮助开发者更好地理解和应用这一技术。 ... [详细]

蜡笔小新 2024-12-27 14:24:17
window
MyBatis：深入解析与应用

在当前众多持久层框架中，MyBatis（前身为iBatis）凭借其轻量级、易用性和对SQL的直接支持，成为许多开发者的首选。本文将详细探讨MyBatis的核心概念、设计理念及其优势。 ... [详细]

蜡笔小新 2024-12-27 12:17:16
ip
Linux 网卡绑定的七种工作模式详解

本文深入探讨了Linux系统中网卡绑定（bonding）的七种工作模式。网卡绑定技术通过将多个物理网卡组合成一个逻辑网卡，实现网络冗余、带宽聚合和负载均衡，在生产环境中广泛应用。文章详细介绍了每种模式的特点、适用场景及配置方法。 ... [详细]

蜡笔小新 2024-12-27 10:18:13

双语的家_352

这个家伙很懒，什么也没留下！

Tags | 热门标签

RankList | 热门文章