【数据结构】线段树(Segment Tree)

 

假设我们现在拿到了一个非常大的数组,对于这个数组里面的数字要反复不断地做两个操作。

分享图片

1、(query)随机在这个数组中选一个区间,求出这个区间所有数的和。

分享图片

2、(update)不断地随机修改这个数组中的某一个值。

分享图片

时间复杂度:

分享图片

枚举

枚举L~R的每个数并累加。

  • query:O(n)

找到要修改的数直接修改

  • update:O(1)

如果query与update要做很多很多次,query的O(n)会被卡住,所以时间复杂度会非常慢。那么有没有办法把query的时间复杂度降成O(1)呢?其中一种方法如下:

  • 先建立一个与a数组一样大的数组。

分享图片

  • s[1]=a[1];s[2]=a[1]+a[2];s[3]=a[1]+a[2]+a[3];...;s[n]=a[1]+a[2]+a[3]+...+a[n](在s数组中存入a的前缀和)

分享图片

  • 此时a[L]+a[L+1]+...+a[R]=s[R]-s[L-1],query的时间复杂度降为O(1)。
  • 但若要修改a[k]的值,随之也需修改s[k],s[k+1],...,s[n]的值,时间复杂度升为O(n)。

前缀和

query:O(1)

update:O(n)

  • 我们发现,当我们想尽方法把其中一个操作的时间复杂度改成O(1)后,另一个操作的时间复杂度就会变为O(n)。当query与update的操作特别多时,不论用哪种方法,总体的时间复杂度都不会特别快。
  • 所以,我们将要讨论一种叫线段树的数据结构,它可以把这两个操作的时间复杂度平均一下,使得query和update的时间复杂度都落在O(n log n)上,从而增加整个算法的效率。

线段树

假设我们拿到了如下长度为6的数组:

分享图片

在构建线段树之前,我们先阐述线段树的性质:

1、线段树的每个节点都代表一个区间。

2、线段树具有唯一的根节点,代表的区间是整个统计范围,如[1,N]。

3、线段树的每个叶节点都代表一个长度为1的元区间[x,x]。

4、对于每个内部节点[l,r],它的左子结点是[l,mid],右子节点是[mid+1,r],其中mid=(l+r)/2(向下取整)。

依照这个数组,我们构建如下线段树(结点的性质为sum):

分享图片

若我们要求[2-5]区间中数的和:

分享图片

若我们要把a[4]改为6:

  • 先一层一层找到目标节点修改,在依次向上修改当前节点的父节点。

 

 

分享图片

接下来的问题是:如何保存这棵线段树?

  • 用数组存储。

分享图片

若我们要取node结点的左子结点(left)与右子节点(right),方法如下:

  • left=2*node+1
  • right=2*ndoe+2

举结点5为例(左子结点为节点11,右子节点为节点12):

  • left5=2*5+1=11
  • right5=2*5+2=12

接下来给出建树的代码

 

#include<bits/stdc++.h>
using namespace std; const int N = 1000; int a[] = {1,3,5,7,9,11}; int size = 6; int tree[N] = {0}; //建立范围为a[start]~a[end] 
void build(int a[],int tree[],int node/*当前节点*/,int start,int end){ //递归边界(即遇到叶子节点时) 
    if (start == end){ //直接存储a数组中的值 
        tree[node] = a[start]; } else { //将建立的区间分成两半 
        int mid = (start + end) / 2; int left  = 2 * node + 1;//左子节点的下标 
        int right = 2 * node + 2;//右子节点的下标 //求出左子节点的值(即从节点left开始,建立范围为a[start]~a[mid])
 build(a,tree,left,start,mid); //求出右子节点的值(即从节点right开始,建立范围为a[start]~a[mid])
        build(a,right,mid+1,end); //当前节点的职位左子节点的值加上右子节点的值 
        tree[node] = tree[left] + tree[right]; } } int main(){ //从根节点(即节点0)开始建树,建树范围为a[0]~a[size-1]
    build(a,0,size-1); for(int i = 0; i <= 14; i ++) printf("tree[%d] = %d\n",i,tree[i]); return 0; }

运行结果:

分享图片

update操作:

  • 确定需要改的分支,向下寻找需要修改的节点,再向上修改节点值。
  •  与建树的函数相比,update函数增加了两个参数x,val,即把a[x]改为val。

例:把a[x]改为6(代码实现)

分享图片

void update(int a[],int node,int end,int x,int val){ //找到a[x],修改
    if (start == end){ a[x] = val; tree[node] = val; } else { int mid = (start + end) / 2; int left  = 2 * node + 1; int right = 2 * node + 2; if (x >= start && x <= mid) {//如果x在左分支 
 update(a,mid,x,val); } else {//如果x在右分支 
            update(a,end,val); } //向上更新值 
        tree[node] = tree[left] + tree[right]; } } 在主函数调用//把a[x]改成6
update(a,size-1,4,6);

 

运行结果:

分享图片

query操作:

  • 向下依次寻找包含在目标区间中的区间,并累加。
  • 与建树的函数相比,query函数增加了两个参数L,Rl,即把求a的区间[L,R]的和。

例:求a[2]+a[3]+...+a[5]的值(代码实现)

分享图片

int query(int a[],int L,int R){ //若目标区间与当时区间没有重叠,结束递归返回0 
    if (start > R || end < L){ return 0; } //若目标区间包含当时区间,直接返回节点值 
    else if (L <=start && end <= R){ return tree[node]; } else { int mid = (start + end) / 2; int left  = 2 * node + 1; int right = 2 * node + 2; //计算左边区间的值 
        int sum_left  = query(a,L,R); //计算右边区间的值 
        int sum_right = query(a,R); //相加即为答案 
        return sum_left + sum_right; } } 在主函数调用//求区间[2,5]的和
int ans = query(a,2,5); printf("ans = %d",ans); 

运行结果:

分享图片

最后,献上完整的代码

#include<bits/stdc++.h>
using namespace std; const int N = 1000; int a[] = {1,int end){ //递归边界(即遇到叶子节点时) 
    if (start == end) { //直接存储a数组中的值 
        tree[node] = a[start]; } else { //将建立的区间分成两半 
        int mid = (start + end) / 2; int left  = 2 * node + 1;//左子节点的下标 
        int right = 2 * node + 2;//右子节点的下标 //求出左子节点的值(即从节点left开始,end); //当前节点的职位左子节点的值加上右子节点的值 
        tree[node] = tree[left] + tree[right]; } } void update(int a[],val); } //向上更新值 
        tree[node] = tree[left] + tree[right]; } } //求a[L]~a[R]的区间和 
int query(int a[],R); //相加即为答案 
        return sum_left + sum_right; } } int main(){ //从根节点(即节点0)开始建树,tree[i]); printf("\n"); //把a[x]改成6
    update(a,6); for(int i = 0; i <= 14; i ++) printf("tree[%d] = %d\n",tree[i]); printf("\n"); //求区间[2,5]的和
    int ans = query(a,5); printf("ans = %d",ans); return 0; }

运行结果:

分享图片

学习视频链接

相关文章

键树的基本概念 键树又称数字查找树(Digital Search Tree)。 它是一棵度大于等于2的树,树中的每个结...
[TOC] 基本概念 数据: 数据 是对客观事物的符号表示,在计算机科学中指所有能输入到计算机中并被计算机...
[TOC] 反证法 基本概念: 一般地,假设原命题不成立(即 在原命题的条件下,结论不成立),经过正确的推...
最近抽空整理了&quot;数据结构和算法&quot;的相关文章。在整理过程中,对于每种数据结构和算法...
[TOC] 矩阵在计算机图形学、工程计算中占有举足轻重的地位。在数据结构中考虑的是如何用最小的内存空间...
[TOC] 大O表示法:算法的时间复杂度通常用大O符号表述,定义为T[n] = O(f(n))。称函数T(n)以f(n)为界或...