線段樹是一個復雜的數據結構,比較難理解,也比較難解釋清楚。在我將這個數據結構反復學習了五遍的時候,我終于有了信心寫出這篇介紹線段樹的文章。希望大家能夠掌握這種數據結構。
這篇文章比較長,建議大家耐心閱讀,好好消化吸收哦~~
前置內容
學習線段樹前,你需要掌握二叉搜索樹,不太了解的小伙伴,可以看看小灰之前發布的紅黑樹漫畫,前半部分講解了二叉搜索樹:
我只補充一個內容,就是關于二叉搜索樹如何編號。
二叉搜索樹的根節點編號為1,對于每個節點,假如其編號為N,它的左兒子編號為2N,右兒子編號為2N+1。因此,整個二叉搜索樹的編號如下:

上圖當中,結點上方的數字是結點的編號,后續為了簡單,把編號寫在結點內不。
有讀者可能要問了,為什么3的兒子是6和7,而不是4和5呢?這是因為雖然節點4和節點5不存在,但是仍然應該為他們保留4和5這2個編號,你可以把這棵樹看成這樣:

線段樹的概念
線段樹,英文名稱是Segment Tree,其本質也是一個二叉搜索樹,區別在于線段樹的每一個節點記錄的都是一個區間,每個區間都被平均分為2個子區間,作為它的左右兒子。比如說區間[1,10],被分為區間[1,5]作為左兒子,區間[6,10]作為右兒子:

為什么要設計這樣奇怪的數據結構呢?
線段樹主要適用于某些相對罕見的應用場景:
比如給定了若干元素,要求統計出不同區間范圍內,元素的個數。
現在我們已經知道了什么是線段樹,那么看一個利用線段樹的例子。
線段樹的存儲與建造
這是一個序列:

現在我們要用它完成一個區間求和的任務。
區間求和就是指求序列中一段區間的所有元素之和。比如說上面的序列,區間[1,5]的和為元素1+元素2+元素3+元素4+元素5,也就是14。再舉一個例子,區間[9,10]的和為9。
在學習線段樹的概念的時候,我們就知道線段樹的每個節點都存儲了一個區間。比如說對于[1,10]這個節點,也就是這棵線段樹的根節點,那么它的值為1+5+1+3+4+2+0+9+0+9=34。看我們把這棵樹填完:

(當一個區間的左右邊界已經相等時,比如[1,1],表示這個區間內只有一個元素了,此時不能再分割,因此它就沒有左右兒子節點了)
現在就讓我們用代碼實現線段樹:
【代碼片段 1】 用一個類Node表示線段樹的節點:
class Node {
int l; // l是區間左邊界
int r; // r是區間右邊界
int sum; // sum是區間元素和
public Node (int l, int r, int sum){
this.l = l;
this.r = r;
this.sum = sum;
}
}
【代碼解析 1】 線段樹的任意節點都有3個屬性:
- 區間的左邊界l
- 區間的右邊界r
- 區間的元素和sum
比如說在上面的線段樹中,區間[1,10]這個元素:
- 左邊界為1
- 右邊界為10
- 元素和為34
【代碼片段 2】 定義元素個數、原序列和線段樹
static int n = 10; // n是元素個數
static int[] array = {0, 1, 5, 1, 3, 4, 2, 0, 9, 0, 9};
// array是原序列(第一個0是占array[0]位的)
static Node[] tree = new Node[4*n];
static void initTree (){
for(int i = 0; i < tree.length; i++){
tree[i] = new Node(0, 0, 0, 0);
}
}
【代碼解析 2】 首先我們在上文已經定義了元素個數和原序列。他們的值如下:
- 元素個數為10個
- 原序列為[0,1,5,1,3,4,2,0,9,0,9]
現在問題在于,存儲線段樹的數組應該開多大的空間?根據證明發現,一個有n個元素的序列,所對應的線段樹至少需要大小為4n的數組來存儲。這一類證明網上有很多,讀者可以自行查閱一下。
我們用inittree這個函數進行線段樹初始化(tree數組初始值為null,不初始化會報錯,我在這個地方卡了好久)
【代碼片段 3】 updateNode函數負責更新節點的值:
static void updateNode (int num) { // num是當前節點序號
tree[num].sum = tree[num * 2].sum + tree[num * 2 + 1].sum;
}
【代碼解析 3】 仔細觀察前面的線段樹可以發現,每一個節點的值都等于其左右兒子值的和。我們剛剛學會,一個編號為n的節點,其左右兒子分別為2n和2n+1。因此我們把num的值更新為2num+2num+1,也就是其左右兒子的和。
【代碼片段 4】 build函數建造線段樹:
static void build (int l, int r, int num) { // 建樹
tree[num].l = l;
tree[num].r = r;
if (l == r) { // l = r說明到達葉子節點
tree[num].sum = array[l];
return;
}
int mid = (l + r) / 2;
build(l, mid, num * 2); // 遞歸左兒子
build(mid + 1, r, num * 2 + 1); // 遞歸右兒子
updateNode(num);
}
【代碼解析 4】 函數從區間[l,r]開始遞歸遍歷整棵線段樹,每一次都遞歸它的左右兒子,到葉子節點時結束。遞歸每一個兒子時,都對它進行更新。這樣下來就完成了整棵樹的初始化。
線段樹的單點修改
現在假如我們需要把第6個元素從2修改為3:

那么就會有很多的區間相應的改變。比如說區間[5,7],從4+2+0=6變成了4+3+0=7。現在讓我們手動模擬一下線段樹的單點修改過程。這里假設我們需要把元素6從2變成3:
首先,從根節點開始遍歷,發現含有元素6的區間是根節點的右兒子,與左兒子沒有關系。因此將修改目標鎖定到右兒子:

第二步,發現含有6的區間是左兒子,因此把目標放到左兒子上:

第三步同理:

第四步同理:

此時發現這是一個葉子節點,因此對它進行更新,從2變成3:

返回到上一層:

接下去同理:

然后我們跳過演示,讀者可以自己試試看用同樣的方法修改這棵樹。最后修改完應該是這樣的:

根節點最后應該從34變成35,我經常會忘記修改它的值,大家千萬不要忘記修改它。
演示完以后我們分析一下時間復雜度。如果我們使用線段樹修改元素,每次都是折半操作,相當于二分查找的速度,時間復雜度僅僅是對數級別,也就是 。
【代碼片段 5】 modify函數實現單點修改:
static void modify (int i, int value, int num) { // 把元素i修改為值value
if (tree[num].l == tree[num].r) { // 到達葉子節點
tree[num].sum = value;
return;
}
int mid = (tree[num].l + tree[num].r) / 2;
if (i <= mid) {
modify(i, value, num * 2); // 遞歸左兒子
}
else {
modify(i, value, num * 2 + 1); // 遞歸右兒子
}
updateNode(num);
}
【代碼解析 5】 這一段代碼也不是很難。每一次我們都從根開始遞歸遍歷。我們先判斷要更改的元素屬于當前節點的左兒子還是右兒子,并且遞歸到該節點。遞歸結束后更新當前節點的值。假如遍歷到葉子節點,說明我們已經遍歷到了想要修改的元素,那么我們直接把該節點的值修改為value就可以了。
到這里我們已經學會了單點修改的方法了。接下來讓我們更進一步,學習區間修改。
線段樹的區間修改
首先讓我們明確一下區間修改的概念:
單點修改,大致是以下兩個步驟:
- 找到需要修改的點
- 修改這個點
而區間修改是這樣兩個步驟:
- 找到需要修改的區間
- 修改這段區間內的所有點
好的,概念我們明白了,現在要知道如何實現這個功能。首先我們看一看區間修改可能的情況:
- 需要修改的區間包含在兒子之內:為大家畫個圖:我們看到需修改區間[6,8]包含在未修改區間的右兒子里。這種情況很簡單,我們直接遞歸到右兒子即可。
- 需要修改的區間被拆開:還是畫一個圖:這時4屬于左兒子,但是5和6屬于右兒子。這怎么辦呢?最直接的方法是把這個區間拆成兩半,屬于左兒子的放一邊,屬于右兒子的放一邊,像這樣:
兩種情況分類討論后,我們就要考慮如何修改區間了。
最簡單的方法就是把這些區間挨個兒修改。但是大家可以試試看,這種方法比暴力還要慢好幾倍。因此我們需要使用懶惰標記。
現在假如我們需要把區間[5,7]每個元素增加2:

首先,5屬于根節點的左兒子,而6和7屬于根節點的右兒子,因此兩邊都要進行修改。我們可以先修改左兒子:

5屬于當前節點的右兒子,因此我們鎖定右兒子:

5屬于當前節點的右兒子,那么我們修改右兒子。我們發現右兒子就是5。當前只有一個元素,因此我們把當前的值+2,并為其打上一個懶惰標記,懶惰標記的值也是2:

之后向上回溯,每一個節點都進行更新,也就是說每一個節點都更新為其左兒子+右兒子,最后更新完是這樣的:

到目前為止,懶惰標記還沒有發揮作用,但是我們可以看一看6和7這段區間的修改。首先因為6和7在根節點的右兒子,因此我們先遍歷右兒子:

接著因為6和7在當前節點的左兒子,因此我們遍歷左兒子:

之后我們發現6和7就是當前節點的左兒子,因此我們直接遍歷到左兒子,修改其值并打上懶惰標記。需要指出的是,因為6~7有2個元素,因此增加的值要乘2,也就是從+2變為+4,但懶惰標記的值不用乘2:

此時讓我們思考一個問題:
我們還需要遍歷修改[6,6]和[7,7]嗎?
這時就不用了,因為我們已經打上了懶惰標記,懶惰標記的初衷就是延遲修改,因此我們當然不需要再修改這兩個節點了。現在讓我們一鼓作氣,回溯到根節點,完成所有更新:

現在我們一起用代碼實現:
【代碼片段 6】 為Node類添加懶惰標記:
class Node {
int l; // l是區間左邊界
int r; // r是區間右邊界
int sum; // sum是區間元素和
int lazy; // lazy是懶惰標記
public Node (int l, int r, int sum, int lazy){
this.l = l;
this.r = r;
this.sum = sum;
this.lazy = lazy;
}
}
【代碼解析 6】 新增了lazy變量作為懶惰標記。
【代碼片段 7】 modifySegment函數實現區間修改的代碼:
static void modifySegment(int l, int r, int value, int num) { // [l,r]每一項都增加value
if (tree[num].l == l && tree[num].r == r) { // 找到當前區間
tree[num].sum += ( r - l + 1 ) * value; // r-l+1是區間元素個數
tree[num].lazy += value;
return;
}
int mid = (tree[num].l + tree[num].r) / 2;
if (r <= mid) { // 在左區間
modifySegment(l, r, value, num * 2);
}
else if (l > mid) { // 在右區間
modifySegment(l, r, value, num * 2 + 1);
}
else { // 分成2塊
modifySegment(l, mid, value, num * 2);
modifySegment(mid + 1, r, value, num * 2 + 1);
}
updateNode(num);
}
【代碼解析 7】 首先,按照開始講的3種情況,進行分類討論(情況分別是:完全在左區間,完全在右區間,分成了2塊),并且向下遞歸。
線段樹的區間查詢
區間查詢,顧名思義就是查詢一段區間內的元素和。那么如何實現呢?
不急,現在我們來看這樣一種情況:

[1,2]有一個懶惰標記2。現在假如我要求[1,1]的值怎么辦?
涼拌
為什么我這么說?因為[1,2]這個節點有一個懶惰標記,但是[1,1]卻沒有被更新,這是一個問題。
此時我們就要實現一個函數,用于把懶惰標記下傳給兒子們,稱為pushdown函數。下面直接給代碼,解析部分請看代碼解析吧:
【代碼片段 8】 使用pushdown函數下傳懶惰標記:
static void pushdown (int num) {
if(tree[num].l == tree[num].r) { // 葉節點不用下傳標記
tree[num].lazy = 0; // 清空當前標記
return;
}
tree[num * 2].lazy += tree[num].lazy; // 下傳左兒子的懶惰標記
tree[num * 2 + 1].lazy += tree[num].lazy; // 下傳右兒子的懶惰標記
tree[num * 2].sum += (tree[num * 2].r - tree[num * 2].l + 1) * tree[num].lazy; // 更新左兒子的值
tree[num * 2 + 1].sum += (tree[num * 2 + 1].r - tree[num * 2 + 1].l + 1) * tree[num].lazy; // 更新右兒子的值
tree[num].lazy=0; // 清空當前節點的懶惰標記
}
【代碼解析 8】 下傳懶惰標記步驟有3步:
- 將懶惰標記傳遞給兒子
- 更新兒子的值
- 清空當前節點的懶惰標記
需要注意的是,葉子節點不用下傳標記。
現在我們完成了pushdown函數的編寫,可以開始學習區間查詢了。剛才我們完成了區間修改,并且將原序列修改為了[1,5,1,3,6,4,2,9,0,9]。現在我們接著實現區間查詢問題。假如我們要查詢區間[5,6]:

正如我們所見,答案為10。現在告訴大家一個好消息,那就是區間查詢的大致步驟其實和區間修改沒有什么出入。讓我們來實踐一下:
首先,5和6分別屬于根節點的左兒子和右兒子,那我們先遍歷左兒子:

接著繼續往下:

往下查找到[5,5]:

記錄好這邊答案為6。接著我們看根節點的右兒子,查找元素6:

向下搜索到[6,8]:

搜索到[6,7]:

此時我們需要下傳[6,7]的懶惰標記,并且更新[6,6]的值,如下:

最后遍歷到[6,6],值為4,與剛才得到的6相加,答案就是10:

那么我們上代碼:
【代碼片段 9】 query函數實現區間查詢:
static int query (int l, int r, int num) {
if (tree[num].lazy != 0) { // 下傳懶惰標記
pushdown(num);
}
if (tree[num].l == l && tree[num].r == r) { // 找到當前區間
return tree[num].sum;
}
int mid = (tree[num].l + tree[num].r) / 2;
if (r <= mid) { // 在左區間
return query(l, r, num * 2);
}
if (l > mid) { // 在右區間
return query(l, r, num * 2 + 1);
}
return query(l, mid, num * 2) + query(mid + 1, r, num * 2 + 1); // 分成2塊
}
【代碼解析 9】 步驟與區間修改完全相同,記得要pushdown一下就行。
思考與探究
下面讓我們進行一些對于線段樹的思考與探究:
【思考 1】 線段樹都應用于什么環境?除了區間和外,能否解決更多問題?比起別的樹有什么優勢?
【答案 1】 線段樹一般多用于區間問題。在本文中我們解決的是區間和,但是也能解決更多的問題,比如區間平方和等等。線段樹只能解決符合下面條件的問題:
當區間[l,r]可以由[l,mid(l,r)]和[mid(l,r) + 1,r]得到答案
我們舉幾個滿足條件的例子:
- 區間[5,8]的區間和,可以由[5,6]的區間和加上[7,8]的區間和得到。
- 區間[5,8]的最小值,等于區間[5,6]的最小值與[7,8]的最小值的最小值。
但是還有一些不滿足條件:
- 區間[5,8]的最長上升子序列。
另外就是線段樹比起別的樹的特點。線段樹屬于二叉搜索樹,像我們熟悉的紅黑樹、AVL樹其實也都屬于二叉搜索樹。只不過不同的二叉搜索樹用處不相同。線段樹比起別的樹,它的最大特點就是用作存儲區間的特性。
【思考 2】 線段樹和前綴和算法有什么優劣區別嗎?
【答案 2】 寫到這里并不清楚各位是否明白前綴和算法。這里給大家簡單介紹一下:

對于任何一個序列,都能制作一個相對應的前綴和數組。對于一個序列來講,假如我們用pre表示前綴和數組,那么pre[i]就表示區間[1,i]的區間和,比如pre[3]為array[1]+array[2]+array[3],也就是7。
現在我們可用pre[i]表示區間[1,i],那么假如有一個任意區間[l,r],我們應該怎么表示它的區間和呢?仔細思考一下不難發現,區間[l,r]的區間和其實就是區間[1,r]減去區間[1,l - 1],剩下的也就是區間[l,r]了。因此我們可用pre[r]-pre[l-1]表示。
舉個例子,區間[3,5]的和為1+3+4=8,相當于區間[1,5]減去區間[1,(3 - 1)],也就是14-6=8。
我們發現,使用前綴和只要做一個減法就能得到區間和,而線段樹還要遍歷好多次,那是不是說,前綴和甚至要快于線段樹呢?我們可以來對比一下線段樹和前綴和的時間復雜度:
算法名稱初始化修改查詢前綴和O(n)O(n)O(1)線段樹O(log n)O(log n)O(log n)
我們發現,線段樹比起前綴和有更加穩定的特點。它的每一項都是對數級別。而前綴和雖然查詢非常快,但是修改速度就相對慢很多。因此我們認為,假如不需要進行元素的修改操作,那么我們一般選擇前綴和。如果需要進行元素修改操作,那么線段樹更為合適。
線段樹的完整代碼
最后,附上線段樹的完整代碼實現:
static int n = 10; // n是元素個數
static int[] array = {0, 1, 5, 1, 3, 4, 2, 0, 9, 0, 9};
// array是原序列(第一個0是占array[0]位的)
static Node[] tree = new Node[4*n]; // tree是線段樹
public static void main(String[] args) {
initTree();
build(1, 10, 1); // 利用build函數建樹
System.out.println("操作1:[2,5]的區間和是:" + query(2, 5, 1));
// 利用query函數搜索區間和
modify(5, 9, 1); // 利用modify函數實現單點修改(元素5從4改為9)
System.out.println("操作2:元素5從4改為9,此時[2,5]的區間和是:" + query(2, 5, 1));
modifySegment(3, 4, 3, 1);
// 利用modifySegment函數將[3,4]每個元素增加3
System.out.println("操作3:區間[3,4]每個元素+3,此時[2,5]的區間和是:" + query(2, 5, 1));
}
static void initTree (){
for(int i = 0; i < tree.length; i++){
tree[i] = new Node(0, 0, 0, 0);
}
}
static void updateNode (int num) { // num是當前節點序號
tree[num].sum = tree[num * 2].sum + tree[num * 2 + 1].sum;
}
static void build (int l, int r, int num) { // 建樹
tree[num].l = l;
tree[num].r = r;
if (l == r) { // l = r說明到達葉子節點
tree[num].sum = array[l];
return;
}
int mid = (l + r) / 2;
build(l, mid, num * 2); // 遞歸左兒子
build(mid + 1, r, num * 2 + 1); // 遞歸右兒子
updateNode(num);
}
static void modify (int i, int value, int num) { // 把元素i修改為值value
if (tree[num].l == tree[num].r) { // 到達葉子節點
tree[num].sum = value;
return;
}
int mid = (tree[num].l + tree[num].r) / 2;
if (i <= mid) {
modify(i, value, num * 2); // 遞歸左兒子
}
else {
modify(i, value, num * 2 + 1); // 遞歸右兒子
}
updateNode(num);
}
static void modifySegment(int l, int r, int value, int num) { // [l,r]每一項都增加value
if (tree[num].l == l && tree[num].r == r) { // 找到當前區間
tree[num].sum += ( r - l + 1 ) * value; // r-l+1是區間元素個數
tree[num].lazy += value;
return;
}
int mid = (tree[num].l + tree[num].r) / 2;
if (r <= mid) { // 在左區間
modifySegment(l, r, value, num * 2);
}
else if (l > mid) { // 在右區間
modifySegment(l, r, value, num * 2 + 1);
}
else { // 分成2塊
modifySegment(l, mid, value, num * 2);
modifySegment(mid + 1, r, value, num * 2 + 1);
}
updateNode(num);
}
static void pushDown(int num) {
if(tree[num].l == tree[num].r) { // 葉節點不用下傳標記
tree[num].lazy = 0; // 清空當前標記
return;
}
tree[num * 2].lazy += tree[num].lazy; // 下傳左兒子的懶惰標記
tree[num * 2 + 1].lazy += tree[num].lazy; // 下傳右兒子的懶惰標記
tree[num * 2].sum += (tree[num * 2].r - tree[num * 2].l + 1) * tree[num].lazy; // 更新左兒子的值
tree[num * 2 + 1].sum += (tree[num * 2 + 1].r - tree[num * 2 + 1].l + 1) * tree[num].lazy; // 更新右兒子的值
tree[num].lazy=0; // 清空當前節點的懶惰標記
}
static int query (int l, int r, int num) {
if (tree[num].lazy != 0) { // 下傳懶惰標記
pushDown(num);
}
if (tree[num].l == l && tree[num].r == r) { // 找到當前區間
return tree[num].sum;
}
int mid = (tree[num].l + tree[num].r) / 2;
if (r <= mid) { // 在左區間
return query(l, r, num * 2);
}
if (l > mid) { // 在右區間
return query(l, r, num * 2 + 1);
}
return query(l, mid, num * 2) + query(mid + 1, r, num * 2 + 1); // 分成2塊
}
static class Node {
int l; // l是區間左邊界
int r; // r是區間右邊界
int sum; // sum是區間元素和
int lazy; // lazy是懶惰標記
public Node (int l, int r, int sum, int lazy){
this.l = l;
this.r = r;
this.sum = sum;
this.lazy = lazy;
}
}