1. 概要

 木構造(Tree Structure)は、データ構造の一種であり、階層的な関係を表現するための非線形データ構造です。木構造は(ルート)から始まり、(エッジ)によって複数の節(ノード)が接続され、最終的に(リーフ)と呼ばれる末端ノードに至ります。

 木構造はコンピュータサイエンスの基礎となる重要なデータ構造であり、ファイルシステム、データベースのインデックス、構文解析、検索アルゴリズムなど、多くの場面で応用されています。木構造を理解することは、効率的なアルゴリズムの設計や実装において不可欠です。

2. 詳細説明

2.1. 木構造の基本用語と概念

 木構造は以下の要素から構成されています:

  • (ルート):木の最上位に位置するノード
  • (エッジ):ノード間を接続する線
  • (リーフ):子ノードを持たない末端ノード
  • 内部ノード:葉ではないノード(子を持つノード)
  • 親ノード:あるノードに対して上位に接続されているノード
  • 子ノード:あるノードから枝で接続された下位のノード
  • 兄弟:同じ親を持つノード同士
  • 深さ:根からあるノードまでの経路の長さ
  • 高さ:木の最も深い部分の深さ

枝(エッジ)

枝(エッジ)

枝(エッジ)

枝(エッジ)

枝(エッジ)

枝(エッジ)

枝(エッジ)

根(ルート)

内部ノード

内部ノード

内部ノード

葉(リーフ)

葉(リーフ)

葉(リーフ)

葉(リーフ)

深さ1

深さ2

深さ0

兄弟

親ノード

子ノード

木の高さ = 3

図1: 木構造の基本用語

2.2. 木構造の種類

2.2.1. 2分木(バイナリツリー)

 2分木(にぶんぎ)は、バイナリーツリー(binary tree)とも呼ばれます。
 各ノードが最大2つの子ノード(左の子と右の子)を持つ木構造です。2分木はシンプルな構造ながら、多くの応用があります。

2.2.2. 完全2分木(完全バイナリツリー)

 最下層を除くすべての層が完全に埋まっており、最下層は左から順に埋まっている2分木です。ヒープデータ構造の実装などで使用されます。

完全2分木(完全バイナリツリー)

A

B

C

D

E

F

G

2分木(バイナリツリー)

A

B

C

D

E

F

図2: 2分木と完全2分木の比較

2分木については以下をご参照ください。

2.2.3. バランス木

 すべての葉ノードの深さがほぼ同じになるように調整された木構造です。これにより検索や挿入、削除などの操作が効率的に行えます。代表的なバランス木にはAVL木や赤黒木などがあります。

非バランス木

10

20

30

40

50

バランス木

50

30

70

20

40

60

80

図3: バランス木と非バランス木の比較

2.2.4. 赤黒木

 赤黒木は自己平衡型の2分探索木で、各ノードは赤または黒で色付けされています。次の性質を保持します:

  1. 各ノードは赤か黒
  2. 根ノードは黒
  3. すべての葉(NILノード)は黒
  4. 赤ノードの子は黒(赤ノードが連続しない)
  5. 根から任意の葉までの黒ノードの数(黒高さ)は同じ

 これらの性質により、最悪の場合でも操作の時間計算量がO(log n)となります。

2.2.5. 順序木(ordered tree)

 各ノードの子ノードに順序が定義されている木構造です。子ノードの順番が意味を持ちます。

2.2.6. 多分木(n分木)

 各ノードが最大n個の子ノードを持つことができる木構造です。B木はこの一種であり、ディスクアクセスを最小化するために設計されたバランス探索木です。

2.2.7. 探索木

 データの検索を効率的に行うための木構造です。代表的なものに2分探索木があります。

2.2.8. 2分探索木(バイナリサーチツリー)

 次の性質を持つ2分木です:

  • 左の子孫のすべての値 < 親ノードの値 < 右の子孫のすべての値

 この性質により、検索が効率的に行えます。

50

30

70

20

40

60

80

左の子孫 < 親

親 < 右の子孫

検索: 比較しながら

左右に進む

図4: 2分探索木の例

2.2.9. B木

 ディスクベースのデータベースやファイルシステムで使用される自己平衡型の探索木です。1つのノードに複数のキーと子ノードへの参照を格納でき、効率的なディスクI/Oを実現します。

[30, 60]

[10, 20]

[40, 50]

[70, 80, 90]

<= 10

11-20

21-29

31-40

41-50

51-59

61-70

71-80

81-90

\>= 91

B木の特徴:

• 1ノードに複数キー

• すべての葉は同じ深さ

• ディスクI/O効率化

図5: B木の構造

2.2.10. AVL木

 各ノードの左右の部分木の高さの差が1以下であることを保証するバランス2分探索木です。挿入や削除操作後に自動的にバランスを調整します。

右回転後

Q

S

P

T

R

右回転前

P

Q

R

S

T

左回転後

C

A

E

B

D

左回転前

A

B

C

D

E

AVL木のバランス調整:

• 左回転: 右部分木が重い場合

• 右回転: 左部分木が重い場合

• 二重回転: 複合的なバランス崩れの場合

図6: AVL木の回転操作

木構造の種類特徴長所短所主な応用
2分木各ノードは最大2つの子を持つシンプルで実装が容易バランスが保証されない式の表現、基本的なデータ構造
完全2分木最下層を除き完全に埋まっている配列での実装が効率的動的な挿入・削除が難しいヒープ、優先度付きキュー
2分探索木左<親<右の順序関係を持つ検索・挿入・削除がO(h)時間偏りがあると性能劣化辞書、シンボルテーブル
AVL木自己平衡型2分探索木、高さ差≦1常に平衡状態を保つ回転操作のオーバーヘッドデータベース、メモリ管理
赤黒木自己平衡型2分探索木、色による制約AVL木より挿入・削除が高速実装が複雑多くの言語のマップ実装、Linux仮想メモリ
B木多分木、ノードに複数キーディスクI/Oの最小化メモリ使用量が多いデータベース、ファイルシステム
多分木各ノードがn個以下の子を持つ幅広いデータ構造の表現メモリ効率が低い場合ありファイルシステム、XML/HTML DOM
順序木兄弟間に順序関係がある順序に意味を持たせられる一般的な操作が複雑になる構文解析、XMLツリー

表1: 主な木構造の特徴比較表

2.3. 木の巡回法

 木構造の全ノードを訪問する方法には、大きく分けて深さ優先探索幅優先探索があります。

 深さ優先探索では、可能な限り深く進んでから戻るというアプローチを取ります。2分木の場合、以下の3種類の巡回順序があります:

  1. 先行順(前順、プレオーダー):親 → 左の子 → 右の子
  2. 中間順(中順、インオーダー):左の子 → 親 → 右の子
  3. 後行順(後順、ポストオーダー):左の子 → 右の子 → 親

A

B

C

D

E

F

G

訪問順序: A,B,D,E,C,F,G

(親→左→右)

図7: 先行順巡回の図解

A

B

C

D

E

F

G

訪問順序: D,B,E,A,F,C,G

(左→親→右)

図8: 中間順巡回の図解

A

B

C

D

E

F

G

訪問順序: D,E,B,F,G,C,A

(左→右→親)

図9: 後行順巡回の図解

 幅優先探索では、同じ深さのノードをすべて訪問してから次の深さに進みます。レベル順(階層順)巡回とも呼ばれます。

A

B

C

D

E

F

G

レベル0

レベル1

レベル2

訪問順序: A,B,C,D,E,F,G

(レベル順に訪問)

実装時は

キュー使用

図10: 幅優先探索の図解

2.4. 節の追加や削除

 木構造、特に2分探索木やバランス木では、データの追加や削除がよく行われる操作です。

2.4.1. 節の追加

 2分探索木への節の追加は、以下のステップで行います:

  1. 根から始め、追加する値と各ノードの値を比較
  2. 値が小さければ左へ、大きければ右へ移動
  3. 適切な位置(葉ノードの位置)に到達したら、新しいノードを追加

 バランス木(AVL木など)の場合は、追加後にバランスを保つための回転操作が必要になる場合があります。

ステップ3: 追加完了

50

30

70

20

40

60

25

ステップ2: 値25の追加を検討

比較: 25 > 20

50

30

70

20

40

60

ステップ1: 初期状態

50

30

70

20

40

60

追加手順:

1. 根から比較開始

2. 値が小さければ左、大きければ右へ移動

3. 適切な位置に到達したら新ノード追加

図11: 節の追加の図解

2.4.2. 節の削除

 2分探索木からの節の削除は、次の場合分けで処理します:

  1. 削除するノードが葉の場合:単純に削除
  2. 削除するノードが1つの子を持つ場合:ノードを削除し、その子を親に接続
  3. 削除するノードが2つの子を持つ場合:ノードの中間順での後継ノード(右部分木の最小値)と値を交換し、後継ノードを削除

 バランス木の場合は、削除後にバランスを保つための回転操作が必要になる場合があります。

子が2つのノードの削除(50を削除)

葉ノードの削除(40を削除)

削除

後継者を特定(中間順での次のノード)

子が1つのノードの削除(30を削除)

削除し、子を親に接続

50

30

70

20

60

80

50

20

70

60

80

50

30

70

20

40

60

80

50

30

70

20

80

60

80

50

30

70

20

40

60

80

60

30

70

20

40

削除手順は3パターン:

1. 葉: 単純に削除

2. 子が1つ: 子を親に接続

3. 子が2つ: 中間順後継と交換し、後継を削除

図12: 節の削除の図解

2.5. ヒープの再構成

 ヒープは完全2分木を用いて実装される優先度付きキューの一種です。ヒープには最小ヒープと最大ヒープがあります。

 ヒープの主な操作には以下があります:

  1. 挿入
    • 最後の位置(配列の末尾)に要素を追加
    • ヒープ条件が満たされるまで上方向にバブルアップ(上昇)
  2. 最大値/最小値の削除
    • 根の値を取り出す
    • 最後の要素を根に移動
    • ヒープ条件が満たされるまで下方向にバブルダウン(下降)
  3. ヒープの再構成(ヒープ化):
    • 任意の配列からヒープを構築するプロセス
    • ボトムアップアプローチが効率的:最後の非葉ノードから始めて根に向かって各部分木をヒープ条件を満たすように調整

バブルダウン操作(最大値抽出後)

比較: 30 < 90, 30 < 80

30

80

90

70

50

40

90

80

30

70

50

40

バブルアップ操作(値75の挿入)

比較: 75 > 40

100

80

90

70

50

40

75

100

80

90

70

50

40

75

最大ヒープ

100

80

90

70

50

40

30

配列表現: [100, 80, 90, 70, 50, 40, 30]

性質: 親 ≥ 子

ヒープ操作:

1. 挿入: 末尾に追加後、バブルアップ

2. 最大値抽出: 根を返し、末尾を根に移動後、バブルダウン

3. ヒープ構築: 非葉から根へ向かってバブルダウン

図13: ヒープの構造と操作

2.5.1. ヒープソート

 ヒープソートはヒープデータ構造を利用したソートアルゴリズムです。手順は以下の通りです:

  1. 配列をヒープに変換(ヒープ化)
  2. 最大ヒープから最大値(根)を取り出し、配列の末尾に配置
  3. ヒープサイズを1減らし、ヒープを再構成
  4. すべての要素がソートされるまで2-3を繰り返す

 ヒープソートの時間計算量はO(n log n)で、安定ではありませんが追加のメモリをほとんど必要としないという特徴があります。

3. 応用例

3.1. ファイルシステム

 コンピュータのファイルシステムは、ディレクトリとファイルの階層構造を表現するために木構造(具体的には多分木)を使用しています。これにより、ファイルやフォルダを効率的に整理・検索できます。

3.2. データベースインデックス

 B木やB+木はデータベース管理システムでインデックスとして広く使用されています。これらの木構造により、大量のデータから特定のレコードを高速に検索できます。

3.3. 構文解析

 プログラミング言語のコンパイラやインタプリタでは、ソースコードの構文を解析する際に構文木(パースツリー)が使用されます。これは順序木の一種です。

3.4. 圧縮アルゴリズム

 ハフマン符号化などのデータ圧縮アルゴリズムでは、文字の出現頻度に基づいて2分木(ハフマン木)を構築し、効率的な符号化を実現しています。

3.5. 人工知能

 決定木は機械学習の分類アルゴリズムとして使用されています。また、ゲームAIでのミニマックスアルゴリズムやアルファベータ剪定も木構造を利用しています。

応用例使用される木構造理由・特徴具体例
ファイルシステム多分木・B木階層構造の表現、ディスクI/O最適化Unix/Linuxファイルシステム、NTFS、ext4
データベースインデックスB木・B+木ブロックアクセスの最小化、範囲検索の効率化MySQL(InnoDB)、PostgreSQL、Oracle
構文解析順序木(構文木)文法構造の階層的表現コンパイラ、インタプリタ、JSON/XMLパーサー
データ圧縮2分木(ハフマン木)出現頻度に基づく可変長符号化JPEG、MP3、ZIP、GZIP
ネットワークルーティングトライ木(Trie)IPアドレスの効率的な検索ルーターのルーティングテーブル
機械学習決定木特徴に基づく分類の視覚化と判断ランダムフォレスト、勾配ブースティング決定木
GUI要素多分木階層的なUIコンポーネントの表現DOM、ウィジェットツリー
ゲームAIミニマックス木ゲーム状態と可能手の探索チェス、将棋、囲碁のAI
メモリ管理AVL木・赤黒木動的メモリブロック管理の効率化メモリアロケータ、ガベージコレクタ
計算幾何学kd木・四分木多次元空間の効率的な分割と検索近傍探索、衝突検出、3Dレンダリング

表2: 木構造の応用例とその特徴

4. 例題

例題1: 2分木の巡回

次の2分木について、先行順、中間順、後行順での巡回結果をそれぞれ示せ。

    A
   / \
  B   C
 / \   \
D   E   F

解答例

  • 先行順: A, B, D, E, C, F
  • 中間順: D, B, E, A, C, F
  • 後行順: D, E, B, F, C, A

例題2: 2分探索木の構築

次の数値を順に2分探索木に挿入した場合の最終的な木の形を示せ。 50, 30, 70, 20, 40, 60, 80

解答例

    50
   /  \
  30   70
 / \   / \
20 40 60  80

例題3: ヒープの再構成

次の配列を最大ヒープに再構成する過程を示せ。 [4, 10, 3, 5, 1]

解答例

  1. 配列を完全2分木として表現:
    4
   / \
  10  3
 / \
5   1
  1. 最後の非葉ノードから根に向かってヒープ条件を適用:
    • インデックス1(値10)は既にヒープ条件を満たしている
    • インデックス0(値4)で比較: 4 < 10, 4 > 3 なので4と10を交換
    10
   /  \
  4    3
 / \
5   1
  1. さらに4を見ると、4 < 5 なので交換:
    10
   /  \
  5    3
 / \
4   1
  1. 最終的な最大ヒープ: [10, 5, 3, 4, 1]

例題4: AVL木のバランス調整

次の操作を行った後のAVL木を示せ。 空のAVL木に10, 20, 30, 40, 50の順に挿入する。

解答例

  1. 10を挿入: 10
  2. 20を挿入: 10 -> 20
  3. 30を挿入: バランス崩れるため左回転
   20
  /  \
 10   30
  1. 40を挿入: 20 -> 30 -> 40
  2. 50を挿入: バランス崩れるため左回転
      30
     /  \
    20   40
   /      \
  10       50

5. まとめ

 木構造は、階層的なデータを表現・操作するための基本的かつ強力なデータ構造です。本記事では、などの基本要素から始まり、2分木完全2分木バランス木順序木多分木探索木2分探索木B木AVL木などの様々な種類の木構造について解説しました。

 また、深さ優先探索幅優先探索という2つの基本的な巡回方法、および先行順後行順中間順という2分木特有の巡回順序についても説明しました。

 節の追加や削除、特に2分探索木とバランス木におけるそれらの操作と、ヒープデータ構造の再構成方法についても詳しく解説しました。

 木構造は理論的な概念にとどまらず、ファイルシステム、データベース、構文解析、人工知能など、情報処理のさまざまな分野で実際に応用されています。木構造の理解と適切な実装は、効率的なアルゴリズムの設計において不可欠な知識です。

参考文献

  1. トーマス・H・コルメン他, “アルゴリズムイントロダクション 第3版”, 近代科学社, 2013.(Amazonアソシエイトリンク)
  2. 石畑清, “アルゴリズムとデータ構造”, 岩波書店, 2016.(Amazonアソシエイトリンク)

※この記事にはAmazonアソシエイトのリンクが含まれています。購入された場合、収益の一部を得ることがあります。

2.1. 流れ図 >>