<< 2.2.3. データ分析における統計的手法

1. 概要

 データの可視化は、複雑な数値情報を視覚的に分かりやすく表現する技術です。ビジネスの意思決定やシステム開発において、大量のデータから意味のある情報を素早く読み取るために欠かせません。適切な図表やグラフを選択することで、データの傾向、パターン、異常値などを直感的に把握できます。一方で、不適切な表現方法は誤った判断を招く可能性があるため、データの正しい可視化方法を理解することが重要です。本記事では、データ可視化の基本原則から実践的な活用方法、そして誤解を招きやすい表現の見極め方まで、体系的に解説します。

2. 詳細説明

2.1 データ可視化の基本原則

 データ可視化の目的は、数値の羅列では見えにくい情報を視覚的に明確にすることです。人間の脳は視覚情報を効率的に処理できるため、適切な可視化により、データの理解速度と精度が大幅に向上します。基本原則として、以下の点が重要です。

 第一に、目的に応じた適切な図表の選択が必要です。時系列データには折れ線グラフ、カテゴリ間の比較には棒グラフ、構成比を示すには円グラフというように、データの性質と伝えたい情報に最適な表現方法を選びます。

 第二に、シンプルで明確な表現を心がけることです。過度な装飾や不必要な3D効果は、かえってデータの理解を妨げます。必要最小限の要素で最大限の情報を伝えることが理想的です。

時系列データ

推移・トレンド

変化の累積

カテゴリデータ

項目間の比較

構成比・割合

複数系列の比較

数値の分布

データの散らばり

分布の詳細

2変数の関係

連続変数間

多次元データ

階層構造

地理データ

データの可視化開始

データの種類は?

目的は?

折れ線グラフ

面グラフ

比較の種類は?

棒グラフ

円グラフ

グループ化棒グラフ

分析の目的は?

ヒストグラム

箱ひげ図

相関の種類は?

散布図

バブルチャート

ツリーマップ

ヒートマップ/地図

可視化完了

2.2 誤解を招く可視化の問題点

 データの可視化において、意図的または無意識的に誤解を招く表現が使われることがあります。最も一般的な問題は、縦軸の起点を0以外に設定することです。例えば、売上高が100億円から110億円に増加した場合、縦軸を90億円から始めると10%の増加が視覚的に大きく誇張されます。

 また、不必要な3D表現も問題です。3D円グラフでは、手前の要素が実際より大きく見え、奥の要素が小さく見えるため、正確な比較が困難になります。さらに、スケールの不統一や、データの一部を恣意的に切り取った表示も、誤った印象を与える原因となります。

 これらの問題を見抜くには、常に数値データそのものを確認し、グラフの軸設定や表現方法に注意を払う必要があります。

3. 実装方法と応用例

3.1 ビジネスインテリジェンスでの活用

 現代のビジネスでは、BIツールを活用したダッシュボードが一般的です。売上推移、在庫状況、顧客動向などを一画面で把握できるよう、複数のグラフを組み合わせて表示します。重要なのは、経営層向けには概要を示す集約的なグラフ、現場担当者向けには詳細な分析が可能なドリルダウン機能を持つグラフというように、利用者に応じた可視化を提供することです。

主要なグラフ種類の一覧と特徴

主要なグラフ種類の一覧と特徴

1. 棒グラフ

用途: カテゴリ間の比較
特徴: 数値の大小関係が一目瞭然

2. 折れ線グラフ

用途: 時系列データの推移
特徴: 変化の傾向を把握しやすい

3. 円グラフ

用途: 構成比の表示
特徴: 全体に対する割合が明確

4. 散布図

用途: 2変数間の相関関係
特徴: データの分布と相関を視覚化

5. ヒストグラム

用途: データの分布状況
特徴: 頻度分布が一目で分かる

6. 箱ひげ図

用途: データのばらつき分析
特徴: 中央値、四分位数、外れ値を表示

7. 積み上げ棒グラフ

用途: 内訳と合計の同時表示
特徴: 構成要素と全体量を比較

8. レーダーチャート

用途: 多項目の評価比較
特徴: バランスを視覚的に表現

9. ヒートマップ

用途: 2次元データの密度表示
特徴: 色の濃淡で数値を表現

10. バブルチャート

用途: 3変数の関係性表示
特徴: X軸、Y軸、サイズで表現

11. ウォーターフォール

用途: 増減の累積効果
特徴: 各要因の影響を段階的に表示

12. ツリーマップ

用途: 階層構造と比率
特徴: 面積で数値の大きさを表現

グラフ種類最適な用途長所短所
棒グラフカテゴリ間の比較直感的で理解しやすい連続的な変化には不向き
折れ線グラフ時系列データの推移トレンドが見えやすい多系列だと見づらい
円グラフ構成比の表示割合が一目瞭然項目が多いと判別困難
散布図相関関係の分析パターンを発見しやすい大量データで重なる
ヒストグラム分布の把握分布形状が明確ビン幅の設定が重要
箱ひげ図統計量の比較外れ値が分かる詳細な分布は不明
積み上げ棒グラフ内訳と合計の表示構成と総量が分かる個別値の比較が困難
レーダーチャート多次元データの比較バランスが見える定量的比較が難しい
ヒートマップ行列データの可視化パターンを発見しやすい正確な値は読み取りにくい
バブルチャート3変数の関係表示多次元情報を表現サイズの比較が困難
ウォーターフォール累積的な変化プロセスが明確作成が複雑
ツリーマップ階層構造の可視化スペース効率が良い小さい項目が見えにくい

// 棒グラフ const barCanvas = document.getElementById(‘barChart’); const barCtx = barCanvas.getContext(‘2d’); const barData = [45, 78, 52, 90, 65]; const barLabels = [‘A’, ‘B’, ‘C’, ‘D’, ‘E’]; const barMax = Math.max(…barData); const barWidth = 40; const barSpacing = 20;

barCtx.clearRect(0, 0, barCanvas.width, barCanvas.height); barCtx.strokeStyle = ‘#333’; barCtx.beginPath(); barCtx.moveTo(30, 170); barCtx.lineTo(280, 170); barCtx.moveTo(30, 170); barCtx.lineTo(30, 20); barCtx.stroke();

barData.forEach((value, i) => { const barHeight = (value / barMax) * 130; const x = 50 + i * (barWidth + barSpacing); barCtx.fillStyle = ‘#4CAF50’; barCtx.fillRect(x, 170 - barHeight, barWidth, barHeight); barCtx.fillStyle = ‘#333’; barCtx.font = ‘12px Arial’; barCtx.textAlign = ‘center’; barCtx.fillText(barLabels[i], x + barWidth/2, 185); });

// 折れ線グラフ const lineCanvas = document.getElementById(‘lineChart’); const lineCtx = lineCanvas.getContext(‘2d’); const lineData = [30, 45, 55, 48, 70, 65, 80]; const lineMax = Math.max(…lineData);

lineCtx.clearRect(0, 0, lineCanvas.width, lineCanvas.height); lineCtx.strokeStyle = ‘#333’; lineCtx.beginPath(); lineCtx.moveTo(30, 170); lineCtx.lineTo(280, 170); lineCtx.moveTo(30, 170); lineCtx.lineTo(30, 20); lineCtx.stroke();

lineCtx.strokeStyle = ‘#2196F3’; lineCtx.lineWidth = 2; lineCtx.beginPath(); lineData.forEach((value, i) => { const x = 40 + i * 35; const y = 170 - (value / lineMax) * 130; if (i === 0) lineCtx.moveTo(x, y); else lineCtx.lineTo(x, y); }); lineCtx.stroke();

lineData.forEach((value, i) => { const x = 40 + i * 35; const y = 170 - (value / lineMax) * 130; lineCtx.fillStyle = ‘#2196F3’; lineCtx.beginPath(); lineCtx.arc(x, y, 3, 0, 2 * Math.PI); lineCtx.fill(); });

// 円グラフ const pieCanvas = document.getElementById(‘pieChart’); const pieCtx = pieCanvas.getContext(‘2d’); const pieData = [35, 25, 20, 15, 5]; const pieColors = [‘#FF6384’, ‘#36A2EB’, ‘#FFCE56’, ‘#4BC0C0’, ‘#9966FF’]; const pieTotal = pieData.reduce((a, b) => a + b, 0); let currentAngle = -Math.PI / 2;

pieCtx.clearRect(0, 0, pieCanvas.width, pieCanvas.height); pieData.forEach((value, i) => { const sliceAngle = (value / pieTotal) * 2 * Math.PI; pieCtx.beginPath(); pieCtx.arc(150, 100, 70, currentAngle, currentAngle + sliceAngle); pieCtx.lineTo(150, 100); pieCtx.fillStyle = pieColors[i]; pieCtx.fill(); currentAngle += sliceAngle; });

// 散布図 const scatterCanvas = document.getElementById(‘scatterChart’); const scatterCtx = scatterCanvas.getContext(‘2d’); const scatterData = [ {x: 20, y: 30}, {x: 40, y: 50}, {x: 60, y: 65}, {x: 80, y: 85}, {x: 100, y: 95}, {x: 45, y: 55}, {x: 75, y: 70}, {x: 35, y: 45}, {x: 90, y: 90} ];

scatterCtx.clearRect(0, 0, scatterCanvas.width, scatterCanvas.height); scatterCtx.strokeStyle = ‘#333’; scatterCtx.beginPath(); scatterCtx.moveTo(30, 170); scatterCtx.lineTo(280, 170); scatterCtx.moveTo(30, 170); scatterCtx.lineTo(30, 20); scatterCtx.stroke();

scatterData.forEach(point => { const x = 30 + (point.x / 100) * 230; const y = 170 - (point.y / 100) * 130; scatterCtx.fillStyle = ‘#FF5722’; scatterCtx.beginPath(); scatterCtx.arc(x, y, 4, 0, 2 * Math.PI); scatterCtx.fill(); });

// ヒストグラム const histCanvas = document.getElementById(‘histogramChart’); const histCtx = histCanvas.getContext(‘2d’); const histData = [15, 25, 40, 35, 20, 10]; const histMax = Math.max(…histData);

histCtx.clearRect(0, 0, histCanvas.width, histCanvas.height); histCtx.strokeStyle = ‘#333’; histCtx.beginPath(); histCtx.moveTo(30, 170); histCtx.lineTo(280, 170); histCtx.moveTo(30, 170); histCtx.lineTo(30, 20); histCtx.stroke();

histData.forEach((value, i) => { const barHeight = (value / histMax) * 130; const x = 40 + i * 38; histCtx.fillStyle = ‘#9C27B0’; histCtx.fillRect(x, 170 - barHeight, 35, barHeight); });

// 箱ひげ図 const boxCanvas = document.getElementById(‘boxChart’); const boxCtx = boxCanvas.getContext(‘2d’);

boxCtx.clearRect(0, 0, boxCanvas.width, boxCanvas.height); boxCtx.strokeStyle = ‘#333’; boxCtx.beginPath(); boxCtx.moveTo(30, 170); boxCtx.lineTo(280, 170); boxCtx.moveTo(30, 170); boxCtx.lineTo(30, 20); boxCtx.stroke();

// 箱ひげ図のデータ const boxPositions = [80, 150, 220]; const boxData = [ {min: 20, q1: 35, median: 50, q3: 65, max: 80}, {min: 15, q1: 30, median: 45, q3: 60, max: 75}, {min: 25, q1: 40, median: 55, q3: 70, max: 85} ];

boxData.forEach((data, i) => { const x = boxPositions[i]; const scale = 130 / 100;

boxCtx.strokeStyle = ‘#00BCD4’; boxCtx.lineWidth = 2;

// 箱 boxCtx.fillStyle = ‘rgba(0, 188, 212, 0.3)’; boxCtx.fillRect(x - 20, 170 - data.q3 * scale, 40, (data.q3 - data.q1) * scale); boxCtx.strokeRect(x - 20, 170 - data.q3 * scale, 40, (data.q3 - data.q1) * scale);

// 中央値 boxCtx.beginPath(); boxCtx.moveTo(x - 20, 170 - data.median * scale); boxCtx.lineTo(x + 20, 170 - data.median * scale); boxCtx.stroke();

// ひげ boxCtx.beginPath(); boxCtx.moveTo(x, 170 - data.max * scale); boxCtx.lineTo(x, 170 - data.q3 * scale); boxCtx.moveTo(x, 170 - data.q1 * scale); boxCtx.lineTo(x, 170 - data.min * scale); boxCtx.stroke(); });

// 積み上げ棒グラフ const stackedCanvas = document.getElementById(‘stackedBarChart’); const stackedCtx = stackedCanvas.getContext(‘2d’); const stackedData = [ [20, 30, 25], [25, 35, 30], [30, 25, 35], [35, 40, 20] ]; const stackedColors = [‘#FF9800’, ‘#795548’, ‘#607D8B’];

stackedCtx.clearRect(0, 0, stackedCanvas.width, stackedCanvas.height); stackedCtx.strokeStyle = ‘#333’; stackedCtx.beginPath(); stackedCtx.moveTo(30, 170); stackedCtx.lineTo(280, 170); stackedCtx.moveTo(30, 170); stackedCtx.lineTo(30, 20); stackedCtx.stroke();

stackedData.forEach((stack, i) => { let currentY = 170; const x = 50 + i * 60; stack.forEach((value, j) => { const barHeight = value * 1.3; stackedCtx.fillStyle = stackedColors[j]; stackedCtx.fillRect(x, currentY - barHeight, 40, barHeight); currentY -= barHeight; }); });

// レーダーチャート const radarCanvas = document.getElementById(‘radarChart’); const radarCtx = radarCanvas.getContext(‘2d’); const radarData = [75, 85, 60, 90, 70, 80]; const radarLabels = [‘A’, ‘B’, ‘C’, ‘D’, ‘E’, ‘F’]; const radarCenter = {x: 150, y: 100}; const radarRadius = 70;

radarCtx.clearRect(0, 0, radarCanvas.width, radarCanvas.height);

// グリッド線 for (let i = 1; i <= 5; i++) { radarCtx.strokeStyle = ‘#ddd’; radarCtx.beginPath(); for (let j = 0; j < 6; j++) { const angle = (j / 6) * 2 * Math.PI - Math.PI / 2; const x = radarCenter.x + Math.cos(angle) * (radarRadius * i / 5); const y = radarCenter.y + Math.sin(angle) * (radarRadius * i / 5); if (j === 0) radarCtx.moveTo(x, y); else radarCtx.lineTo(x, y); } radarCtx.closePath(); radarCtx.stroke(); } // データプロット radarCtx.fillStyle = ‘rgba(255, 99, 132, 0.3)’; radarCtx.strokeStyle = ‘#FF6384’; radarCtx.lineWidth = 2; radarCtx.beginPath(); radarData.forEach((value, i) => { const angle = (i / 6) * 2 * Math.PI - Math.PI / 2; const x = radarCenter.x + Math.cos(angle) * (radarRadius * value / 100); const y = radarCenter.y + Math.sin(angle) * (radarRadius * value / 100); if (i === 0) radarCtx.moveTo(x, y); else radarCtx.lineTo(x, y); }); radarCtx.closePath(); radarCtx.fill(); radarCtx.stroke();

// ヒートマップ const heatmapCanvas = document.getElementById(‘heatmapChart’); const heatmapCtx = heatmapCanvas.getContext(‘2d’); const heatmapData = [ [80, 65, 45, 70, 55], [60, 90, 70, 85, 75], [40, 55, 85, 60, 95], [75, 70, 60, 90, 80] ];

heatmapCtx.clearRect(0, 0, heatmapCanvas.width, heatmapCanvas.height); const cellWidth = 45; const cellHeight = 35;

heatmapData.forEach((row, i) => { row.forEach((value, j) => { const intensity = value / 100; const red = Math.floor(255 * intensity); const blue = Math.floor(255 * (1 - intensity)); heatmapCtx.fillStyle = `rgb(${red}, 0, ${blue})`; heatmapCtx.fillRect(40 + j * cellWidth, 30 + i * cellHeight, cellWidth - 2, cellHeight - 2); }); });

// バブルチャート const bubbleCanvas = document.getElementById(‘bubbleChart’); const bubbleCtx = bubbleCanvas.getContext(‘2d’); const bubbleData = [ {x: 30, y: 40, size: 15}, {x: 60, y: 70, size: 25}, {x: 80, y: 50, size: 20}, {x: 45, y: 85, size: 30}, {x: 90, y: 30, size: 18} ];

bubbleCtx.clearRect(0, 0, bubbleCanvas.width, bubbleCanvas.height); bubbleCtx.strokeStyle = ‘#333’; bubbleCtx.beginPath(); bubbleCtx.moveTo(30, 170); bubbleCtx.lineTo(280, 170); bubbleCtx.moveTo(30, 170); bubbleCtx.lineTo(30, 20); bubbleCtx.stroke();

bubbleData.forEach(bubble => { const x = 30 + (bubble.x / 100) * 230; const y = 170 - (bubble.y / 100) * 130; bubbleCtx.fillStyle = ‘rgba(54, 162, 235, 0.5)’; bubbleCtx.beginPath(); bubbleCtx.arc(x, y, bubble.size / 2, 0, 2 * Math.PI); bubbleCtx.fill(); bubbleCtx.strokeStyle = ‘#36A2EB’; bubbleCtx.stroke(); });

// ウォーターフォールチャート const waterfallCanvas = document.getElementById(‘waterfallChart’); const waterfallCtx = waterfallCanvas.getContext(‘2d’); const waterfallData = [ {value: 50, type: ‘start’}, {value: 20, type: ‘increase’}, {value: -15, type: ‘decrease’}, {value: 30, type: ‘increase’}, {value: -10, type: ‘decrease’}, {value: 75, type: ‘end’} ];

waterfallCtx.clearRect(0, 0, waterfallCanvas.width, waterfallCanvas.height); waterfallCtx.strokeStyle = ‘#333’; waterfallCtx.beginPath(); waterfallCtx.moveTo(30, 170); waterfallCtx.lineTo(280, 170); waterfallCtx.moveTo(30, 170); waterfallCtx.lineTo(30, 20); waterfallCtx.stroke();

let waterfallCurrent = 0; waterfallData.forEach((item, i) => { const x = 40 + i * 40; const barWidth = 35;

if (item.type === ‘start’ || item.type === ‘end’) { waterfallCtx.fillStyle = ‘#673AB7’; waterfallCtx.fillRect(x, 170 - item.value, barWidth, item.value); waterfallCurrent = item.value; } else { const startY = 170 - waterfallCurrent; const barHeight = Math.abs(item.value); if (item.value > 0) { waterfallCtx.fillStyle = ‘#4CAF50’; waterfallCtx.fillRect(x, startY - barHeight, barWidth, barHeight); waterfallCurrent += item.value; } else { waterfallCtx.fillStyle = ‘#F44336’; waterfallCtx.fillRect(x, startY, barWidth, barHeight); waterfallCurrent += item.value; } } });

// ツリーマップ const treemapCanvas = document.getElementById(‘treemapChart’); const treemapCtx = treemapCanvas.getContext(‘2d’); const treemapData = [ {value: 35, color: ‘#E91E63’}, {value: 25, color: ‘#9C27B0’}, {value: 20, color: ‘#3F51B5’}, {value: 15, color: ‘#009688’}, {value: 5, color: ‘#FF5722’} ];

treemapCtx.clearRect(0, 0, treemapCanvas.width, treemapCanvas.height); const totalValue = treemapData.reduce((sum, item) => sum + item.value, 0); let currentX = 20; const treeMapY = 30; const treeMapHeight = 140; const treeMapWidth = 260;

treemapData.forEach(item => { const itemWidth = (item.value / totalValue) * treeMapWidth; treemapCtx.fillStyle = item.color; treemapCtx.fillRect(currentX, treeMapY, itemWidth - 2, treeMapHeight); currentX += itemWidth; });

3.2 プログラムによる実装例

 PythonのMatplotlibやJavaScriptのD3.jsなど、プログラミング言語を使用したデータ可視化も重要です。以下は、適切なグラフ作成の基本的な考え方です。

データ可視化ツールの機能比較表

データ可視化ツールの機能比較表

ツール名主な機能難易度主な用途
Excel基本的なグラフ作成、ピボットテーブル、簡易分析機能初級日常的なデータ分析、レポート作成、小規模データの可視化
Tableauドラッグ&ドロップ操作、インタラクティブダッシュボード、高度な可視化中級ビジネスインテリジェンス、経営ダッシュボード、大規模データ分析
Power BIMicrosoft製品連携、リアルタイム更新、モバイル対応中級企業向けBI、Office 365連携、部門横断的な分析
Python (matplotlib)プログラマブル、科学技術計算対応、機械学習連携上級データサイエンス、研究開発、自動化された分析処理
R統計解析特化、豊富なパッケージ、学術向け機能上級統計分析、学術研究、高度な数理モデリング
D3.jsWeb対応、完全カスタマイズ可能、インタラクティブ機能専門家Webアプリケーション、独自の可視化要件、インタラクティブコンテンツ

**注記:**難易度は一般的な学習曲線を示しています。初級は基本操作が数日で習得可能、中級は数週間から数ヶ月、上級は数ヶ月以上の学習期間、専門家レベルはプログラミング経験が必須となります。

色覚多様性に配慮した配色パターン

通常の見え方

赤緑色覚異常

青黄色覚異常

推奨配色パレット

オレンジ

水色

※ 色覚多様性に配慮した配色は、赤緑の組み合わせを避け、   明度差を大きくすることで識別しやすくなります

 まず、データの前処理として欠損値の処理や外れ値の検出を行います。次に、データの特性を分析し、最適な可視化方法を選択します。実装時は、軸ラベル、凡例、タイトルを明確に設定し、色使いにも配慮します。特に色覚多様性への対応として、赤と緑の組み合わせを避けるなどの工夫が必要です。

4. 例題と解説

【例題】
 ある企業の四半期売上高の推移を示すグラフについて、以下の選択肢から最も適切でないものを選べ。

ア.時系列データであるため、折れ線グラフで表示する
イ.見やすさを優先し、縦軸の起点を売上高の最小値付近に設定する
ウ.各四半期の値を明確にするため、データポイントにマーカーを表示する
エ.前年同期との比較のため、2本の折れ線を同じグラフに表示する

【解説】
 正解は「イ」です。縦軸の起点を0以外に設定すると、売上高の変化が実際より大きく見え、誤った印象を与えます。例えば、100億円から110億円への10%増加が、縦軸を90億円から始めると視覚的に2倍以上の増加に見える可能性があります。

 アは時系列データの基本的な表示方法として適切です。ウのマーカー表示は具体的な数値を読み取りやすくし、エの複数系列の表示は比較分析に有効です。データの可視化では、正確性と分かりやすさのバランスを保ちながら、誤解を招かない表現を選ぶことが重要です。

5. まとめ

 データの可視化は、情報を効果的に伝達し、意思決定を支援する重要な技術です。適切な図表の選択、シンプルで明確な表現、そして誤解を招く表現の回避が成功の鍵となります。特に、グラフの軸設定や不必要な装飾に注意し、常にデータの本質を正確に伝えることを心がける必要があります。応用情報技術者として、データを正しく可視化し、また他者が作成した図表を批判的に読み解く能力は、システム開発やビジネス分析において不可欠なスキルです。

3.1.1. 売上と利益の関係 >>

ご利用上のご注意

 このコンテンツの一部は、生成AIによるコンテンツ自動生成・投稿システムをもちいて作成し、人間がチェックをおこなった上で公開しています。チェックは十分に実施していますが、誤謬・誤解などが含まれる場合が想定されます。お気づきの点がございましたらご連絡いただけましたら幸甚です。