03. 了解與評估計算機的效能

效能 (Performance) 的定義

  • 兩種衡量計算機效能的標準:
    • 反應時間(respone time):
      • 工作從開始到結束所花的時間,又稱執行時間(execution time)
      • 適用於比較執行相同程式的兩部不同個人電腦
    • 生產量(throughput):
      • 單位時間內所完成的工作量(job 數量)
      • 適用於評比多人連線的伺服器network connection 數量
  • 執行時間定義 computer X 之效能: PerformanceX Performance_X = 1Execution TimeX \dfrac{1}{\mathit{\text{Execution Time}}_X}

    computer X 的速度是 computer Y 的 n 倍: PerformanceXPerformanceY \dfrac{Performance_X}{Performance_Y} = n n

Execution Time 的量測

  • 流逝時間(elapsed time): 執行一個程式或完成一項工作的所需時間總量

    • 程式執行及等待 I/O 時間
      • Disk 和 Memory I/O
      • Input/Output I/O
      • 作業系統的開銷(Operating System overhead)
    • 處理器執行時間(CPU execution time)

      程式或工作使用 CPU 的時間,又稱處理器時間(CPU time)

      • 系統處理器時間(System CPU time)

        CPU 執行作業系統的時間,為了服務使用者程式

      • 使用者處理器時間(User CPU time)

        CPU 執行使用者程式的時間,即本章所量測的執行時間(execution time)

        • absolute: wall clock
        • relative: CPU clock

影響 CPU 效能的因素

以時脈週期來量測 CPU Execution Time

  • 時脈(clock): computer 協調硬體動作的同步信號
  • 時脈週期(clock cycle): 時脈與時脈的時間間隔

    ex. ^{ex.} ALU 運算時,連續的 $Hi 與 $Lo 暫存器 load 完所花的時間間隔

  • 時脈週期時間(clock cycle time \text{\color{blue}{clock cycle time}} , clock period): 一個時脈週期的時間
  • 時脈頻率(clock rate) = 1clock cycle time \dfrac{1}{\text{clock cycle time}}
clock rate(Hz) clock cycle time(s)
K = 103 10^3 m = 103 10^{-3}
M = 106 10^6 μ \mu = 106 10^{-6}
G = 109 10^9 n = 109 10^{-9}
T = 1012 10^{12} p = 1012 10^{-12}
  • 時脈週期數(clock cycles) = 程式所執行的指令個數(Instruction Count, IC \text{\color{red}{IC}} ) × \times 平均執行每個指令所需的時脈週期數(Cycles Per Instruction, CPI \text{\color{green}{CPI}} )
  • 一個程式的 CPU Time = 程式所使用的時脈週期數 × \times 時脈週期時間

CPU Execution Time \rightarrow \Large{\text{CPU Execution Time}} = IC \Large{\text{\color{red}{IC}}} × \times CPI \Large{\text{\color{green}{CPI}}} × \times clock cycle time \Large{\text{\color{blue}{clock cycle time}}}

  • CPU clock cycles: IC×CPI \text{\color{red}{IC}} \times \text{\color{green}{CPI}}

    programs run on the same machine.

    • 在一個程式內,執行不同指令所需的時脈週期數不一定相同時:
      CPU clock cycles = i=1n \displaystyle\sum_{i=1}^n (Ci×CPIi C_i \times CPI_i ) \Rightarrow CPI \text{\color{green}{CPI}} = i=1n \displaystyle\sum_{i=1}^n (Frequencyi×CPIi Frequency_i \times CPI_i )
      • n n : 指令類別個數
      • Ci C_i : 指令類別 i i 所使用之指令個數
      • CPIi CPI_i : 指令類別 i i 之 CPI
      • Frequencyi Frequency_i : CiIC \dfrac{C_i}{\text{\color{red}{IC}}}
  • Instruction time: CPI×clock cycle time \text{\color{green}{CPI}} \times \text{\color{blue}{clock cycle time}}

    machines run the same program.

Measure for CPU Execution Time

右下角的 MIPS MIPS 使用 MIPS 做為效能評估標準的謬誤裡會詳細討論


IC CPI clock rate
Algorithm (Thought) \checkmark \checkmark
High Level Programming Language \checkmark \checkmark
Compiler \checkmark \checkmark
*ISA \checkmark \checkmark \checkmark
*Computer Organization \checkmark \checkmark
*VLSI Technology \checkmark
  • *ISA \uparrow : software; *ISA \downarrow : hardware
  • *ISA
\because IC CPI cycle time
  • *Computer Organization
\because IC CPI cycle time
single × \times
multiple × \times
pipeline × \times
  • *VLSI Technology \because IC 製程讓零件距離 \downarrow \Rightarrow 傳輸同步信號時間 \downarrow

使用 MIPS 做為效能評估標準的謬誤

  • MIPS MIPS (Million Instructions Per Second)

    指令的執行率,又稱 native MIPS

MIPS MIPS = Instruction rate106 \dfrac{\text{Instruction rate}}{10^6} = ICExecution Time×106 \dfrac{\text{IC}}{\mathit{\text{Execution Time}} \times 10^6} = clock rateCPI×106 \dfrac{\text{clock rate}}{\text{CPI} \times 10^6}

此 MIPS 01. 指令: 計算機的語言」之 MIPS(Microprocessor without Interlocked Pipe Stages)!

  • MIPS MIPS 作為 computer 效能評估標準時應注意:
    • MIPS MIPS 雖然表示指令的執行率,卻沒有考慮每一個指令在不同指令集裡的能力

      ex. ^{ex.} Judge by same MIPS MIPS , CISC > RISC

    • 同一 computer 的不同指令群,其 MIPS MIPS 不一定相同
    • MIPS MIPS 甚至可能會與 Performance 成反比

Amdahl's Law


Execution Time after \mathit{\text{Execution Time}} \bold{\text{ after}} = affected Execution Timeimprove rate \dfrac{\bold{\text{affected }} \mathit{\text{Execution Time}}}{\bold{\text{improve rate}}} + unaffected Execution Time \bold{\text{unaffected }} \mathit{\text{Execution Time}}

  • Execution Time after \mathit{\text{Execution Time}} \bold{\text{ after}} : 改善後的執行時間
  • affected Execution Time \bold{\text{affected }} \mathit{\text{Execution Time}} : 會受改善影響的執行時間
  • improve rate \bold{\text{improve rate}} : 改善倍率
  • unaffected Execution Time \bold{\text{unaffected }} \mathit{\text{Execution Time}} : 不會受改善影響的執行時間

加速 (Speedup)


speedup \bold{\text{speedup}} = Performance afterPerformance before \dfrac{Performance \bold{\text{ after}}}{Performance \bold{\text{ before}}} = Execution Time beforeExecution Time after \dfrac{\mathit{\text{Execution Time}} \bold{\text{ before}}}{\mathit{\text{Execution Time}} \bold{\text{ after}}} = 1FS+(1F) \bold{\dfrac{1}{\dfrac{F}{S} + (1 - F)}}
(上下同 ÷ \div Execution Time before \mathit{\text{Execution Time}} \bold{\text{ before}} )

  • Execution Time before \mathit{\text{Execution Time}} \bold{\text{ before}} : 改善前的執行時間,即 affected Execution Time \bold{\text{affected }} \mathit{\text{Execution Time}} + unaffected Execution Time \bold{\text{unaffected }} \mathit{\text{Execution Time}}
  • F \bold{F} : 原始程式花在改善部分計算的比例,即 affected Execution TimeExecution Time before \dfrac{\bold{\text{affected }} \mathit{\text{Execution Time}}}{\mathit{\text{Execution Time}} \bold{\text{ before}}}
  • S \bold{S} = improve rate \bold{\text{improve rate}}

Make the Common Case Fast

\because 改善效率該部分所佔全部時間的比例有關
\therefore 一個程式只要改善較常出現的部分,就會比去對極少出現的部分做最佳化還來得有效


算數平均 (Arithmetic Mean, AM)

AM AM = 1ni=1nTimei \dfrac{1}{n} \displaystyle\sum_{i=1}^n Time_i

  • n n : 工作負載(workload)中的程式數量
  • Timei Time_i : 程式 i i 的執行時間

\rightarrow 適用條件: 工作負載中的每個程式的執行次數皆相同

加權算數平均 (Weighted Arithmetic Mean, WAM)

WAM WAM = i=1nTimei×Weighti \displaystyle\sum_{i=1}^n Time_i \times Weight_i

  • Weighti Weight_i : 工作負載中的程式出現頻率

\rightarrow 適用條件: 工作負載中的每個程式的執行次數不一定相同,在算數學期望值

正規化 (SPECratio)

將某一程式在某部機器上的執行時間 ÷ \div 此程式在各部機器上的執行時間:
SPECratio SPECratio = referenced Execution Timemeasured Execution Time \dfrac{\bold{\text{referenced }} \mathit{\text{Execution Time}}}{\bold{\text{measured }} \mathit{\text{Execution Time}}}

\rightarrow 適用條件: 同時評估數部機器的效能SPECratio SPECratio \uparrow \Rightarrow 效能愈好

ex. ^{ex.} 考慮 program 1 和 program 2 同時在 computer A 與 computer B 上的執行時間:

computer A computer B
program 1 1 10
program 2 1000 100
AM \mathit{AM} 500.5 55


對 A 正規化 (A, B) 對 B 正規化 (A, B)
program 1 (1, 0.1) (10, 1)
program 2 (1, 10) (0.1, 1)
AM \mathit{AM} (1, 5.05) (5.05, 1)

\Rightarrow 分別對 A 和 B 做正規化後,透過 AM AM 比較 A 與 B 效能的結果卻不相同,且有些結果與單純計算 A 和 B 的 AM AM 做比較也有所差異,存在不確定性下無法總評效能!
\therefore 此時應該採用下方的幾何平均

幾何平均 (Geometric Mean, GM)

GM GM = i=1nSPECratioin \sqrt[n]{\displaystyle\prod_{i=1}^n SPECratio_i}

i=1nai \displaystyle\prod_{i=1}^n a_i = a1×a2× a_1 \times a_2 \times ... ×an \times a_n

\rightarrow 適用條件: 使用 SPECratio SPECratio 無法準確評估數部機器的效能時

ex. ^{ex.} 承上題:

computer A computer B
program 1 1 10
program 2 1000 100
GM \mathit{GM} 31.6 31.6


對 A 正規化 (A, B) 對 B 正規化 (A, B)
program 1 (1, 0.1) (10, 1)
program 2 (1, 10) (0.1, 1)
GM \mathit{GM} (1, 1) (1, 1)

\Rightarrow \because GM(Xi)GM(Yi) \dfrac{GM(X_i)}{GM(Y_i)} = GM(XiYi) GM(\dfrac{X_i}{Y_i}) \therefore 先做 GM GM 再正規化 = 先正規化再做 GM GM ,然而違背效能測量的基本原則: 只能知道時間比值,卻無法預測執行時間

效能評估程式 (Benchmark)

SPEC(System Performance Evaluation Coporation):

  • SPEC CPU2000: 評估處理器
    • CINT2000: 12整數程式
    • CFP2000: 14浮點數程式
  • SPECweb99: 評估網頁伺服器
