脈象標準化的困境：設備之外的問題

學習資源 ｜本文接續脈象是什麼的討論，深入探討為什麼「標準化脈診設備」還不夠。

一個常見的誤解

脈診現代化討論裡，有一個很容易落入的思維陷阱：

「脈診之所以難以重複、難以科學化，是因為現在的感測器不夠好、施壓機構不夠穩定、取樣率不夠高。只要設備標準了，問題就解決了。」

這個說法不算錯，但它解決的只是問題的一層。

即使有一天，全球的脈診研究實驗室都使用完全相同的感測器、完全相同的施壓協議、完全相同的取樣率，脈診研究仍然會面臨另外兩個更根本的標準化問題：分析方法的標準化，以及概念本身的標準化。

標準化的三層結構

把脈診的標準化問題拆開來看，至少有三個層次：

第一層：設備標準化（Device Standardization）

測量工具的物理一致性：

感測器的型號、靈敏度、頻率響應
施壓機構的力量控制
受測部位的定位（橈動脈的哪一點？寸、關、尺的位置如何定義？）
取樣率（常見的脈診研究取樣率從 200 Hz 到 1000 Hz 不等，高頻細節的保留程度不同）
環境條件（室溫、受測者靜息時間、體位）

這是目前研究界討論最多的層次。已經有一些嘗試制定協議的努力，但跨實驗室的標準仍然不統一。

第二層：分析方法的標準化（Analytical Standardization）

即使使用同樣的設備，分析脈搏波的方式也可以完全不同：

頻域 vs 時域：有的研究用 FFT 分析諧波，有的研究直接測量波形特徵（上升時間、主峰寬度、面積比）
分析窗口的長度：用幾秒的片段做分析？10 秒、30 秒、還是 5 分鐘？
拍的辨識方式：怎麼定義一次搏動的起點和終點？
雜訊過濾：低通濾波的截止頻率是多少？這個選擇直接影響波形細節的保留程度
異常拍的處理：如果有一拍明顯不正常，要剔除還是保留？

不同的分析選擇，可以讓同一段脈搏錄音產生完全不同的數值結果。兩篇研究都在量化「弦脈」，但一篇用的是 C1/C0 諧波比，另一篇用的是收縮期上升斜率，它們測量的是同一件事嗎？沒有人知道。

第三層：概念標準化（Conceptual Standardization）

這是最根本、也最少被討論的層次：脈象名稱本身代表的概念，在不同人之間是否一致？

「弦脈」這個詞，在台北某位中醫師的臨床判斷裡，跟在廣州某位中醫師的判斷裡，指的是同一件事嗎？

文獻研究給出了令人不安的答案：不一定。

信度問題：脈診師之間的一致性

在臨床研究方法學裡，有一個概念叫做評分者間信度（inter-rater reliability）——不同的評分者，在評估同一個對象時，給出相同結論的機率有多高。

對脈診而言，問題是：請兩位有經驗的中醫師，同時診同一位病人的脈象，他們的診斷結果吻合嗎？

現有研究的結果，並不樂觀。幾項設計嚴謹的一致性研究（包含來自台灣、香港、大陸的研究）發現，不同中醫師對同一位受試者的脈象診斷，一致性程度往往只在「偶然水準以上一點點」——也就是說，協議的程度不比隨機猜測高很多。

這不是在說中醫師的能力有問題，而是說：傳統脈象語言的操作性定義模糊，導致它本身就難以在不同學習者之間形成一致的感知標準。

操作性定義的缺失

「操作性定義」（operational definition）是科學測量的基礎概念：把一個抽象的概念，翻譯成具體的、可重複的測量程序。

例如：

「體溫」的操作性定義是：使用已校準的電子溫度計，探頭置於腋下三分鐘，讀取數值
「血壓偏高」的操作性定義是：在靜息狀態下，以標準血壓計測量三次，平均值超過 140/90 mmHg

脈象目前缺乏的，正是這一層。

「弦脈」的操作性定義是什麼？「滑脈」要滿足哪些波形條件才算是滑？這些定義，不同的教材說法不一，不同的臨床老師傳授的標準也不同。

在沒有操作性定義的情況下，即使你建立了完美的感測器，你也不知道感測器測出來的數值，應該對應到哪一種脈象——因為「哪一種脈象」的邊界本身就不清楚。

一個可以驗證這個問題的實驗

想像這樣一個研究設計：

招募 20 位有執照的中醫師
讓他們各自診斷 50 位受試者的脈象（不互相討論）
計算他們對同一位受試者診斷的吻合率（Cohen's kappa 或 ICC）

如果結果顯示吻合率很低，那就說明：在進行任何脈診量化研究之前，首先需要解決的是人類診斷者之間的一致性問題。

把不一致的人類判斷當作「金標準」（ground truth），再用感測器去預測這個金標準，測量的是什麼？是脈象的客觀特徵，還是某一位中醫師的主觀判斷模式？

這個問題，在許多脈診研究中被跳過了。

為什麼這麼難解決

概念標準化的困難，有幾個深層原因：

語言的固有模糊性

傳統脈象描述是詩意的、比喻的，不是工程規格書。「如按琴弦」描述的是觸覺體驗，不是數學公式。把體驗翻譯成數值，需要中間步驟——而中間步驟目前是缺失的。

訓練路徑的多樣性

中醫教育沒有像西方醫學那樣高度標準化的課程。不同學校、不同師承、不同地區，學到的脈象標準可能有實質差異。台灣的脈診教育、大陸的教材、日本漢方的流派，對同一個脈象可能有不同的理解。

缺乏校準機制

在電子測量設備裡，「校準」是指把設備的讀數對照到已知標準值，確保測量的準確性。脈診的「校準」是什麼？誰的判斷是標準？沒有公認的金標準，也就沒有辦法校準。

脈象本身的動態性

前一篇文章提到，脈象會隨著情境改變。這意味著脈象的「標準」不只是一個靜態定義，還需要規定「在什麼條件下測量」——時段、情緒狀態、飲食狀況、體位，都可能影響脈象。

已有的嘗試

這個問題不是完全沒有人意識到。幾個值得注意的方向：

1. 脈診教學客觀化 部分研究嘗試建立脈象的標準教學模型——製作人工脈搏模擬器，讓學生觸診標準脈象，訓練手感的一致性。但這解決的是「如何把標準傳授給下一代」，沒有解決「標準本身是什麼」。

2. 多指標聯合定義 有研究提出，不要用單一指標（如某個諧波比）定義脈象，而是用多個波形指標的組合來界定。這是合理的方向，但需要前述的評分者信度研究來確認哪個組合真的和臨床判斷對應。

3. 機器學習分類 近年有研究用機器學習，把大量脈搏錄音對應到中醫師的診斷標籤，訓練分類器。這個方法有個隱藏的前提：用來標記數據的中醫師判斷是一致的。如果標記者之間不一致，訓練出來的分類器是在學習「某種混合了多種標準的模糊判斷」。

小結：三層問題，三條路

標準化層次	核心問題	解決方向
設備標準化	感測器、施壓、取樣不一致	制定跨實驗室的硬體協議
分析方法標準化	同樣數據，不同算法給不同結果	公開分析流程，預先登記分析計畫
概念標準化	脈象名稱本身的定義不一致	制定操作性定義，測量評分者信度

這三層問題需要同步推進，而不是只解決其中一層。

目前脈診研究的資源和注意力，過度集中在第一層。而第三層——概念的操作性定義——幾乎是被忽略的。

在第三層問題被認真面對之前，任何「我設計的設備能量出弦脈」的宣稱，都需要先回答一個問題：

你用的「弦脈」定義，和臨床上用的「弦脈」，是同一件事嗎？怎麼驗證？