脈象標準化的困境:設備之外的問題
學習資源 | 本文接續 脈象是什麼 的討論,深入探討為什麼「標準化脈診設備」還不夠。
一個常見的誤解
脈診現代化討論裡,有一個很容易落入的思維陷阱:
「脈診之所以難以重複、難以科學化,是因為現在的感測器不夠好、施壓機構不夠穩定、取樣率不夠高。只要設備標準了,問題就解決了。」
這個說法不算錯,但它解決的只是問題的一層。
即使有一天,全球的脈診研究實驗室都使用完全相同的感測器、完全相同的施壓協議、完全相同的取樣率,脈診研究仍然會面臨另外兩個更根本的標準化問題:分析方法的標準化,以及概念本身的標準化。
標準化的三層結構
把脈診的標準化問題拆開來看,至少有三個層次:
第一層:設備標準化(Device Standardization)
測量工具的物理一致性:
- 感測器的型號、靈敏度、頻率響應
- 施壓機構的力量控制
- 受測部位的定位(橈動脈的哪一點?寸、關、尺的位置如何定義?)
- 取樣率(常見的脈診研究取樣率從 200 Hz 到 1000 Hz 不等,高頻細節的保留程度不同)
- 環境條件(室溫、受測者靜息時間、體位)
這是目前研究界討論最多的層次。已經有一些嘗試制定協議的努力,但跨實驗室的標準仍然不統一。
第二層:分析方法的標準化(Analytical Standardization)
即使使用同樣的設備,分析脈搏波的方式也可以完全不同:
- 頻域 vs 時域:有的研究用 FFT 分析諧波,有的研究直接測量波形特徵(上升時間、主峰寬度、面積比)
- 分析窗口的長度:用幾秒的片段做分析?10 秒、30 秒、還是 5 分鐘?
- 拍的辨識方式:怎麼定義一次搏動的起點和終點?
- 雜訊過濾:低通濾波的截止頻率是多少?這個選擇直接影響波形細節的保留程度
- 異常拍的處理:如果有一拍明顯不正常,要剔除還是保留?
不同的分析選擇,可以讓同一段脈搏錄音產生完全不同的數值結果。兩篇研究都在量化「弦脈」,但一篇用的是 C1/C0 諧波比,另一篇用的是收縮期上升斜率,它們測量的是同一件事嗎?沒有人知道。
第三層:概念標準化(Conceptual Standardization)
這是最根本、也最少被討論的層次:脈象名稱本身代表的概念,在不同人之間是否一致?
「弦脈」這個詞,在台北某位中醫師的臨床判斷裡,跟在廣州某位中醫師的判斷裡,指的是同一件事嗎?
文獻研究給出了令人不安的答案:不一定。
信度問題:脈診師之間的一致性
在臨床研究方法學裡,有一個概念叫做評分者間信度(inter-rater reliability)——不同的評分者,在評估同一個對象時,給出相同結論的機率有多高。
對脈診而言,問題是:請兩位有經驗的中醫師,同時診同一位病人的脈象,他們的診斷結果吻合嗎?
現有研究的結果,並不樂觀。幾項設計嚴謹的一致性研究(包含來自台灣、香港、大陸的研究)發現,不同中醫師對同一位受試者的脈象診斷,一致性程度往往只在「偶然水準以上一點點」——也就是說,協議的程度不比隨機猜測高很多。
這不是在說中醫師的能力有問題,而是說:傳統脈象語言的操作性定義模糊,導致它本身就難以在不同學習者之間形成一致的感知標準。
操作性定義的缺失
「操作性定義」(operational definition)是科學測量的基礎概念:把一個抽象的概念,翻譯成具體的、可重複的測量程序。
例如:
- 「體溫」的操作性定義是:使用已校準的電子溫度計,探頭置於腋下三分鐘,讀取數值
- 「血壓偏高」的操作性定義是:在靜息狀態下,以標準血壓計測量三次,平均值超過 140/90 mmHg
脈象目前缺乏的,正是這一層。
「弦脈」的操作性定義是什麼?「滑脈」要滿足哪些波形條件才算是滑?這些定義,不同的教材說法不一,不同的臨床老師傳授的標準也不同。
在沒有操作性定義的情況下,即使你建立了完美的感測器,你也不知道感測器測出來的數值,應該對應到哪一種脈象——因為「哪一種脈象」的邊界本身就不清楚。
一個可以驗證這個問題的實驗
想像這樣一個研究設計:
- 招募 20 位有執照的中醫師
- 讓他們各自診斷 50 位受試者的脈象(不互相討論)
- 計算他們對同一位受試者診斷的吻合率(Cohen's kappa 或 ICC)
如果結果顯示吻合率很低,那就說明:在進行任何脈診量化研究之前,首先需要解決的是人類診斷者之間的一致性問題。
把不一致的人類判斷當作「金標準」(ground truth),再用感測器去預測這個金標準,測量的是什麼?是脈象的客觀特徵,還是某一位中醫師的主觀判斷模式?
這個問題,在許多脈診研究中被跳過了。
為什麼這麼難解決
概念標準化的困難,有幾個深層原因:
語言的固有模糊性
傳統脈象描述是詩意的、比喻的,不是工程規格書。「如按琴弦」描述的是觸覺體驗,不是數學公式。把體驗翻譯成數值,需要中間步驟——而中間步驟目前是缺失的。
訓練路徑的多樣性
中醫教育沒有像西方醫學那樣高度標準化的課程。不同學校、不同師承、不同地區,學到的脈象標準可能有實質差異。台灣的脈診教育、大陸的教材、日本漢方的流派,對同一個脈象可能有不同的理解。
缺乏校準機制
在電子測量設備裡,「校準」是指把設備的讀數對照到已知標準值,確保測量的準確性。脈診的「校準」是什麼?誰的判斷是標準?沒有公認的金標準,也就沒有辦法校準。
脈象本身的動態性
前一篇文章提到,脈象會隨著情境改變。這意味著脈象的「標準」不只是一個靜態定義,還需要規定「在什麼條件下測量」——時段、情緒狀態、飲食狀況、體位,都可能影響脈象。
已有的嘗試
這個問題不是完全沒有人意識到。幾個值得注意的方向:
1. 脈診教學客觀化 部分研究嘗試建立脈象的標準教學模型——製作人工脈搏模擬器,讓學生觸診標準脈象,訓練手感的一致性。但這解決的是「如何把標準傳授給下一代」,沒有解決「標準本身是什麼」。
2. 多指標聯合定義 有研究提出,不要用單一指標(如某個諧波比)定義脈象,而是用多個波形指標的組合來界定。這是合理的方向,但需要前述的評分者信度研究來確認哪個組合真的和臨床判斷對應。
3. 機器學習分類 近年有研究用機器學習,把大量脈搏錄音對應到中醫師的診斷標籤,訓練分類器。這個方法有個隱藏的前提:用來標記數據的中醫師判斷是一致的。如果標記者之間不一致,訓練出來的分類器是在學習「某種混合了多種標準的模糊判斷」。
小結:三層問題,三條路
| 標準化層次 | 核心問題 | 解決方向 |
|---|
| 設備標準化 | 感測器、施壓、取樣不一致 | 制定跨實驗室的硬體協議 |
| 分析方法標準化 | 同樣數據,不同算法給不同結果 | 公開分析流程,預先登記分析計畫 |
| 概念標準化 | 脈象名稱本身的定義不一致 | 制定操作性定義,測量評分者信度 |
這三層問題需要同步推進,而不是只解決其中一層。
目前脈診研究的資源和注意力,過度集中在第一層。而第三層——概念的操作性定義——幾乎是被忽略的。
在第三層問題被認真面對之前,任何「我設計的設備能量出弦脈」的宣稱,都需要先回答一個問題:
你用的「弦脈」定義,和臨床上用的「弦脈」,是同一件事嗎?怎麼驗證?
延伸閱讀
本文為 TCMpulse 學習資源系列。如有勘誤或補充,歡迎透過 contact@tcmpulse.com 聯絡。