量表的診斷陷阱

文:吳俊漢醫師

很久沒有寫過動症相關的議題,最近剛好有網紅醫師在談自己怎麼診斷過動症的患者,也有家長在相關社群質疑台灣此方面的診斷是不是太浮濫,我們就來談一個非常本質,也很殘酷的現狀:在台灣,部分行醫者以量表診斷過動症,並未嚴謹參照診斷準則去核實功能缺損的程度,到底會不會有浮濫診斷的問題,文章會引三個文獻,內容會有些長,但就直接說結論:肯定會,而且會把不應下診斷的孩子納入診療用藥的對象中。

在古希臘神話中,強盜普羅克拉斯提斯(Procrustes)有兩張惡名昭彰的鐵床。他強迫路人躺在床上,若受害者的身高超出床位,他便殘酷地砍斷其雙腳;若路人太矮,他則強行拉長其肢體直到契合。這暗喻以量表不試圖找尋其他線索拼湊可疑情境下的不同視角與故事房景時,手中的量表會成為單一僵化削足適履的工作,裁切了來訪兒少的全貌。

沒有功能性缺損就診斷會怎樣?

在 DSM-IV 與 DSM-5 的診斷標準中,單純符合症狀數並不足以確診注意力不足過動症;必須同時具備「功能性缺損」(Functional Impairment)的證據才可以診斷。而早在2012年的統合分析就指出,忽視功能性缺損對盛行率的估計與誤診風險有著巨大的影響。以下表格是針對已嚴格符合 6 個月持續時間、發病年齡限制兩個充要條件的潛在族群的分析:

以老師資料推估之盛行率以家長資料推估之盛行率
只看症狀數13.3%8.8%
必需加上功能性缺損之後7.1% (下降47%)6.1% (下降31%)

首先,我們立刻可以發現:若診斷過程中不納入功能性缺損證據,將導致接近三成到近五成的兒童面臨被誤診的風險

再來,補充一下「跨情境症狀」這個要件的影響力:比例高達 91% 至 100%的兒少都有單一情境症狀之表現。但論到跨情境症狀(同時在多個環境中受損) 僅有 70.3% 至 95.2% 的症狀陽性兒童能展現「跨情境」(家庭學校同時受損)的普遍損害,這代表僅憑單一環境的損害註定會導致「濫診」。

接著我們來看幾個玄機,裡面所有括號內數字代表樣本中有多少%孩童被視為是注意力不足過動症。左起各欄代表「採納家長評分」、「採納老師評分」、「或規則 (意指某一個症狀,如「很健忘」這個症狀,家長或老師其中任一方認定為陽性就採納為真)」、「由一群資深臨床醫師評估所有可用的臨床資訊以達成共識診斷」、「家長跟老師一致認可有無診斷與否」幾個指標,黃色範圍是病症發病年齡的切載時間,第一組的7歲,是DSM-IV 的標準,而DSM-5目前已改為12歲前發病即算數。粉紅色範圍則是採計單一情境下、二擇一情擇、跨情境診斷下的狀況:

  • 黃色範圍,很明顯,7歲與10歲畫分診斷年齡,10歲會畫進更多孩童
  • 粉紅色範圍,也很明顯,跨情境都有症狀的,被納入診斷的孩童相對最少
  • 我們鎖定「資深臨床醫師評估」組來看,上下左右對比,雖然是不同的研究設計下的條件與樣本,但統合分析時已經有做相當校正,醫師給予診斷的比例比家長、老師還要高,這個發現正面的解讀是醫師確實比較資深,觀察細膩,但結合近15-20年北美瘋狂上漲的兒少注意力不足過動症盛行率來看,不得不思考一下反面的解讀:醫師有沒有可能對自己下診斷的本事太自信了,過度地擴大了診療的範圍?
  • 補充一個沒附上圖表上的,即使家長與老師評定孩童患病的一致性很高,但該疾病有3 種亞型(注意力不足型、過動衝動型、混合型),評定是哪個亞型的一致性很低,僅有 11% 到 31%而已,這說明什麼:大家看到的東西是不一樣的、大家有感的程度是不一樣的、就像我們首張圖裡的木尺與鐵尺,原點不一樣,刻度的寬距也不一樣。

僅用SNAP-IV 量表診斷的關鍵侷限

我們曾在《過動症的常見20問》再一次提了電腦化專注力測驗做為診斷工具的缺陷:正常受測者有 30% 可能出現偽陽性,而超過一半的 ADHD 孩童在測驗中反而呈現偽陰性(測不出來)。好,那台灣每個兒童青少年精神科門診都會發的SNAP-IV 量表,就很有用嗎?

2019年時諾丁漢大學再次分析了一回這個篩檢用量表的利弊得失,收納了 250 名 6-17 歲、因疑似症狀被轉介至診所的兒童與青少年:是的,在捕捉潛在案例方面具有極高的「敏感度」(Sensitivity,家長量表可達 100%),但在排除非注意力不足過動症案例的「特異性」(Specificity)上表現極差,家長評定僅為 4.4%。這表示絕大多數被 SNAP-IV 標示為陽性的案例,在臨床醫師進一步確認後可能並不是注意力不足過動症。因為很重要,再說一次:如果量表分數低,孩子很大機率沒有注意力不足過動症;但如果量表分數高,完全不能證明孩子有注意力不足過動症

除了我們講的大家的量尺不一樣之外,家長和老師在使用量表時,對症狀的理解程度與標準並不相同,因此兩者的分數無法直接相互比較或簡單加總,其他的問題在於:

  • 量表的題目(如:「常坐立不安」、「常動來動去」、「很健忘」…),可以說每一題都具有極強的主觀性,深受填答者(家長或老師)文化價值觀、教育期待與當時師生/親子關係與情緒狀態的影響。例如,一位對課堂秩序極為要求的老師,與一位體制外小學重視創意發展的老師,對同一個孩子的評分時,他/她們心中量尺的標準一樣嗎?

所以我們診所從開業準備期至今,每一張臨床問卷,從只擷取SNAP-IV 量表的主要18題問題,並且在家長版/老師版不同的量表中,詢問不同的問題,如:

  • 對家長:
    • 與孩子相處的時數
    • 孩子假日活動的安排,假日活動觀察到什麼症狀,影響力多大
    • 孩子的3C使用情形、睡覺時間、睡眠品質、早上易有起床氣嗎?
    • 您覺得孩子最能維持長時間的靜態活動是多麼,能多久,怎麼進行?
  • 對老師:
    • 您覺得孩子一堂課可維持專注多久、覺得孩子專心的水準在全班同學裡PR值佔到多少?
    • 孩子現在坐在班級的哪個位置
    • 孩子在什麼課最容易分心、最常見的干擾行為是什麼,舉例說明
    • 您覺得孩子上下午的專注力水準有差別嗎?
    • 您覺得孩子的人際、學習有受到疑似症狀的什麼影響?
    • 您今年教學年資多久,覺得目前任教班子可能有幾個類似困擾的孩子?

而且複診時,一定會花到近10分鐘在參看孩子的習字本、聯絡本、平時考、大考至少兩科的考卷,詢問孩童發生疏漏時的歷程。為什麼要這樣折磨自己與麻煩親師?因為功能的缺損可能藏在學習成就表現上,而我們需要有十分確切的證據來說服自己、家長、孩童到底是或不是,同時,也需要跟隨老師的量尺做適度的校準。

孩子是被家長帶來的,所以可以直接從家長獲取諸多重要鑑別資訊,但老師未必,所以一定需要試圖深入了解老師的視角,絕對不能聽憑量表上的數字就定生死。最近巴西的教育學者也深入剖析 SNAP-IV 的 18 個症狀,探討其描述用語背後是否真正適切:

  • 研究發現 18 個症狀條目中,至少有 9 項(50%)直接提及學校相關情境(如:學校作業、教室、課堂活動)。這顯示量表在很大程度上是在評估兒童「對學校體制與規則的適應度」
  • 量表使用的頻率副詞(如「有一點點」、「還算不少」)極其主觀。同一個孩子的行為,在不同老師或教學風格的環境下,可能會得到完全不同的評分*
  • 若照目前神經發展障礙的所有研究基礎來看,一個患童,假日應該也都有症狀,所以照道理說,每個患童都應該會拿到滿級分 (>5天有症狀 = 非常的多) 才對,分數的變動反而說明症狀是有情境性的,這跟理論是相互矛盾的。

其實每個精神科醫師、兒童青少年精神科醫師都朗朗上口說我們是「生物-心理-社會-心靈」模式視角的專家,我們應該清楚診斷中要考慮兒童生存的社會、家庭背景與教育環境,然而,我們整個群體是這麼做的嗎?還是很不幸地像Allen Frances這位老前輩醫師說的,我們一直在擴張診斷,病理化各種人類的行為?

*在台灣的本土化此一量表的過程中,有用「天數」試圖定量,但在建立常模時就發現,以「天數」來把頻率副詞定量,以「天數」來做切分點,畫出的盛行率會偏高

結論:這是關於人的醫療,不是計算症狀的過程

我們之前在臉書上分享關於近年唱得漫天響的神經多樣性的反思提醒,神經多樣性的浪潮時間線跟兒少精神疾病的診斷浪潮時間線有相當的重疊,這是身為臨床工作者常常要有的自覺:我們需要經常審視自己診療的憑據與思考犯錯的可能。

  • 警惕病理化的擴張: 健康與疾病之間不存在絕對的定量邊界,不能僅憑行為出現頻率的「多」或「少」來定義疾病。
  • 好好了解一個故事: 忽略功能性缺損會導致診斷的氾濫,讓不應被診斷的兒童被過度醫療化。
  • 多面向、有證據的診斷: 一個負責任的臨床評估應整合量表、客觀測試、跨情境觀察與深度的脈絡認識。

參考文獻:

Hall, C. L., Guo, B., Valentine, A. Z., Groom, M. J., Daley, D., Sayal, K., & Hollis, C. (2018). The validity of the SNAP-IV in children displaying ADHD symptoms. Journal of Attention Disorders

Redon, S. A., & Cartaxo, S. R. M. (2026). Between the normal and the pathological: Inconsistencies of the SNAP-IV in ADHD evaluation. Revista Brasileira de Educação, 31, e310032.

Willcutt, E. G. (2012). The prevalence of DSM-IV attention-deficit/hyperactivity disorder: A meta-analytic review. Neurotherapeutics, 9(3), 490-499.





返回頂端