內分泌檢查結果的解釋原則
?目錄
作者:Peter A. Graham
譯者:吹過的晚風
一般原則內分泌測試結果的解釋通常是令人生畏的。在很大程度上,這是因為內分泌系統對外部和內部反應是非常動態的。因此,實驗室測試結果可能在生理上是合適的,但很難與真正病理狀態下的結果區分開來。
“正常的”生理和“異常的”病理之間有一條很細的分界線,可能并不總是能夠簡單地將所有內分泌測試結果歸為這兩類。然而,在某些情況下,內分泌檢測結果可以清楚地分為陽性或陰性兩類,兩者之間很少有重疊。對于執業的獸醫來說,重要的是知道哪些結果值得信賴,哪些結果值得謹慎。這種信心來自于:
了解內分泌系統的生理學認識到其他內分泌器官和非內分泌疾病的影響了解所使用測試的診斷性能屬性。在某些情況下,檢測結果只是加強了對內分泌疾病的診斷。在其他情況下,測試結果有助于提供明確的診斷。解釋的技巧是知道哪些判斷可以提供滿意的診斷,哪些判斷可能需要隨著事件的發生而在單個患者中進行復查。
通常,器官系統中是否存在疾病是根據個體測量值是落在給定參考區間之內還是之外來確定的。然而,在許多內分泌疾病中,特定的測試結果可能保持在其參考區間內,但仍為疾病的存在或分類提供強有力的證據。在這些情況下解釋結果的關鍵是回憶和依賴負反饋的概念,這是內分泌學的主要規則。記住這條規則有助于臨床醫生了解特定情況下的內分泌測試結果,簡化解釋,并允許區分生理上適當的反應和病理。掌握了負反饋原理的知識,除了其他例子外,還有可能解釋參考區間甲狀旁腺激素 (PTH) 結果導致犬高鈣血癥,對垂體依賴性高腎上腺皮質激素 (HAC) 進行分類,并理解為什么低劑量地塞米松抑制 (LDDS) 試驗之后可以立即進行促腎上腺皮質激素 (ACTH) 反應試驗,但反之則不然。
診斷測試性能如上所述,由生理和病理反應引起的內分泌檢查結果可能有相當多的重疊。因此,在調查內分泌疾病時測量的許多激素濃度并不能提供完美的診斷效果。例如,下丘腦垂體腎上腺對壓力和其他疾病的反應經常與犬HAC的檢測結果相關,導致診斷特異性差(許多假陽性)。同樣,非甲狀腺疾病的總甲狀腺素(T4)反應使這種單獨測量對犬甲狀腺功能減退的特異性很差。
診斷靈敏度和特異性
一旦建立了實驗室檢測的分析性能,或確定了對動態內分泌檢測的適當反應,下一步就是確定檢測的診斷性能。這提供了關于檢測如何區分某一特定疾病的存在和不存在的信息。
為了評估診斷效果,通常使用二分結果,即檢測結果是陽性或陰性,病理狀況或疾病是存在的或不存在的。然而,雖然這是最容易理解和最常用的方法,但它是一個具有兩個極端的系統(未患病或患病)。它沒有考慮到“灰色地帶”的結果,也沒有考慮到不同程度的病理,這通常是內分泌失調的特征,特別是那些需要時間發展的。
診斷靈敏度
診斷敏感度(不要與分析敏感度混淆)是通過測試正確識別出患有疾病的患者的比例。 這個比例的推導需要一個合理規模的患病人群,通常通過獨立的金標準診斷方法或技術已經很好地表征為患有這種疾病。
Dixon 和 Mooney (1999) 通過在 30 只使用促甲狀腺激素 (TSH) 反應測試結果確認為甲狀腺功能減退的狗中測量游離 T4,推導出平衡透析 (fT4d) 的診斷敏感性。 在這 30 只狗中,有 24 只的 fT4d 結果低于 5.42 pmol/l 的診斷臨界值。
診斷靈敏度= 24/30 = 0.80 (80%)
由于該屬性是基于樣本的比例,因此總體比例的置信區間可估計為±1.96 x估計比例的標準誤差。
靈敏度的95%置信限=靈敏度 ±1.96 x√[靈敏度x(1 -靈敏度)/ n]
因此,患病研究組的規模越大,置信區間越窄,因此估計的敏感性越可靠。 基于少量動物的診斷敏感性研究將產生非常寬的置信區間,這意味著與基于大量動物的研究相比,它們是不太可靠的敏感性來源。 在上面的示例中,95% 置信區間的范圍從 0.61 (61%) 到 0.92 (92%)。
診斷敏感性與真陽性率同義。 由于敏感性來自患病人群,因此敏感性越高,假陰性率越低。 由于假陰性很少見,因此可以對陰性結果為真更有信心。 因此,高診斷靈敏度的測試對于排除疾病特別有用(圖 1)。


常用的記憶輔助工具是 SnOut(靈敏度有助于排除疾病)。
推導出的診斷敏感性在某種程度上會受到患病組的選擇的影響。 通常,患病組包含易于分類的病例,因此可能患有嚴重或明顯的疾病。 較難分類的輕度或早期病例可能會被忽略。 因此,在不包括具有代表性的表現程度范圍的研究中,敏感性可能被高估。 如果對新測試引用了高診斷敏感性,則謹慎地檢查患病組是否恰當地代表了完整的范圍或連續的表現。
診斷特異性
診斷特異性(不要與分析特異性混淆)是通過測試正確識別的無疾病患者的比例。 這個比例的推導需要一個明確表征的人群,該人群已知沒有所討論的病理。 理想情況下,這不應該只是一個健康的群體,而應該包括具有類似信號的動物,這些動物具有某種暗示所討論疾病的屬性或臨床癥狀。 除非患病組外,特異性的計算方式與靈敏度相同。
Dixon和Mooney通過使用TSH反應測試結果對77只被證實為甲狀腺正常(即非甲狀腺減退)的狗進行測量,得出fT4的診斷特異性。在這77只狗中,72只的結果大于或等于5.42 pmol/L。
診斷特異性= 72/77 = 0.935 (93.5%)
診斷特異性的置信區間與敏感性的置信區間的推導方法相同。在上面的例子中,95%置信區間在0.85(85%)到0.98(98%)之間。
診斷的特異性等同于真實的陰性率。由于特異性來自于非患病人群,特異性越高,假陽性率越低。更大的信心可以放在積極的結果是真實的,因為假陽性是罕見的。因此,診斷特異性高的檢測對診斷疾病特別有用(圖2)。


一種常用的記憶輔助工具是“SpIn”(特異性有利于統治疾病)。
對非患病人群中受試者的選擇可能會影響診斷特異性的估計。 正如已經提到的,重要的是所選對象正在接受有關疾病的適當調查。 例如,一項關于犬 HAC 測試特異性的研究,使用沒有兼容的臨床或表現體征的非常年幼的動物,可能會顯著高估診斷特異性。 如果對新測試引用了高診斷特異性,則謹慎地檢查非患病組是否代表了適合于所討論疾病的信號和各種表現。
理想情況下,當主要目的是排除或排除疾病時,診斷測試的選擇應提供最佳的可用診斷靈敏度,而當目的是排除或確認疾病時,應提供最佳的特異性(圖 3 和圖 4)。




陽性和陰性預測值和患病率的影響
診斷敏感性和診斷特異性提供了有關測試如何在明確定義的疾病狀態的人群中執行的有用信息。 然而,在臨床實踐中,明確定義的疾病狀態是一種罕見的奢侈。 實際上,進行測試的目的通常是試圖更清楚地定義患者的疾病狀態。 執行測試后,會生成結果,了解測試結果指示正確診斷的可能性(概率)很重要。
為了確定正確診斷的概率,使用陽性預測值 (PPV) 和陰性預測值 (NPV)。 PPV 和 NPV 由敏感性 (Se) 和特異性 (Sp) 與流行率相結合得出(圖 5)。
在大多數情況下,受試動物群體中該??病癥的真實流行率是未知的。然而,了解測試在不同流行情況下的行為可以改變結果的權重,并可以影響進行測試的動物類型。
另一種考慮患病率的方法是在執行測試之前疾病存在的概率(測試前概率)。通過僅對已經很可能患有該疾病的動物(適當的年齡、品種或性別、相容的臨床癥狀和常規臨床病理學異常、排除其他鑒別診斷等)進行測試,可以顯著提高測試前的概率。
如圖 6 所示,流行率(測試前概率)對預測值有顯著影響,尤其是在診斷敏感性或特異性相對較差時;內分泌疾病的檢測通常就是這種情況。
在高患病率(高預測試概率)情況下,例如在有相關疾病的適當支持數據的情況下,診斷敏感性低的測試具有較差的陰性預測值。當用于診斷的支持臨床數據有限時,低診斷特異性的測試在低流行(低預測試概率)情況下的陽性預測值很差。 在針對相對罕見的疾病篩查大量人群時,如此低的患病率并不少見。PPV流行的影響可能是有意思的。當患病率(檢測前的概率)低至5%時,陽性LDDS檢測用于診斷犬HAC的PPV是不可接受的15%。面對一個陽性的LDDS測試結果,盡管結果是“陽性”,這是非常有可能的(85%)的人認為動物實際上沒有HAC。正是由于這個原因,LDDS檢測不適合“篩查”狗的HAC,除非有強有力的支持證據(高流行率或檢測前的概率)。


低診斷特異性的測試在獸醫內分泌學中很常見; 因此建議在對犬甲狀腺功能減退癥使用總 T4 或對犬 HAC 進行 LDDS 測試之前增加預測試概率(患病率)。 對于犬甲狀腺功能減退癥的總 T4,避免在已知會增加假陽性結果風險的情況下(例如非甲狀腺疾病、某些藥物療法)對狗進行測試也很重要。 或者,即使在假陽性組中,通過結合使用具有更好特異性的甲狀腺功能測試,而不是僅依賴總 T4,也可以提高對甲狀腺功能減退癥診斷的信心。
對于診斷貓甲狀腺功能亢進癥,總 T4 具有較高的特異性,但敏感性較低。 因此,這是一個很好的篩查老年貓的測試,因為有信心通過陽性測試結果診斷甲狀腺功能亢進癥。 然而,當患病率(測試前概率)很高時,NPV 會降低,并且不能使用參考區間 TT4 值明確排除甲狀腺功能亢進。 適當的行動方案是重新測試或與更高靈敏度的測試相結合,例如 fT4d。
已發布的預測值并不普遍適用。 如圖 6 所示,它們完全取決于測試群體中的流行度(測試前概率),因此,除非還說明了流行度,否則不應信任預測值。 為了應用于臨床環境,引用的流行率必須與臨床醫生的預期相似。
一些研究引用測試準確性(所有正確的結果占所有測試的比例)。這種績效衡量與預測值一樣受到流行程度的影響,因此應該以類似的方式進行嚴格評估。
非內分泌因素的影響在某些情況下,非內分泌因素會顯著影響內分泌測試結果的解釋,并可能影響所選測試。他們甚至可以決定是否進行測試。非內分泌因素對個體內分泌系統檢測結果的具體影響在相關章節中討論。
在許多情況下,非內分泌因素的影響是微妙的。由于生理因素導致的測試結果變化可能會出現在單個動物或動物組的結果之間。然而,這種變化通常不足以引起診斷類別的重大變化。在這些情況下,即使生理因素使結果超過診斷閾值,結果也很可能處于臨界狀態,并以適當低的診斷置信度來看待,而不是被自信地錯誤分類為患病或健康。然而,在某些特殊情況下,非內分泌因素會導致健康與疾病的嚴重且頻繁的錯誤分類。
品種
狗的身體特征差異很大,因此使用一般的全品種參考區間時診斷錯誤分類的風險并不奇怪; 可以認為特定品種的參考區間更合適。 由于廣泛的品種變異在貓身上不是什么問題,這個問題在狗身上更受關注。
品種特定參考區間的必要性取決于對每個感興趣品種內大量健康個體的研究。 到目前為止,只完成了有限數量的研究,并且從中,僅在少數特定情況下提出了品種特定范圍的有力案例。
現在人們普遍認為,長頭型獵犬品種的總 T4 參考區間要低得多,在某些情況下,還有游離 T4。 在這些狗中,它們的參考區間的下限可能低于大多數市售檢測的檢測限。 在這個群體之外,盡管一些品種協會堅持認為,幾乎沒有證據表明一般的全品種參考區間是不合適的。
測量肝臟在生長激素 (GH) 影響下產生的胰島素樣生長因子 (IGF-1) 的循環濃度,用于疑似肢端肥大癥和侏儒癥,并確定營養狀況。 這受到狗的大小(和年齡,見下文)的強烈影響。 較小的狗的 IGF-1 濃度自然低于較大的狗,在解釋結果時需要考慮到這一點。
如果特定品種的參考區間不可用,提交年齡和品種匹配的狗的對照樣本可能會有所幫助。
年齡
幼年期和青春期的動物的循環激素濃度可能與成年動物明顯不同。 例如,在生命的最初幾周,甲狀腺激素濃度可能很高; 并且在生長動物中 IGF-1 的濃度遠高于成年動物。
隨著成年動物年齡的增長,激素濃度可能會發生更微妙的變化; 例如,總 T4 似乎隨著年齡的增長而緩慢下降。 然而,一般而言,當使用全年齡參考區間時,這些變化不足以導致嚴重的診斷錯誤分類。
一天中的時間段
盡管在人類和其他哺乳動物中,通常測量的激素循環濃度可能存在很強的晝夜模式,但這在狗和貓中可能有限或沒有相關性,盡管在教科書中經常被引用。 已經表明狗的皮質醇具有周期性和脈動的分泌模式,但尚未證明晝夜模式。 因此,建議在一天中的特定時間進行腎上腺功能檢查是沒有根據和不必要的。
當使用測試進行治療監測時,一天中的時間(或更準確地說,自上次用藥以來的時間)更為重要,例如治療犬甲狀腺功能減退癥時的甲狀腺激素或治療犬 HAC 的三氯司坦。
藥物
有一長串常用的獸藥已經被研究過,它們可能會改變內分泌測試結果。到目前為止,大多數此類調查只發現細微或最小的影響,因此診斷錯誤分類是不太可能的。然而,有一些藥物可以發揮重要的診斷效果。常見的例子包括:
磺胺類藥物,可導致原發性但可逆的甲狀腺功能減退巴比妥酸鹽抑制總T4,通過代謝酶的誘導,可導致假陽性ACTH反應和ldd測試結果糖皮質激素,它抑制甲狀腺激素濃度,并對垂體-腎上腺軸產生負反饋,影響腎上腺功能測試。理想情況下,當使用這些藥物治療時,不應進行內分泌檢查。如果不能避免使用巴比妥類藥物或糖皮質激素,則應考慮采用專業實驗室方法(如fT4d)或其他診斷技術。
非內分泌疾病
非內分泌疾病是最大的挑戰和錯誤分類的風險。非內分泌疾病顯著影響伴侶動物兩個最常被調查的內分泌系統的結果:甲狀腺和腎上腺。
如上所述,檢查的診斷特異性(如甲狀腺功能減退和HAC的LDDS測試),全T4對貓甲狀腺功能亢進的診斷敏感性尚不完善。最重要的原因是非甲狀腺或非腎上腺疾病的影響。
任何嚴重的非甲狀腺疾病,無論是急性的還是慢性的,都有可能將 T4 的總濃度抑制在參考區間以下。因此,對于已知的非甲狀腺疾病的狗,應該推遲甲狀腺檢測,直到它通過治療減輕或穩定。或者,由于非甲狀腺疾病對 fT4d 結果的影響較小,因此測量此參數可提高正確診斷甲狀腺功能減退癥的機會。非甲狀腺疾病的影響在貓甲狀腺功能亢進癥的調查中也存在類似的困難,因此需要在從非甲狀腺疾病中恢復后重新測試貓,或額外測量 fT4d 以進行正確診斷。任何可能被描述為代謝壓力的疾病都有可能導致 HAC 測試的假陽性結果。簡單的解釋是壓力疾病對糖皮質激素的生理需求增加了生產能力,這可能會被動態內分泌測試(例如 ACTH 反應和 LDDS 測試)誤解為病理性過剩(HAC)的證據。內分泌疾病的影響雖然內分泌系統(如甲狀腺、腎上腺)被稱為獨立的實體,但值得強調的是,在許多情況下,它們是緊密相連的。此外,與內分泌病相關的病理過程有時會干擾檢測結果的分析有效性或正確解釋結果的能力。
并發內分泌病
一種內分泌病的預先存在可能會影響可靠地確認或排除其他內分泌病的能力。例如,控制不良的糖尿病犬的常規臨床病理異常與HAC犬的相似。在這種情況下,肝酶和膽固醇升高在支持HAC診斷中的重要性必須打折扣。同樣,患有HAC的狗可能有一個低的循環總T4濃度,即使是真正的正常甲狀腺。
高脂血癥
多種內分泌疾病可導致高脂血癥。 使用某些分析方法,脂血癥能夠干擾某些分析物的測試結果。 對于使用他們的技術測量的每種特定分析物,商業實驗室通常知道這種影響的程度。 當存在干擾時,通常是因為存在的脂質改變了設備檢測樣品中光或顏色變化的能力。 抗體與分析物的相互作用以及抗體結合激素與游離激素的分離較少受到影響。 一般來說,放射免疫測定不受干擾影響,因為光或顏色變化不是不可或缺的。 然而,對于 fT4d,樣品中游離脂肪酸濃度的增加將通過結合蛋白的置換,導致游離激素分數增加。
內源性抗體
正如之前所討論的,免疫分析幾乎只用于測量激素。 免疫測定的原理依賴于針對被測激素的抗體。 通過在樣品和測定標準品中使用均勻量的抗激素抗體,可以控制相互作用,并可以可靠地估計樣品中的激素濃度。 然而,如果患者樣本中已經存在可與受測激素發生交叉反應的抗體,則失去對激素抗體相互作用的控制。 因此,不能再對激素濃度進行可靠的估計,并產生錯誤的結果。
抗甲狀腺球蛋白
產生錯誤結果的常見情況與存在與三碘甲狀腺原氨酸 (T3) 和 T4(T3AA 和 T4AA)交叉反應的抗甲狀腺球蛋白抗體有關。這些分別發生在大約 30% 和 10% 的甲狀腺功能減退犬中。這些抗體的結果是假高還是假低結果取決于免疫分析設計的復雜性。然而,假高(不一定高于但通常在參考區間內)是最常見的后果。這些抗體在甲狀腺激素的可用性方面對動物沒有生理影響,但它們對正確測量激素的影響很大。
在總 T4 的情況下,可以通過在樣品預處理后通過透析 (fT4d) 或免疫分離測量游離 T4 來避免 T4AA 的影響。不包括此類預處理的免費 T4 測量技術(例如直接 RIA、模擬)與總 T4 測量一樣受到 T4AA 的干擾。
抗胰島素
在治療前或更常見的情況下,在用抗原性與內源性胰島素不同的胰島素治療后測量胰島素時,也可能會看到由于抗胰島素抗體干擾而導致的假高結果。
抗鼠抗體
依賴于源自鼠雜交瘤的單克隆抗體 (MAB) 的檢測(例如常用的犬 TSH 檢測)存在來自患者體內循環的抗小鼠抗體的風險。 這在職業暴露于小鼠或小鼠血清產品或接受 MAB 治療產品的患者中可見。 這種現象尚未在狗身上得到令人信服的認可。
內分泌治療
盡管用于測量激素的免疫分析的設計應盡可能針對所討論的激素進行特定設計,但在某些分析中,所使用的抗體會與相關化合物發生交叉反應。 例如,潑尼松龍會導致皮質醇結果虛假增加,而地塞米松不會,并且在曲洛司坦治療期間積累的類固醇前體將導致 17-羥基孕酮濃度比預期更顯著升高。
如果在未確認潛在疾病的情況下進行對癥或姑息治療,則可能會妨礙準確解釋。 在沒有確定潛在病癥的情況下治療鈣疾病可能會出現問題。 如果治療使循環鈣濃度正常化,PTH 結果的解釋就會受到影響。 類似地,如果在糖皮質激素給藥后進行,在確認性內分泌測試之前對可疑的腎上腺皮質功能減退癥進行治療可能會影響調查。 在這種情況下,醛固酮測量可能更有幫助。
外源性糖皮質激素,包括局部眼、耳和皮膚藥物治療,通常會導致ACTH反應試驗結果被抑制,不應被解釋為腎上腺素缺乏的證據。