薈萃分析

薈萃分析,又稱“Meta 分析”,Meta意指較晚出現的更為綜合的事物,而且通常用於命名一個新的相關的並對原始學科進行評論的學問,不但包括數據結合,而且包括結果的流行病學探索和評價,以原始研究的發現取代個體作為分析實體。薈萃分析產生的主要的理由是:對於多個單獨進行的研究而言,許多觀察組樣本過小,難以產生任何明確意見。

基本介紹

  • 中文名:薈萃分析
  • 類型:概念
  • 提出者:Light 和Smith 
  • 提出時間:1971 年
薈萃分析概念,薈萃分析分類,分析優劣,分析的步驟,

薈萃分析概念

薈萃分析的概念最早是由Light 和Smith 於1971 年提出的。當時針對大量發表的科學論文中,對於同樣的研究卻得出截然不同的結果的問題,他們提出應該在全世界範圍內收集對某一疾病各種療法的小樣本、單個臨床試驗的結果,對其進行系統評價和統計分析,將儘可能真實的科學結論及時提供給社會和臨床醫師,以促進推廣真正有效的治療手段,擯棄尚無依據的無效的甚至是有害的方法。
1976 年Glass 首次將這一概念命名為Meta-analysis(薈萃分析),並定義為一種對不同研究結果進行收集、合併及統計分析的方法。這種方法逐漸發展成為一門新興學科--“循證醫學”的主要內容和研究手段。薈萃分析的主要目的是將以往的研究結果更為客觀的綜合反映出來。研究者並不進行原始的研究,而是將研究已獲得的結果進行綜合分析。

薈萃分析分類

通常概念下的文獻綜述是對有關文獻的內容或結果進行羅列、簡單的描述和初步的討論,而薈萃分析則完全上了一個台階。根據薈萃分析所依據的基礎或數據來源可以將其分為三類:文獻結果薈萃分析(Meta-analysis based on literature, MAL);綜合或合併數據薈萃分析(Meta-analysis based on summary data, MAS);獨立研究原始數據薈萃分析(Meta-analysis based on individual patient data, MAP or IPD Meta-analysis)。它們的區別在於:MAL 的文獻檢索局限於已經發表的研究,然後將這些研究的結果合併進行分析;MAS 不僅要得到相關的發表的文獻,同時還有作者進行的相關統計學數據的總結;而IPD 薈萃分析除了要檢索所有已發表的相關文獻,還要尋找存在於各科學團體中的未發表的有關研究,在MAS 基礎上更進了一步。所有臨床試驗不管是否已經發表,必須能夠從研究者處得到單個患者原始的,以及各效應指標的數據。這一點對於腫瘤病因或療效研究方面的分析來說較為重要。因為多數的關於腫瘤病人預後的III 期臨床試驗,主要的研究指標大多為生存時間或生存率,或疾病無進展時間等,在多數情況下,不同的出版物中所得到的信息不足以進行一項真正的事件(如腫瘤死亡)發生時間全過程的分析。這使得以已經發表的文獻作為基礎的MAL 和MAS 變得較為困難。同時,考慮到有統計學意義的陽性結果較陰性結果更易發表等能夠造成偏倚發生的情況存在,故MAL 和MAS 有一定的不足。相對來講,IPD 薈萃分析不存在上述的弊端或受有關偏倚的影響較小。因此,在腫瘤生存或療效研究領域中,當要求進行這方面的分析時,IPD 薈萃分析是唯一推薦使用的分析方法,儘管它比其它兩種方法要耗費更長的時間,以及人力和物力。

分析優劣

薈萃分析的優劣
薈萃分析的套用,避免了單個小樣本臨床試驗的局限性,使分析的結果更為全面和可靠,從而為醫學決策提供了良好的依據。但是,許多人為的因素可能會對分析結果產生影響。如試驗的選擇、研究終點的確定,試驗同質性的認可程度等。要想克服這些不利因素,應嚴格按照薈萃分析的有關規定,並逐漸形成相對固定的標準,如將生存指標作為規定的研究效應指標等。同時要認識到薈萃分析並不是包治百病的良藥,它不能代替大型的單個的臨床隨機試驗,也不應該作為進行一些小的、沒有多大說服力的、意義不大的臨床試驗的藉口。它和大型的隨機臨床試驗應該是相互補充、各取所長的關係。我們不應該把薈萃分析只當作是一個統計分析的工具,而要把它和臨床觀察或對數據的批判性回顧結合起來,從而幫助我們來評價一些臨床試驗的質量,研究不同試驗間療效的差異及造成的原因,以及為進一步的研究提供方向和證據等。?
薈萃分析的未來
薈萃分析在近20 年來得到了迅速的發展,每年發表的此類文章已經從80 年代的幾十篇到2000 年的將近500 篇左右。更有人認為,IPD 薈萃分析應該系統的進行,定期的更新。世界Cochrane 協作網目前正在進行一項龐大的工作,即將全世界所有的隨機臨床試驗進行註冊,然後進行相應的薈萃分析。同時,隨著信息技術的發展和大型臨床試驗資料庫的不斷完善,目前還出現了從回顧型薈萃分析向前瞻型薈萃分析轉換的趨勢,因為後者能更好的避免出版偏倚,更早得到分析結果和醫學決策的依據。這一點,相信應能更好的推動薈萃分析的進一步發展。薈萃分析-健擇治療非小細胞肺癌薈萃分析實例 在剛剛結束的第十屆世界肺癌會議(加拿大,2003 年?月)上,Le Chevalier T 教授及其同事們向大會報告了一份關於健擇治療進展期非小細胞肺癌(NSCLC) 生存資料薈萃分析的結果,引起了與會代表極大的興趣。
該項薈萃分析的研究的目很明確,比較健擇聯合其他藥物治療進展期非小細胞肺癌與其他化療方案的療效,看健擇/鉑類較其他鉑類為基礎的方案是否能輕度提高病人的總生存率和TTP,所以觀察指標的包括總生存率和無進展生存率。對2002 年12 月前發表的所有有關文獻進行了綜合性的回顧,檢索了主要的腫瘤方面資料庫、註冊的臨床試驗資料庫、會議摘要及發表的綜述,各獨立研究的設計特徵定義為頭對頭(head to head)隨機化臨床試驗,各試驗目的是比較健擇加鉑類與其它鉑類為基礎的方案的療效。15 個臨床試驗被研究者檢索到,2 個試驗被排除在本次薈萃分析外,原因是其中1 個試驗因為生存資料報導不足,1 個試驗因為患者的隨機化程度較差。在剩餘的13 個試驗中,7 個試驗的資料由研究者提供,僅11 個試驗同時報導了無進展生存率和總生存率。研究者主要的分析是全部鉑類為基礎的比較方案,總計13 個試驗,約4500 例患者。試驗的規模從76 例至超過1100 例患者分析分為2 個亞組進行,第一組包括所有第一代或第二代鉑類方案,包括長春花鹼、異環磷醯胺、足葉乙甙和米托蒽醌。第二組為第三代藥物加鉑類。分析指標為危險率、總生存率和生存率差、無疾病進展生存率,危險率直接取自研究者的報導有7 個試驗,或從發表的生存資料進行推算的有6 個試驗。若未進行報導,生存率從Kaplan-Meier 生存曲線估算,利用Parmar 等於1998 年發表的方法來進行計算。各組資料還進行明顯發表偏倚和異質性的檢驗,分別採用線性回歸隨機效應模型
無疾病進展1 年生存率差(絕對受益)估計值為4.2%,合併危險率比(HR) 為0.87,有統計學意義(P<0.001)。所有試驗的合併危險率比(HR)為0.90,1 年總生存率的差(絕對受益)估計值為3.9%。對照組的1 年生存率約為35%,健擇治療組約為39%。合併危險率比0.90 的95%可信區間為0.84-0.96,有統計學意義(P<0.001)。亞組分析表明,順鉑單藥或第一或二代鉑類方案無進展生存率的合併危險率比為0.85,總生存率的合併危險率比為0.89,均有統計學意義。第三代藥物/鉑類方案無進展生存率的合併危險率比為0.84,總生存率的合併危險率比為0.93,前者有統計學意義,後者95%可信區間為0.86-1.01,接近統計學意義P=0.05 水平。結果為第二個亞組在總生存率方面試驗組和對照組無顯著性差異,這是唯一不利於健擇的數據。
研究者還報告了敏感性分析的結果,顯示益處的方向是一致的。其潛在缺陷或不足包括以下幾個方面:一是分析是基於總結的資料;二是由於試驗對照組的數量,無法就單獨的某一藥物與健擇進行比較;三是因為沒有獲得單獨試驗的資料,無法就性別、行為狀態等預後因素進行分層分析。
總之,該薈萃分析結果顯示,總體上健擇/鉑類聯合與其它鉑類方案比較,患者能獲得輕微但有統計學意義的改善(總生存率和無疾病進展生存率),但無法就單獨藥物進行比較。結果同時顯示,健擇方案較傳統方案更有效;與其他三代藥物聯合至少療效相當。研究者最後還提醒各位,治療決定的選擇必須遵從療效好壞,還要考慮到其他在這裡沒有進行討論或研究的一些臨床預後因素的作用。

分析的步驟

計畫階段
首先要確定研究的主題,然後明確本方案的目的,試驗的入選標準和排除標準,計畫的分析指標,以及準備套用的統計學方法等。一篇薈萃分析最好只研究一個主要問題,但在研究的主要目的明確後,還可以同時研究其他的次要問題。
尋找和選擇臨床試驗
理想情況下,所有與研究主題相關的文獻都應該包括在薈萃分析之內,不管它是否已經發表。必須考慮到文章出版、語言和引用上的偏倚。一般情況下,顯示有統計意義的試驗更易被某些雜誌刊登,這些論文的發表周期較短,他們有最高的點擊指數。通常會用英語發表,他們比未顯示出統計學意義的試驗被更多的參考和引用。單單使用計算機進行檢索是不夠的,儘管這樣比較方便。因為即便是象MEDLINE 或EMBASE 這樣的大型資料庫,其所收錄的也都是在各類雜誌上發表的文獻,且分別是1966 年和1974 年以後的文獻。還要通過人工檢索一些會議資料,或直接同研究者和製藥公司進行個人接觸,來保證文獻的全面性。
試驗的質量
確保每一個試驗的質量是很關鍵的,因為它會影響整個薈萃分析的質量。不充分的隨機化,隨機分組後將患者排除在外,治療組之間不能平行的隨訪,以及對研究終點的主觀評價都會使試驗的結果發生偏差。因此各獨立研究的質量是不同的。在進行薈萃分析時,各研究結果就不應該被平等的對待,而應根據各個獨立研究質量的高低給予不同的處理。比如對單個隨機對照臨床試驗的質量進行評分,將分值納入薈萃分析的入選標準,或將其作為合併檢驗時的權重。
對試驗進行描述
在對各試驗結果進行薈萃分析前,每一個試驗必須被記錄和描述。包括對試驗設計的評價,治療組間進行比較的特性,患者人群特徵,試驗質量的評估和試驗結果的定量總結等。這個過程使研究者可以發現相似的試驗而將其合併,了解入組患者的類型和評價數據的可靠性。被排除在薈萃分析之外的試驗,以及被排除的原因也應該進行描述。
分析
在薈萃分析中,齊性檢驗是重要的一環,目的是檢查各個試驗結果是否具有一致性。一般來講,僅僅由於抽樣誤差造成的各試驗間結果不同,不會影響薈萃分析結果的可靠性。但若發現不一致性的原因是某種特殊因素所致,如某個研究失訪病例過多,則不應該將這個試驗結果列入薈萃分析。常用的齊性檢驗方法主要有χ2 或Q 檢驗。
對數據結果進行匯總合併分析是薈萃分析的精華,目前套用於此的統計學方法較多。如隨機效應模型,Cochrane 法,Glass 法和Fisher-Z 轉換法等。在腫瘤生存或療效研究領域,較多的是對生存率或死亡風險比(Hazard Ratio,HR)指標的分析。通常,要對每個入選試驗的數據進行統計計算,得出主要的三個值:O=試驗組所觀察到的事件發生數;E=假設試驗組和對照組事件發生的幾率相同,預期試驗組的事件發生數;Var(O-E)=(O-E)的方差,用來衡量試驗中治療差異估計的精確度。計算單個試驗風險比的公式為:HR=Exp[(O-E)/Var(O-E)]。多個試驗總風險比的計算為:HRc=Exp[Σ(O-E)/ ΣVar(O-E)]。風險比95%的可信區間可通過下列公式計算:上限=Exp[(O-E)/Var(O-E) +1.96/ Var(O-E)1/2];下限= Exp[(O-E)/Var(O-E)-1.96/ Var(O-E)11/2]。分析得出的數據最終可以用林圖(Forest Plot)來直觀顯示。
兩個治療組間的絕對生存率或無病生存差異是療效研究中的主要分析指標,通過採用一定的統計方法,同樣可獲得某一時點(如5 年)生存率合併估計值,以及該時點兩組生存率差的合併估計值,具體的公式可參見有關的文獻。

相關詞條

熱門詞條

聯絡我們