基本介紹
- 中文名:基準劑量最佳化算法
- 外文名:benchmark dose optimization algorithm
- 模型:劑量——反應模型
- 目的:取得最優值
- 過程1:參數初始值粗略計算
- 過程2:參數最優估計
基準劑量法概述,基準劑量最佳化算法,參數初始值計算,參數最優估計,
基準劑量法概述
基準劑量(benchmarkdose,BMD)方法F}lCrumpK.S.在1985年最先提出(Crump}1984,1985,1995),主要用於風險評估領域的劑量——反應分析,主要思想是採用劑量——反應模型擬合實驗數據,再利用統計學的方法取得估計劑量。目前風險評估領域大多數人使用的定義是美國環境保護署(EPA)對基準劑量法的定義:基準劑量方法是指通過劑量——反應曲線獲得使某種反應增加到某一個特定水平的劑量——反應分析方法,達到特定水平的劑量稱為基準劑量(BMD),達到這一特定劑量水平的反應稱為基準反應(benchmarkresponseBMR)。基準劑量下限(benchmarkdoselowerconfidencelimit,BMDL)是基準劑量BMD的可信區間下限。
通常令基準反應BMR=10%,表示不良反應要控制在10%。實曲線表示劑量——反應模型的擬合曲線,與水平直線的交叉點所對應的橫坐標是基準劑量BMD。基準劑量下限BMDL等於反應可能低於10%的劑量,這裡的“可能”在統計學上通常取95%,虛曲線表示反應的95%可信區間上限,它是劑量的函式,虛曲線與水平直線的交叉點所對應的橫坐標是基準劑量下限BMDL,表示在BMDL這個劑量下的不良反應以95%的機率小於10%。
基準劑量法由於能夠提供較高的可信區間而被廣泛使用。使用基準劑量評估方法一般需要四步:第一步是進行實驗設計。基準劑量方法除要求反應指標是劑量的單調函式外,在毒物的劑量——反應本質上沒有其它特殊要求;實驗數據中包含的樣本量不能太少,至少要滿足統計建模的最低要求。第二步是根據反應指標的類型確定基準反應值BMR。第三步是選擇並擬合基準劑量模型,在模型顯著性條件下,根據基準反應BMR計算基準劑量BMD。第四步是計算基準劑量下限BMDL基準劑量下限的計算考慮了由實驗設計造成的不確定性,並且當所有一實驗劑量都存在顯著不良反應時,仍然能夠計算BMDL,外推實驗劑量範圍。使用基準劑量法分析後,應該給出全面的分析報告,供他人對比參照,一般要包括觀察終點詳細信息,BMR的取值,參數初始位設定、最佳化及假設信息,顯著性檢驗信息,基準劑量BMD,基準劑量下限BMDL計算結果等。
目前使用基準劑量評估分析的理論和方法並不存在爭議,學術界公認為是和傳統NOAEL分析法相近的一種更科學更準確的分析方法,值得推廣使用。但是目前基準劑量分析法並沒有被許多地區和組織完全系統採用,歐洲食品安全局(EFSA)認為主要原因在於外部不同部門人員之間在風險交流上產生歧義造成的,比如BMD有無效應水平在風險管理者和消費者保護組織之間就存在不同認識。
基準劑量最佳化算法
基準劑量最佳化算法主要是指這樣的一個過程,在用劑量——反應模型擬合實驗數據時,首先粗略估計參數的初始值,然後從初始值出發,通過反覆擬合不斷搜尋較優參數值,直到模型參數取得“認為的”最優值為止。該過程涉及兩個主要概念,一個是參數初始值粗略計算,另外一個是參數最優估計。基準劑量分析在此基礎上估計基準劑量BMD值,以及基準劑量下限BMDL值。
參數初始值計算
在數值分析軟體的開發中,一般把參數初始值的計算分為三種情況。第一種情況是模型形式很複雜、不易化簡計算,而且沒有人為的經驗可以借鑑,在這種情況下一般由計算機系統進行隨機賦值,或者人為地猜測指定。從這樣的初始值出發不斷搜尋計算,可以預想到時間的漫長以及不確定性,這樣的求取參數初始值方法一般不作為軟體的主要計算方法,有時作為計算的一種輔助辦法在軟體設定中供選擇使用。第二種情況是模型形式較複雜,雖然不能通過化簡求解,但是可以藉助實驗數據進行粗略計算,比如從實驗數據中選取最大反應數據,最小反應數據,平均反應值等,將這些值帶入劑量——反應模型,通過解方程組或線性回歸等數學方法求得計算結果。第三種情況是對一般常用的主要數學模型,其模型形式相對簡單,屬於線性的,或者可以化簡為線性的,比如帶有指數的,可以對模型公式取對數轉換成線性模型,然後用線性回歸方法求解。第三種方法是目前常見的參數初始值計算方法。
線性回歸(linearregression,LR)是數據分析領域運用非常廣泛的一種統計學方法,線性回歸方法分為簡單線性回歸方法和多重線性回歸方法(陳寶林,2005)。目前基準劑量評估系統用於基準劑量分析的都是單變數,即只有一個自變數稱為劑量(dose)。
參數最優估計
參數估計也稱為參數推斷,是統計學中的一項重要統計推斷。參數估計方法分為點估計和區間估計兩類,點估計是指由樣本觀察值計算模型參數的估計值,到今天為止形成很多方法,包括最容易計算的矩估計(methodofmomentsestimators,MME),最常用最經典的極大似然估計(maximumlikelihoodestimation,MLE),介紹的通過使均方誤差(MSE)最小的最小二乘法,還有1958年由圖基提出的適用於有一偏樣木或存在異常值等情況的“刀切法”(Jackknife),以及適用於多數機率分布的穩健估計,假設參數具有先驗分布的貝葉斯估計等。區間估計是估計參數的一個可信區間,主要方法有樞軸法、自助法和貝葉斯法等。其基本思想是如果能找到這樣的參數,參數使得出現己有實驗樣本的機率是最大的,那么就理所當然的認為這樣的參數就是最好的,將這些值做為真實值的估計。極大似然估計法由統計學家和遺傳學家在1912年最開始使用,如果假設模型正確,使用極大似然估計法推斷參數是最優的。使用極大似然估計,首先要定義似然函式,但有時候似然函式存在,有時候不存在,或者可能還不唯一。