溫馨提示×

您好,登錄后才能下訂單哦!

密碼登錄×
登錄注冊(cè)×
其他方式登錄
點(diǎn)擊 登錄注冊(cè) 即表示同意《億速云用戶服務(wù)條款》

logistic回歸應(yīng)用的常見(jiàn)問(wèn)題有哪些

發(fā)布時(shí)間:2022-01-04 16:56:14 來(lái)源:億速云 閱讀:255 作者:柒染 欄目:大數(shù)據(jù)

logistic回歸應(yīng)用的常見(jiàn)問(wèn)題有哪些,針對(duì)這個(gè)問(wèn)題,這篇文章詳細(xì)介紹了相對(duì)應(yīng)的分析和解答,希望可以幫助更多想解決這個(gè)問(wèn)題的小伙伴找到更簡(jiǎn)單易行的方法。


醫(yī)學(xué)研究尤其是流行病學(xué)研究中,常見(jiàn)分析疾病(結(jié)局)與多種因素(暴露)之間的定量關(guān)系。當(dāng)結(jié)局為分類(二分類、多分類)資料時(shí),為研究多種因素共同作用及其交互作用對(duì)結(jié)局的定量影響,可以采用Logistic 回歸( Logistic regression) 分析方法。Logistic回歸屬于概率型非線性回歸的一種多變量分析方法。隨著計(jì)算機(jī)技術(shù)的發(fā)展,越來(lái)越多Lo-gistic回歸被應(yīng)用于醫(yī)學(xué)研究,隨之也常常出現(xiàn)誤用及結(jié)果解釋不當(dāng)?shù)膯?wèn)題。本文主要討論Logistic回歸應(yīng)用中有關(guān)建模與結(jié)果解釋方面的常見(jiàn)問(wèn)題。            

二元logistic回歸分析


優(yōu)勢(shì)比的意義            

注意,OR的應(yīng)用及解釋存在以下誤區(qū)

1)認(rèn)為OR> 1代表為危險(xiǎn)因素,OR<1代表為保護(hù)因素。事實(shí)上,OR代表應(yīng)變量與自變量之間聯(lián)系的強(qiáng)度,需要根據(jù)研究結(jié)局進(jìn)行專業(yè)意義的解釋。

如果研究結(jié)局是正性事件,如疾病治愈、生存,則OR>1代表為促進(jìn)疾病治愈、促進(jìn)生存的保護(hù)因素,而OR<1代表為不利于正性事件的危險(xiǎn)因素;

當(dāng)研究結(jié)局為負(fù)性事件,如疾病發(fā)生、進(jìn)展、死亡等,則OR> 1代表為危險(xiǎn)因素,OR<1代表為保護(hù)因素。

2)將OR與相對(duì)危險(xiǎn)度(relative.risk,RR)含義混淆。RR是暴露組與未暴露組的研究結(jié)局發(fā)生率之比,它是一個(gè)比值,代表暴露于某個(gè)因素的研究結(jié)局發(fā)生率是未暴露組的多少倍。而OR是優(yōu)勢(shì)比,可以理解為工;每改變一個(gè)單位時(shí),研究結(jié)局的發(fā)生風(fēng)險(xiǎn)改變量。只有發(fā)生率很低的研究結(jié)局,即P很小時(shí),OR才近似等于RR。

啞變量的設(shè)置            


【在Logistic回歸中 設(shè)置啞變量】

 Logistic回歸中最常見(jiàn)的自變量類型為多分類變量,如分娩方式分為順產(chǎn)、難產(chǎn)、剖腹產(chǎn),嬰兒喂養(yǎng)方式分為母乳喂養(yǎng)、混合喂養(yǎng)、人工喂養(yǎng)。有些研究者將多分類自變量誤作為連續(xù)型變量引人Logistic模型進(jìn)行分析,這意味著該變量各:相鄰分類水平間是等距的,顯然不符合實(shí)際邏輯。例如,有研究對(duì)合肥市城區(qū)低出生體重兒影響因素的Logistic回歸分析中,原作者將“父親職業(yè)”這個(gè)分類變量分為“體力勞動(dòng)”、“體力兼腦力勞動(dòng)”、“腦力勞動(dòng)三個(gè)分類水平,進(jìn)行Logistic回歸分析時(shí)卻將該變量作為有序分類(等級(jí))變量賦值為各分類水平的得分,按連續(xù)變量進(jìn)行處理欠妥。

此外,如果研究者想觀察分類變量的各暴露水平對(duì)研究結(jié)局的影響,也可以將有m個(gè)分類水平的變量轉(zhuǎn)變?yōu)閙個(gè)啞變量(取值0或1),每個(gè)啞變量分別代表有無(wú)該水平的暴露(取值1代表有,取值0代表無(wú))。例如,有研究對(duì)兒童慢性胃炎、消化性潰瘍致病危險(xiǎn)因素的Logistic回歸分析中,對(duì)于膳食模式這個(gè)3分類變量(喜愛(ài)蔬菜/水果/肉食),可轉(zhuǎn)變?yōu)?個(gè)啞變量(分別表示“是否喜愛(ài)蔬菜”、“是否喜愛(ài)水果”、“是否喜愛(ài)肉食”)。

變量篩選            

Logistic回歸模型建立時(shí),如自變量較多,可采用逐步回歸法進(jìn)行變量篩選。不同的篩選方法有時(shí)會(huì)產(chǎn)生不同的模型。判斷某個(gè)變量是否顯著以及作用大小,與模型中所包含的變量有關(guān)。實(shí)際工作中衡量某些變量是.否選人模型,需要考慮專業(yè)背景、研究目的、用以調(diào)整的某些重要混雜因素以及模型的可解釋性、節(jié)約性等。


logistic分析結(jié)果解釋

【回歸分析最強(qiáng)總結(jié)】


變量的參照水平設(shè)置


實(shí)際工作中,有些論文作者在Logistic回歸模型的結(jié)果展示中只標(biāo)注自變量中文名稱和回歸系數(shù),未說(shuō)明各變量的參照水平設(shè)置。在回歸系數(shù)的解釋上,也只說(shuō)明自變量對(duì)研究結(jié)局是危險(xiǎn)或保護(hù)因素,未考慮實(shí)際專業(yè)意義。

下圖能更清楚說(shuō)明問(wèn)題。父親肥胖的兒童更容易發(fā)生超重和肥胖,其風(fēng)險(xiǎn)是父親體重正常者的1. 976倍;而相較于出生體重≥4000g的兒童,出生體重在2500~4000g是兒童超重肥胖的保護(hù)因素。


 logistic回歸應(yīng)用的常見(jiàn)問(wèn)題有哪些

關(guān)于logistic回歸應(yīng)用的常見(jiàn)問(wèn)題有哪些問(wèn)題的解答就分享到這里了,希望以上內(nèi)容可以對(duì)大家有一定的幫助,如果你還有很多疑惑沒(méi)有解開,可以關(guān)注億速云行業(yè)資訊頻道了解更多相關(guān)知識(shí)。

向AI問(wèn)一下細(xì)節(jié)

免責(zé)聲明:本站發(fā)布的內(nèi)容(圖片、視頻和文字)以原創(chuàng)、轉(zhuǎn)載和分享為主,文章觀點(diǎn)不代表本網(wǎng)站立場(chǎng),如果涉及侵權(quán)請(qǐng)聯(lián)系站長(zhǎng)郵箱:is@yisu.com進(jìn)行舉報(bào),并提供相關(guān)證據(jù),一經(jīng)查實(shí),將立刻刪除涉嫌侵權(quán)內(nèi)容。

AI