Що таке довірчий інтервал: як обчислити 95%, для середнього або для різниці

95% довірчий інтервал різниці по гемоглобіну, (г / л)

Костянтин Кравчик дохідливо пояснює, що таке довірчий інтервал в медичних дослідженнях і як його використовувати

«Катрен-Стиль» продовжує публікацію циклу Костянтина Кравчика про медичною статистикою. У двох попередніх статтях автор стосувався пояснення таких понять, як розмір вибірки, генеральна сукупність, статистична гіпотеза і класифікацію шкал .

У двох попередніх статтях автор стосувався пояснення таких понять, як розмір вибірки, генеральна сукупність, статистична гіпотеза і класифікацію шкал

Досьє КС

Костянтин Кравчик

Математик-аналітик. Спеціаліст в області статистичних досліджень в медицині і гуманітарних науках

Місто Москва

Дуже часто в статтях з клінічних досліджень можна зустріти загадкове словосполучення: «довірчий інтервал» (95% ДІ або 95% CI - confidence interval). Наприклад, в статті може бути написано: «Для оцінки значущості відмінностей використовували t-критерій Стьюдента з розрахунком 95% довірчого інтервалу».

Якого ж значення «95% довірчого інтервалу» і навіщо його розраховувати?

Що таке довірчий інтервал? - Це діапазон, в якому знаходяться справжні середні значення в генеральній сукупності. А що, бувають «несправжні» середні значення? В якомусь сенсі так, бувають. В минулій статті ми пояснювали, що неможливо виміряти цікавить параметр у всій генеральної сукупності, тому дослідники задовольняються обмеженою вибіркою. У цій вибірці (наприклад, по масі тіла) є одне середнє значення (певне політичне значення), за яким ми і судимо про середнє значення у всій генеральної сукупності. Однак навряд чи середня вага у вибірці (особливо невеликий) співпаде із середньою вагою в генеральної сукупності. Тому більш правильно розраховувати і користуватися діапазоном середніх значень генеральної сукупності.

Наприклад, уявімо, що 95% довірчий інтервал (95% ДІ) по гемоглобіну становить від 110 до 122 г / л. Це означає, що з імовірністю 95% справжнє середнє значення по гемоглобіну в генеральної сукупності перебуватиме в межах від 110 до 122 г / л. Іншими словами, ми не знаємо середній показник гемоглобіну в генеральної сукупності, але можемо з 95% -й вірогідністю вказати діапазон значень для цієї ознаки.

Довірчий інтервал особливо доречний для різниці в середніх значеннях між групами або, як це називають, в розмірі ефекту.

Припустимо, ми порівнювали ефективність двох препаратів заліза: давно присутнього на ринку і тільки що зареєстрованого. Після курсу терапії оцінили концентрацію гемоглобіну в досліджуваних групах пацієнтів, і статистична програма нам порахувала, що різниця між середніми значеннями двох груп з імовірністю 95% знаходиться в діапазоні від 1,72 до 14,36 г / л (табл. 1).

Табл. 1. Критерій для незалежних вибірок
(Порівнюються групи за рівнем гемоглобіну)

t-критерій Значимість
(2-стороння) Різниця середніх 95% довірчий інтервал для різниці

Нижня

Верхня

2,609 0,014 8,048 1,7274 14,3678

Трактувати це слід так: у частини пацієнтів генеральної сукупності, яка приймає новий препарат, гемоглобін буде вище в середньому на 1,72-14,36 г / л, ніж у тих, хто приймав уже відомий препарат.

Іншими словами, в генеральної сукупності різниця в середніх значеннях по гемоглобіну у груп з 95% -й вірогідністю знаходиться в цих межах. Судити, багато це чи мало, буде вже дослідник. Сенс всього цього в тому, що ми працюємо не з одним середнім значенням, а з діапазоном значень, отже, ми більш вірогідно оцінюємо різницю по параметру між групами.

У статистичних пакетах, на розсуд дослідника, можна самостійно звужувати або розширювати межі довірчого інтервалу. Знижуючи ймовірності довірчого інтервалу, ми звужуємо діапазон середніх. Наприклад, при 90% ДІ діапазон середніх (або різниці середніх) буде вже, ніж при 95%.

І навпаки, збільшення ймовірності до 99% розширює діапазон значень. При порівнянні груп нижня межа ДІ може перетнути нульову позначку. Наприклад, якщо ми розширили межі довірчого інтервалу до 99%, то межі інтервалу розташувалися від -1 до 16 г / л. Це означає, що в генеральній сукупності є групи, відмінність середніх між якими по досліджуваному ознакою дорівнює 0 (М = 0).

За допомогою довірчого інтервалу можна перевіряти статистичні гіпотези. Якщо довірчий інтервал перетинає нульове значення, то нульова гіпотеза, що припускає, що групи не розрізняються по досліджуваному параметру, вірна. Приклад описаний вище, коли ми розширили межі до 99%. Десь в генеральної сукупності у нас знайшлися групи, які не відрізнялися.

Чому рекомендується дивитися на довірчий інтервал? Для більшої наочності звернемося до малюнка.

95% довірчий інтервал різниці по гемоглобіну, (г / л)

На малюнку у вигляді лінії зображений 95% довірчий інтервал різниці середніх значень по гемоглобіну між двома групами. Лінія проходить нульову позначку, отже, має місце різниця між середніми значеннями, що дорівнює нулю, що підтверджує нульову гіпотезу про те, що групи не розрізняються. Діапазон різниці між групами лежить від -2 до 5 г / л, Це означає, що гемоглобін може як знизитися на 2 г / л, так і підвищитися на 5 г / л.

Довірчий інтервал - дуже важливий показник. Завдяки йому можна подивитися, чи були відмінності в групах дійсно за рахунок різниці середніх або за рахунок великої вибірки, т. К. При великій вибірці шанси знайти відмінності більше, ніж при малій.

На практиці це може виглядати так. Ми взяли вибірку в 1000 чоловік, виміряли рівень гемоглобіну і виявили, що довірчий інтервал різниці середніх лежить від 1,2 до 1,5 г / л. Рівень статистичної значущості при цьому p

Ми бачимо, що концентрація гемоглобіну підвищилася, але практично непомітно, отже, статистична значимість з'явилася саме за рахунок обсягу вибірки.

Довірчий інтервал може бути вирахуваний не тільки для середніх значень, а й для пропорцій (і відносин ризиків). Наприклад, нас цікавить довірчий інтервал пропорцій пацієнтів, які досягли ремісії, приймаючи розроблене ліки. Припустимо, що 95% ДІ для пропорцій, т. Е. Для частки таких пацієнтів, лежить в межах 0,60-0,80. Таким чином, ми можемо сказати, що наші ліки має терапевтичний ефект від 60 до 80% випадків.

Якого ж значення «95% довірчого інтервалу» і навіщо його розраховувати?
Що таке довірчий інтервал?
А що, бувають «несправжні» середні значення?
Чому рекомендується дивитися на довірчий інтервал?