Калькулятор оценки качества в задачах классификации (точность, полнота, F-мера, ...)
Расчет оценки качества в задачах классификации
Понимание статистических показателей имеет решающее значение при оценке производительности алгоритмов или систем. Будь то оценка точности прогноза или понимание чувствительности модели, эти показатели дают ценную информацию. В этом руководстве разъясняются такие термины, как «полнота (recall)», «Точность (precision)», «Accuracy» и другие. Погрузитесь в суть этих понятий и узнайте, как умело использовать калькулятор оценки качества в задачах классификации.
- Как использовать калькулятор оценки качества?
- Определение ключевых статистических показателей
- Формулы для вычислений
Как использовать Калькулятор оценки качества?
Калькулятор интуитивно понятен и удобен для пользователя:
- Входные данные. Начните с ввода значений для истинно положительных, истинно отрицательных, ложно положительных и ложно отрицательных результатов.
- Вычислите: после ввода данных, все вычисления будут выполняться автоматически.
- Интерпретация результатов. Калькулятор мгновенно отобразит различные показатели. Чтобы понять эти результаты, обратитесь к определениям и формулам, приведенным ниже.
Определение ключевых статистических показателей
Давайте углубимся в значение каждого показателя:
- Accuracy. Отображает общую правильность прогнозов.
- Точность (Precision). Показывает долю истинно положительных прогнозов от общего числа прогнозируемых положительных результатов.
- Полнота (Recall, Sensitivity): подчеркивает долю истинно положительных прогнозов по отношению ко всем фактическим положительным прогнозам.
- Оценка F1 (F1-Score): Гармоничный среднее значение точности и полноты, обеспечивая баланс между ними.
- Специфичность (Specificity): указывает долю истинно отрицательных прогнозов по отношению ко всем фактическим негативам.
- Доля ложноположительных результатов (False Positive Rate): отображает долю ложноположительных результатов по отношению ко всем фактически отрицательным результатам.
- Прогнозирующая ценность отрицательного результата (Negative Predictive Value): Показывает долю истинно отрицательных прогнозов к общему числу прогнозируемых негативных результатов.
- Коэффициент корреляции Мэтьюза (MCC): показатель, который дает представление о качестве двоичных классификаций.
- Распространенность (Prevalence): указывает на фактическое появление положительного класса в наборе данных.
- Процент ошибок (Percent Error): показывает процент неверных прогнозов.
- Точность на основе распространенности (Prevalence-Based Accuracy): Точность корректируется в зависимости от распространенности классов.
- Сбалансированная точность (Balanced Accuracy): Среднее арифметическое чувствительности и специфичности.
Формулы для вычислений
Понимание механики Калькулятор точности по этим формулам:
Accuracy:\text{Accuracy} = \dfrac{TP + TN}{TP + TN + FP + FN}
Точность:\text {Precision} = \dfrac{TP}{TP + FP}
Полнота: \text{Recall} = \dfrac{TP}{TP + FN}
F1-Score:\text{F1-Score} = 2 \cdot \dfrac{Precision \cdot Recall}{Precision + Recall}
Специфика:\text{Specificity} = \dfrac{TN}{TN + FP}
Доля ложноположительных результатов:\text{Доля ложноположительных результатов} = \dfrac{FP}{FP + TN}
Отрицательная прогнозируемая ценность:\text{Отрицательная прогнозируемая ценность} = \dfrac{TN}{TN + FN}
Коэффициент корреляции Мэтьюза (MCC):MCC = \dfrac{TP * TN - FP * FN}{\sqrt{(TP + FP)(TP + FN)(TN + FP)(TN + FN)}}
Распространенность :\text{Prevalence} = \dfrac{TP + FN}{\text{Всего наблюдений}}
Процентная ошибка:\text{Процентная ошибка} = \dfrac{FP + FN}{Всего наблюдений} \cdot 100
Точность на основе распространенности:\text{Точность на основе распространенности} = \text{Распространенность} \cdot \text{Чувствительность} + (1 - \text{Распространенность}) \cdot \text{Специфичность}
Сбалансированная точность (продолжение):\text{Сбалансированная точность} = \dfrac{\text{Полнота} + \text{Специфичность}}{2}
Каждая из этих формул играет решающую роль в понимании эффективности прогнозной модели. Используя калькулятор точности, пользователи могут легко получать эти показатели, обеспечивая точную интерпретацию и более эффективное принятие решений.
В области науки о данных, машинного обучения и аналитики понимание Вышеуказанные показатели имеют решающее значение. Независимо от того, оцениваете ли вы производительность модели машинного обучения или результаты медицинского обследования, эта статистика дает комплексное представление о точности и связанных с ней показателях. Погрузитесь глубже, используйте их с умом и убедитесь, что ваши прогнозы и интерпретации имеют прочную основу.
Теги
- Вероятность и дискретные распределения
- Непрерывное распределение и визуализация данных