ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Как ΠΏΠΎΠ½ΡΡ‚ΡŒ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Python

Если Π²Ρ‹ ΠΏΠΎΠ³ΡƒΠ³Π»ΠΈΡ‚Π΅ ROC curve machine learning, Ρ‚ΠΎ ВикипСдия выдаст Π²Π°ΠΌ Ρ‚Π°ΠΊΠΎΠΉ ΠΎΡ‚Π²Π΅Ρ‚: ΠšΡ€ΠΈΠ²Π°Ρ Ρ€Π°Π±ΠΎΡ‡ΠΈΡ… характСристик ΠΏΡ€ΠΈΡ‘ΠΌΠ½ΠΈΠΊΠ°, ΠΈΠ»ΠΈ ROC-кривая, прСдставляСт собой Π³Ρ€Π°Ρ„ΠΈΠΊ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΈΠ»Π»ΡŽΡΡ‚Ρ€ΠΈΡ€ΡƒΠ΅Ρ‚ диагностичСскиС возмоТности систСмы Π΄Π²ΠΎΠΈΡ‡Π½ΠΎΠ³ΠΎ классификатора ΠΏΡ€ΠΈ ΠΈΠ·ΠΌΠ΅Π½Π΅Π½ΠΈΠΈ Π΅Ρ‘ ΠΏΠΎΡ€ΠΎΠ³Π° распознавания.

Π•Ρ‰Ρ‘ ΠΎΠ΄Π½ΠΎ частоС описаниС ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ: ROC-кривая ΠΎΡ‚Ρ€Π°ΠΆΠ°Π΅Ρ‚ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊ Ρ€Π°Π·Π½Ρ‹ΠΌ ΠΏΠΎΡ€ΠΎΠ³Π°ΠΌ классификации. Новичков эти опрСдСлСния ΠΌΠΎΠ³ΡƒΡ‚ ΡΠ±ΠΈΡ‚ΡŒ с Ρ‚ΠΎΠ»ΠΊΡƒ. ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠ΅ΠΌ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Ρ‚ΡŒΡΡ ΠΈ Ρ€Π°Π·Π²ΠΈΡ‚ΡŒ прСдставлСниС ΠΎ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Ρ….

Π§Ρ‚ΠΎ Π·Π° Ρ‡Π΅Ρ€Ρ‚ΠΎΠ²Ρ‰ΠΈΠ½Π° эта ROC-кривая?

Π’Π°Ρ€ΠΈΠ°Π½Ρ‚, ΠΊΠ°ΠΊ ΠΏΠΎΠ½ΡΡ‚ΡŒ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ: ΠΎΠ½Π° описываСт взаимосвязь ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΌΠΎΠ΄Π΅Π»ΠΈ (TPR, ΠΈΠ»ΠΈ true positives rate β€” доля истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ²) ΠΈ Π΅Ρ‘ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ (описываСмой Π² ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠΈ Π΄ΠΎΠ»Π΅ΠΉ Π»ΠΎΠΆΠ½ΠΎΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ²: 1-FPR).

Π”Π°Π²Π°ΠΉΡ‚Π΅ Ρ€Π°Π·ΠΎΠ²ΡŒΡ‘ΠΌ эту ΠΊΠΎΠ½Ρ†Π΅ΠΏΡ†ΠΈΡŽ. TPR, ΠΈΠ»ΠΈ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ, являСтся ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ΠΌ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½Ρ‹Ρ… классификаций ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ класса, Ρ€Π°Π·Π΄Π΅Π»Ρ‘Π½Π½Ρ‹Ρ… Π½Π° всС ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ классы, доступныС ΠΈΠ· Π½Π°Π±ΠΎΡ€Π° Π΄Π°Π½Π½Ρ‹Ρ…:

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваякакиС Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

FPR β€” доля Π»ΠΎΠΆΠ½ΠΎΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ², false positives rate. Π­Ρ‚ΠΎ ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρƒ Π»ΠΎΠΆΠ½Ρ‹ΠΌΠΈ срабатываниями (количСство ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΎΠ², ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎ отнСсённых Π² ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅), ΠΈ всСми доступными ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ классами. ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈ:

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваякакиС Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

ΠžΠ±ΠΎΠ±Ρ‰Π°Ρ: Π²Ρ‹ сравниваСтС, ΠΊΠ°ΠΊ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ мСняСтся ΠΏΠΎ ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡŽ ΠΊ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ долям Π½Π° Ρ€Π°Π·Π½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³Π°Ρ… отсСчСния. МодСль опираСтся Π½Π° ΠΏΠΎΡ€ΠΎΠ³ отсСчСния, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎ Π²Ρ…ΠΎΠ΄Π½Ρ‹ΠΌ Π΄Π°Π½Π½Ρ‹ΠΌ ΠΈ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒ ΠΈΡ… ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ.

Π Π°Π·Π΄Π΅Π»Π΅Π½ΠΈΠ΅ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ с ΠΏΠΎΡ€ΠΎΠ³Π°ΠΌΠΈ отсСчСния

ΠŸΠΎΠ½Π°Ρ‡Π°Π»Ρƒ интуиция Ρ‚ΠΎΠ»ΠΊΠ°Π»Π° ΠΊ пониманию Ρ€ΠΎΠ»ΠΈ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ² отсСчСния. МнС ΠΏΠΎΠΌΠΎΠ³Π»Π° мыслСнная ΠΊΠ°Ρ€Ρ‚ΠΈΠ½Π°:

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяНа ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ Π»Π°Π±ΠΎΡ€Π°Ρ‚ΠΎΡ€Π½Ρ‹Ρ… ΠΌΡ‹ΡˆΠ΅ΠΉ

Π‘ Ρ‚Π°ΠΊΠΎΠΉ классичСской Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ Π΄ΠΎ мСня дошло ΠΏΠ΅Ρ€Π²ΠΎΠ΅ прСдставлСниС, Π° ΠΈΠΌΠ΅Π½Π½ΠΎ: идСальная модСль β€” Ρ‚Π°, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ доля истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² максимально высока, Π² Ρ‚ΠΎ ΠΆΠ΅ врСмя доля Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² удСрТиваСтся ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ Π½ΠΈΠΆΠ΅.

ΠŸΠΎΡ€ΠΎΠ³ соотвСтствуСт ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ T (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΌΠ΅ΠΆΠ΄Ρƒ 0 ΠΈ 1), слуТит Π³Ρ€Π°Π½ΠΈΡ†Π΅ΠΉ принятия Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ для классификатора ΠΈ влияСт Π½Π° компромисс ΠΌΠ΅ΠΆΠ΄Ρƒ TPR ΠΈ FPR. Π”Π°Π²Π°ΠΉΡ‚Π΅ напишСм ΠΊΠΎΠ΄, Ρ‡Ρ‚ΠΎΠ±Ρ‹ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ всС ΠΊΠΎΠΌΠΏΠΎΠ½Π΅Π½Ρ‚Ρ‹.

Визуализация ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

Π‘Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Π΄Π°Π½Π½Ρ‹Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ drawdata для Jupyter

Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ сгСнСрированныС Π΄Π°Π½Π½Ρ‹Π΅ Π² Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ pandas

ΠŸΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ модСль логистичСской рСгрСссии ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌ

ΠŸΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ логистичСской рСгрСссии Π² Π²ΠΈΠ΄Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ вСроятности

Π£ΡΡ‚Π°Π½ΠΎΠ²ΠΈΡ‚ΡŒ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎΡ€ΠΎΠ³ΠΈ отсСчСния

Π‘Π΄Π΅Π»Π°Ρ‚ΡŒ ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π²Ρ‹Π²ΠΎΠ΄Ρ‹

Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌ зависимости

Π‘Π³Π΅Π½Π΅Ρ€ΠΈΡ€ΡƒΠ΅ΠΌ Π΄Π°Π½Π½Ρ‹Π΅ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ΠΏΠ°ΠΊΠ΅Ρ‚Π° drawdata для Π±Π»ΠΎΠΊΠ½ΠΎΡ‚ΠΎΠ² Jupyter

Π§Ρ‚ΠΎ получаСтся Π½Π° Π²Ρ‹Ρ…ΠΎΠ΄Π΅:

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Π˜ΠΌΠΏΠΎΡ€Ρ‚ΠΈΡ€ΡƒΠ΅ΠΌ Π΄Π°Π½Π½Ρ‹Π΅ Π² Ρ„Ρ€Π΅ΠΉΠΌΠ²ΠΎΡ€ΠΊ pandas

ΠŸΠΎΠ΄Π±Π΅Ρ€Ρ‘ΠΌ модСль логистичСской рСгрСссии ΠΊ Π΄Π°Π½Π½Ρ‹ΠΌ

ΠŸΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Ρ‹ ΠΌΠΎΠ΄Π΅Π»ΠΈ логистичСской рСгрСссии Π² Π²ΠΈΠ΄Π΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΉ вСроятности

Установим Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Π΅ значСния

Π’ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΠ΅ΠΌ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Π‘Π΄Π΅Π»Π°Π΅ΠΌ ΠΎΠΊΠΎΠ½Ρ‡Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π²Ρ‹Π²ΠΎΠ΄Ρ‹

ИзмСняя ΠΏΠΎΡ€ΠΎΠ³, ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»ΠΈ Π²ΠΎΠ·Ρ€Π°ΡΡ‚Π°ΡŽΡ‰ΠΈΠ΅ значСния ΠΊΠ°ΠΊ истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ…, Ρ‚Π°ΠΊ ΠΈ Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π΄ΠΎΠ»Π΅ΠΉ. Π’ Ρ…ΠΎΡ€ΠΎΡˆΠ΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΠΎΡ€ΠΎΠ³ отсСчСния ставит истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π΄ΠΎΠ»ΠΈ ΠΊΠ°ΠΊ ΠΌΠΎΠΆΠ½ΠΎ Π±Π»ΠΈΠΆΠ΅ ΠΊ 1, ΠΏΡ€ΠΈ этом сохраняя Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ Π΄ΠΎΠ»ΠΈ Π½Π° самом Π½ΠΈΠΆΠ½Π΅ΠΌ ΠΈΠ· Π²ΠΎΠ·ΠΌΠΎΠΆΠ½Ρ‹Ρ… ΡƒΡ€ΠΎΠ²Π½Π΅ΠΉ.

Как Π½Π°ΠΌ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π»ΡƒΡ‡ΡˆΠΈΠΉ ΠΏΠΎΡ€ΠΎΠ³?

ΠŸΡ€ΠΎΡΡ‚ΠΎΠΉ способ: Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Ρ‚ΠΎΡ‚ ΠΏΠΎΡ€ΠΎΠ³, Ρƒ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠ³ΠΎ максимальная сумма ΠΈΠ· истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΈ Π»ΠΎΠΆΠ½ΠΎ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π΄ΠΎΠ»Π΅ΠΉ (1-FPR).

Π”Ρ€ΡƒΠ³ΠΎΠΉ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ: простой Π²Ρ‹Π±ΠΎΡ€ Ρ‚ΠΎΡ‡ΠΊΠΈ, блиТайшСй ΠΊ Π»Π΅Π²ΠΎΠΌΡƒ Π²Π΅Ρ€Ρ…Π½Π΅ΠΌΡƒ ΡƒΠ³Π»Ρƒ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ. Однако Ρ‚Π°ΠΊΠΎΠΉ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ ΠΏΠΎΠ΄Ρ€Π°Π·ΡƒΠΌΠ΅Π²Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΈ истинно ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΠΈ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΉ вСс. Π’ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… случаях, такая Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π½Π΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΈΡ‚, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ΅ влияниС Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… Π΄ΠΎΠ»Π΅ΠΉ вСсомСС, Ρ‡Π΅ΠΌ влияниС истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ….

Π˜Ρ‚ΠΎΠ³ΠΎΠ²Ρ‹Π΅ Π²Ρ‹Π²ΠΎΠ΄Ρ‹ ΠΎ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

Π― ΡΡ‡ΠΈΡ‚Π°ΡŽ, Ρ‡Ρ‚ΠΎ Π² долгосрочной пСрспСктивС машинного обучСния ΠΏΠΎΠ»Π΅Π·Π½ΠΎ ΠΏΠΎΡ‚Ρ€Π°Ρ‚ΠΈΡ‚ΡŒ врСмя Π½Π° освоСниС ΠΎΡ†Π΅Π½ΠΎΡ‡Π½Ρ‹Ρ… ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»Π΅ΠΉ. Π’ этой ΡΡ‚Π°Ρ‚ΡŒΠ΅ Π²Ρ‹ ΡƒΠ·Π½Π°Π»ΠΈ:

Π‘Π°Π·ΠΎΠ²ΠΎΠ΅ прСдставлСниС ΠΎ Ρ‚ΠΎΠΌ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°ΡŽΡ‚ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅

Как ΠΏΠΎΡ€ΠΎΠ³ΠΈ отсСчСния Π²Π»ΠΈΡΡŽΡ‚ Π½Π° ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΠΈ ΠΈ особСнности ΠΌΠΎΠ΄Π΅Π»ΠΈ

Как ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅ для Π²Ρ‹Π±ΠΎΡ€Π° ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ² отсСчСния

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π“Π»ΡƒΠ±ΠΎΠΊΠΎΠ΅ ΠΏΠΎΠ³Ρ€ΡƒΠΆΠ΅Π½ΠΈΠ΅ Π² ROC-AUC

Π― Π΄ΡƒΠΌΠ°ΡŽ, Ρ‡Ρ‚ΠΎ Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ людСй ΡΠ»Ρ‹ΡˆΠ°Π»ΠΈ ΠΎ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΈΠ»ΠΈ ΠΎ AUC (ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ) Ρ€Π°Π½ΡŒΡˆΠ΅. ОсобСнно Ρ‚Π΅, ΠΊΡ‚ΠΎ интСрСсуСтся Π½Π°ΡƒΠΊΠΎΠΉ ΠΎ Π΄Π°Π½Π½Ρ‹Ρ…. Однако, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ROC-кривая ΠΈ ΠΏΠΎΡ‡Π΅ΠΌΡƒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ этой ΠΊΡ€ΠΈΠ²ΠΎΠΉ являСтся Ρ…ΠΎΡ€ΠΎΡˆΠ΅ΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ классификации?

ВСория ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

ПолноС Π½Π°Π·Π²Π°Π½ΠΈΠ΅ ROC β€” Receiver Operating Characteristic (рабочая характСристика ΠΏΡ€ΠΈΡ‘ΠΌΠ½ΠΈΠΊΠ°). Π’ΠΏΠ΅Ρ€Π²Ρ‹Π΅ ΠΎΠ½Π° Π±Ρ‹Π»Π° создана для использования Ρ€Π°Π΄ΠΈΠΎΠ»ΠΎΠΊΠ°Ρ†ΠΈΠΎΠ½Π½ΠΎΠ³ΠΎ обнаруТСния сигналов Π²ΠΎ врСмя Π’Ρ‚ΠΎΡ€ΠΎΠΉ ΠΌΠΈΡ€ΠΎΠ²ΠΎΠΉ Π²ΠΎΠΉΠ½Ρ‹. БША использовали ROC для ΠΏΠΎΠ²Ρ‹ΡˆΠ΅Π½ΠΈΡ точности обнаруТСния японских самолСтов с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ Ρ€Π°Π΄Π°Ρ€Π°. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Π΅Π΅ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ Ρ€Π°Π±ΠΎΡ‡Π΅ΠΉ характСристикой ΠΏΡ€ΠΈΠ΅ΠΌΠ½ΠΈΠΊΠ°.

AUC ΠΈΠ»ΠΈ area under curve β€” это просто ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ROC. ΠŸΡ€Π΅ΠΆΠ΄Π΅ Ρ‡Π΅ΠΌ ΠΌΡ‹ ΠΏΠ΅Ρ€Π΅ΠΉΠ΄Π΅ΠΌ ΠΊ Ρ‚ΠΎΠΌΡƒ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ROC-кривая, Π½ΡƒΠΆΠ½ΠΎ Π²ΡΠΏΠΎΠΌΠ½ΠΈΡ‚ΡŒ, Ρ‡Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Как Π²ΠΈΠ΄Π½ΠΎ ΠΈΠ· рисунка Π²Ρ‹ΡˆΠ΅, ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок β€” это комбинация вашСго ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·Π° (1 ΠΈΠ»ΠΈ 0) ΠΈ фактичСского значСния (1 ΠΈΠ»ΠΈ 0). Π’ зависимости ΠΎΡ‚ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π° прСдсказания ΠΈ Ρ‚ΠΎΠ³ΠΎ, ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½Π° Π»ΠΈ Π±Ρ‹Π»Π° ΠΏΡ€ΠΎΠ²Π΅Π΄Π΅Π½Π° классификация, ΠΌΠ°Ρ‚Ρ€ΠΈΡ†Π° Ρ€Π°Π·Π΄Π΅Π»Π΅Π½Π° Π½Π° 4 части. НапримСр, true positive (истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ) Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ β€” это количСство случаСв, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Ρ‹ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ классифицируСтС сСмпл ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ. А false positive (Π»ΠΎΠΆΠ½ΠΎΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ) β€” это число случаСв, Π² ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Ρ… Π²Ρ‹ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎ классифицируСтС сСмпл ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΉ.

ΠœΠ°Ρ‚Ρ€ΠΈΡ†Π° ошибок содСрТит Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½Ρ‹Π΅ числа. Однако, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ ΠΈΡ…, ΠΌΡ‹ ΠΌΠΎΠΆΠ΅ΠΌ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ мноТСство Π΄Ρ€ΡƒΠ³ΠΈΡ… ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊ, основанных Π½Π° ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚Π½Ρ‹Ρ… ΡΠΎΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΡΡ…. True Positive Rate (TPR) ΠΈ False Positive Rate (FPR) β€” Π΄Π²Π΅ ΠΈΠ· Π½ΠΈΡ….

True Positive Rate (TPR) ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚, ΠΊΠ°ΠΊΠΎΠΉ ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ срСди всСх positive Π²Π΅Ρ€Π½ΠΎ прСдсказан модСлью.
TPR = TP / (TP + FN).

False Positive Rate (FPR): ΠΊΠ°ΠΊΠΎΠΉ ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ срСди всСх negative Π½Π΅Π²Π΅Ρ€Π½ΠΎ прСдсказан модСлью.
FPR = FP / (FP + TN).

Π₯ΠΎΡ€ΠΎΡˆΠΎ, Π΄Π°Π²Π°ΠΉΡ‚Π΅ Ρ‚Π΅ΠΏΠ΅Ρ€ΡŒ ΠΏΠ΅Ρ€Π΅ΠΉΠ΄Π΅ΠΌ ΠΊ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ROC!

Π§Ρ‚ΠΎ Ρ‚Π°ΠΊΠΎΠ΅ ROC-кривая?

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Как Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π²ΠΈΠ΄Π΅Ρ‚ΡŒ Π½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅, кривая ROC β€” это просто ΠΎΡ‚Π½ΠΎΡˆΠ΅Π½ΠΈΠ΅ TPR ΠΊ FPR. Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π²Π°ΠΌ всС понятно, Π² Π·Π°ΠΊΠ»ΡŽΡ‡Π΅Π½ΠΈΠ΅β€¦

ΠŸΠΎΠ²Π΅Ρ€ΠΈΠ»ΠΈ?
Если ΡΠ΅Ρ€ΡŒΠ΅Π·Π½ΠΎ, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΡ€ΠΎΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ Π½Π°ΠΌΠ½ΠΎΠ³ΠΎ большС ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ ΠΈΠ· Π΄ΠΈΠ°Π³Ρ€Π°ΠΌΠΌΡ‹. ΠŸΠ΅Ρ€Π²Ρ‹ΠΉ вопрос, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ я Ρ…ΠΎΡ‡Ρƒ здСсь ΠΎΠ±ΡΡƒΠ΄ΠΈΡ‚ΡŒ: Ρƒ нас ΠΆΠ΅ Π΅ΡΡ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄ΠΈΠ½ Π½Π°Π±ΠΎΡ€ TPR, FPR, посчитанный Π½Π° основС сдСланных модСлью прСдсказаний. Π’Π°ΠΊ ΠΎΡ‚ΠΊΡƒΠ΄Π° взялось Ρ‚Π°ΠΊΠΎΠ΅ количСство Ρ‚ΠΎΡ‡Π΅ΠΊ для построСния Ρ†Π΅Π»ΠΎΠ³ΠΎ Π³Ρ€Π°Ρ„ΠΈΠΊΠ°?

ВсС слСдуСт ΠΈΠ· Ρ‚ΠΎΠ³ΠΎ, ΠΊΠ°ΠΊ Ρ€Π°Π±ΠΎΡ‚Π°Π΅Ρ‚ модСль классификации. Когда Π²Ρ‹ строитС ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΠΊΠ°Ρ†ΠΈΠΎΠ½Π½ΡƒΡŽ модСль, Ρ‚Π°ΠΊΡƒΡŽ ΠΊΠ°ΠΊ Π΄Π΅Ρ€Π΅Π²ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ, ΠΈ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ, Π±ΡƒΠ΄ΡƒΡ‚ Π»ΠΈ Π°ΠΊΡ†ΠΈΠΈ расти Π² Ρ†Π΅Π½Π΅ ΠΈΠ»ΠΈ ΠΏΠ°Π΄Π°Ρ‚ΡŒ Π½Π° основС Π²Ρ…ΠΎΠ΄Π½Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…. МодСль сначала рассчитаСт Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ увСличСния ΠΈΠ»ΠΈ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ΅Π½ΠΈΡ, ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡ прСдоставлСнныС Π²Π°ΠΌΠΈ историчСскиС Π΄Π°Π½Π½Ρ‹Π΅. ПослС этого, ΠΎΡΠ½ΠΎΠ²Ρ‹Π²Π°ΡΡΡŒ Π½Π° ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠΈ, ΠΎΠ½Π° Ρ€Π΅ΡˆΠΈΡ‚, Π±ΡƒΠ΄Π΅Ρ‚ Π»ΠΈ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Ρ‚ΡŒΡΡ ΠΈΠ»ΠΈ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Ρ‚ΡŒΡΡ.

Π”Π°, ΠΊΠ»ΡŽΡ‡Π΅Π²ΠΎΠ΅ слово здСсь β€” ΠΏΠΎΡ€ΠΎΠ³. Π Π°Π·Π½Ρ‹Π΅ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Π΅ значСния ΡΠΎΠ·Π΄Π°ΡŽΡ‚ Ρ€Π°Π·Π½Ρ‹Π΅ TPR ΠΈ FPR. Они ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²Π»ΡΡŽΡ‚ Ρ‚Π΅ самыС Ρ‚ΠΎΡ‡ΠΊΠΈ, Ρ‡Ρ‚ΠΎ ΠΎΠ±Ρ€Π°Π·ΡƒΡŽΡ‚ ΠΊΡ€ΠΈΠ²ΡƒΡŽ ROC. Π’Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Β«Π£Π²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅Β» Π² качСствС прСдсказания ΠΌΠΎΠ΄Π΅Π»ΠΈ, Ссли получСнная Π½Π° основС историчСских Π΄Π°Π½Π½Ρ‹Ρ… Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ роста Π°ΠΊΡ†ΠΈΠΉ большС 50%. Π’Π°ΠΊΠΆΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΈ ΠΎΡ‚ΠΎΠ±Ρ€Π°Π·ΠΈΡ‚ΡŒ Β«Π£Π²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠ΅Β», Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ссли ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰Π°Ρ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ большС 90%. Если Π²Ρ‹ установитС 90% ΠΏΠΎΡ€ΠΎΠ³ вмСсто 50%, Π²Ρ‹ Π±ΡƒΠ΄Π΅Ρ‚Π΅ Π±ΠΎΠ»Π΅Π΅ ΡƒΠ²Π΅Ρ€Π΅Π½Ρ‹ Π² Ρ‚ΠΎΠΌ, Ρ‡Ρ‚ΠΎ Π²Ρ‹Π±Ρ€Π°Π½Π½Ρ‹Π΅ для «УвСличСния» Π°ΠΊΡ†ΠΈΠΈ Π΄Π΅ΠΉΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ вырастут. Но Ρ‚Π°ΠΊ Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΡƒΠΏΡƒΡΡ‚ΠΈΡ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΏΠΎΡ‚Π΅Π½Ρ†ΠΈΠ°Π»ΡŒΠ½ΠΎ Π²Ρ‹Π³ΠΎΠ΄Π½Ρ‹Π΅ Π²Π°Ρ€ΠΈΠ°Π½Ρ‚Ρ‹.

Π§Ρ‚ΠΎ Π·Π½Π°Ρ‡ΠΈΡ‚ синяя пунктирная линия Π½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅?

Как ΠΌΡ‹ Π·Π½Π°Π΅ΠΌ, Ρ‡Π΅ΠΌ большС ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ (AUC), Ρ‚Π΅ΠΌ Π»ΡƒΡ‡ΡˆΠ΅ классификация. ИдСальная ΠΈΠ»ΠΈ Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠ°Ρ кривая β€” это Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Π°Ρ линия ΠΎΡ‚ (0,0) Π΄ΠΎ (0,1), которая тянСтся Π΄ΠΎ (1,1). Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚: модСль всСгда ΠΌΠΎΠΆΠ΅Ρ‚ Ρ€Π°Π·Π»ΠΈΡ‡ΠΈΡ‚ΡŒ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ случаи. Однако, Ссли Π²Ρ‹ Π²Ρ‹Π±ΠΈΡ€Π°Π΅Ρ‚Π΅ класс случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ сСмпла, TPR ΠΈ FPR Π΄ΠΎΠ»ΠΆΠ½Ρ‹ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°Ρ‚ΡŒΡΡ с ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΠΎΠΉ ΡΠΊΠΎΡ€ΠΎΡΡ‚ΡŒΡŽ. Биняя пунктирная линия ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ ΠΊΡ€ΠΈΠ²ΡƒΡŽ TPR ΠΈ FPR ΠΏΡ€ΠΈ случайном ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠΈ positive ΠΈΠ»ΠΈ negative для ΠΊΠ°ΠΆΠ΄ΠΎΠ³ΠΎ случая. Для этой диагональной Π»ΠΈΠ½ΠΈΠΈ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ (AUC) составляСт 0.5.

Π§Ρ‚ΠΎ ΠΏΡ€ΠΎΠΈΠ·ΠΎΠΉΠ΄Π΅Ρ‚ с TPR, FPR ΠΈ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ, Ссли ΠΈΠ·ΠΌΠ΅Π½ΠΈΡ‚ΡŒ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅?

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

ΠŸΠΎΡΠΌΠΎΡ‚Ρ€ΠΈΡ‚Π΅ Π½Π° Π΄Π²Π΅ Ρ‚ΠΎΡ‡ΠΊΠΈ Π½Π° ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ. ЗСлСная Ρ‚ΠΎΡ‡ΠΊΠ° ΠΈΠΌΠ΅Π΅Ρ‚ ΠΎΡ‡Π΅Π½ΡŒ высокий ΠΏΠΎΡ€ΠΎΠ³, это ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ссли Π²Ρ‹ ΡƒΠ²Π΅Ρ€Π΅Π½Ρ‹ Π½Π° 99%, ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ случай ΠΊΠ°ΠΊ positive. ΠšΡ€Π°ΡΠ½Π°Ρ Ρ‚ΠΎΡ‡ΠΊΠ° ΠΈΠΌΠ΅Π΅Ρ‚ ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π±ΠΎΠ»Π΅Π΅ Π½ΠΈΠ·ΠΊΠΈΠΉ ΠΏΠΎΡ€ΠΎΠ³. Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΊΠ»Π°ΡΡΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ случай ΠΊΠ°ΠΊ positive, Ссли Π²Ρ‹ ΡƒΠ²Π΅Ρ€Π΅Π½Ρ‹ Π½Π° 90%.

Как ΠΈΠ·ΠΌΠ΅Π½ΡΡŽΡ‚ΡΡ TPR ΠΈ FPR ΠΏΡ€ΠΈ Π΄Π²ΠΈΠΆΠ΅Π½ΠΈΠΈ ΠΎΡ‚ Π·Π΅Π»Π΅Π½ΠΎΠΉ Ρ‚ΠΎΡ‡ΠΊΠΈ ΠΊ красной?

И TPR, ΠΈ FPR ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°ΡŽΡ‚ΡΡ. Когда Π²Ρ‹ ΡƒΠΌΠ΅Π½ΡŒΡˆΠ°Π΅Ρ‚Π΅ ΠΏΠΎΡ€ΠΎΠ³, модСль Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡ‚ΡŒ большС ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… случаСв. Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, TP увСличиваСтся, ΠΊΠ°ΠΊ ΠΈ TP/(TP + FN). Π‘ Π΄Ρ€ΡƒΠ³ΠΎΠΉ стороны, Π²Ρ‹ Π½Π΅ΠΈΠ·Π±Π΅ΠΆΠ½ΠΎ ΠΎΡˆΠΈΠ±ΠΎΡ‡Π½ΠΎ классифицируСтС Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ случаи ΠΊΠ°ΠΊ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΈΠ·-Π·Π° сниТСния ΠΏΠΎΡ€ΠΎΠ³Π°, ΠΈ поэтому FP ΠΈ FP/(FP + TN) Ρ‚Π°ΠΊΠΆΠ΅ ΡƒΠ²Π΅Π»ΠΈΡ‡ΠΈΠ²Π°ΡŽΡ‚ΡΡ.

ΠœΡ‹ Π²ΠΈΠ΄ΠΈΠΌ, Ρ‡Ρ‚ΠΎ TPR ΠΈ FPR ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΊΠΎΡ€Ρ€Π΅Π»ΠΈΡ€ΡƒΡŽΡ‚. Π’Π°ΠΌ Π½ΡƒΠΆΠ½ΠΎ Π±Π°Π»Π°Π½ΡΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΌΠ°ΠΊΡΠΈΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΌ ΠΎΡ…Π²Π°Ρ‚ΠΎΠΌ positive случаСв ΠΈ ΠΌΠΈΠ½ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠ΅ΠΉ Π½Π΅ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎΠΉ классификации negative случаСв.

Как Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΡƒΡŽ Ρ‚ΠΎΡ‡ΠΊΡƒ Π½Π° ΠΊΡ€ΠΈΠ²ΠΎΠΉ ROC?

Π’Ρ€ΡƒΠ΄Π½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΡƒΡŽ Ρ‚ΠΎΡ‡ΠΊΡƒ, ΠΏΠΎΡ‚ΠΎΠΌΡƒ Ρ‡Ρ‚ΠΎ Π½ΡƒΠΆΠ½ΠΎ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ подходящСС ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅, учитывая сфСру примСнСния ΠΌΠΎΠ΄Π΅Π»ΠΈ. Однако ΠΎΠ±Ρ‰Π΅Π΅ ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ β€” ΠΌΠ°ΠΊΡΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ€Π°Π·Π½ΠΈΡ†Ρƒ (TPR-FPR), которая Π½Π° Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅ прСдставлСна Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌ расстояниСм ΠΌΠ΅ΠΆΠ΄Ρƒ ΠΎΡ€Π°Π½ΠΆΠ΅Π²ΠΎΠΉ ΠΈ синСй ΠΏΡƒΠ½ΠΊΡ‚ΠΈΡ€Π½ΠΎΠΉ Π»ΠΈΠ½ΠΈΠ΅ΠΉ.

ΠŸΠΎΡ‡Π΅ΠΌΡƒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ROC – Ρ…ΠΎΡ€ΠΎΡˆΠ°Ρ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° для ΠΎΡ†Π΅Π½ΠΊΠΈ ΠΌΠΎΠ΄Π΅Π»ΠΈ классификации?

Π₯ΠΎΡ€ΠΎΡˆΠ°Ρ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠ° ΠΌΠΎΠ΄Π΅Π»ΠΈ машинного обучСния Π΄ΠΎΠ»ΠΆΠ½Π° ΠΎΡ‚ΠΎΠ±Ρ€Π°ΠΆΠ°Ρ‚ΡŒ ΠΈΡΡ‚ΠΈΠ½Π½ΡƒΡŽ ΠΈ ΠΏΠΎΡΡ‚ΠΎΡΠ½Π½ΡƒΡŽ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΊ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ. Π­Ρ‚ΠΎ ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ, Ссли я измСню тСстовый Π½Π°Π±ΠΎΡ€ Π΄Π°Π½Π½Ρ‹Ρ…, ΠΎΠ½ Π½Π΅ Π΄ΠΎΠ»ΠΆΠ΅Π½ Π΄Π°Π²Π°Ρ‚ΡŒ Π΄Ρ€ΡƒΠ³ΠΎΠΉ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚.

ROC-кривая ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ Π½Π΅ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Ρ‹ классификации, Π½ΠΎ ΠΈ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ прСдсказания всСх классов. НапримСр, Ссли Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΊΠΎΡ€Ρ€Π΅ΠΊΡ‚Π½ΠΎ классифицирован Π½Π° основС 51% вСроятности, Ρ‚ΠΎ ΠΎΠ½, скорСС всСго, Π±ΡƒΠ΄Π΅Ρ‚ классифицирован Π½Π΅Π²Π΅Ρ€Π½ΠΎ, Ссли Π²Ρ‹ Π²ΠΎΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚Π΅ΡΡŒ Π΄Ρ€ΡƒΠ³ΠΈΠΌ тСстовым датасСтом. ΠšΡ€ΠΎΠΌΠ΅ Ρ‚ΠΎΠ³ΠΎ, ROC-кривая Ρ‚Π°ΠΊΠΆΠ΅ ΡƒΡ‡ΠΈΡ‚Ρ‹Π²Π°Π΅Ρ‚ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΏΡ€ΠΈ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Ρ… ΠΏΠΎΡ€ΠΎΠ³ΠΎΠ²Ρ‹Ρ… значСниях. Она являСтся комплСксной ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΎΠΉ для ΠΎΡ†Π΅Π½ΠΊΠΈ Ρ‚ΠΎΠ³ΠΎ, насколько Ρ…ΠΎΡ€ΠΎΡˆΠΎ Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‚ΡΡ случаи Π² Ρ€Π°Π·Π½Ρ‹Ρ… Π³Ρ€ΡƒΠΏΠΏΠ°Ρ….

КакоС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ AUC являСтся ΠΏΡ€ΠΈΠ΅ΠΌΠ»Π΅ΠΌΡ‹ΠΌ для ΠΌΠΎΠ΄Π΅Π»ΠΈ классификации?

Как я ΠΏΠΎΠΊΠ°Π·Π°Π» Ρ€Π°Π½Π΅Π΅, для Π·Π°Π΄Π°Ρ‡ΠΈ Π΄Π²ΠΎΠΈΡ‡Π½ΠΎΠΉ классификации ΠΏΡ€ΠΈ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½ΠΈΠΈ классов случайным ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ 0.5 AUC. Π‘Π»Π΅Π΄ΠΎΠ²Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Ссли Π²Ρ‹ Ρ€Π΅ΡˆΠ°Π΅Ρ‚Π΅ Π·Π°Π΄Π°Ρ‡Ρƒ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации, Ρ€Π°Π·ΡƒΠΌΠ½ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ AUC Π΄ΠΎΠ»ΠΆΠ½ΠΎ Π±Ρ‹Ρ‚ΡŒ > 0.5. Π£ Ρ…ΠΎΡ€ΠΎΡˆΠ΅ΠΉ ΠΌΠΎΠ΄Π΅Π»ΠΈ классификации ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ AUC > 0.9, Π½ΠΎ это Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ сильно зависит ΠΎΡ‚ сфСры Π΅Π΅ примСнСния.

Как Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ AUC ΠΈ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ Π² Python?

Если Π²Ρ‹ просто Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ Ρ€Π°ΡΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ AUC, Π²Ρ‹ ΠΌΠΎΠΆΠ΅Ρ‚Π΅ Π²ΠΎΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒΡΡ ΠΏΠ°ΠΊΠ΅Ρ‚ΠΎΠΌ metrics Π±ΠΈΠ±Π»ΠΈΠΎΡ‚Π΅ΠΊΠΈ sklearn (ссылка).
Если Π²Ρ‹ Ρ…ΠΎΡ‚ΠΈΡ‚Π΅ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ для Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² вашСй ΠΌΠΎΠ΄Π΅Π»ΠΈ, Π²Π°ΠΌ стоит ΠΏΠ΅Ρ€Π΅ΠΉΡ‚ΠΈ сюда.

Π’ΠΎΡ‚ ΠΊΠΎΠ΄ для построСния Π³Ρ€Π°Ρ„ΠΈΠΊΠ° ROC, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ я использовал Π² этой ΡΡ‚Π°Ρ‚ΡŒΠ΅.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

ЛогистичСская рСгрСссия ΠΈ ROC-Π°Π½Π°Π»ΠΈΠ· β€” матСматичСский Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

ΠœΠ°Ρ‚Π΅ΠΌΠ°Ρ‚ΠΈΡ‡Π΅ΡΠΊΠΈΠΉ Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚ ΠΈ Π½Π°Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ логистичСской рСгрСссии β€” популярного инструмСнта для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ‡ рСгрСссии ΠΈ классификации. ROC-Π°Π½Π°Π»ΠΈΠ· тСсно связан с Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ логистичСской рСгрСссиСй ΠΈ примСняСтся для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ: позволяСт Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π°Π½Π°Π»ΠΈΡ‚ΠΈΠΊΡƒ модСль с Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠ΅ΠΉ прогностичСской силой, ΠΏΡ€ΠΎΠ°Π½Π°Π»ΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ, ΠΏΠΎΠ΄ΠΎΠ±Ρ€Π°Ρ‚ΡŒ ΠΏΠΎΡ€ΠΎΠ³ отсСчСния.

Π’Π²Π΅Π΄Π΅Π½ΠΈΠ΅

ЛогистичСская рСгрСссия β€” ΠΏΠΎΠ»Π΅Π·Π½Ρ‹ΠΉ классичСский инструмСнт для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Π·Π°Π΄Π°Ρ‡ΠΈ рСгрСссии ΠΈ классификации. ROC-Π°Π½Π°Π»ΠΈΠ· β€” Π°ΠΏΠΏΠ°Ρ€Π°Ρ‚ для Π°Π½Π°Π»ΠΈΠ·Π° качСства ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ. Оба Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π°ΠΊΡ‚ΠΈΠ²Π½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ΡΡ для построСния ΠΌΠΎΠ΄Π΅Π»Π΅ΠΉ Π² ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½Π΅ ΠΈ провСдСния клиничСских исслСдований.

ЛогистичСская рСгрСссия ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ»Π° распространСниС Π² скорингС для расчСта Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³Π° Π·Π°Π΅ΠΌΡ‰ΠΈΠΊΠΎΠ² ΠΈ управлСния ΠΊΡ€Π΅Π΄ΠΈΡ‚Π½Ρ‹ΠΌΠΈ рисками. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ, нСсмотря Π½Π° своС «происхоТдСниС» ΠΈΠ· статистики, Π»ΠΎΠ³ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ ΠΈ ROC-Π°Π½Π°Π»ΠΈΠ· ΠΏΠΎΡ‡Ρ‚ΠΈ всСгда ΠΌΠΎΠΆΠ½ΠΎ ΡƒΠ²ΠΈΠ΄Π΅Ρ‚ΡŒ Π² Π½Π°Π±ΠΎΡ€Π΅ Data Mining Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠ².

ЛогистичСская рСгрСссия

ЛогистичСская рСгрСссия β€” это Ρ€Π°Π·Π½ΠΎΠ²ΠΈΠ΄Π½ΠΎΡΡ‚ΡŒ мноТСствСнной рСгрСссии, ΠΎΠ±Ρ‰Π΅Π΅ Π½Π°Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ состоит Π² Π°Π½Π°Π»ΠΈΠ·Π΅ связи ΠΌΠ΅ΠΆΠ΄Ρƒ нСсколькими нСзависимыми ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹ΠΌΠΈ (Π½Π°Π·Ρ‹Π²Π°Π΅ΠΌΡ‹ΠΌΠΈ Ρ‚Π°ΠΊΠΆΠ΅ рСгрСссорами ΠΈΠ»ΠΈ ΠΏΡ€Π΅Π΄ΠΈΠΊΡ‚ΠΎΡ€Π°ΠΌΠΈ) ΠΈ зависимой ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ. Бинарная логистичСская рСгрСссия примСняСтся Π² случаС, ΠΊΠΎΠ³Π΄Π° зависимая пСрСмСнная являСтся Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ (Ρ‚.Π΅. ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ Ρ‚ΠΎΠ»ΡŒΠΊΠΎ Π΄Π²Π° значСния). Π‘ ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ логистичСской рСгрСссии ΠΌΠΎΠΆΠ½ΠΎ ΠΎΡ†Π΅Π½ΠΈΠ²Π°Ρ‚ΡŒ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ событиС наступит для ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠ³ΠΎ испытуСмого (больной/Π·Π΄ΠΎΡ€ΠΎΠ²Ρ‹ΠΉ, Π²ΠΎΠ·Π²Ρ€Π°Ρ‚ ΠΊΡ€Π΅Π΄ΠΈΡ‚Π°/Π΄Π΅Ρ„ΠΎΠ»Ρ‚ ΠΈ Ρ‚.Π΄.).

ВсС рСгрСссионныС ΠΌΠΎΠ΄Π΅Π»ΠΈ ΠΌΠΎΠ³ΡƒΡ‚ Π±Ρ‹Ρ‚ΡŒ записаны Π² Π²ΠΈΠ΄Π΅ Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρ‹:

y = F (x_1,\, x_2, \,\dots, \, x_n)

Π’ мноТСствСнной Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии прСдполагаСтся, Ρ‡Ρ‚ΠΎ зависимая пСрСмСнная являСтся Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ нСзависимых ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…, Ρ‚.Π΅.:

МоТно Π»ΠΈ Π΅Π΅ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ для Π·Π°Π΄Π°Ρ‡ΠΈ ΠΎΡ†Π΅Π½ΠΊΠΈ вСроятности исхода события? Π”Π°, ΠΌΠΎΠΆΠ½ΠΎ, вычислив стандартныС коэффициСнты рСгрСссии. НапримСр, Ссли рассматриваСтся исход ΠΏΠΎ Π·Π°ΠΉΠΌΡƒ, задаСтся пСрСмСнная y со значСниями 1 ΠΈ 0, Π³Π΄Π΅ 1 ΠΎΠ·Π½Π°Ρ‡Π°Π΅Ρ‚, Ρ‡Ρ‚ΠΎ ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‰ΠΈΠΉ Π·Π°Π΅ΠΌΡ‰ΠΈΠΊ расплатился ΠΏΠΎ ΠΊΡ€Π΅Π΄ΠΈΡ‚Ρƒ, Π° 0, Ρ‡Ρ‚ΠΎ ΠΈΠΌΠ΅Π» мСсто Π΄Π΅Ρ„ΠΎΠ»Ρ‚.

Для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡ‹ Π·Π°Π΄Π°Ρ‡Π° рСгрСссии ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ сформулирована ΠΈΠ½Π°Ρ‡Π΅: вмСсто прСдсказания Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ, ΠΌΡ‹ прСдсказываСм Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΡƒΡŽ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΡƒΡŽ со значСниями Π½Π° ΠΎΡ‚Ρ€Π΅Π·ΠΊΠ΅ [0,1] ΠΏΡ€ΠΈ Π»ΡŽΠ±Ρ‹Ρ… значСниях нСзависимых ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½Ρ‹Ρ…. Π­Ρ‚ΠΎ достигаСтся ΠΏΡ€ΠΈΠΌΠ΅Π½Π΅Π½ΠΈΠ΅ΠΌ ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π³ΠΎ рСгрСссионного уравнСния (Π»ΠΎΠ³ΠΈΡ‚-ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅):

Π³Π΄Π΅ P β€” Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ ΠΏΡ€ΠΎΠΈΠ·ΠΎΠΉΠ΄Π΅Ρ‚ ΠΈΠ½Ρ‚Π΅Ρ€Π΅ΡΡƒΡŽΡ‰Π΅Π΅ событиС e β€” основаниС Π½Π°Ρ‚ΡƒΡ€Π°Π»ΡŒΠ½Ρ‹Ρ… Π»ΠΎΠ³Π°Ρ€ΠΈΡ„ΠΌΠΎΠ² 2,71…; y β€” стандартноС ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠ΅ рСгрСссии.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Рис. 1 β€” ЛогистичСская кривая

P’ = \log_e \Bigl(\frac

<1-P>\Bigr)

Π­Ρ‚ΠΎ ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ логистичСским ΠΈΠ»ΠΈ Π»ΠΎΠ³ΠΈΡ‚-ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ΠΌ. ВСорСтичСски P’ ΠΌΠΎΠΆΠ΅Ρ‚ ΠΏΡ€ΠΈΠ½ΠΈΠΌΠ°Ρ‚ΡŒ любоС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ логистичСскоС ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ Ρ€Π΅ΡˆΠ°Π΅Ρ‚ ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΡƒ ΠΎΠ± ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½ΠΈΠΈ Π½Π° 0-1 Π³Ρ€Π°Π½ΠΈΡ†Ρ‹ для ΠΏΠ΅Ρ€Π²ΠΎΠ½Π°Ρ‡Π°Π»ΡŒΠ½ΠΎΠΉ зависимой ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ (вСроятности), Ρ‚ΠΎ эти ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½Π½Ρ‹Π΅ значСния ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ Π² ΠΎΠ±Ρ‹Ρ‡Π½ΠΎΠΌ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΌ рСгрСссионном ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠΈ. А ΠΈΠΌΠ΅Π½Π½ΠΎ, Ссли произвСсти логистичСскоС ΠΏΡ€Π΅ΠΎΠ±Ρ€Π°Π·ΠΎΠ²Π°Π½ΠΈΠ΅ ΠΎΠ±Π΅ΠΈΡ… частСй описанного Π²Ρ‹ΡˆΠ΅ уравнСния, ΠΌΡ‹ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ ΡΡ‚Π°Π½Π΄Π°Ρ€Ρ‚Π½ΡƒΡŽ модСль Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ рСгрСссии.

БущСствуСт нСсколько способов нахоТдСния коэффициСнтов логистичСской рСгрСссии. На ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ ΠΌΠ΅Ρ‚ΠΎΠ΄ максимального правдоподобия. Он примСняСтся Π² статистикС для получСния ΠΎΡ†Π΅Π½ΠΎΠΊ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΎΠ² Π³Π΅Π½Π΅Ρ€Π°Π»ΡŒΠ½ΠΎΠΉ совокупности ΠΏΠΎ Π΄Π°Π½Π½Ρ‹ΠΌ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ. ΠžΡΠ½ΠΎΠ²Ρƒ ΠΌΠ΅Ρ‚ΠΎΠ΄Π° составляСт функция правдоподобия (likehood function), Π²Ρ‹Ρ€Π°ΠΆΠ°ΡŽΡ‰Π°Ρ ΠΏΠ»ΠΎΡ‚Π½ΠΎΡΡ‚ΡŒ вСроятности (Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ) совмСстного появлСния Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ

L\,(Y_1,\,Y_2,\,\dots,\,Y_k;\,\theta) = p\,(Y_1;\, \theta)\cdot\dots\cdotp\,p\,(Y_k;\,\theta)

L\,*\,(Y;\,\theta) = \ln\,(L\,(Y;\,\theta)\,) \rightarrow \max

ЛогарифмичСская функция правдоподобия Ρ€Π°Π²Π½Π°:

МоТно ΠΏΠΎΠΊΠ°Π·Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ g ΠΈ гСссиан H Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ правдоподобия Ρ€Π°Π²Π½Ρ‹:

g = \sum_i (Y_i\,-\,P_i)\,X_i

H=-\sum_i P_i\,(1\,-\,P_i)\,X_i^T\,X_i\,\leq 0

ГСссиан Π²ΡΡŽΠ΄Ρƒ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ ΠΎΠΏΡ€Π΅Π΄Π΅Π»Π΅Π½Π½Ρ‹ΠΉ, поэтому логарифмичСская функция правдоподобия Π²ΡΡŽΠ΄Ρƒ Π²ΠΎΠ³Π½ΡƒΡ‚Π°. Для поиска максимума ΠΌΠΎΠΆΠ½ΠΎ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚ΡŒ ΠΌΠ΅Ρ‚ΠΎΠ΄ ΠΡŒΡŽΡ‚ΠΎΠ½Π°, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ здСсь Π±ΡƒΠ΄Π΅Ρ‚ всСгда ΡΡ…ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ (Π²Ρ‹ΠΏΠΎΠ»Π½Π΅Π½ΠΎ условиС сходимости ΠΌΠ΅Ρ‚ΠΎΠ΄Π°):

Π›ΠΎΠ³ΠΈΡΡ‚ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ Ρ€Π΅Π³Ρ€Π΅ΡΡΠΈΡŽ ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€Π΅Π΄ΡΡ‚Π°Π²ΠΈΡ‚ΡŒ Π² Π²ΠΈΠ΄Π΅ однослойной Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти с сигмоидальной Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ Π°ΠΊΡ‚ΠΈΠ²Π°Ρ†ΠΈΠΈ, вСса ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π΅ΡΡ‚ΡŒ коэффициСнты логистичСской рСгрСссии, Π° вСс поляризации β€” константа рСгрСссионного уравнСния (рис. 2).

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Рис. 2 β€” ΠŸΡ€Π΅Π΄ΡΡ‚Π°Π²Π»Π΅Π½ΠΈΠ΅ логистичСской рСгрСссии Π² Π²ΠΈΠ΄Π΅ Π½Π΅ΠΉΡ€ΠΎΠ½Π½ΠΎΠΉ сСти

Однослойная нСйронная ΡΠ΅Ρ‚ΡŒ ΠΌΠΎΠΆΠ΅Ρ‚ ΡƒΡΠΏΠ΅ΡˆΠ½ΠΎ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ лишь Π·Π°Π΄Π°Ρ‡Ρƒ Π»ΠΈΠ½Π΅ΠΉΠ½ΠΎΠΉ сСпарации. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ возмоТности ΠΏΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈΡ€ΠΎΠ²Π°Π½ΠΈΡŽ Π½Π΅Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Ρ… зависимостСй Ρƒ логистичСской рСгрСссии ΠΎΡ‚ΡΡƒΡ‚ΡΡ‚Π²ΡƒΡŽΡ‚. Однако для ΠΎΡ†Π΅Π½ΠΊΠΈ качСства ΠΌΠΎΠ΄Π΅Π»ΠΈ логистичСской рСгрСссии сущСствуСт эффСктивный инструмСнт ROC-Π°Π½Π°Π»ΠΈΠ·Π°, Ρ‡Ρ‚ΠΎ являСтся нСсомнСнным Π΅Π΅ прСимущСством.

Для расчСта коэффициСнтов логистичСской рСгрСссии ΠΌΠΎΠΆΠ½ΠΎ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ Π»ΡŽΠ±Ρ‹Π΅ Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚Π½Ρ‹Π΅ ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹: ΠΌΠ΅Ρ‚ΠΎΠ΄ сопряТСнных Π³Ρ€Π°Π΄ΠΈΠ΅Π½Ρ‚ΠΎΠ², ΠΌΠ΅Ρ‚ΠΎΠ΄Ρ‹ ΠΏΠ΅Ρ€Π΅ΠΌΠ΅Π½Π½ΠΎΠΉ ΠΌΠ΅Ρ‚Ρ€ΠΈΠΊΠΈ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅.

ROC-Π°Π½Π°Π»ΠΈΠ·

ROC-кривая (Receiver Operator Characteristic) β€” кривая, которая Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ для прСдставлСния Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации Π² машинном ΠΎΠ±ΡƒΡ‡Π΅Π½ΠΈΠΈ. НазваниС ΠΏΡ€ΠΈΡˆΠ»ΠΎ ΠΈΠ· систСм ΠΎΠ±Ρ€Π°Π±ΠΎΡ‚ΠΊΠΈ сигналов. ΠŸΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ классов Π΄Π²Π°, ΠΎΠ΄ΠΈΠ½ ΠΈΠ· Π½ΠΈΡ… называСтся классом с ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ исходами, Π²Ρ‚ΠΎΡ€ΠΎΠΉ β€” с ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ исходами. ROC-кривая ΠΏΠΎΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π·Π°Π²ΠΈΡΠΈΠΌΠΎΡΡ‚ΡŒ количСства Π²Π΅Ρ€Π½ΠΎ классифицированных ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² ΠΎΡ‚ количСства Π½Π΅Π²Π΅Ρ€Π½ΠΎ классифицированных ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ².

Π’ Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΎΠ»ΠΎΠ³ΠΈΠΈ ROC-Π°Π½Π°Π»ΠΈΠ·Π° ΠΏΠ΅Ρ€Π²Ρ‹Π΅ Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ΡΡ истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ, Π²Ρ‚ΠΎΡ€Ρ‹Π΅ β€” Π»ΠΎΠΆΠ½ΠΎ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ мноТСством. ΠŸΡ€ΠΈ этом прСдполагаСтся, Ρ‡Ρ‚ΠΎ Ρƒ классификатора имССтся Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€, Π²Π°Ρ€ΡŒΠΈΡ€ΡƒΡ ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ, ΠΌΡ‹ Π±ΡƒΠ΄Π΅ΠΌ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒ Ρ‚ΠΎ ΠΈΠ»ΠΈ ΠΈΠ½ΠΎΠ΅ Ρ€Π°Π·Π±ΠΈΠ΅Π½ΠΈΠ΅ Π½Π° Π΄Π²Π° класса. Π­Ρ‚ΠΎΡ‚ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ часто Π½Π°Π·Ρ‹Π²Π°ΡŽΡ‚ ΠΏΠΎΡ€ΠΎΠ³ΠΎΠΌ, ΠΈΠ»ΠΈ Ρ‚ΠΎΡ‡ΠΊΠΎΠΉ отсСчСния (cut-off value). Π’ зависимости ΠΎΡ‚ Π½Π΅Π³ΠΎ Π±ΡƒΠ΄ΡƒΡ‚ ΠΏΠΎΠ»ΡƒΡ‡Π°Ρ‚ΡŒΡΡ Ρ€Π°Π·Π»ΠΈΡ‡Π½Ρ‹Π΅ Π²Π΅Π»ΠΈΡ‡ΠΈΠ½Ρ‹ ошибок I ΠΈ II Ρ€ΠΎΠ΄Π°.

Π’ логистичСской рСгрСссии ΠΏΠΎΡ€ΠΎΠ³ отсСчСния измСняСтся ΠΎΡ‚ 0 Π΄ΠΎ 1 β€” это ΠΈ Π΅ΡΡ‚ΡŒ расчСтноС Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ уравнСния рСгрСссии. Π‘ΡƒΠ΄Π΅ΠΌ Π½Π°Π·Ρ‹Π²Π°Ρ‚ΡŒ Π΅Π³ΠΎ Ρ€Π΅ΠΉΡ‚ΠΈΠ½Π³ΠΎΠΌ.

Для понимания сути ошибок I ΠΈ II Ρ€ΠΎΠ΄Π° рассмотрим Ρ‡Π΅Ρ‚Ρ‹Ρ€Π΅Ρ…ΠΏΠΎΠ»ΡŒΠ½ΡƒΡŽ Ρ‚Π°Π±Π»ΠΈΡ†Ρƒ сопряТСнности (confusion matrix), которая строится Π½Π° основС Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ΠΎΠ² классификации модСлью ΠΈ фактичСской (ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΠΉ) ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² ΠΊ классам.

ΠœΠΎΠ΄Π΅Π»ΡŒΠ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ€Π°ΠΊΡ‚ΠΈΡ‡Π΅ΡΠΊΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ
ΠŸΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎTPFP
ΠžΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎFNTN

Π§Ρ‚ΠΎ являСтся ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ событиСм, Π° Ρ‡Ρ‚ΠΎ β€” ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ, зависит ΠΎΡ‚ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ Π·Π°Π΄Π°Ρ‡ΠΈ. НапримСр, Ссли ΠΌΡ‹ ΠΏΡ€ΠΎΠ³Π½ΠΎΠ·ΠΈΡ€ΡƒΠ΅ΠΌ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ наличия заболСвания, Ρ‚ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ исходом Π±ΡƒΠ΄Π΅Ρ‚ класс Β«Π‘ΠΎΠ»ΡŒΠ½ΠΎΠΉ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Β», ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ β€” Β«Π—Π΄ΠΎΡ€ΠΎΠ²Ρ‹ΠΉ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Β». И Π½Π°ΠΎΠ±ΠΎΡ€ΠΎΡ‚, Ссли ΠΌΡ‹ Ρ…ΠΎΡ‚ΠΈΠΌ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΠΈΡ‚ΡŒ Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ Π·Π΄ΠΎΡ€ΠΎΠ², Ρ‚ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌ исходом Π±ΡƒΠ΄Π΅Ρ‚ класс Β«Π—Π΄ΠΎΡ€ΠΎΠ²Ρ‹ΠΉ ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚Β», ΠΈ Ρ‚Π°ΠΊ Π΄Π°Π»Π΅Π΅.

ΠŸΡ€ΠΈ Π°Π½Π°Π»ΠΈΠ·Π΅ Ρ‡Π°Ρ‰Π΅ ΠΎΠΏΠ΅Ρ€ΠΈΡ€ΡƒΡŽΡ‚ Π½Π΅ Π°Π±ΡΠΎΠ»ΡŽΡ‚Π½Ρ‹ΠΌΠΈ показатСлями, Π° ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹ΠΌΠΈ β€” долями (rates), Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½Π½Ρ‹ΠΌΠΈ Π² ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚Π°Ρ…:

Π’Π²Π΅Π΄Π΅ΠΌ Π΅Ρ‰Π΅ Π΄Π²Π° опрСдСлСния: Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Ими опрСдСляСтся ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΈΠ²Π½Π°Ρ Ρ†Π΅Π½Π½ΠΎΡΡ‚ΡŒ любого Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ классификатора.

Π§ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ (Sensitivity) β€” это ΠΈ Π΅ΡΡ‚ΡŒ доля истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… случаСв:

Π‘ΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ (Specificity) β€” доля истинно ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… случаСв, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π±Ρ‹Π»ΠΈ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ ΠΈΠ΄Π΅Π½Ρ‚ΠΈΡ„ΠΈΡ†ΠΈΡ€ΠΎΠ²Π°Π½Ρ‹ модСлью:

Π—Π°ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ FPR=100-Sp

ΠŸΠΎΠΏΡ‹Ρ‚Π°Π΅ΠΌΡΡ Ρ€Π°Π·ΠΎΠ±Ρ€Π°Ρ‚ΡŒΡΡ Π² этих опрСдСлСниях.

МодСль с высокой Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ часто Π΄Π°Π΅Ρ‚ истинный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ исхода (ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹). Наоборот, модСль с высокой ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ Ρ‡Π°Ρ‰Π΅ Π΄Π°Π΅Ρ‚ истинный Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ ΠΏΡ€ΠΈ Π½Π°Π»ΠΈΡ‡ΠΈΠΈ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠ³ΠΎ исхода (ΠΎΠ±Π½Π°Ρ€ΡƒΠΆΠΈΠ²Π°Π΅Ρ‚ ΠΎΡ‚Ρ€ΠΈΡ†Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹). Если Ρ€Π°ΡΡΡƒΠΆΠ΄Π°Ρ‚ΡŒ Π² Ρ‚Π΅Ρ€ΠΌΠΈΠ½Π°Ρ… ΠΌΠ΅Π΄ΠΈΡ†ΠΈΠ½Ρ‹ β€” Π·Π°Π΄Π°Ρ‡ΠΈ диагностики заболСвания, Π³Π΄Π΅ модСль классификации ΠΏΠ°Ρ†ΠΈΠ΅Π½Ρ‚ΠΎΠ² Π½Π° Π±ΠΎΠ»ΡŒΠ½Ρ‹Ρ… ΠΈ Π·Π΄ΠΎΡ€ΠΎΠ²Ρ‹Ρ… называСтся диагностичСским тСстом, Ρ‚ΠΎ получится ΡΠ»Π΅Π΄ΡƒΡŽΡ‰Π΅Π΅:

ROC-кривая получаСтся ΡΠ»Π΅Π΄ΡƒΡŽΡ‰ΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ:

ΠšΠ°Π½ΠΎΠ½ΠΈΡ‡Π΅ΡΠΊΠΈΠΉ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ построСния ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ вырисовываСтся нСкоторая кривая (рис. 3).

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Для идСального классификатора Π³Ρ€Π°Ρ„ΠΈΠΊ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΏΡ€ΠΎΡ…ΠΎΠ΄ΠΈΡ‚ Ρ‡Π΅Ρ€Π΅Π· Π²Π΅Ρ€Ρ…Π½ΠΈΠΉ Π»Π΅Π²Ρ‹ΠΉ ΡƒΠ³ΠΎΠ», Π³Π΄Π΅ доля истинно ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… случаСв составляСт 100% ΠΈΠ»ΠΈ 1,0 (идСальная Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ), Π° доля Π»ΠΎΠΆΠ½ΠΎ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½Ρ‹Ρ… ΠΏΡ€ΠΈΠΌΠ΅Ρ€ΠΎΠ² Ρ€Π°Π²Π½Π° Π½ΡƒΠ»ΡŽ. ΠŸΠΎΡΡ‚ΠΎΠΌΡƒ Ρ‡Π΅ΠΌ Π±Π»ΠΈΠΆΠ΅ кривая ΠΊ Π²Π΅Ρ€Ρ…Π½Π΅ΠΌΡƒ Π»Π΅Π²ΠΎΠΌΡƒ ΡƒΠ³Π»Ρƒ, Ρ‚Π΅ΠΌ Π²Ρ‹ΡˆΠ΅ ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½Π°Ρ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ. Наоборот, Ρ‡Π΅ΠΌ мСньшС ΠΈΠ·Π³ΠΈΠ± ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΈ Ρ‡Π΅ΠΌ Π±Π»ΠΈΠΆΠ΅ ΠΎΠ½Π° располоТСна ΠΊ диагональной прямой, Ρ‚Π΅ΠΌ ΠΌΠ΅Π½Π΅Π΅ эффСктивна модСль. Π”ΠΈΠ°Π³ΠΎΠ½Π°Π»ΡŒΠ½Π°Ρ линия соотвСтствуСт «бСсполСзному» классификатору, Ρ‚.Π΅. ΠΏΠΎΠ»Π½ΠΎΠΉ нСразличимости Π΄Π²ΡƒΡ… классов.

ΠŸΡ€ΠΈ Π²ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠΉ ΠΎΡ†Π΅Π½ΠΊΠ΅ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Ρ… располоТСниС ΠΈΡ… ΠΎΡ‚Π½ΠΎΡΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ Π΄Ρ€ΡƒΠ³ Π΄Ρ€ΡƒΠ³Π° ΡƒΠΊΠ°Π·Ρ‹Π²Π°Π΅Ρ‚ Π½Π° ΠΈΡ… ΡΡ€Π°Π²Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΠΎΡΡ‚ΡŒ. ΠšΡ€ΠΈΠ²Π°Ρ, располоТСнная Π²Ρ‹ΡˆΠ΅ ΠΈ Π»Π΅Π²Π΅Π΅, ΡΠ²ΠΈΠ΄Π΅Ρ‚Π΅Π»ΡŒΡΡ‚Π²ΡƒΠ΅Ρ‚ ΠΎ большСй ΠΏΡ€Π΅Π΄ΡΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎΠΉ способности ΠΌΠΎΠ΄Π΅Π»ΠΈ. Π’Π°ΠΊ, Π½Π° рис. 4 Π΄Π²Π΅ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅ совмСщСны Π½Π° ΠΎΠ΄Π½ΠΎΠΌ Π³Ρ€Π°Ρ„ΠΈΠΊΠ΅. Π’ΠΈΠ΄Π½ΠΎ, Ρ‡Ρ‚ΠΎ модСль Β«AΒ» Π»ΡƒΡ‡ΡˆΠ΅.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Рис. 4 β€” Π‘Ρ€Π°Π²Π½Π΅Π½ΠΈΠ΅ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Ρ…

Π’ΠΈΠ·ΡƒΠ°Π»ΡŒΠ½ΠΎΠ΅ сравнСниС ΠΊΡ€ΠΈΠ²Ρ‹Ρ… ROC Π½Π΅ всСгда позволяСт Π²Ρ‹ΡΠ²ΠΈΡ‚ΡŒ Π½Π°ΠΈΠ±ΠΎΠ»Π΅Π΅ ΡΡ„Ρ„Π΅ΠΊΡ‚ΠΈΠ²Π½ΡƒΡŽ модСль. Π‘Π²ΠΎΠ΅ΠΎΠ±Ρ€Π°Π·Π½Ρ‹ΠΌ ΠΌΠ΅Ρ‚ΠΎΠ΄ΠΎΠΌ сравнСния ROC-ΠΊΡ€ΠΈΠ²Ρ‹Ρ… являСтся ΠΎΡ†Π΅Π½ΠΊΠ° ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²Ρ‹ΠΌΠΈ. ВСорСтичСски ΠΎΠ½Π° измСняСтся ΠΎΡ‚ 0 Π΄ΠΎ 1,0, Π½ΠΎ, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ модСль всСгда Ρ…Π°Ρ€Π°ΠΊΡ‚Π΅Ρ€ΠΈΠ·ΡƒΡŽΡ‚ΡΡ ΠΊΡ€ΠΈΠ²ΠΎΠΉ, располоТСнной Π²Ρ‹ΡˆΠ΅ ΠΏΠΎΠ»ΠΎΠΆΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠΉ Π΄ΠΈΠ°Π³ΠΎΠ½Π°Π»ΠΈ, Ρ‚ΠΎ ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ говорят ΠΎΠ± измСнСниях ΠΎΡ‚ 0,5 («бСсполСзный» классификатор) Π΄ΠΎ 1,0 («идСальная» модСль).

Π­Ρ‚Π° ΠΎΡ†Π΅Π½ΠΊΠ° ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π° нСпосрСдствСнно вычислСниСм ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ ΠΏΠΎΠ΄ ΠΌΠ½ΠΎΠ³ΠΎΠ³Ρ€Π°Π½Π½ΠΈΠΊΠΎΠΌ, ΠΎΠ³Ρ€Π°Π½ΠΈΡ‡Π΅Π½Π½Ρ‹ΠΌ справа ΠΈ снизу осями ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚ ΠΈ слСва Π²Π²Π΅Ρ€Ρ…Ρƒ β€” ΡΠΊΡΠΏΠ΅Ρ€ΠΈΠΌΠ΅Π½Ρ‚Π°Π»ΡŒΠ½ΠΎ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½Π½Ρ‹ΠΌΠΈ Ρ‚ΠΎΡ‡ΠΊΠ°ΠΌΠΈ (рис. 5). ЧислСнный ΠΏΠΎΠΊΠ°Π·Π°Ρ‚Π΅Π»ΡŒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ называСтся AUC (Area Under Curve). Π’Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ Π΅Π³ΠΎ ΠΌΠΎΠΆΠ½ΠΎ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ числСнного ΠΌΠ΅Ρ‚ΠΎΠ΄Π° Ρ‚Ρ€Π°ΠΏΠ΅Ρ†ΠΈΠΉ:

AUC = \int f(x)\,dx = \sum_i \Bigl[ \frac\,+\,X_i><2>\Bigr]\,\cdot \,(Y_\,-\, Y_i)

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Рис. 5 β€” ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

Π˜Π½Ρ‚Π΅Ρ€Π²Π°Π» AUCΠšΠ°Ρ‡Π΅ΡΡ‚Π²ΠΎ ΠΌΠΎΠ΄Π΅Π»ΠΈ
0,9-1,0ΠžΡ‚Π»ΠΈΡ‡Π½ΠΎΠ΅
0,8-0,9ΠžΡ‡Π΅Π½ΡŒ Ρ…ΠΎΡ€ΠΎΡˆΠ΅Π΅
0,7-0,8Π₯ΠΎΡ€ΠΎΡˆΠ΅Π΅
0,6-0,7Π‘Ρ€Π΅Π΄Π½Π΅Π΅
0,5-0,6ΠΠ΅ΡƒΠ΄ΠΎΠ²Π»Π΅Ρ‚Π²ΠΎΡ€ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΠ΅

ΠŸΠΎΡ€ΠΎΠ³ отсСчСния Π½ΡƒΠΆΠ΅Π½ для Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎΠ±Ρ‹ ΠΏΡ€ΠΈΠΌΠ΅Π½ΡΡ‚ΡŒ модСль Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅: ΠΎΡ‚Π½ΠΎΡΠΈΡ‚ΡŒ Π½ΠΎΠ²Ρ‹Π΅ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Ρ‹ ΠΊ ΠΎΠ΄Π½ΠΎΠΌΡƒ ΠΈΠ· Π΄Π²ΡƒΡ… классов. Для опрСдСлСния ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½ΠΎΠ³ΠΎ ΠΏΠΎΡ€ΠΎΠ³Π° Π½ΡƒΠΆΠ½ΠΎ Π·Π°Π΄Π°Ρ‚ΡŒ ΠΊΡ€ΠΈΡ‚Π΅Ρ€ΠΈΠΉ Π΅Π³ΠΎ опрСдСлСния, Ρ‚.ΠΊ. Π² Ρ€Π°Π·Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡Π°Ρ… присутствуСт своя ΠΎΠΏΡ‚ΠΈΠΌΠ°Π»ΡŒΠ½Π°Ρ стратСгия. ΠšΡ€ΠΈΡ‚Π΅Ρ€ΠΈΡΠΌΠΈ Π²Ρ‹Π±ΠΎΡ€Π° ΠΏΠΎΡ€ΠΎΠ³Π° отсСчСния ΠΌΠΎΠ³ΡƒΡ‚ Π²Ρ‹ΡΡ‚ΡƒΠΏΠ°Ρ‚ΡŒ:

Π’Ρ‚ΠΎΡ€ΠΎΠ΅ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΏΠΎΡ€ΠΎΠ³Π° ΠΎΠ±Ρ‹Ρ‡Π½ΠΎ прСдлагаСтся ΠΏΠΎΠ»ΡŒΠ·ΠΎΠ²Π°Ρ‚Π΅Π»ΡŽ ΠΏΠΎ ΡƒΠΌΠΎΠ»Ρ‡Π°Π½ΠΈΡŽ. Π’ Ρ‚Ρ€Π΅Ρ‚ΡŒΠ΅ΠΌ случаС ΠΏΠΎΡ€ΠΎΠ³ Π΅ΡΡ‚ΡŒ Ρ‚ΠΎΡ‡ΠΊΠ° пСрСсСчСния Π΄Π²ΡƒΡ… ΠΊΡ€ΠΈΠ²Ρ‹Ρ…, ΠΊΠΎΠ³Π΄Π° ΠΏΠΎ оси X откладываСтся ΠΏΠΎΡ€ΠΎΠ³ отсСчСния, Π° ΠΏΠΎ оси Y β€” Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒ ΠΈΠ»ΠΈ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒ ΠΌΠΎΠ΄Π΅Π»ΠΈ (рис. 6).

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Рис. 6 β€” Β«Π’ΠΎΡ‡ΠΊΠ° баланса» ΠΌΠ΅ΠΆΠ΄Ρƒ Ρ‡ΡƒΠ²ΡΡ‚Π²ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎΡΡ‚ΡŒΡŽ ΠΈ ΡΠΏΠ΅Ρ†ΠΈΡ„ΠΈΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ

Π‘ΡƒΡ‰Π΅ΡΡ‚Π²ΡƒΡŽΡ‚ ΠΈ Π΄Ρ€ΡƒΠ³ΠΈΠ΅ ΠΏΠΎΠ΄Ρ…ΠΎΠ΄Ρ‹, ΠΊΠΎΠ³Π΄Π° ошибкам I ΠΈ II Ρ€ΠΎΠ΄Π° назначаСтся вСс, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ интСрпрСтируСтся ΠΊΠ°ΠΊ Ρ†Π΅Π½Π° ошибок. Но здСсь встаСт ΠΏΡ€ΠΎΠ±Π»Π΅ΠΌΠ° опрСдСлСния этих вСсов, Ρ‡Ρ‚ΠΎ само ΠΏΠΎ сСбС являСтся слоТной, Π° часто Π½Π΅ Ρ€Π°Π·Ρ€Π΅ΡˆΠΈΠΌΠΎΠΉ Π·Π°Π΄Π°Ρ‡Π΅ΠΉ.

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Анализ ΠΌΠ°Π»Ρ‹Ρ… Π΄Π°Π½Π½Ρ‹Ρ…

ΠšΠ²Π°Π·ΠΈΠΠ°ΡƒΡ‡Π½Ρ‹ΠΉ Π±Π»ΠΎΠ³ АлСксандра Π”ΡŒΡΠΊΠΎΠ½ΠΎΠ²Π°

AUC ROC (ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ΠΊΡ€ΠΈΠ²ΠΎΠΉ ошибок)

ΠŸΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ – ΠΎΠ΄ΠΈΠ½ ΠΈΠ· самых популярных Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΎΠ½Π°Π»ΠΎΠ² качСства Π² Π·Π°Π΄Π°Ρ‡Π°Ρ… Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠΉ классификации. На ΠΌΠΎΠΉ взгляд, простых ΠΈ ΠΏΠΎΠ»Π½Ρ‹Ρ… источников ΠΈΠ½Ρ„ΠΎΡ€ΠΌΠ°Ρ†ΠΈΠΈ Β«Ρ‡Ρ‚ΠΎ ΠΆΠ΅ это Ρ‚Π°ΠΊΠΎΠ΅Β» Π½Π΅Ρ‚. Как ΠΏΡ€Π°Π²ΠΈΠ»ΠΎ, объяснСниС Π½Π°Ρ‡ΠΈΠ½Π°ΡŽΡ‚ с ввСдСния Ρ€Π°Π·Π½Ρ‹Ρ… Ρ‚Π΅Ρ€ΠΌΠΈΠ½ΠΎΠ² (FPR, TPR), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½Ρ‹ΠΉ Ρ‡Π΅Π»ΠΎΠ²Π΅ΠΊ Ρ‚ΡƒΡ‚ ΠΆΠ΅ Π·Π°Π±Ρ‹Π²Π°Π΅Ρ‚. Π’Π°ΠΊΠΆΠ΅ Π½Π΅Ρ‚ Ρ€Π°Π·Π±ΠΎΡ€ΠΎΠ² ΠΊΠ°ΠΊΠΈΡ…-Ρ‚ΠΎ ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½Ρ‹Ρ… Π·Π°Π΄Π°Ρ‡ ΠΏΠΎ AUC ROC. Π’ этом постС описано, ΠΊΠ°ΠΊ я объясняю эту Ρ‚Π΅ΠΌΡƒ студСнтам ΠΈ своим сотрудникам…

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Допустим, Ρ€Π΅ΡˆΠ°Π΅Ρ‚ΡΡ Π·Π°Π΄Π°Ρ‡Π° классификации с двумя классами <0, 1>. Алгоритм Π²Ρ‹Π΄Π°Ρ‘Ρ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΡƒΡŽ ΠΎΡ†Π΅Π½ΠΊΡƒ (ΠΌΠΎΠΆΠ΅Ρ‚, Π½ΠΎ Π½Π΅ ΠΎΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½ΠΎ, Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ) принадлСТности ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π° ΠΊ классу 1. МоТно ΡΡ‡ΠΈΡ‚Π°Ρ‚ΡŒ, Ρ‡Ρ‚ΠΎ ΠΎΡ†Π΅Π½ΠΊΠ° ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠΈΡ‚ ΠΎΡ‚Ρ€Π΅Π·ΠΊΡƒ [0, 1].

Часто Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚ Ρ€Π°Π±ΠΎΡ‚Ρ‹ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° фиксированной тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠ΅ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·ΠΈΡ€ΡƒΡŽΡ‚ с ΠΏΠΎΠΌΠΎΡ‰ΡŒΡŽ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ (ROC = receiver operating characteristic, ΠΈΠ½ΠΎΠ³Π΄Π° говорят «кривая ошибок»), Π° качСство ΠΎΡ†Π΅Π½ΠΈΠ²Π°ΡŽΡ‚ ΠΊΠ°ΠΊ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ этой ΠΊΡ€ΠΈΠ²ΠΎΠΉ – AUC (AUC = area under the curve). ПокаТСм Π½Π° ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΌ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅, ΠΊΠ°ΠΊ строится кривая.

ΠŸΡƒΡΡ‚ΡŒ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π²Ρ‹Π΄Π°Π» ΠΎΡ†Π΅Π½ΠΊΠΈ, ΠΊΠ°ΠΊ ΠΏΠΎΠΊΠ°Π·Π°Π½ΠΎ Π² Ρ‚Π°Π±Π». 1. Упорядочим строки Ρ‚Π°Π±Π». 1 ΠΏΠΎ ΡƒΠ±Ρ‹Π²Π°Π½ΠΈΡŽ ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° – ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠΌ Ρ‚Π°Π±Π». 2. Ясно, Ρ‡Ρ‚ΠΎ Π² ΠΈΠ΄Π΅Π°Π»Π΅ Π΅Ρ‘ столбСц «класс» Ρ‚ΠΎΠΆΠ΅ станСт упорядочСн (сначала ΠΈΠ΄ΡƒΡ‚ 1, ΠΏΠΎΡ‚ΠΎΠΌ 0); Π² самом Ρ…ΡƒΠ΄ΡˆΠ΅ΠΌ случаС – порядок Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠ±Ρ€Π°Ρ‚Π½Ρ‹ΠΉ (сначала 0, ΠΏΠΎΡ‚ΠΎΠΌ 1); Π² случаС «слСпого угадывания» Π±ΡƒΠ΄Π΅Ρ‚ случайноС распрСдСлСниС 0 ΠΈ 1.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Π§Ρ‚ΠΎΠ±Ρ‹ Π½Π°Ρ€ΠΈΡΠΎΠ²Π°Ρ‚ΡŒ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ, Π½Π°Π΄ΠΎ Π²Π·ΡΡ‚ΡŒ Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½Ρ‹ΠΉ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ Π½Π° ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π½ΠΎΠΉ плоскости, см. рис. 1, Ρ€Π°Π·Π±ΠΈΡ‚ΡŒ Π΅Π³ΠΎ Π½Π° m Ρ€Π°Π²Π½Ρ‹Ρ… частСй Π³ΠΎΡ€ΠΈΠ·ΠΎΠ½Ρ‚Π°Π»ΡŒΠ½Ρ‹ΠΌΠΈ линиями ΠΈ Π½Π° n – Π²Π΅Ρ€Ρ‚ΠΈΠΊΠ°Π»ΡŒΠ½Ρ‹ΠΌΠΈ, Π³Π΄Π΅ m – число 1 срСди ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½Ρ‹Ρ… ΠΌΠ΅Ρ‚ΠΎΠΊ тСста (Π² нашСм ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ m=3), n – число Π½ΡƒΠ»Π΅ΠΉ (n=4). Π’ Ρ€Π΅Π·ΡƒΠ»ΡŒΡ‚Π°Ρ‚Π΅ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ разбиваСтся сСткой Π½Π° mΓ—n Π±Π»ΠΎΠΊΠΎΠ².

Π’Π΅ΠΏΠ΅Ρ€ΡŒ Π±ΡƒΠ΄Π΅ΠΌ ΠΏΡ€ΠΎΡΠΌΠ°Ρ‚Ρ€ΠΈΠ²Π°Ρ‚ΡŒ строки Ρ‚Π°Π±Π». 2 свСрху Π²Π½ΠΈΠ· ΠΈ ΠΏΡ€ΠΎΡ€ΠΈΡΠΎΠ²Ρ‹Π²Π°Ρ‚ΡŒ Π½Π° сСткС Π»ΠΈΠ½ΠΈΠΈ, пСрСходя ΠΈΡ… ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΡƒΠ·Π»Π° Π² Π΄Ρ€ΡƒΠ³ΠΎΠΉ. Π‘Ρ‚Π°Ρ€Ρ‚ΡƒΠ΅ΠΌ ΠΈΠ· Ρ‚ΠΎΡ‡ΠΊΠΈ (0, 0). Если Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ ΠΌΠ΅Ρ‚ΠΊΠΈ класса Π² просматриваСмой строкС 1, Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅ΠΌ шаг Π²Π²Π΅Ρ€Ρ…; Ссли 0, Ρ‚ΠΎ Π΄Π΅Π»Π°Π΅ΠΌ шаг Π²ΠΏΡ€Π°Π²ΠΎ. Ясно, Ρ‡Ρ‚ΠΎ Π² ΠΈΡ‚ΠΎΠ³Π΅ ΠΌΡ‹ ΠΏΠΎΠΏΠ°Π΄Ρ‘ΠΌ Π² Ρ‚ΠΎΡ‡ΠΊΡƒ (1, 1), Ρ‚.ΠΊ. сдСлаСм Π² суммС m шагов Π²Π²Π΅Ρ€Ρ… ΠΈ n шагов Π²ΠΏΡ€Π°Π²ΠΎ.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис.1. ΠŸΠΎΡΡ‚Ρ€ΠΎΠ΅Π½ΠΈΠ΅ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ.

На рис. 1 (справа) ΠΏΠΎΠΊΠ°Π·Π°Π½ ΠΏΡƒΡ‚ΡŒ для нашСго ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° – это ΠΈ являСтся ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ. Π’Π°ΠΆΠ½Ρ‹ΠΉ ΠΌΠΎΠΌΠ΅Π½Ρ‚: Ссли Ρƒ Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² значСния ΠΎΡ†Π΅Π½ΠΎΠΊ Ρ€Π°Π²Π½Ρ‹, Ρ‚ΠΎ ΠΌΡ‹ Π΄Π΅Π»Π°Π΅ΠΌ шаг Π² Ρ‚ΠΎΡ‡ΠΊΡƒ, которая Π½Π° a Π±Π»ΠΎΠΊΠΎΠ² Π²Ρ‹ΡˆΠ΅ ΠΈ b Π±Π»ΠΎΠΊΠΎΠ² ΠΏΡ€Π°Π²Π΅Π΅, Π³Π΄Π΅ a – число Π΅Π΄ΠΈΠ½ΠΈΡ† Π² Π³Ρ€ΡƒΠΏΠΏΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² с ΠΎΠ΄Π½ΠΈΠΌ Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ΠΌ ΠΌΠ΅Ρ‚ΠΊΠΈ, b – число Π½ΡƒΠ»Π΅ΠΉ Π² Π½Π΅ΠΉ. Π’ частности, Ссли всС ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²ΡƒΡŽ ΠΌΠ΅Ρ‚ΠΊΡƒ, Ρ‚ΠΎ ΠΌΡ‹ сразу шагаСм ΠΈΠ· Ρ‚ΠΎΡ‡ΠΊΠΈ (0, 0) Π² Ρ‚ΠΎΡ‡ΠΊΡƒ (1, 1).

AUC ROC – ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ – часто ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΡŽΡ‚ для оцСнивания качСства упорядочивания Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π΄Π²ΡƒΡ… классов. Ясно, Ρ‡Ρ‚ΠΎ это Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ Π»Π΅ΠΆΠΈΡ‚ Π½Π° ΠΎΡ‚Ρ€Π΅Π·ΠΊΠ΅ [0, 1]. Π’ нашСм ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π΅ AUC ROC = 9.5 / 12

Π’Ρ‹ΡˆΠ΅ ΠΌΡ‹ описали случаи идСального, Π½Π°ΠΈΡ…ΡƒΠ΄ΡˆΠ΅Π³ΠΎ ΠΈ случайного слСдования ΠΌΠ΅Ρ‚ΠΎΠΊ Π² упорядочСнной Ρ‚Π°Π±Π»ΠΈΡ†Π΅. Π˜Π΄Π΅Π°Π»ΡŒΠ½ΠΎΠΌΡƒ соотвСтствуСт ROC-кривая, проходящая Ρ‡Π΅Ρ€Π΅Π· Ρ‚ΠΎΡ‡ΠΊΡƒ (0, 1), ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ Π½Π΅ΠΉ Ρ€Π°Π²Π½Π° 1. ΠΠ°ΠΈΡ…ΡƒΠ΄ΡˆΠ΅ΠΌΡƒ – ROC-кривая, проходящая Ρ‡Π΅Ρ€Π΅Π· Ρ‚ΠΎΡ‡ΠΊΡƒ (1, 0), ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ Π½Π΅ΠΉ – 0. Π‘Π»ΡƒΡ‡Π°ΠΉΠ½ΠΎΠΌΡƒ – Ρ‡Ρ‚ΠΎ-Ρ‚ΠΎ ΠΏΠΎΡ…ΠΎΠΆΠ΅Π΅ Π½Π° диагональ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π°, ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π½ΠΎ Ρ€Π°Π²Π½Π° 0.5.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 2. ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅ для Π½Π°ΠΈΠ»ΡƒΡ‡ΡˆΠ΅Π³ΠΎ (AUC=1), случайного (AUC=0.5) ΠΈ Π½Π°ΠΈΡ…ΡƒΠ΄ΡˆΠ΅Π³ΠΎ (AUC=0) Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ°.

Π—Π°ΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅. ROC-кривая считаСтся Π½Π΅ΠΎΠΏΡ€Π΅Π΄Π΅Π»Ρ‘Π½Π½ΠΎΠΉ для тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Ρ†Π΅Π»ΠΈΠΊΠΎΠΌ состоящСй ΠΈΠ· ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΠ΄Π½ΠΎΠ³ΠΎ класса. Π‘ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ соврСмСнных Ρ€Π΅Π°Π»ΠΈΠ·Π°Ρ†ΠΈΠΉ Π²Ρ‹Π΄Π°ΡŽΡ‚ ΠΎΡˆΠΈΠ±ΠΊΡƒ ΠΏΡ€ΠΈ ΠΏΠΎΠΏΡ‹Ρ‚ΠΊΠΈ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ Π΅Ρ‘ Π² этом случаС

Бмысл AUC ROC

Π‘Π΅Ρ‚ΠΊΠ° Π½Π° рис. 1 Ρ€Π°Π·Π±ΠΈΠ»Π° ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚ Π½Π° mΓ—n Π±Π»ΠΎΠΊΠΎΠ². Π ΠΎΠ²Π½ΠΎ ΡΡ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΆΠ΅ ΠΏΠ°Ρ€ Π²ΠΈΠ΄Π° (ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 1, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 0), составлСнных ΠΈΠ· ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π·Π°ΠΊΡ€Π°ΡˆΠ΅Π½Π½Ρ‹ΠΉ Π±Π»ΠΎΠΊ Π½Π° рис. 1 соотвСтствуСт ΠΏΠ°Ρ€Π΅ (ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 1, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 0), для ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ наш Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΏΡ€Π°Π²ΠΈΠ»ΡŒΠ½ΠΎ прСдсказал порядок (ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 1 ΠΏΠΎΠ»ΡƒΡ‡ΠΈΠ» ΠΎΡ†Π΅Π½ΠΊΡƒ Π²Ρ‹ΡˆΠ΅, Ρ‡Π΅ΠΌ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 0), Π½Π΅Π·Π°ΠΊΡ€Π°ΡˆΠ΅Π½Π½Ρ‹ΠΉ Π±Π»ΠΎΠΊ – ΠΏΠ°Ρ€Π΅, Π½Π° ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ ошибся.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 3. ΠšΠ°ΠΆΠ΄Ρ‹ΠΉ Π±Π»ΠΎΠΊ соотвСтствуСт ΠΏΠ°Ρ€Π΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ².

Π’Π°ΠΊΠΈΠΌ ΠΎΠ±Ρ€Π°Π·ΠΎΠΌ, AUC ROC Ρ€Π°Π²Π΅Π½ Π΄ΠΎΠ»Π΅ ΠΏΠ°Ρ€ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² Π²ΠΈΠ΄Π° (ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 1, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 0), ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π²Π΅Ρ€Π½ΠΎ упорядочил, Ρ‚.Π΅. ΠΏΠ΅Ρ€Π²Ρ‹ΠΉ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ ΠΈΠ΄Ρ‘Ρ‚ Π² упорядочСнном спискС Ρ€Π°Π½ΡŒΡˆΠ΅. ЧислСнно это ΠΌΠΎΠΆΠ½ΠΎ Π·Π°ΠΏΠΈΡΠ°Ρ‚ΡŒ Ρ‚Π°ΠΊ:

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Π—Π°ΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅. Π’ Ρ„ΠΎΡ€ΠΌΡƒΠ»Π΅ (*) всС постоянно ΠΎΡˆΠΈΠ±Π°ΡŽΡ‚ΡΡ, забывая случай равСнства ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Π½Π° Π½Π΅ΡΠΊΠΎΠ»ΡŒΠΊΠΈΡ… ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Π°Ρ…. Π’Π°ΠΊΠΆΠ΅ эту Ρ„ΠΎΡ€ΠΌΡƒΠ»Ρƒ всС постоянно ΠΏΠ΅Ρ€Π΅ΠΎΡ‚ΠΊΡ€Ρ‹Π²Π°ΡŽΡ‚. Она Ρ…ΠΎΡ€ΠΎΡˆΠ° Ρ‚Π΅ΠΌ, Ρ‡Ρ‚ΠΎ Π»Π΅Π³ΠΊΠΎ обобщаСтся ΠΈ Π½Π° Π΄Ρ€ΡƒΠ³ΠΈΠ΅ Π·Π°Π΄Π°Ρ‡ΠΈ обучСния с ΡƒΡ‡ΠΈΡ‚Π΅Π»Π΅ΠΌ.

ΠŸΡ€ΠΈΠ½ΡΡ‚ΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΠΉ Π½Π° основС ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ

Пока наш Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ Π²Ρ‹Π΄Π°Π²Π°Π» ΠΎΡ†Π΅Π½ΠΊΠΈ принадлСТности ΠΊ классу 1. Ясно, Ρ‡Ρ‚ΠΎ Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅ Π½Π°ΠΌ часто Π½Π°Π΄ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ Ρ€Π΅ΡˆΠΈΡ‚ΡŒ: ΠΊΠ°ΠΊΠΈΠ΅ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ отнСсти ΠΊ классу 1, Π° ΠΊΠ°ΠΊΠΈΠ΅ ΠΊ классу 0. Для этого Π½ΡƒΠΆΠ½ΠΎ Π±ΡƒΠ΄Π΅Ρ‚ Π²Ρ‹Π±Ρ€Π°Ρ‚ΡŒ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€Ρ‹ΠΉ ΠΏΠΎΡ€ΠΎΠ³ (ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ с ΠΎΡ†Π΅Π½ΠΊΠ°ΠΌΠΈ Π²Ρ‹ΡˆΠ΅ ΠΏΠΎΡ€ΠΎΠ³Π° считаСм ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‰ΠΈΠΌΠΈ классу 1, ΠΎΡΡ‚Π°Π»ΡŒΠ½Ρ‹Π΅ – 0).

Π’Ρ‹Π±ΠΎΡ€Ρƒ ΠΏΠΎΡ€ΠΎΠ³Π° соотвСтствуСт Π²Ρ‹Π±ΠΎΡ€ Ρ‚ΠΎΡ‡ΠΊΠΈ Π½Π° ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ. НапримСр, для ΠΏΠΎΡ€ΠΎΠ³Π° 0.25 ΠΈ нашСго ΠΏΡ€ΠΈΠΌΠ΅Ρ€Π° – Ρ‚ΠΎΡ‡ΠΊΠ° ΡƒΠΊΠ°Π·Π°Π½Π° Π½Π° рис. 4 (1/4, 2/3). см. Ρ‚Π°Π±Π». 3

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 4. Π’Ρ‹Π±ΠΎΡ€ ΠΏΠΎΡ€ΠΎΠ³Π° для Π±ΠΈΠ½Π°Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ.

Π—Π°ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ 1/4 – это ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ Ρ‚ΠΎΡ‡Π΅ΠΊ класса 0, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π½Π΅Π²Π΅Ρ€Π½ΠΎ классифицированы нашим Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ (это называСтся FPR = False Positive Rate), 2/3 – ΠΏΡ€ΠΎΡ†Π΅Π½Ρ‚ Ρ‚ΠΎΡ‡Π΅ΠΊ класса 1, ΠΊΠΎΡ‚ΠΎΡ€Ρ‹Π΅ Π²Π΅Ρ€Π½ΠΎ классифицированы нашим Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠΎΠΌ (это называСтся TPR = True Positive Rate). ИмСнно Π² этих ΠΊΠΎΠΎΡ€Π΄ΠΈΠ½Π°Ρ‚Π°Ρ… (FPR, TPR) построСна ROC-кривая. Часто Π² Π»ΠΈΡ‚Π΅Ρ€Π°Ρ‚ΡƒΡ€Π΅ Π΅Ρ‘ ΠΎΠΏΡ€Π΅Π΄Π΅Π»ΡΡŽΡ‚ ΠΊΠ°ΠΊ ΠΊΡ€ΠΈΠ²ΡƒΡŽ зависимости TPR ΠΎΡ‚ FPR ΠΏΡ€ΠΈ Π²Π°Ρ€ΡŒΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠΈ ΠΏΠΎΡ€ΠΎΠ³Π° для Π±ΠΈΠ½Π°Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ.

ΠšΡΡ‚Π°Ρ‚ΠΈ, для Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Ρ… ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ² Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° Ρ‚ΠΎΠΆΠ΅ ΠΌΠΎΠΆΠ½ΠΎ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ AUC ROC, ΠΏΡ€Π°Π²Π΄Π° это практичСски Π½ΠΈΠΊΠΎΠ³Π΄Π° Π½Π΅ Π΄Π΅Π»Π°ΡŽΡ‚, ΠΏΠΎΡΠΊΠΎΠ»ΡŒΠΊΡƒ ROC-кривая состоит ΠΈΠ· Ρ‚Ρ€Ρ‘Ρ… Ρ‚ΠΎΡ‡Π΅ΠΊ, соСдинёнными линиями: (0,0), (FPR, TPR), (1, 1), Π³Π΄Π΅ FPR ΠΈ TPR ΡΠΎΠΎΡ‚Π²Π΅Ρ‚ΡΡ‚Π²ΡƒΡŽΡ‚ Π»ΡŽΠ±ΠΎΠΌΡƒ ΠΏΠΎΡ€ΠΎΠ³Ρƒ ΠΈΠ· ΠΈΠ½Ρ‚Π΅Ρ€Π²Π°Π»Π° (0, 1). На рис. 4 (Π·Π΅Π»Ρ‘Π½Ρ‹ΠΌ) ΠΏΠΎΠΊΠ°Π·Π°Π½Π° ROC-кривая Π±ΠΈΠ½Π°Ρ€ΠΈΠ·ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ, Π·Π°ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ AUC послС Π±ΠΈΠ½Π°Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ ΡƒΠΌΠ΅Π½ΡŒΡˆΠΈΠ»ΡΡ ΠΈ стал Ρ€Π°Π²Π½Ρ‹ΠΌ 8.5/12

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 5. ВычислСниС AUC ROC Π² случаС Π±ΠΈΠ½Π°Ρ€Π½Ρ‹Ρ… ΠΎΡ‚Π²Π΅Ρ‚ΠΎΠ².

Π’ ΠΎΠ±Ρ‰Π΅ΠΌ случаС, ΠΊΠ°ΠΊ Π²ΠΈΠ΄Π½ΠΎ ΠΈΠ· рис. 5 AUC ROC для Π±ΠΈΠ½Π°Ρ€Π½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ Ρ€Π°Π²Π½Π°

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

(ΠΊΠ°ΠΊ сумма ΠΏΠ»ΠΎΡ‰Π°Π΄Π΅ΠΉ Π΄Π²ΡƒΡ… Ρ‚Ρ€Π΅ΡƒΠ³ΠΎΠ»ΡŒΠ½ΠΈΠΊΠΎΠ² ΠΈ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π°). Π­Ρ‚ΠΎ Π²Ρ‹Ρ€Π°ΠΆΠ΅Π½ΠΈΠ΅ ΠΈΠΌΠ΅Π΅Ρ‚ ΡΠ°ΠΌΠΎΡΡ‚ΠΎΡΡ‚Π΅Π»ΡŒΠ½ΡƒΡŽ Ρ†Π΅Π½Π½ΠΎΡΡ‚ΡŒ ΠΈ являСтся «чСстной Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽΒ» Π² Π·Π°Π΄Π°Ρ‡Π΅ с дисбалансом классов (Π½ΠΎ ΠΎΠ± этом Π½Π°Π΄ΠΎ ΠΏΠΈΡΠ°Ρ‚ΡŒ ΠΎΡ‚Π΄Π΅Π»ΡŒΠ½Ρ‹ΠΉ пост).

Π—Π°Π΄Π°Ρ‡Π°

На ΠΎΡ‚Π²Π΅Ρ‚Π°Ρ… Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌΠ° a(x) ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ класса 0 распрСдСлСны с ΠΏΠ»ΠΎΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ p(a)=2-2a, Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ класса 1 – с ΠΏΠ»ΠΎΡ‚Π½ΠΎΡΡ‚ΡŒΡŽ p(a)=2a, см. рис. 6. Π˜Π½Ρ‚ΡƒΠΈΡ‚ΠΈΠ²Π½ΠΎ понятно, Ρ‡Ρ‚ΠΎ Π°Π»Π³ΠΎΡ€ΠΈΡ‚ΠΌ ΠΎΠ±Π»Π°Π΄Π°Π΅Ρ‚ Π½Π΅ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Ρ€Π°Π·Π΄Π΅Π»ΡΡŽΡ‰Π΅ΠΉ ΡΠΏΠΎΡΠΎΠ±Π½ΠΎΡΡ‚ΡŒΡŽ (Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² класса 0 ΠΈΠΌΠ΅ΡŽΡ‚ ΠΎΡ†Π΅Π½ΠΊΡƒ мСньшС 0.5, Π° Π±ΠΎΠ»ΡŒΡˆΠΈΠ½ΡΡ‚Π²ΠΎ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² класса 1 – большС). ΠŸΠΎΠΏΡ€ΠΎΠ±ΡƒΠΉΡ‚Π΅ ΡƒΠ³Π°Π΄Π°Ρ‚ΡŒ, Ρ‡Π΅ΠΌΡƒ здСсь Ρ€Π°Π²Π΅Π½ AUC ROC, Π° ΠΌΡ‹ ΠΏΠΎΠΊΠ°ΠΆΠ΅ΠΌ ΠΊΠ°ΠΊ ΠΏΠΎΡΡ‚Ρ€ΠΎΠΈΡ‚ΡŒ ROC-ΠΊΡ€ΠΈΠ²ΡƒΡŽ ΠΈ Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ Π½Π΅ΠΉ. ΠžΡ‚ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ здСсь ΠΌΡ‹ Π½Π΅ Ρ€Π°Π±ΠΎΡ‚Π°Π΅ΠΌ с ΠΊΠΎΠ½ΠΊΡ€Π΅Ρ‚Π½ΠΎΠΉ тСстовой Π²Ρ‹Π±ΠΎΡ€ΠΊΠΎΠΉ, Π° считаСм, Ρ‡Ρ‚ΠΎ Π·Π½Π°Π΅ΠΌ распрСдСлСния ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² всСх классов. Π’Π°ΠΊΠΎΠ΅ ΠΌΠΎΠΆΠ΅Ρ‚ Π±Ρ‹Ρ‚ΡŒ, Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, Π² модСльной Π·Π°Π΄Π°Ρ‡Π΅, ΠΊΠΎΠ³Π΄Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π»Π΅ΠΆΠ°Ρ‚ Π² Π΅Π΄ΠΈΠ½ΠΈΡ‡Π½ΠΎΠΌ ΠΊΠ²Π°Π΄Ρ€Π°Ρ‚Π΅, ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π²Ρ‹ΡˆΠ΅ ΠΎΠ΄Π½ΠΎΠΉ ΠΈΠ· Π΄ΠΈΠ°Π³ΠΎΠ½Π°Π»Π΅ΠΉ ΠΏΡ€ΠΈΠ½Π°Π΄Π»Π΅ΠΆΠ°Ρ‚ классу 0, Π½ΠΈΠΆΠ΅ – классу 1, для Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΈΡΠΏΠΎΠ»ΡŒΠ·ΡƒΠ΅Ρ‚ΡΡ логистичСская рСгрСссия (см. рис. 7). Π’ случаС, ΠΊΠΎΠ³Π΄Π° Ρ€Π΅ΡˆΠ΅Π½ΠΈΠ΅ зависит Ρ‚ΠΎΠ»ΡŒΠΊΠΎ ΠΎΡ‚ ΠΎΠ΄Π½ΠΎΠ³ΠΎ ΠΏΡ€ΠΈΠ·Π½Π°ΠΊΠ° (ΠΏΡ€ΠΈ Π²Ρ‚ΠΎΡ€ΠΎΠΌ коэффициСнт Ρ€Π°Π²Π΅Π½ Π½ΡƒΠ»ΡŽ), ΠΏΠΎΠ»ΡƒΡ‡Π°Π΅ΠΌ ΠΊΠ°ΠΊ Ρ€Π°Π· ΡΠΈΡ‚ΡƒΠ°Ρ†ΠΈΡŽ, ΠΎΠΏΠΈΡΠ°Π½Π½ΡƒΡŽ Π² нашСй Π·Π°Π΄Π°Ρ‡Π΅.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 6. РаспрСдСлСния Π² модСльной Π·Π°Π΄Π°Ρ‡Π΅. ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 7. МодСльная Π·Π°Π΄Π°Ρ‡Π° (ΠΏΠΎΠΊΠ°Π·Π°Π½Π° лишь ΠΏΠΎΠ΄Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°).

Π—Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ TPR ΠΏΡ€ΠΈ Π²Ρ‹Π±ΠΎΡ€Π΅ ΠΏΠΎΡ€ΠΎΠ³Π° Π±ΠΈΠ½Π°Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ Ρ€Π°Π²Π½ΠΎ ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ, ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΡ‘Π½Π½ΠΎΠΉ Π½Π° рис. 6 (Ρ†Π΅Π½Ρ‚Ρ€), Π° FPR – ΠΏΠ»ΠΎΡ‰Π°Π΄ΠΈ, ΠΈΠ·ΠΎΠ±Ρ€Π°ΠΆΡ‘Π½Π½ΠΎΠΉ Π½Π° рис. 6 (справа), Ρ‚.Π΅.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая
ΠŸΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈΡ‡Π΅ΡΠΊΠΎΠ΅ ΡƒΡ€Π°Π²Π½Π΅Π½ΠΈΠ΅ для ROC-ΠΊΡ€ΠΈΠ²ΠΎΠΉ ΠΏΠΎΠ»ΡƒΡ‡Π΅Π½ΠΎ, ΠΌΠΎΠΆΠ½ΠΎ ΡƒΠΆΠ΅ сразу Π²Ρ‹Ρ‡ΠΈΡΠ»ΠΈΡ‚ΡŒ ΠΏΠ»ΠΎΡ‰Π°Π΄ΡŒ ΠΏΠΎΠ΄ Π½Π΅ΠΉ:
ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая
Но Ссли Π’Ρ‹ Π½Π΅ Π»ΡŽΠ±ΠΈΡ‚Π΅ ΠΏΠ°Ρ€Π°ΠΌΠ΅Ρ‚Ρ€ΠΈΡ‡Π΅ΡΠΊΡƒΡŽ запись, Π»Π΅Π³ΠΊΠΎ ΠΏΠΎΠ»ΡƒΡ‡ΠΈΡ‚ΡŒ:

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая
Π—Π°ΠΌΠ΅Ρ‚ΠΈΠΌ, Ρ‡Ρ‚ΠΎ максимальная Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒ достигаСтся ΠΏΡ€ΠΈ ΠΏΠΎΡ€ΠΎΠ³Π΅ Π±ΠΈΠ½Π°Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ 0.5 (ΠΏΠΎΡ‡Π΅ΠΌΡƒ?), ΠΈ ΠΎΠ½Π° Ρ€Π°Π²Π½Π° 3/4 = 0.75 (Ρ‡Ρ‚ΠΎ Π½Π΅ каТСтся ΠΎΡ‡Π΅Π½ΡŒ большой). Π­Ρ‚ΠΎ частая ситуация: AUC ROC сущСствСнно Π²Ρ‹ΡˆΠ΅ максимальной достиТимой точности (accuracy)!

ΠšΡΡ‚Π°Ρ‚ΠΈ, AUC ROC Π±ΠΈΠ½Π°Ρ€ΠΈΠ·ΠΎΠ²Π°Π½Π½ΠΎΠ³ΠΎ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ (ΠΏΡ€ΠΈ ΠΏΠΎΡ€ΠΎΠ³Π΅ Π±ΠΈΠ½Π°Ρ€ΠΈΠ·Π°Ρ†ΠΈΠΈ 0.5) Ρ€Π°Π²Π½Π° 0.75! ΠŸΠΎΠ΄ΡƒΠΌΠ°ΠΉΡ‚Π΅, ΠΏΠΎΡ‡Π΅ΠΌΡƒ это Π·Π½Π°Ρ‡Π΅Π½ΠΈΠ΅ совпало с Ρ‚ΠΎΡ‡Π½ΠΎΡΡ‚ΡŒΡŽ?

Π’ Ρ‚Π°ΠΊΠΎΠΉ Β«Π½Π΅ΠΏΡ€Π΅Ρ€Ρ‹Π²Π½ΠΎΠΉΒ» постановкС Π·Π°Π΄Π°Ρ‡ΠΈ (ΠΊΠΎΠ³Π΄Π° ΠΎΠ±ΡŠΠ΅ΠΊΡ‚Ρ‹ Π΄Π²ΡƒΡ… классов ΠΎΠΏΠΈΡΡ‹Π²Π°ΡŽΡ‚ΡΡ плотностями) AUC ROC ΠΈΠΌΠ΅Π΅Ρ‚ вСроятностный смысл: это Π²Π΅Ρ€ΠΎΡΡ‚Π½ΠΎΡΡ‚ΡŒ Ρ‚ΠΎΠ³ΠΎ, Ρ‡Ρ‚ΠΎ случайно взятый ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 1 ΠΈΠΌΠ΅Π΅Ρ‚ ΠΎΡ†Π΅Π½ΠΊΡƒ принадлСТности ΠΊ классу 1 Π²Ρ‹ΡˆΠ΅, Ρ‡Π΅ΠΌ случайно взятый ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ класса 0.

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая

Для нашСй модСльной Π·Π°Π΄Π°Ρ‡ΠΈ ΠΌΠΎΠΆΠ½ΠΎ провСсти нСсколько экспСримСнтов: Π²Π·ΡΡ‚ΡŒ ΠΊΠΎΠ½Π΅Ρ‡Π½Ρ‹Π΅ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ Ρ€Π°Π·Π½ΠΎΠΉ мощности с ΡƒΠΊΠ°Π·Π°Π½Π½Ρ‹ΠΌΠΈ распрСдСлСниями. На рис. 8 ΠΏΠΎΠΊΠ°Π·Π°Π½Ρ‹ значСния AUC ROC Π² Ρ‚Π°ΠΊΠΈΡ… экспСримСнтах: всС ΠΎΠ½ΠΈ распрСдСлСны ΠΎΠΊΠΎΠ»ΠΎ тСорСтичСского значСния 5/6, Π½ΠΎ разброс достаточно Π²Π΅Π»ΠΈΠΊ для Π½Π΅Π±ΠΎΠ»ΡŒΡˆΠΈΡ… Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ. Π—Π°ΠΏΠΎΠΌΠ½ΠΈΡ‚Π΅: для ΠΎΡ†Π΅Π½ΠΊΠΈ AUC ROC Π²Ρ‹Π±ΠΎΡ€ΠΊΠ° Π² нСсколько сотСн ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² ΠΌΠ°Π»Π°!

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 8. Π’Π°Ρ€ΡŒΠΈΡ€ΠΎΠ²Π°Π½ΠΈΠ΅ AUC ROC Π² экспСримСнтах.

Π’Π°ΠΊΠΆΠ΅ ΠΏΠΎΠ»Π΅Π·Π½ΠΎ ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ, ΠΊΠ°ΠΊ выглядят ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅ Π² Π½Π°ΡˆΠΈΡ… экспСримСнтах. ЕстСствСнно, ΠΏΡ€ΠΈ ΡƒΠ²Π΅Π»ΠΈΡ‡Π΅Π½ΠΈΠΈ ΠΎΠ±ΡŠΡ‘ΠΌΠ° Π²Ρ‹Π±ΠΎΡ€ΠΎΠΊ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅, построСнныС ΠΏΠΎ Π²Ρ‹Π±ΠΎΡ€ΠΊΠ°ΠΌ, Π±ΡƒΠ΄ΡƒΡ‚ ΡΡ…ΠΎΠ΄ΠΈΡ‚ΡŒΡΡ ΠΊ тСорСтичСской ΠΊΡ€ΠΈΠ²ΠΎΠΉ (построСнной для распрСдСлСний).

ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Ρ„ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π‘ΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ ΠΊΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΡƒ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. ΠšΠ°Ρ€Ρ‚ΠΈΠ½ΠΊΠ° ΠΏΡ€ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc кривая. Π€ΠΎΡ‚ΠΎ ΠΊΠ°ΠΊΠΈΠ΅ Ρ€Π΅ΡˆΠ΅Π½ΠΈΡ ΠΏΠΎΠΌΠΎΠ³Π°Π΅Ρ‚ ΠΏΡ€ΠΈΠ½ΡΡ‚ΡŒ roc криваяРис. 9. ROC-ΠΊΡ€ΠΈΠ²Ρ‹Π΅ Π² экспСримСнтах.

Π—Π°ΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅
Π˜Π½Ρ‚Π΅Ρ€Π΅ΡΠ½ΠΎ, Ρ‡Ρ‚ΠΎ Π² рассмотрСнной Π·Π°Π΄Π°Ρ‡Π΅ исходныС Π΄Π°Π½Π½Ρ‹Π΅ Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹ (Π½Π°ΠΏΡ€ΠΈΠΌΠ΅Ρ€, плотности – Π»ΠΈΠ½Π΅ΠΉΠ½Ρ‹Π΅ Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠΈ), Π° ΠΎΡ‚Π²Π΅Ρ‚ (ROC-кривая) нСлинСйная (ΠΈ Π΄Π°ΠΆΠ΅ нСполиномиальная) функция!

Π—Π°ΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅
ΠŸΠΎΡ‡Π΅ΠΌΡƒ-Ρ‚ΠΎ ΠΌΠ½ΠΎΠ³ΠΈΠ΅ ΡΡ‡ΠΈΡ‚Π°ΡŽΡ‚, Ρ‡Ρ‚ΠΎ ROC-кривая всСгда являСтся ступСнчатой Ρ„ΡƒΠ½ΠΊΡ†ΠΈΠ΅ΠΉ – лишь ΠΏΡ€ΠΈ построСнии Π΅Ρ‘ для ΠΊΠΎΠ½Π΅Ρ‡Π½ΠΎΠΉ Π²Ρ‹Π±ΠΎΡ€ΠΊΠΈ, Π² ΠΊΠΎΡ‚ΠΎΡ€ΠΎΠΉ Π½Π΅Ρ‚ ΠΎΠ±ΡŠΠ΅ΠΊΡ‚ΠΎΠ² с ΠΎΠ΄ΠΈΠ½Π°ΠΊΠΎΠ²Ρ‹ΠΌΠΈ ΠΎΡ†Π΅Π½ΠΊΠ°ΠΌΠΈ. ПолСзно ΠΏΠΎΡΠΌΠΎΡ‚Ρ€Π΅Ρ‚ΡŒ Π½Π° ΠΈΠ½Ρ‚Π΅Ρ€Π°ΠΊΡ‚ΠΈΠ²Π½ΡƒΡŽ Π²ΠΈΠ·ΡƒΠ°Π»ΠΈΠ·Π°Ρ†ΠΈΡŽ ROC-ΠΊΡ€ΠΈΠ²Ρ‹Ρ… для Π½ΠΎΡ€ΠΌΠ°Π»ΡŒΠ½ΠΎ распрСдСлённых классов.

ΠœΠ°ΠΊΡΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΡ AUC ROC Π½Π° ΠΏΡ€Π°ΠΊΡ‚ΠΈΠΊΠ΅

ΠžΠΏΡ‚ΠΈΠΌΠΈΠ·ΠΈΡ€ΠΎΠ²Π°Ρ‚ΡŒ AUC ROC Π½Π°ΠΏΡ€ΡΠΌΡƒΡŽ Π·Π°Ρ‚Ρ€ΡƒΠ΄Π½ΠΈΡ‚Π΅Π»ΡŒΠ½ΠΎ ΠΏΠΎ нСскольким ΠΏΡ€ΠΈΡ‡ΠΈΠ½Π°ΠΌ:

Π•ΡΡ‚ΡŒ нСсколько ΠΏΠΎΠ΄Ρ…ΠΎΠ΄ΠΎΠ² ΠΊ ΠΎΠΏΡ‚ΠΈΠΌΠΈΠ·Π°Ρ†ΠΈΠΈ

ЗамСчания

Gini = 2 Γ—AUC_ROC – 1

Если Π’Ρ‹ Π΄ΠΎΡ‡ΠΈΡ‚Π°Π»ΠΈ Π΄ΠΎ ΠΊΠΎΠ½Ρ†Π° β€” ΠΌΠΎΠΆΠ΅Ρ‚Π΅ ΠΏΠΎΠΏΡ€ΠΎΠ±ΠΎΠ²Π°Ρ‚ΡŒ ΠΏΡ€ΠΎΠΉΡ‚ΠΈ тСст ΠΏΠΎ AUC ROC (авторский, публикуСтся Π²ΠΏΠ΅Ρ€Π²Ρ‹Π΅). Π—Π°Π΄Π°Ρ‡ΠΈ тСста ΠΌΠΎΠΆΠ½ΠΎ ΠΎΠ±ΡΡƒΠΆΠ΄Π°Ρ‚ΡŒ Π² коммСнтариях. Π›ΡŽΠ±Ρ‹Π΅ Π·Π°ΠΌΠ΅Ρ‡Π°Π½ΠΈΠ΅ ΠΏΠΎ тСксту β€” смСло ΠΏΠΈΡˆΠΈΡ‚Π΅!

Π˜ΡΡ‚ΠΎΡ‡Π½ΠΈΠΊ

Π”ΠΎΠ±Π°Π²ΠΈΡ‚ΡŒ ΠΊΠΎΠΌΠΌΠ΅Π½Ρ‚Π°Ρ€ΠΈΠΉ

Π’Π°Ρˆ адрСс email Π½Π΅ Π±ΡƒΠ΄Π΅Ρ‚ ΠΎΠΏΡƒΠ±Π»ΠΈΠΊΠΎΠ²Π°Π½. ΠžΠ±ΡΠ·Π°Ρ‚Π΅Π»ΡŒΠ½Ρ‹Π΅ поля ΠΏΠΎΠΌΠ΅Ρ‡Π΅Π½Ρ‹ *