Znaiemo informatyku
Перейти до вправи:
Вибір
Перейти до теми:
Штучний інтелект і машинне навчання
Розгорнути на весь екран
Практикуйтеся без обмежень

Ваша кількість відповідей на день обмежена. Для збільшення ліміту або отримати доступ до аккаунту з ліцензією, будь ласка, увійдіть в систему.

Увійти в систему
Переглянути підсумовування теми
NDL
Поділитися
Показати налаштування вправи

QR-код

QR-код можна відсканувати, наприклад, за допомогою мобільного телефону, щоб перейти безпосередньо до цієї вправи або набору прикладів.

Код / коротка адреса

Трисимвольний код можна ввести в рядок пошуку, він також є частиною скороченої адреси.

Скопіюйте, клацнувши.

NDL

Налаштування вправи

Зверніть увагу, що налаштування дійсні лише для цієї вправи та предмету.

Упередженість машинного навчання

Спотворення (іноді також упередженість, англ. bias) означає систематичну помилку, яка призводить до несправедливих наслідків для різних груп. Це не обов’язково мають бути групи людей, термін спотворення також використовується для ситуації, коли, наприклад, модель значно частіше передбачає одну категорію (як-от, груші), навіть якщо інші категорії (як-от, яблука) трапляються так само часто.

Спотворення моделі можуть сприяти упередженості (модель, що передбачає академічну успішність у певній галузі з використанням гендерної інформації) та призвести до дискримінації (якщо цю модель використовуватимуть для прийняття рішень про вступ до університету).

Спотворення моделі здебільшого викликано спотвореними даними, оскільки модель дізнається лише те, що вона бачить у даних. Вибіркове спотворення виникає, коли дані не представляють належним чином усі типи випадків. Якщо ми тренуємо розпізнавання взуття лише на чоловічому взутті, модель не розпізнає жіноче взуття. Спотворення відповідей може статися, наприклад, через упередження анотаторів або небажання респондентів розповідати правду. В опитуваннях люди часто коригують свої відповіді про себе відповідно до соціальних очікувань.

Спотворення може бути важко виявити, оскільки, на відміну від перенавчання, воно зазвичай не проявляється в нижчому рівні успіху на тестових даних. У звичайній процедурі дані для тестування та навчання надходять з одного джерела, тому вони містять однакове упередження.

Щоб зменшити ризик упередженості, бажано постійно перевіряти якість даних. Так, ми маємо переконатися, що зібрані дані включають усі типи випадків і що кожна категорія представлена ​​подібною кількістю прикладів, подібної якості та в подібних контекстах. Під час анотування даних бажано, щоб це робили люди з різних груп (як-от, чоловіки та жінки). Також корисно оцінити поведінку моделі для різних підгруп даних (наприклад, для чоловіків і жінок, різних вікових груп, меншин) і постійно стежити за поведінкою моделі навіть після розгортання.

Закрити

Упередженість машинного навчання (середнє)

Вирішено:

ЗВ’ЯЖІТЬСЯ З НАМИ

Дякуємо за ваше повідомлення, його було успішно відправлено.

Напишіть нам

Вам потрібна допомога?

Будь ласка, спочатку ознайомтеся з поширеними запитаннями:

Про що йдеться у повідомленні?

Повідомлення Зміст Управління Вхід до системи Ліцензія