Newsletter

Машини, які вчаться (також) на наших помилках Ефект бумеранга: ми навчаємо ШІ наших помилок, а він повертає їх нам... примноженими!

ШІ успадковує наші упередження, а потім посилює їх. Ми бачимо упереджені результати - і підсилюємо їх. Цикл самопідживлення. Дослідження UCL: упередженість у розпізнаванні облич, що становила 4,7%, зросла до 11,3% після взаємодії людини і ШІ. У HR кожен цикл збільшує гендерну упередженість на 8-14%. Які хороші новини? Метод "алгоритмічного дзеркала", який показує менеджерам, як би виглядав їхній вибір, якби його зробив штучний інтелект, зменшує упередженість на 41%.

Підсумуйте цю статтю за допомогою ШІ

Деякі нещодавні дослідження висвітлили цікавий феномен: існує "двосторонній" зв'язок між упередженнями, присутніми в моделях штучного інтелекту, і упередженнями людського мислення.

Ця взаємодія створює механізм, який має тенденцію посилювати когнітивні викривлення в обох напрямках.

Це дослідження показує, що системи штучного інтелекту не лише успадковують людські упередження з навчальних даних, але й при впровадженні можуть посилювати їх, впливаючи на процеси прийняття рішень. Це створює цикл, який, якщо ним не керувати належним чином, ризикує поступово посилити початкові упередження.

Це явище особливо помітне у таких важливих секторах, як:

У цих сферах невеликі початкові упередження можуть посилюватися через повторні взаємодії між людьми-операторами та автоматизованими системами, поступово перетворюючись на значні відмінності в результатах.

Витоки упереджень

У людській думці

Людський розум природно використовує "мисленнєві ярлики", які можуть вносити систематичні помилки в наші судження. Теорія "подвійного мислення"розрізняє

  • Швидке та інтуїтивне мислення (схильне до стереотипів)
  • Повільне та рефлексивне мислення (здатне виправляти упередження)

Наприклад, у медицині лікарі схильні надавати занадто великої ваги початковим гіпотезам, нехтуючи протилежними доказами. Це явище, яке називається "упередженням підтвердження", відтворюється і посилюється системами штучного інтелекту, навченими на історичних діагностичних даних.

У моделях штучного інтелекту

Моделі машинного навчання увічнюють упередження переважно трьома шляхами:

  1. Незбалансовані дані про навчання, що відображають історичну нерівність
  2. Вибір характеристик, що включають захищені ознаки (такі як стать або етнічна приналежність)
  3. Петлі зворотного зв'язку, що виникають внаслідок взаємодії з уже спотвореними людськими рішеннями

Один дослідження UCL 2024 року показало, що системи розпізнавання облич, навчені на емоційних судженнях людей, успадкували 4,7-відсоткову тенденцію позначати обличчя як "сумні", а потім посилили цю тенденцію до 11,3 відсотка при подальшій взаємодії з користувачами.

Як вони підсилюють один одного

Аналіз даних рекрутингових платформ показує, що кожен цикл співпраці людини та алгоритму збільшує гендерну упередженість на 8-14% завдяки механізмам зворотного зв'язку, що взаємно підсилюють один одного.

Коли HR-фахівці отримують від ШІ списки кандидатів, на яких вже вплинули історичні упередження, їхня подальша взаємодія (наприклад, вибір питань для співбесіди або оцінювання результатів роботи) посилює упередженість моделі.

Мета-аналіз 47 досліджень, проведений у 2025 році, показав, що три раунди співпраці людини та АІ збільшили демографічні диспропорції в 1,7-2,3 рази в таких сферах, як охорона здоров'я, кредитування та освіта.

Стратегії вимірювання та пом'якшення упереджень

Кількісна оцінка за допомогою машинного навчання

Система вимірювання упереджень, запропонована Донгом та ін. (2024), дозволяє виявляти упередження без потреби в ярликах "абсолютної істини", аналізуючи розбіжності в моделях прийняття рішень між захищеними групами.

Когнітивні втручання

Методика "алгоритмічного дзеркала", розроблена дослідниками UCL, зменшила гендерну упередженість у рішеннях про просування по службі на 41%, показавши менеджерам, як би виглядав їхній історичний вибір, якби він був зроблений системою штучного інтелекту.

Особливо перспективними виявилися навчальні протоколи, які чергують допомогу з боку експерта та самостійне прийняття рішень, що дозволило знизити ефект перенесення упередження з 17% до 6% у клінічних діагностичних дослідженнях.

Наслідки для суспільства

Організації, які впроваджують системи штучного інтелекту без урахування взаємодії з людськими упередженнями, стикаються з підвищеними юридичними та операційними ризиками.

Аналіз справ про дискримінацію на робочому місці показує, що процеси найму за допомогою ШІ збільшують шанси позивачів на успіх на 28% порівняно з традиційними справами, які ведуть люди, оскільки сліди алгоритмічних рішень надають чіткіші докази неспівмірного впливу.

На шляху до штучного інтелекту, який поважає свободу та ефективність

Взаємозв'язок між алгоритмічними викривленнями та обмеженням свободи вибору вимагає від нас переосмислення технологічного розвитку з точки зору індивідуальної відповідальності та забезпечення ефективності ринку. Вкрай важливо, щоб ШІ став інструментом розширення можливостей, а не їх обмеження.

Перспективні напрямки включають:

  • Ринкові рішення, які стимулюють розробку неупереджених алгоритмів
  • Більша прозорість в автоматизованих процесах прийняття рішень
  • Дерегуляція сприяє конкуренції між різними технологічними рішеннями

Лише завдяки відповідальному саморегулюванню галузі в поєднанні зі свободою вибору для користувачів ми можемо гарантувати, що технологічні інновації і надалі залишатимуться рушієм процвітання та можливостей для всіх тих, хто готовий випробувати свої навички.

Ресурси для розвитку бізнесу

9 листопада 2025 року

Чому математика - це складно (навіть якщо ви штучний інтелект)

Мовні моделі не вміють множити і запам'ятовувати результати так, як ми запам'ятовуємо число пі, але це не робить їх математиками. Проблема структурна: вони навчаються за статистичною схожістю, а не за алгоритмічним розумінням. Навіть нові "моделі мислення", такі як o1, не справляються з тривіальними завданнями: вони правильно рахують "r" у слові "полуниця" після декількох секунд обробки, але не можуть написати абзац, де друга буква кожного речення складає слово. Преміум-версія за 200 доларів на місяць витрачає чотири хвилини на те, що дитина робить миттєво. DeepSeek і Mistral у 2025 році все ще неправильно рахують літери. Яке рішення з'являється? Гібридний підхід - найрозумніші моделі з'ясували, коли потрібно викликати справжній калькулятор, а не намагатися обчислити самостійно. Зміна парадигми: ШІ не повинен знати, як робити все, а лише організувати правильні інструменти. Останній парадокс: GPT-4 може блискуче пояснити вам теорію меж, але неправильно виконує множення, які кишеньковий калькулятор завжди виконує правильно. Для навчання математики вони чудові - пояснюють з безмежним терпінням, адаптують приклади, розбивають складні міркування. Для точних розрахунків? Точно на калькулятор, а не на штучний інтелект.
9 листопада 2025 року

Регулювання штучного інтелекту для споживчих додатків: як підготуватися до нових правил 2025 року

2025 рік знаменує собою кінець ери "Дикого Заходу" для ШІ: Закон ЄС про ШІ набув чинності в серпні 2024 року, зобов'язання щодо ШІ-грамотності - з 2 лютого 2025 року, управління та GPAI - з 2 серпня. Каліфорнійські першопрохідці з SB 243 (народився після самогубства Сьюелла Сетцера, 14-річного підлітка, який розвинув емоційні стосунки з чат-ботом) накладають заборону на системи нав'язливої винагороди, виявлення суїцидальних думок, нагадування кожні 3 години "Я не людина", незалежний громадський аудит, штрафи в розмірі $1 000 за порушення. SB 420 вимагає проведення оцінки впливу "автоматизованих рішень з високим рівнем ризику" з правом на оскарження з боку людини. Реальне правозастосування: Noom назвав 2022 рік для ботів, які видавали себе за тренерів-людей, виплативши 56 мільйонів доларів. Національна тенденція: Алабама, Гаваї, Іллінойс, Мен, Массачусетс класифікують неповідомлення чат-ботів зі штучним інтелектом як порушення UDAP. Трирівневий підхід до критично важливих систем (охорона здоров'я/транспорт/енергетика): сертифікація перед розгортанням, прозоре розкриття інформації для споживачів, реєстрація загального призначення + тестування безпеки. Регуляторна клаптикова ковдра без федеральних преференцій: компанії з різних штатів повинні орієнтуватися у змінних вимогах. ЄС з серпня 2026 року: інформувати користувачів про взаємодію зі штучним інтелектом, якщо вона не очевидна, вміст, створений штучним інтелектом, має бути позначений як машинозчитуваний.