Newsletter

Машини, які вчаться (також) на наших помилках Ефект бумеранга: ми навчаємо ШІ наших помилок, а він повертає їх нам... примноженими!

ШІ успадковує наші упередження, а потім посилює їх. Ми бачимо упереджені результати - і підсилюємо їх. Цикл самопідживлення. Дослідження UCL: упередженість у розпізнаванні облич, що становила 4,7%, зросла до 11,3% після взаємодії людини і ШІ. У HR кожен цикл збільшує гендерну упередженість на 8-14%. Які хороші новини? Метод "алгоритмічного дзеркала", який показує менеджерам, як би виглядав їхній вибір, якби його зробив штучний інтелект, зменшує упередженість на 41%.

Підсумуйте цю статтю за допомогою ШІ

Деякі нещодавні дослідження висвітлили цікавий феномен: існує "двосторонній" зв'язок між упередженнями, присутніми в моделях штучного інтелекту, і упередженнями людського мислення.

Ця взаємодія створює механізм, який має тенденцію посилювати когнітивні викривлення в обох напрямках.

Це дослідження показує, що системи штучного інтелекту не лише успадковують людські упередження з навчальних даних, але й при впровадженні можуть посилювати їх, впливаючи на процеси прийняття рішень. Це створює цикл, який, якщо ним не керувати належним чином, ризикує поступово посилити початкові упередження.

Це явище особливо помітне у таких важливих секторах, як:

У цих сферах невеликі початкові упередження можуть посилюватися через повторні взаємодії між людьми-операторами та автоматизованими системами, поступово перетворюючись на значні відмінності в результатах.

Витоки упереджень

У людській думці

Людський розум природно використовує "мисленнєві ярлики", які можуть вносити систематичні помилки в наші судження. Теорія "подвійного мислення"розрізняє

  • Швидке та інтуїтивне мислення (схильне до стереотипів)
  • Повільне та рефлексивне мислення (здатне виправляти упередження)

Наприклад, у медицині лікарі схильні надавати занадто великої ваги початковим гіпотезам, нехтуючи протилежними доказами. Це явище, яке називається "упередженням підтвердження", відтворюється і посилюється системами штучного інтелекту, навченими на історичних діагностичних даних.

У моделях штучного інтелекту

Моделі машинного навчання увічнюють упередження переважно трьома шляхами:

  1. Незбалансовані дані про навчання, що відображають історичну нерівність
  2. Вибір характеристик, що включають захищені ознаки (такі як стать або етнічна приналежність)
  3. Петлі зворотного зв'язку, що виникають внаслідок взаємодії з уже спотвореними людськими рішеннями

Один дослідження UCL 2024 року показало, що системи розпізнавання облич, навчені на емоційних судженнях людей, успадкували 4,7-відсоткову тенденцію позначати обличчя як "сумні", а потім посилили цю тенденцію до 11,3 відсотка при подальшій взаємодії з користувачами.

Як вони підсилюють один одного

Аналіз даних рекрутингових платформ показує, що кожен цикл співпраці людини та алгоритму збільшує гендерну упередженість на 8-14% завдяки механізмам зворотного зв'язку, що взаємно підсилюють один одного.

Коли HR-фахівці отримують від ШІ списки кандидатів, на яких вже вплинули історичні упередження, їхня подальша взаємодія (наприклад, вибір питань для співбесіди або оцінювання результатів роботи) посилює упередженість моделі.

Мета-аналіз 47 досліджень, проведений у 2025 році, показав, що три раунди співпраці людини та АІ збільшили демографічні диспропорції в 1,7-2,3 рази в таких сферах, як охорона здоров'я, кредитування та освіта.

Стратегії вимірювання та пом'якшення упереджень

Кількісна оцінка за допомогою машинного навчання

Система вимірювання упереджень, запропонована Донгом та ін. (2024), дозволяє виявляти упередження без потреби в ярликах "абсолютної істини", аналізуючи розбіжності в моделях прийняття рішень між захищеними групами.

Когнітивні втручання

Методика "алгоритмічного дзеркала", розроблена дослідниками UCL, зменшила гендерну упередженість у рішеннях про просування по службі на 41%, показавши менеджерам, як би виглядав їхній історичний вибір, якби він був зроблений системою штучного інтелекту.

Особливо перспективними виявилися навчальні протоколи, які чергують допомогу з боку експерта та самостійне прийняття рішень, що дозволило знизити ефект перенесення упередження з 17% до 6% у клінічних діагностичних дослідженнях.

Наслідки для суспільства

Організації, які впроваджують системи штучного інтелекту без урахування взаємодії з людськими упередженнями, стикаються з підвищеними юридичними та операційними ризиками.

Аналіз справ про дискримінацію на робочому місці показує, що процеси найму за допомогою ШІ збільшують шанси позивачів на успіх на 28% порівняно з традиційними справами, які ведуть люди, оскільки сліди алгоритмічних рішень надають чіткіші докази неспівмірного впливу.

На шляху до штучного інтелекту, який поважає свободу та ефективність

Взаємозв'язок між алгоритмічними викривленнями та обмеженням свободи вибору вимагає від нас переосмислення технологічного розвитку з точки зору індивідуальної відповідальності та забезпечення ефективності ринку. Вкрай важливо, щоб ШІ став інструментом розширення можливостей, а не їх обмеження.

Перспективні напрямки включають:

  • Ринкові рішення, які стимулюють розробку неупереджених алгоритмів
  • Більша прозорість в автоматизованих процесах прийняття рішень
  • Дерегуляція сприяє конкуренції між різними технологічними рішеннями

Лише завдяки відповідальному саморегулюванню галузі в поєднанні зі свободою вибору для користувачів ми можемо гарантувати, що технологічні інновації і надалі залишатимуться рушієм процвітання та можливостей для всіх тих, хто готовий випробувати свої навички.

Ресурси для розвитку бізнесу

9 листопада 2025 року

Ілюзія розуму: дебати, які стрясають світ штучного інтелекту

Apple публікує дві розгромні статті - "GSM-Symbolic" (жовтень 2024) та "The Illusion of Thinking" (червень 2025), які демонструють, як LLM не справляється з невеликими варіаціями класичних задач (Ханойська вежа, переправа через річку): "продуктивність знижується, коли змінюються лише числові значення". Нульовий успіх на складній Ханойській вежі. Але Алекс Лоусен (Open Philanthropy) заперечує "Ілюзією мислення", демонструючи невдалу методологію: невдачі були пов'язані з обмеженнями на виведення символів, а не з колапсом міркувань, автоматичні скрипти неправильно класифікували частково правильні результати, деякі головоломки були математично нерозв'язними. Повторюючи тести з рекурсивними функціями замість того, щоб перераховувати ходи, Claude/Gemini/GPT розгадали 15 рекордів Ханойської вежі. Гері Маркус приймає тезу Apple про "зміну розподілу", але стаття про хронометраж до WWDC піднімає стратегічні питання. Наслідки для бізнесу: наскільки можна довіряти ШІ у вирішенні критично важливих завдань? Рішення: нейросимволічні підходи - нейронні мережі для розпізнавання образів + мова, символьні системи для формальної логіки. Приклад: АІ-бухгалтерія розуміє "скільки витрат на відрядження?", але SQL/розрахунки/податковий аудит = детермінований код.
9 листопада 2025 року

Tech Talk: Коли ШІ розробляє свої секретні мови

У той час як 61% людей вже насторожено ставляться до ШІ, який розуміє, у лютому 2025 року Gibberlink набрав 15 мільйонів переглядів, показавши дещо радикально нове: двох ШІ, які перестають говорити англійською і спілкуються за допомогою високочастотних звуків на частоті 1875-4500 Гц, незрозумілих для людини. Це не наукова фантастика, а протокол FSK, який підвищує продуктивність на 80%, підриваючи статтю 13 Закону ЄС про ШІ і створюючи дворівневу непрозорість: незбагненні алгоритми, що координують свої дії на нерозбірливих мовах. Наука показує, що ми можемо вивчити машинні протоколи (наприклад, азбуку Морзе зі швидкістю 20-40 слів на хвилину), але ми стикаємося з непереборними біологічними обмеженнями: 126 біт/с у людини проти понад Мбіт/с у машини. З'являються три нові професії - аналітик протоколів ШІ, аудитор комунікацій ШІ, дизайнер інтерфейсів ШІ-людина - в той час як IBM, Google і Anthropic розробляють стандарти (ACP, A2A, MCP), щоб уникнути остаточного "чорного ящика". Рішення, прийняті сьогодні щодо протоколів зв'язку ШІ, визначатимуть траєкторію розвитку штучного інтелекту на десятиліття вперед.