Минулого року на ринку прогнозів щодо результату президентських виборів у Венесуелі було укладено контрактів на понад 6 мільйонів доларів. Однак після підрахунку голосів ринок зіткнувся з неможливою ситуацією: уряд оголосив переможцем Ніколаса Мадуро, а опозиція та міжнародні спостерігачі заявили про фальсифікації. Чи мала резолюція контракту спиратися на «офіційну інформацію» (перемога Мадуро) чи на «консенсус достовірних джерел» (перемога опозиції)?
У випадку виборів у Венесуелі спостерігачі стверджували про ігнорування правил, про те, що учасники «втратили свої кошти», а також описували протокол вирішення спірних контрактів як «суддя, присяжний і кат» у політичній драмі з високими ставками, а ще називали його «серйозно сфальсифікованим».
Це не поодинокий інцидент. Це симптом одного з найбільших викликів для масштабування ринків прогнозів — резолюції контрактів.
Ставки тут високі. Якщо резолюція працює коректно, ринку довіряють, на ньому хочуть торгувати, і ціни стають важливими сигналами для суспільства. Якщо механізм резолюції неефективний, торгівля стає фрустрованою та непередбачуваною. Учасники можуть залишати ринок, ліквідність зникає, а ціни перестають відображати точні прогнози. Замість цього вони відображають незрозумілу суміш реальної ймовірності події та очікувань трейдерів щодо того, як спотворений механізм резолюції ухвалить рішення.
Суперечка щодо Венесуели була досить публічною, але менш помітні збої трапляються регулярно на багатьох платформах:
У цій статті я аналізую, як поєднання LLM і криптотехнологій може допомогти створити масштабовані механізми резолюції ринків прогнозів, які важко маніпулювати, які є точними, прозорими та справді нейтральними.
Схожі проблеми тривалий час існували й на фінансових ринках. Міжнародна асоціація свопів і деривативів (ISDA) роками намагалася вирішити питання резолюції на ринку кредитних дефолтних свопів — контрактів, що виплачуються у разі дефолту компанії чи країни, — і її огляд за 2024 рік відверто описує ці труднощі. Їхні комітети з визначення, що складаються з основних учасників ринку, голосують щодо того, чи відбулася кредитна подія. Але процес критикували за непрозорість, конфлікти інтересів і непослідовність — як і процес UMA.
Проблема незмінна: коли великі суми залежать від визначення того, що сталося в неоднозначній ситуації, кожен механізм резолюції стає мішенню для маніпуляцій, а кожна неоднозначність — потенційною точкою конфлікту.
Яким має бути якісний механізм резолюції?
Життєздатне рішення має одночасно відповідати низці ключових властивостей.
Стійкість до маніпуляцій. Якщо зловмисники можуть впливати на резолюцію — редагуючи Вікіпедію, створюючи фейкові новини, підкуповуючи оракулів чи використовуючи лазівки — ринок перетворюється на змагання у маніпуляціях, а не у прогнозуванні.
Розумна точність. Механізм має забезпечувати правильне вирішення більшості контрактів у більшості випадків. Абсолютна точність неможлива у світі неоднозначності, але системні помилки чи очевидні збої руйнують довіру.
Ex ante прозорість. Трейдери мають розуміти, як працюватиме механізм резолюції, ще до здійснення ставок. Зміна правил у процесі порушує базову угоду між платформою і користувачем.
Достовірна нейтральність. Учасники повинні вірити, що механізм не віддає перевагу жодному трейдеру чи результату. Саме тому вирішення контрактів великими власниками UMA, які самі робили ставки, є проблемним: навіть за чесних дій виникає конфлікт інтересів, що підриває довіру.
Людські комітети можуть задовольнити частину цих вимог, але їм важко забезпечити стійкість до маніпуляцій і нейтральність у масштабі. Системи голосування на основі токенів, як UMA, мають проблеми з домінуванням великих гравців і конфліктами інтересів.
Тут на сцену виходить штучний інтелект.
Останнім часом у колах ринків прогнозів набирає популярності ідея використовувати великі мовні моделі як суддів резолюції, із фіксацією конкретної моделі та запиту у блокчейні під час створення контракту.
Базова архітектура виглядає так: під час створення контракту маркетмейкер визначає не лише критерії резолюції природною мовою, а й конкретну LLM (ідентифіковану за версією моделі з міткою часу) і чіткий запит, який буде використано для визначення результату.
Ця специфікація криптографічно фіксується у блокчейні. Коли відкривається торгівля, учасники можуть перевірити весь механізм резолюції — вони точно знають, яка AI-модель оцінюватиме результат, який запит вона отримає і якими джерелами інформації скористається.
Якщо учасників не влаштовують умови, вони не торгують.
Під час резолюції зафіксована LLM працює із зафіксованим запитом, використовує зазначені джерела інформації й видає рішення. Його результат визначає, хто отримає виплату.
Такий підхід вирішує кілька ключових обмежень одночасно:
Висока стійкість до маніпуляцій (хоч і не абсолютна). На відміну від сторінки Вікіпедії чи другорядного новинного сайту, змінити результати великої LLM неможливо. Ваги моделі фіксуються на момент створення. Щоб маніпулювати резолюцією, зловмиснику доведеться або змінити інформаційні джерела моделі, або вплинути на її навчальні дані задовго до цього — обидва варіанти значно дорожчі й менш передбачувані, ніж підкуп оракула чи редагування карти.
Забезпечує точність. Моделі швидко вдосконалюються, особливо коли можуть шукати нову інформацію в Інтернеті, тому LLM-судді можуть точно вирішувати багато ринків — і зараз тривають експерименти щодо їхньої точності.
Вбудована прозорість. Увесь механізм резолюції видно та можна перевірити до здійснення ставки. Жодних змін правил під час гри, жодних дискреційних рішень чи неформальних домовленостей. Ви точно знаєте, на що погоджуєтеся.
Значно підвищує нейтральність. LLM не має фінансової зацікавленості у результаті, її не можна підкупити, вона не володіє UMA-токенами. Усі її можливі упередження — властивість самої моделі, а не зацікавлених сторін.
Звісно, LLM-судді мають свої обмеження, які я розгляну нижче.
Моделі можуть помилятися. LLM може неправильно трактувати новину, вигадати факт або застосувати критерії резолюції непослідовно. Але якщо трейдери знають, із якою моделлю працюють, вони можуть врахувати її особливості у ставках. Якщо певна модель має тенденцію вирішувати неоднозначні випадки певним чином, досвідчені трейдери це врахують. Модель не повинна бути ідеальною — вона має бути передбачуваною.
Маніпуляції не неможливі, але складніші. Якщо у запиті вказані конкретні джерела новин, зловмисники можуть намагатися розмістити там потрібні матеріали. Це дорого для провідних ЗМІ, але потенційно можливо для менш відомих — проблема редагування карти у новому вигляді. Тут критично важливий дизайн запиту: механізми резолюції, що спираються на різноманітні, дубльовані джерела, стійкіші за ті, що залежать від одного джерела.
Теоретично можливі атаки через навчальні дані. Зловмисник із достатніми ресурсами може намагатися вплинути на навчальні дані LLM, щоб упередити майбутні рішення. Але це потребує дій задовго до контракту, із невизначеними вигодами і значними витратами — значно складніше, ніж підкупити члена комітету.
Множинність LLM-суддів створює проблеми координації. Якщо різні творці ринків фіксують різні LLM із різними запитами, ліквідність розпорошується. Трейдерам складно порівнювати контракти чи агрегувати інформацію між ринками. Важливо стандартизувати підходи, але також дозволяти ринку визначати найкращі комбінації LLM і запитів. Ймовірно, потрібен компроміс: експериментувати, але створювати механізми для поступового переходу спільноти до перевірених стандартів.
Підсумовуючи: рішення на основі ШІ фактично змінює один набір проблем (людські упередження, конфлікти інтересів, непрозорість) на інший (обмеження моделей, складність створення запитів, уразливість джерел інформації), які можуть бути простішими для вирішення. Як діяти далі? Платформи мають:
Експериментувати, тестуючи LLM-рішення на контрактах із низькими ставками, щоб напрацювати досвід. Які моделі працюють найкраще? Які структури запитів найбільш надійні? Які помилки виникають на практиці?
Стандартизувати. У міру появи кращих практик спільнота має працювати над уніфікованими комбінаціями LLM і запитів, які можуть стати стандартом. Це не виключає інновацій, але сприяє концентрації ліквідності на добре зрозумілих ринках.
Створювати інструменти прозорості, наприклад інтерфейси, які дозволяють трейдерам легко перевіряти весь механізм резолюції — модель, запит, джерела інформації — до торгівлі. Резолюція не повинна бути прихована у примітках.
Проводити постійне управління. Навіть із ШІ-суддями потрібні метарішення: які моделі обирати, як діяти у випадках явно хибних відповідей моделей, коли оновлювати стандарти. Мета — не повністю виключити людину, а перевести її роль із ситуативного прийняття рішень до встановлення системних правил.
Ринки прогнозів мають колосальний потенціал для розуміння складного світу. Але цей потенціал залежить від довіри, а довіра — від справедливої резолюції контрактів. Ми бачили, що буває, коли механізми резолюції не працюють: плутанина, обурення, відхід трейдерів. Я спостерігав, як люди залишали ринки прогнозів після того, як відчували себе обдуреними результатом, що суперечив суті їхньої ставки, — відмовляючись від платформ, якими раніше користувалися. Це втрата можливості розкрити переваги та ширші застосування ринків прогнозів.
LLM-судді не ідеальні. Але у поєднанні з криптотехнологіями вони забезпечують прозорість, нейтральність і стійкість до маніпуляцій, які переслідували системи з людським фактором. У світі, де ринки прогнозів масштабуються швидше, ніж механізми управління, це може бути саме тим, що потрібно.





