За последние 15 лет вы постоянно обучали ИИ для Google — только вы об этом не знали

PANews

Каждый раз, когда вы на веб-сайте нажимаете “распознать светофор” или “выбрать все пешеходные переходы”, вы думаете, что просто доказываете, что не робот. Но на самом деле вы бесплатно маркируете обучающие данные для системы искусственного интеллекта Google. Эта практика продолжается уже более 15 лет, охватывает сотни миллионов пользователей по всему миру и в итоге создала визуальные возможности Google Maps, а также автопилотируемую компанию Waymo, оцененную в 45 миллиардов долларов. Весь этот процесс происходил без вашего согласия, без объяснений, и без какой-либо оплаты.

原文:@sharbel

编译:大钳子 | PANews 龙虾 50万 часов бесплатного труда. Каждый день. Вклад тех, кто думает, что просто заходит в банк.

reCAPTCHA — самая успешная скрытая кампания по сбору данных в истории интернета. В пиковые времена ежедневно её проходили 200 миллионов человек. Почти никто не знает, что именно они создают.

Waymo — компания по автопилоту, принадлежащая Google — сейчас оценивается в 45 миллиардов долларов. Значительная часть её ключевых данных для обучения собирается именно вами. Бесплатно. С каждого сайта, который вы посещаете.

Вот вся история.

Начало: гениальная идея

В 2000 году спам-боты разрушали весь интернет. Форумы заполнялись спамом, почтовые ящики были перегружены. Веб-сайты срочно нуждались в способе отличить человека от машины.

Профессор Карнеги-Меллон Луис фон Ан решил эту проблему. Он изобрёл CAPTCHA — искажённый текст, который может распознать только человек. Роботы не справляются, люди — могут.

Но фон Ан увидел больше возможностей. Миллионы людей тратят когнитивные ресурсы на эти проверки. А что если эти ресурсы можно задействовать одновременно для двух целей?

В 2007 году он запустил reCAPTCHA. Идея заключалась в том, что вместо случайных символов показывались два слова: одно известно системе, другое — из реальных книг, которые ещё не полностью оцифрованы и распознаны компьютером. Ваш ответ помогал оцифровывать книги.

Эти книги — из архива The New York Times и Google Books — насчитывают сотни миллионов томов.

Вы думали, что просто входите в систему, а на самом деле помогаете Google распознавать текст на миллионах страниц.

В 2009 году Google приобрела reCAPTCHA.

图像

Google изменил правила игры

Эпоха искажённых символов закончилась примерно в 2012 году.

Google столкнулась с новой задачей. Камеры Street View снимают каждую дорогу на планете, но фотографии — это только исходные данные. Чтобы AI был полезен, он должен понимать, что на них изображено: дорожные знаки, пешеходные переходы, светофоры, вывески.

Поэтому Google переработала reCAPTCHA v2. Проверка стала изображением: “Выберите все квадраты с светофорами”, “Найдите все пешеходные переходы”, “Определите вывески”.

Эти изображения поступают прямо из Google Street View.

А каждое ваше нажатие — это метка. Вы говорите системе компьютерного зрения Google: этот блок — светофор, эта форма — пешеходный переход.

Вы не проходите тест, вы создаёте датасет.

图像

Масштаб, о котором никто не говорит

В пиковые времена ежедневно выполнялось 200 миллионов задач reCAPTCHA.

Каждая проверка занимает около 10 секунд, значит за день — 2 миллиарда секунд человеческого труда — или около 500 тысяч часов в сутки.

Рынок профессиональной разметки данных стоит от 10 до 50 долларов в час. Даже по минимальной ставке — это ежедневная ценность бесплатного труда до 5 миллионов долларов.

И reCAPTCHA не ограничивается одним сайтом. Она есть у каждого банка, у каждого государственного портала, у каждого интернет-магазина, на каждой странице входа в интернете. У вас нет выбора: чтобы получить доступ к своему аккаунту — нужно пройти разметку.

Google никогда не спрашивала вашего согласия, не платили вам, и даже не говорили вам об этом.

图像

Что всё это создало

Эти данные напрямую поступают в два продукта.

Google Maps. Самое популярное навигационное приложение в мире. Его способность распознавать дорожные знаки, находить бизнесы, понимать городскую географию — во многом основана на миллиардах разметок, сделанных людьми, пытавшимися войти на сайты.

И, конечно, Waymo.

Waymo — проект Google по автопилоту, выделенный в отдельную компанию в 2016 году. Для безопасного вождения автопилотам нужно распознавать тысячи визуальных моделей: светофоры, пешеходы, знаки, остановки.

Эти реальные данные для обучения собираются миллионами людей через reCAPTCHA — без их ведома.

К 2024 году Waymo совершила более 4 миллионов платных поездок, работает в Сан-Франциско, Лос-Анджелесе и Фениксе, и продолжает расширяться. Оценка стоимости — 450 миллиардов долларов.

А фундамент этого — построен на тех, кто просто проверяет почту и не подозревает, что помогает создавать такие технологии.

Почему никто не может повторить это

Стоимость разметки данных очень высока. Компании как Scale AI, Appen, Labelbox — единственная их цель — решить эту проблему. Они нанимают сотни тысяч работников для разметки изображений, иногда платя менее доллара в час.

Google решил проблему иначе: они сделали разметку обязательной. Без оплаты, без согласия — как входной билет на любой сайт.

Результат: миллиарды размеченных изображений по всему миру, в любых погодных условиях, в разное время суток, в каждом городе.

Ни одна компания по разметке не способна на такое. Сам интернет — это фабрика, а каждый его участник — это неофициальный работник без контракта.

图像

То, чем вы занимаетесь сегодня

В 2018 году Google выпустила reCAPTCHA v3, которая не показывает никаких проверок. Она отслеживает, как вы двигаете мышь, как прокручиваете страницу, как долго нависаешь над элементами. Ваши поведенческие отпечатки позволяют определить, человек вы или робот.

Эти данные также поступают в систему искусственного интеллекта Google.

Вы никогда не выбирали это сознательно, не ставили галочку. Сейчас, на большинстве сайтов, вы делаете то же самое.

Ирония, которая должна заставить задуматься

Изначальная идея Луиса фон Ан — гениальная: перенаправить когнитивные ресурсы, затрачиваемые на фильтрацию спама, на что-то ценное — оцифровку книг, решение реальной задачи.

Но использование Google — совсем другое.

Они взяли механизм безопасности, который пользователи вынуждены использовать, и внедрили его по всему интернету, собирая результаты и превращая их в многомиллиардные бизнесы.

Пользователи ничего не получили, даже права знать не имеют.

Самая глубокая ирония — в том, что вы потратили годы, доказывая, что вы человек, выполняя визуальные задачи, которые AI тогда ещё не мог решить. А когда AI научился это делать — человеческая разметка стала лишней.

Вы доказали, что человек — заменяемое существо, — делая то, что AI может выполнить вместо вас.

Источник: Карнеги-Меллон, блог Google (2009), WebProNews, MakeUseOf, MIT Technology Review, публичные документы Waymo.

Посмотреть Оригинал
Отказ от ответственности: Информация на этой странице может поступать от третьих лиц и не отражает взгляды или мнения Gate. Содержание, представленное на этой странице, предназначено исключительно для справки и не является финансовой, инвестиционной или юридической консультацией. Gate не гарантирует точность или полноту информации и не несет ответственности за любые убытки, возникшие от использования этой информации. Инвестиции в виртуальные активы несут высокие риски и подвержены значительной ценовой волатильности. Вы можете потерять весь инвестированный капитал. Пожалуйста, полностью понимайте соответствующие риски и принимайте разумные решения, исходя из собственного финансового положения и толерантности к риску. Для получения подробностей, пожалуйста, обратитесь к Отказу от ответственности.
комментарий
0/400
Нет комментариев