Сейчас активно обсуждается новость, что Amazon отказался от системы Just Walk Out ("Взял и иди"), которая была введена в более чем половине магазинов сети Amazon Fresh. Предполагалось, что эта технология позволит производить оплату с помощью искусственного интеллекта (ИИ): покупателю достаточно взять нужные товары и уйти, а оборудованные в помещениях датчики считают их продуктовую корзину и спишут стоимость покупок со счёта. Как оказалось, система не была полностью автоматизирована, и в ней были задействованы более 1000 низкооплачиваемых сотрудников из Индии. Они просматривали записи камер наблюдения и проверяли, выставлялись ли покупателям корректные чеки. При этом некоторые покупатели все равно жаловались на то, что счета приходили с большим опозданием или в них были указаны неточные суммы.
Несмотря на сенсационность новости, нельзя сказать, что случившееся — совсем уж неординарное событие. Аналитики фонда MMC Ventures еще в 2019 году в ходе исследования пришли к выводу, что около 40% европейских ИИ-стартапов на самом деле его не используют. В частности, в некоторых компания на самом деле вместо ИИ всю или основную часть работы выполняли люди. Примеры этого можно найти в России, и за рубежом.
ИИ-стартап, который занимается переводом 2D-изображений в 3D-модели. Как признавалась Константина Псома, основательница компании, все началось с того, что, она во время учебы в университете занималась моделированием одного из соборов Бристоля. Консультируясь с игровыми студиями насчет трудностей, которые она испытала во время выполнения этого проекта, Псоме пришла идея создать инструмент, который бы помогал разработчикам с моделированием трехмерных объектов. Так появился Kaedim — ИИ, задействующий алгоритмы машинного обучения для превращения 2D-изображений в 3D-модели. Стартап казался крайне перспективным, а его основательница даже попала в список Forbes "30 до 30” в 2023 году.
Тем не менее были сомнения насчет того, действительно ли в Kaedim задействуется ИИ. Так, летом 2022 года на сайте компании в требованиях к вакансиям для 3D-художников на фрилансе было указано, что кандидаты должны "создавать низкокачественные 3D-модели из 2D-изображений в течение 15 минут после получения запроса". Осенью следующего года издание 404 Media провело расследование, которое подтвердило, что для генерации 3D-моделей использовался дешевый человеческий труд. Журналисты выяснили, что в действительности компания нанимала 3D-художников по всему миру, чтобы они вместо ИИ в режиме 24/7 создавали изображения. Им платили за одну модель от 1 до 4 долларов. После выхода расследования стартап буквально за несколько часов провел ребрендинг сайта, и там появились упоминания, что Kaedim сочетает машинное обучение и труд команды художников для создания 3D-моделей.
Основанный еще в 2008 году в Массачусетском технологическом институте стартап предоставляет решение Presto Voice — голосовой ИИ-ассистент, который может принимать заказы у посетителей заведений общественного питания практически без вмешательства человека. Эта технология используется в таких крупных сетях фаст-фуда, как Carl's Jr., Hardee's, Del Taco и Checkers. Несмотря на заверения Presto Automation Inc о том, что они являются "лидером в области автоматизации голосового управления”, в действительности оказалось, что около 70% заказов, принимаемых через Presto Voice, обрабатываются также людьми. В частности, с Филиппин. Компания объяснила участие "сторонних агентов” тем, что они помогают проверять, не дает ли ИИ сбоев. В результате в отношении стартапа началось расследование со стороны Комиссии по ценным бумагам и биржам США, и компания начала позиционировать человеческий фактор как один из компонентов своей работы. Стоит отметить, что одним из ранних инвесторов стартапа был Сэм Альтман, генеральный директор OpenAI.
Резидент Сколково занимается созданием систем на базе нейронных сетей и машинного обучения для оцифровки изображений. На сайте "Биорга” (ИНН 7724396261) указано, что решения компании позволяют автоматизировать обработку юридических и бухгалтерских документов, распознавать паспорта, заявления, удостоверения. В сервисе Beorg Smart Vision над распознаванием документов трудится не только ИИ, но и люди. Внешние сотрудники работают на краудсорсинговой платформе этой компании: они используются для автоматизации ввода бухгалтерских документов и персональных данных из паспортов, анкет, верифицируют и набирают текст на своих компьютерах за вознаграждение.
С одной стороны, "Биорг” не скрывает, что у него работают более 50 000 операторов по всей стране. С другой — непонятно, что в процессе ввода данных делает ИИ, а что люди. К компании были иски от заказчиков о неисполнении или ненадлежащем исполнении обязательств по договорам оказания услуг, где для ввода данных из документов применяется двойной операторский ввод. Такой иск к компании "Биорг" (ИНН 7725682434, переименована 12.11.2021 в ООО "Новые Технологии") был предъявлен и удовлетворен от ЗАГС Воронежской области. Учредителем обоих "Биоргов” является Георгий Зуев.
Генеральный директор "Биорг" Руслан Алигаджиев убеждает, что люди в его сервисе необходимы для обучения нейросетей в задачах, где ИИ испытывает проблемы (методика human-in-the-loop — HITL). К таким задачам он относит и распознавание паспорта РФ и говорит, что за ввод паспортных данных людям платят не столько же, сколько за ввод данных на редких языках. На сайте краудсорсинговой платформы Биорга указано, что она запущена в 2017 году. Это означает, что компании за 7 лет не удалось добиться такого качества распознавания у ИИ, чтобы отказаться от привлечения краудсорсеров даже для ввода данных из паспортов, водительских прав и СНИЛС.
Схожую ситуацию можно обнаружить у другого резидента Сколково — платформы Dbrain. Эта компания тоже предоставляет клиентам сервис для распознавания паспортов и обработки первичных бухгалтерских документов. При этом стартап заявляет, что использует платформу Яндекс. Толока (отзыв от генерального директора Dbrain Алексея Хахунова есть на сайте) для аналогичных с "Биоргом” целей — сторонние операторы вбивают данные с картинки и проверяют, корректно ли ИИ распознал документы. В Dbrain говорят, что также используют подход Human-in-the-loop (человек-в-контуре). Эта технология обычно используется для машинного обучения, но в данном случае ее приспособили для ввода данных с изображений документов. Об этом говорит то, что у работников Яндекс. Толоки (толокистов) при выполнении заданий стоят серьезные ограничения по времени на ручной ввод данных, чтобы клиент ждал как можно меньше. Отделить работу ИИ и облачного оператора при отправке документов в этот сервис тоже нельзя.
Почему же компании завышают, а порой откровенно лгут о доли ИИ в своих продуктах? Прежде всего, важную роль играет популярность определенных направлений у инвесторов. Как следует из доклада MMC Ventures, стартапы, которые заявляют о работе с ИИ, привлекают на 15-50% больше средств, чем в традиционные компании-разработчики программного обеспечения. Это приводит в том числе к ситуациям, когда бизнесмены сознательно приписывают своим программам то, что они пока не умеют, надеясь в будущем с помощью инвестиций дополнить недостающий функционал.
Когда речь идет о сервисах, где вместо или вместе с ИИ работают люди, важно иметь в виду, чем конкретно занимается этот сервис. Одно дело, когда операторы ищут на картинках котиков, товары в корзине или оценивают тональность отзывов. Но совсем другое дело, когда в такой сервис компании отправляют важную информацию о своей деятельности (например, договора или модели продукции) или изображения с персданными своих клиентов, думая, что с этой информацией будет работать исключительно машина.
И перед инвесторами стоит задача не только найти перспективный стартап в области ИИ, но и убедиться, что ИИ в нем действительно есть. Если ИИ-сервис сильно зависит от людей, то это может ограничивать возможности масштабирования проекта и привести также к репутационным рискам. Очень точно про это говорит управляющий партнер Blossom Capital Офелия Браун:
"Есть разные уровни сложности, когда речь идет о создании этих алгоритмов, и многие раздувают информацию о том, что они якобы делают. Это зона ответственности инвестора — провести экспертизу деятельности компании… но многие фирмы не могут сделать это".
Здесь остается только посоветовать действовать согласно одной известной русской поговорке — "доверяй, но проверяй”.