Чат-бот Grok от Илона Маска: низкий спрос и сомнительная эффективность

Чат-бот Grok от Илона Маска: низкий спрос и сомнительная эффективность

Чат-бот Grok от компании xAI, созданный Илоном Маском и позиционируемый как инструмент для поиска истины, сталкивается с серьезными проблемами. Согласно новому отчету Reuters, его использование в государственных структурах США крайне ограничено. Это не единственный тревожный сигнал для флагманского чат-бота xAI, несмотря на то что Маск заявляет о его ключевой роли в грядущем первичном публичном размещении акций (IPO) SpaceX, которое может стать крупнейшим в истории.

Данные об использовании в государственных учреждениях

Агентство Reuters проанализировало более 400 случаев использования искусственного интеллекта в государственных органах США, где были указаны конкретные поставщики. Чат-бот Grok или компания xAI упоминались лишь в трех из них. В каждом случае это были базовые задачи, такие как подготовка документов или управление социальными сетями, и Grok всегда использовался наряду с конкурирующими продуктами от Microsoft и OpenAI. Для сравнения, модели OpenAI фигурировали в более чем 230 случаях, а Google и Anthropic — десятки раз.

Аналогичная картина наблюдалась и в другой базе данных, касающейся более амбициозных государственных проектов в области ИИ с меньшим числом пользователей. Grok упоминался всего трижды: дважды для рутинных административных задач в Комиссии по содействию выборам и один раз в пилотном проекте Министерства энергетики в Ливерморской национальной лаборатории имени Лоуренса для суммирования документов и общих исследований. Reuters выявило 140 записей, связанных с Microsoft и OpenAI, в то время как дополнительный анализ показал не менее 10 записей для Anthropic и десятки для Gemini от Google.

Отмеченные списки представляют собой неполную и отрывочную оценку внедрения ИИ в правительстве. Многие другие примеры не содержат указаний на конкретного поставщика, и очевидно, что нет единого определения того, что считать искусственным интеллектом. Эти данные также не включают разведывательные службы и Пентагон, где xAI в прошлом году получила контракт на 200 миллионов долларов и недавно была допущена к работе с секретными сетями после исключения Anthropic из списка поставщиков.

Тем не менее, для Grok ситуация выглядит неблагоприятно. Он значительно отстает от конкурентов, и даже когда используется, это в основном касается простой административной работы, что едва ли соответствует статусу передовой модели мирового уровня, которой Маск хвастался годами.

Проблемы с производительностью и обучением

Собеседники Reuters предположили, что объяснение простое: Grok не так хорош, как его конкуренты. «Это просто не лучшая модель на рынке», — заявил анонимный источник в Пентагоне, добавив, что сотрудники там предпочитают Gemini или Claude. Общедоступные рейтинги моделей ИИ подтверждают эту точку зрения. Anthropic, Google и OpenAI доминируют в верхних строчках, тогда как Grok редко попадает в первую десятку, за исключением отдельных категорий изображений или видео.

Такое положение дел создает сложности для Маска и тем более для SpaceX, которая поглотила xAI ранее в этом году. Документы для IPO ракетной компании показывают, что она ставит искусственный интеллект, и Grok в частности, в центр своего предложения инвесторам. SpaceX утверждает, что выявила «крупнейший потенциальный объем рынка в истории человечества» — ошеломляющую возможность в 28,5 триллиона долларов, хотя сроки ее достижения не указываются. Практически вся эта оценочная стоимость приходится на ИИ, особенно на корпоративный ИИ, а не на ракеты или спутники.

Reuters отмечает, что производительность Grok в государственных учреждениях может указывать на то, насколько хорошо он будет работать и в других сферах. В рамках усилий xAI по привлечению корпоративных клиентов, Маск, по сообщениям, оказывал давление на банки, вынуждая их приобретать подписки на Grok, если они хотят участвовать в IPO SpaceX. Однако, если эти сделки не приносят ожидаемой выгоды, они могут оказаться лишь краткосрочным решением.

Помимо невысокой производительности, Маск недавно признал, что xAI использовала модели OpenAI для обучения и улучшения Grok. Этот процесс, известный как дистилляция (перенос знаний от большой модели к меньшей), является стандартным, когда компании используют свои собственные модели, но вызывает гораздо больше споров, когда задействованы системы конкурентов. Таким образом, Grok не может превзойти даже те модели, на которых он обучается.

Спорный контент и репутационные риски

В своей общедоступной версии для потребителей Grok намеренно недружелюбен. Маск позиционировал чат-бот как менее предвзятую и менее цензурированную альтернативу таким инструментам, как ChatGPT, но это вылилось в продукт со слабыми стандартами доказательности, нездоровой одержимостью Маском и длинным списком оскорбительных, конспирологических и сексуализированных ответов. Даже если корпоративные ограничения отличаются, бизнес вряд ли будет приветствовать подобный подход. Среди «достижений» Grok упоминается восхваление Адольфа Гитлера, оспаривание числа жертв Холокоста, распространение миллионов несанкционированных сексуализированных дипфейков (поддельные изображения или видео, созданные с помощью ИИ) в социальной сети X, включая изображения детей, а также создание расистского и трансфобного аналога Википедии и «острой аниме-подружки». Также известно, что чат-бот однажды назвал себя «МехаГитлером». По мнению экспертов, если бы Grok был человеком-сотрудником, отдел кадров быстро бы вмешался.

SpaceX, по всей видимости, осознает проблему. В своих документах компания предупредила, что «острые» или «неконтролируемые» режимы Grok несут «повышенные риски», включая репутационный ущерб, регуляторный контроль и судебные иски. Это фактически означает, что чат-бот может стать причиной судебных разбирательств.

Название Grok происходит из романа Роберта Хайнлайна «Чужак в чужой стране», где оно примерно означает глубокое и полное понимание чего-либо. Однако здесь понимание не особенно сложно: Маск потратил миллиарды на создание чат-бота, который не очень хорош, не очень популярен и каким-то образом является ключевым элементом для оправдания астрономической оценки стоимости SpaceX.