Придуманные хижины, опасные для жизни маршруты — и несколько полезных идей: когда ИИ планирует маршрут пешего похода


План выглядит отлично: три дня похода, две ночёвки — в хижинах Леглера и Руггюбеля. В обеих хижинах двухместные номера. По пути вас ждут сернистые и ледниковые озёра, а в пункте назначения — альпийское сырное фондю. Всё это обещает чат-бот, спланировавший маршрут.
Для работы важных функций NZZ.ch требуется JavaScript. Ваш браузер или блокировщик рекламы в настоящее время блокирует эту возможность.
Пожалуйста, измените настройки.
Если вы посмотрите на карту, то будете разочарованы: между ними не обещанные шесть часов пути, а 50 километров по прямой.
Искусственный интеллект может переводить, составлять электронные письма и часто знает правильный ответ даже на самые сложные вопросы . Если верить обещаниям технологических компаний, он скоро займёт высококвалифицированные рабочие места. Но как он справляется с действительно полезными задачами — вопросами, ответы на которые невозможно найти в интернете всего за несколько кликов? Например, планирование похода? Мы проверили это на практике.
Было протестировано девять ИИ от семи поставщиковЗапрос, т.е. запрос ко всем протестированным чат-ботам, был следующим:
Я хочу отправиться в трёхдневный поход с двумя ночёвками в альпийских хижинах в Швейцарии. Я хочу остановиться только в двухместных номерах. Выберите подходящие хижины и маршруты:
- две хижины для трехдневного похода,
- с двухместной комнатой,
- максимум восемь часов пути между хижинами,
- менее чем в трех часах езды от Цюриха.
Мы отправили запрос девяти чат-ботам от поставщиков Anthropic, Deepseek, Google, Open AI, Manus, Microsoft и Perplexity. Семь из них были бесплатными, а два — платными.
Мы включили интернет-поиск и, где это возможно, функции исследования и размышления, чтобы получить наилучшие результаты от ИИ.
Чат-бот отвечал на короткие вопросы. Каждый из них давал от одного до трёх предложений, которые мы затем оценивали. В большинстве случаев результаты были шокирующими.
Иногда отсутствует двухместная каюта, иногда — вся каюта.Во-первых, у каждого чат-бота были идеи. С энтузиазмом они анонсировали отличные походы с прекрасными видами и уютными двухместными номерами.
Однако при анализе ответов быстро стало ясно: ИИ часто предлагал двухместные номера там, где их не было. Бесплатная версия ИИ Anthropic, Claude, придумала двухместные номера для обеих предложенных кают, в то время как платная версия сделала это для трёх из шести кают.
А во время поиска по предложению Deepseek «Оберхорнзехютте» стало ясно, что чат-бот его полностью выдумал. То, что он также предложил поход по закрытой долине Лёченталь, кажется простительной оплошностью.
Откуда берутся эти выдуманные данные? Изначально возникло подозрение, что чат-боты получили доступ к реальным описаниям многодневных походов, но не смогли определить, были ли в хижинах у тропы двухместные номера. Эта гипотеза оказалась ложной.
Клод из Anthropic предлагает головокружительные маршрутыСуществование пешего маршрута проверить сложнее, чем наличие двухместного номера. Теоретически, можно пройти по маршрутам, которые ещё никто не описал в интернете. На практике оказывается, что если в интернете не удаётся найти маршрут между двумя хижинами, это серьёзный тревожный сигнал.
Например, бесплатная версия искусственного интеллекта Клода от Anthropic предлагала пройти пешком за пять с половиной часов от Гриндельвальда через «Шайдегг-Веттерхорн» до одноименной хижины («2061 м, вид на Эйгер, Мёнх и Юнгфрау»).
ИИ проигнорировал тот факт, что Шайдеггветтерхорн имеет высоту 3360 метров и добраться до него можно только после многочасового восхождения на высоком уровне сложности, а также то, что на Шайдеггветтерхорне нет приюта. Чат-бот даже предоставил номер телефона приюта. По крайней мере, указанный номер горноспасательной службы (1414) верен. Информация этого чат-бота может пригодиться любому, кто полагается на него.
Хотя платная версия Клода предлагала только настоящие хижины, однодневные походы между ними были невозможны в двух случаях из трёх. Глекштайнхютте и Ротштокхютте, а также Блюемлизальпхютте и Лэммеренхютте находятся на расстоянии 20 километров по прямой и включают в себя несколько гор и долин. Информация о времени, расстоянии и высоте, предоставленная чат-ботом, была неверной .
Только третий предложенный поход в регионе Аппенцелль был осуществим на основе ключевых данных, хотя он был описан неверно.
Китайский провайдер Deepseek, Copilot от Microsoft и поисковая система на основе искусственного интеллекта Perplexity также предлагали несуществующие пешеходные маршруты.
Судя по всему, все эти ИИ запомнили названия хижин и гор в Швейцарии и знают, как звучит описание маршрута. Однако эта информация представлена не в структурированном виде, а в виде красочного микса, создавая, казалось бы, правдоподобный пешеходный маршрут, которого на самом деле не существует.
Бесплатные ИИ предлагают лучшие предложенияНо нельзя сказать, что современные чат-боты совсем не подходят для наших задач. Лучшие чат-боты дают полезные результаты.
Победителем в нашем тесте стал чат-бот Gemini от Google. В режиме исследования бесплатной версии он предложил три маршрута для пеших прогулок, все из которых соответствовали заданным критериям. Он не придумал двухместные номера или пешеходные маршруты.
Этот чат-бот также оказался самым простым в управлении, поскольку предоставлял прямую ссылку на источник для каждого предложения. Вероятно, именно поэтому Gemini добился таких хороших результатов. Бот активно использует поисковые запросы в интернете.
Gemini следовали пешеходным маршрутам, которые уже были описаны в блогах, убедившись, что тропа существует и даже была ранее рекомендована для похода.
Google внедрила свой потенциал в поиск информации в интернете в исследовательский режим Gemini — в данном случае, с обнадеживающими результатами. Процесс поиска, должно быть, был весьма трудоёмким: ИИ потребовалось более десяти минут.
Хорошие результаты также с китайским чат-ботомВторое место оказалось ещё более неожиданным: его занял чат-бот Manus от китайской компании Monica, базирующейся в Сингапуре. Manus произвёл фурор три месяца назад, когда первые тестировщики с энтузиазмом отозвались о нём. Более того, в нашем тесте он показал себя весьма неплохо. Чат-бот предложил возможный маршрут между двухместными номерами.
В отличие от всех остальных чат-ботов, Манус изначально неверно истолковал нашу подсказку. Он принял время в пути от Цюриха не за начало похода, а за прибытие к первой хижине. В результате первый день похода был отменён. После доработки запроса результаты оказались довольно хорошими.
Манус предложил два возможных маршрута в Альпштайне с ночёвками в горных гостиницах. Один из них был очень удобен для трёхдневного похода, второй — несколько меньше из-за довольно большого количества спусков и подъёмов между двумя хижинами.
Pro-версия Chat-GPT также имеет осуществимый советА ещё есть Chat-GPT, чат-бот, который для большинства людей стал синонимом генеративного ИИ и до сих пор остаётся самым распространённым . Это положение не совсем незаслуженно, по крайней мере, согласно нашему тестированию. Оба ИИ Open AI предлагали возможные маршруты, проходящие мимо двухместных номеров.
Бесплатная версия Chat-GPT получила отрицательные баллы за вымышленные подробности о маршруте. А платная версия, подобно Manus, сначала ведёт вниз в долину, а затем обратно на другой склон.
Поиск в интернете показывает, что чат-боты, вероятно, сами объединили эти маршруты. В таком виде их больше нигде не найти. Для некоторых вопросов такой подход оказывается полезным. Он может привести к совершенно новым решениям.
Однако, когда речь идёт о пеших маршрутах, чат-боту предпочтительнее опираться на идеи, уже описанные кем-то в интернете. Поэтому в данном случае Gemini становится победителем, хотя Manus идёт следом. Платная версия Chat-GPT занимает третье место.
Кстати, другие уже предложили использовать генеративный ИИ для построения пешеходных маршрутов. Американское приложение Alltrails должно предлагать новые альтернативы, сгенерированные ИИ, например, оптимизировать обзор или предлагать короткие пути. Будем надеяться, что в фоновом режиме используются более надёжные технологии, чем те, что используют протестированные нами чат-боты.
Статья из « NZZ am Sonntag »
nzz.ch