тест Тьюринга и искусственный интеллект 10 17

Пексели/Google Deepmind, CC BY-SA

В 1950 году британский учёный-компьютерщик Алан Тьюринг предложил экспериментальный метод ответа на вопрос: могут ли машины думать? Он предположил, что если человек после пяти минут допроса не сможет определить, разговаривает ли он с машиной с искусственным интеллектом (ИИ) или с другим человеком, это продемонстрирует, что ИИ обладает интеллектом, подобным человеческому.

Хотя системы искусственного интеллекта еще далеки от прохождения теста Тьюринга при его жизни, он предположил, что

«[…] примерно через пятьдесят лет можно будет запрограммировать компьютеры […] так, чтобы заставить их играть в имитационную игру настолько хорошо, что средний следователь будет иметь не более 70% шансов сделать правильное опознание после пяти минут допрос.

Сегодня, спустя более 70 лет после предложения Тьюринга, ни одному ИИ не удалось успешно пройти испытание, выполнив изложенные им конкретные условия. Тем не менее, как некоторые заголовки отражать, несколько систем подошли довольно близко.

Один недавний эксперимент протестировал три крупные языковые модели, включая GPT-4 (технологию искусственного интеллекта, лежащую в основе ChatGPT). Участники потратили две минуты на общение либо с другим человеком, либо с системой искусственного интеллекта. ИИ предлагалось допускать небольшие орфографические ошибки и прекращать работу, если тестер становился слишком агрессивным.


графика подписки внутри себя


Благодаря этой подсказке ИИ хорошо справился с задачей обмануть тестировщиков. В сочетании с ботом с искусственным интеллектом тестировщики могли только правильно угадать, разговаривают ли они с системой искусственного интеллекта, только в 60% случаев.

Учитывая быстрый прогресс, достигнутый в разработке систем обработки естественного языка, мы можем увидеть, как ИИ пройдет первоначальный тест Тьюринга в течение следующих нескольких лет.

Но действительно ли подражание людям является эффективной проверкой интеллекта? А если нет, то какие альтернативные критерии мы могли бы использовать для измерения возможностей ИИ?

Ограничения теста Тьюринга

Хотя система, проходящая тест Тьюринга, дает нам некоторые доказательства того, что он разумен, этот тест не является решающим тестом интеллекта. Одна из проблем заключается в том, что он может давать «ложноотрицательные результаты».

Сегодняшние большие языковые модели часто создаются так, чтобы сразу заявить, что они не являются людьми. Например, когда вы задаете вопрос ChatGPT, он часто предваряет свой ответ фразой «как языковая модель искусственного интеллекта». Даже если системы искусственного интеллекта имеют базовую способность пройти тест Тьюринга, такого рода программирование перекрывает эту способность.

Тест также рискует получить определенные виды «ложных срабатываний». Как философ Нед Блок отметил, В статье 1981 года предположительно система могла бы пройти тест Тьюринга, просто будучи жестко запрограммированной с человеческой реакцией на любой возможный ввод.

Помимо этого, тест Тьюринга фокусируется, в частности, на человеческом познании. Если познание ИИ отличается от познания человека, эксперт-дознаватель сможет найти задачу, в которой ИИ и люди различаются по производительности.

По поводу этой проблемы Тьюринг писал:

Это возражение очень сильное, но, по крайней мере, мы можем сказать, что, если тем не менее можно сконструировать машину, которая будет удовлетворительно вести игру в имитацию, нам не нужно беспокоиться об этом возражении.

Другими словами, хотя прохождение теста Тьюринга является хорошим доказательством того, что система разумна, его провал не является хорошим доказательством того, что система разумна. не умный.

Более того, этот тест не является хорошим показателем того, обладают ли ИИ сознанием, могут ли они чувствовать боль и удовольствие или имеют ли они моральное значение. По мнению многих ученых-когнитивистов, сознание включает в себя определенный набор умственных способностей, в том числе рабочую память, мысли высшего порядка, а также способность воспринимать окружающую среду и моделировать, как тело движется вокруг нее.

Тест Тьюринга не отвечает на вопрос, являются ли системы искусственного интеллекта есть эти способности.

Растущие возможности ИИ

Тест Тьюринга основан на определенной логике. То есть: люди разумны, поэтому все, что может эффективно имитировать людей, скорее всего, будет разумным.

Но эта идея ничего не говорит нам о природе интеллекта. Другой способ измерения интеллекта ИИ предполагает более критическое рассмотрение того, что такое интеллект.

В настоящее время не существует единого теста, который мог бы достоверно измерить искусственный или человеческий интеллект.

В самом широком смысле мы можем рассматривать интеллект как способность для достижения различных целей в различных условиях. Более интеллектуальные системы — это те, которые могут достигать более широкого круга целей в более широком диапазоне сред.

Таким образом, лучший способ отслеживать достижения в разработке систем искусственного интеллекта общего назначения — это оценивать их производительность при выполнении различных задач. Исследователи машинного обучения разработали ряд тестов, которые позволяют сделать это.

Например, GPT-4 был способен правильно ответить 86% вопросов на понимание языка в условиях многозадачности — эталон, измеряющий успеваемость в тестах с несколькими вариантами ответов по ряду академических предметов на уровне колледжа.

Он также получил положительные оценки в АгентБенч, инструмент, который может измерить способность большой языковой модели вести себя как агент, например, просматривая Интернет, покупая товары в Интернете и соревнуясь в играх.

Актуален ли тест Тьюринга?

Тест Тьюринга — это мера имитации — способности ИИ моделировать человеческое поведение. Большие языковые модели являются опытными имитаторами, что теперь отражается на их способности пройти тест Тьюринга. Но интеллект — это не то же самое, что подражание.

Существует столько типов интеллекта, сколько существует целей, которых необходимо достичь. Лучший способ понять интеллект ИИ — следить за его прогрессом в развитии ряда важных возможностей.

В то же время важно, чтобы мы не продолжали «менять цели», когда дело доходит до вопроса о том, разумен ли ИИ. Поскольку возможности искусственного интеллекта быстро улучшаются, критики идеи искусственного интеллекта постоянно находят новые задачи, которые системы искусственного интеллекта могут с трудом выполнить, но обнаруживают, что они перепрыгнули через них. еще одно препятствие.

В этой ситуации актуальный вопрос не в том, являются ли системы искусственного интеллекта интеллектуальными, а, точнее, в том, какие виды интеллекта, который они могут иметь.Беседа

Саймон Гольдштейн, доцент Института философии Дианойи Австралийского католического университета, Католический университет Австралии и Кэмерон Доменико Кирк-Джаннини, Доцент философии, Rutgers University

Эта статья переиздана из Беседа под лицензией Creative Commons. Прочтите оригинал статьи.