Shutterstock/Valentyn640

В 1956 году, во время годовой поездки в Лондон, когда ему было чуть больше 20, математик и биолог-теоретик Джек Д. Коуэн посетил Уилфреда Тейлора и его странную новую «обучающая машина». По прибытии он был сбит с толку стоявшим перед ним «огромным набором аппаратуры». Коуэн мог только стоять в стороне и смотреть, как «машина делает свое дело». Судя по всему, он выполнял «схему ассоциативной памяти» — похоже, он был способен научиться находить связи и извлекать данные.

Возможно, это выглядело как неуклюжие блоки схем, спаянные вручную в массу проводов и коробок, но то, что стал свидетелем Коуэна, было ранней аналоговой формой нейронной сети – предшественником самого совершенного искусственного интеллекта современности, включая много обсуждалось ChatGPT с его способностью генерировать письменный контент в ответ практически на любую команду. Базовой технологией ChatGPT является нейронная сеть.

Когда Коуэн и Тейлор стояли и наблюдали за работой машины, они понятия не имели, как именно она справляется с этой задачей. Ответ на загадку машинного мозга Тейлора можно найти где-то в его «аналоговых нейронах», в ассоциациях, создаваемых его машинной памятью, и, что наиболее важно, в том факте, что его автоматизированное функционирование на самом деле не может быть полностью объяснено. Этим системам потребуются десятилетия, чтобы найти свое предназначение и раскрыть эту мощь.

Термин «нейронная сеть» включает в себя широкий спектр систем, но централизованно. согласно IBMЭти «нейронные сети, также известные как искусственные нейронные сети (ИНС) или моделируемые нейронные сети (SNN), представляют собой подмножество машинного обучения и лежат в основе алгоритмов глубокого обучения». Важно отметить, что сам термин, его форма и «структура вдохновлены человеческим мозгом, имитируя способ передачи сигналов друг другу биологическими нейронами».

Возможно, на начальных этапах существовали некоторые остаточные сомнения в их ценности, но с течением времени мода на ИИ твердо перешла в сторону нейронных сетей. Сейчас их часто понимают как будущее искусственного интеллекта. Они имеют большое значение для нас и для того, что значит быть человеком. Мы слышали отголоски этих опасений в последнее время с призывами приостановить новые разработки в области ИИ на шестимесячный период, чтобы обеспечить уверенность в их последствиях.


графика подписки внутри себя


Конечно, было бы ошибкой считать, что нейронная сеть предназначена исключительно для блестящих, привлекательных новых гаджетов. Они уже прочно вошли в нашу жизнь. Некоторые из них сильны в своей практичности. Еще в 1989 году группа под руководством Яна Лекуна из AT&T Bell Laboratories использовала методы обратного распространения ошибки для обучения системы распознавать рукописные почтовые индексы. Недавняя объявление Microsoft тот факт, что поисковые запросы Bing будут осуществляться с помощью искусственного интеллекта, что сделает его вашим «вторым пилотом в Интернете», иллюстрирует, как вещи, которые мы обнаруживаем и как мы их понимаем, будут все больше становиться продуктом такого типа автоматизации.

Опираясь на обширные данные для поиска закономерностей, ИИ аналогичным образом можно научить выполнять такие задачи, как быстрое распознавание изображений, в результате чего они будут включены в распознавания лиц, например. Эта способность идентифицировать закономерности привела к появлению многих других приложений, таких как прогнозирование фондовых рынков.

Нейронные сети также меняют то, как мы интерпретируем и общаемся. Разработано компанией с интересным названием Мозговая команда Google, Google Translate, — еще одно известное применение нейронной сети.

Вы также не захотите играть с ним в шахматы или сёги. Их понимание правил, память стратегий и всех записанных ходов означает, что они исключительно хороши в играх (хотя ChatGPT, похоже, борьба с Wordle). Системы, которые беспокоят игроков в го (го – общеизвестно сложная стратегическая настольная игра) и шахматных гроссмейстеров, сделанный из нейронных сетей.

Но их сфера действия выходит далеко за рамки этих случаев и продолжает расширяться. Поиск патентов, ограниченный только упоминанием точной фразы «нейронные сети», дает 135,828 XNUMX результатов. В условиях такого быстрого и продолжающегося расширения шансы на то, что мы сможем полностью объяснить влияние ИИ, могут стать еще меньше. Вот вопросы, которые я изучал в своем исследовании. и моя новая книга об алгоритмическом мышлении.

Таинственные слои «непознаваемости»

Оглядываясь назад на историю нейронных сетей, мы можем сказать что-то важное об автоматизированных решениях, определяющих наше настоящее, или о тех, которые, возможно, окажут более глубокое влияние в будущем. Их присутствие также говорит нам о том, что со временем мы, скорее всего, будем понимать решения и влияние ИИ еще меньше. Эти системы — не просто черные ящики, это не просто скрытые части системы, которые нельзя увидеть или понять.

Это нечто иное, коренящееся в целях и конструкции самих этих систем. Существует давняя погоня за необъяснимым. Чем более непрозрачна, тем более аутентичной и продвинутой считается система. Речь идет не только об усложнении систем или контроле над интеллектуальной собственностью, ограничивающем доступ (хотя они являются его частью). Вместо этого я хочу сказать, что движущая ими идеология имеет особый и заложенный интерес к «непознаваемости». Тайна закодирована даже в самой форме и дискурсе нейронной сети. Они состоят из глубоко сложенных слоев (отсюда и термин «глубокое обучение»), и внутри этих глубин находятся еще более загадочно звучащие «скрытые слои». Тайны этих систем скрываются глубоко под поверхностью.

Есть большая вероятность, что чем большее влияние искусственный интеллект окажет на нашу жизнь, тем меньше мы будем понимать, как и почему. Сегодня наблюдается сильный толчок развитию ИИ, и это вполне объяснимо. Мы хотим знать, как это работает и как приходит к решениям и результатам. ЕС настолько обеспокоен потенциально «неприемлемыми рисками» и даже «опасными» приложениями, что в настоящее время продвигает новый закон об искусственном интеллекте призван установить «глобальный стандарт» для «разработки безопасного, заслуживающего доверия и этического искусственного интеллекта».

Эти новые законы будут основаны на необходимости объяснимости, требуя, чтобы «Для систем ИИ с высоким уровнем риска требования к высококачественным данным, документации и отслеживаемости, прозрачности, человеческому надзору, точности и надежности строго необходимы для снижения рисков для фундаментальных прав и безопасности, создаваемых ИИ». Речь идет не только о таких вещах, как беспилотные автомобили (хотя системы, обеспечивающие безопасность, попадают в категорию искусственного интеллекта с высоким уровнем риска в ЕС), это также вызывает беспокойство по поводу того, что в будущем появятся системы, которые будут иметь последствия для прав человека.

Это часть более широких призывов к прозрачности ИИ, чтобы его деятельность можно было проверять, проверять и оценивать. Другим примером может служить организация Королевского общества. политический брифинг по объяснимому ИИ в котором они отмечают, что «политические дебаты во всем мире все чаще звучат призывы к той или иной форме объяснимости ИИ как части усилий по внедрению этических принципов в проектирование и развертывание систем с поддержкой ИИ».

Но история нейронных сетей говорит нам, что в будущем мы, скорее всего, отойдём от этой цели, а не приблизимся к ней.

Вдохновлен человеческим мозгом

Эти нейронные сети могут быть сложными системами, но у них есть некоторые основные принципы. Вдохновленные человеческим мозгом, они стремятся копировать или моделировать формы биологического и человеческого мышления. По конструкции и дизайну они таковы, как IBM также объясняет, состоящий из «слоев узлов, содержащих входной слой, один или несколько скрытых слоев и выходной слой». При этом «каждый узел или искусственный нейрон соединяется с другим». Поскольку для создания результатов им требуются входные данные и информация, они «полагаются на обучающие данные, чтобы учиться и со временем повышать свою точность». Эти технические детали имеют значение, но не менее важно и желание смоделировать эти системы на основе сложного человеческого мозга.

Понимание амбиций, стоящих за этими системами, имеет жизненно важное значение для понимания того, что эти технические детали стали означать на практике. В 1993 интервьюУченый по нейронным сетям Теуво Кохонен пришел к выводу, что «самоорганизующаяся» система «это моя мечта», действующая «что-то вроде того, что наша нервная система делает инстинктивно». В качестве примера Кохонен представил, как «самоорганизующаяся» система, система, которая сама себя контролирует и управляет, «может использоваться в качестве панели мониторинга для любой машины… в каждом самолете, реактивном самолете, или на каждой атомной электростанции, или в каждом машина". Это, по его мнению, будет означать, что в будущем «можно сразу увидеть, в каком состоянии находится система».

Главной целью было создание системы, способной адаптироваться к окружающей среде. Оно будет мгновенным и автономным, действуя по принципу нервной системы. Это была мечта – иметь системы, которые могли бы справляться сами с собой без особого вмешательства человека. Сложности и неизвестность мозга, нервной системы и реального мира вскоре стали основой разработки и проектирования нейронных сетей.

«Что-то в этом подозрительное»

Но вернемся в 1956 год и к этой странной обучающейся машине. Именно практический подход, который Тейлор применил при ее создании, сразу привлек внимание Коуэна. Он явно потел над сборкой деталей. Тейлор, Коуэн заметил во время интервью со своей стороны в рассказе об этих системах «не делал этого по теории и не делал на компьютере». Вместо этого, имея в руках инструменты, он «фактически создал аппаратное обеспечение». Это была материальная вещь, комбинация частей, возможно, даже хитроумное изобретение. И это было «все сделано с помощью аналоговых схем», и Тейлору, как отмечает Коуэн, потребовалось «несколько лет, чтобы построить это и поиграть с ним». Случай проб и ошибок.

Понятно, что Коуэн хотел разобраться в том, что он видел. Он пытался заставить Тейлора объяснить ему эту обучающуюся машину. Разъяснения не пришли. Коуэн не смог заставить Тейлора описать ему, как это работает. Аналоговые нейроны оставались загадкой. Более удивительной проблемой, по мнению Коуэна, было то, что Тейлор «сам не понимал, что происходит». Это был не просто кратковременный разрыв общения между двумя учеными разных специальностей, это было нечто большее.

В одном из интервью середины 1990-х годовВспоминая машину Тейлора, Коуэн обнаружил, что «по сей день в опубликованных статьях вы не можете до конца понять, как она работает». Этот вывод наводит на мысль о том, что неизвестное глубоко укоренилось в нейронных сетях. Необъяснимость этих нейронных систем присутствовала даже на фундаментальных стадиях развития, насчитывающих почти семь десятилетий.

Эта загадка остается и сегодня, и ее можно найти в развивающихся формах ИИ. Непостижимость функционирования ассоциаций, создаваемых машиной Тейлора, заставила Коуэна задуматься, нет ли в этом «чего-то подозрительного».

Длинные и запутанные корни

Коуэн вернулся к своему краткому визиту к Тейлору, когда несколько лет спустя его спросили о том, как восприняли его собственную работу. В 1960-е годы люди, по мнению Коуэна, «немного не спешили понимать смысл аналоговых нейронных сетей». И это несмотря на то, вспоминает Коуэн, что работа Тейлора 1950-х годов над «ассоциативной памятью» была основана на «аналоговых нейронах». Лауреат Нобелевской премии по нейронным системам, Леон Н. Купер заключил что разработки, связанные с применением модели мозга в 1960-х годах, считались «одной из глубоких загадок». Из-за этой неопределенности оставался скептицизм относительно того, чего может достичь нейронная сеть. Но постепенно ситуация начала меняться.

Около 30 лет назад нейробиолог Уолтер Дж. Фриман был удивлензамечательный» диапазона применений, которые были найдены для нейронных сетей, уже комментировал тот факт, что он не рассматривает их как «принципиально новый вид машин». Они развивались медленно: сначала появлялись технологии, а затем находили для них последующие применения. Это потребовало времени. Действительно, чтобы найти корни технологии нейронных сетей, мы могли бы отправиться даже дальше, чем визит Коуэна к загадочной машине Тейлора.

Ученый по нейронным сетям Джеймс Андерсон и научный журналист Эдвард Розенфельд отметили что история нейронных сетей восходит к 1940-м годам и к некоторым ранним попыткам, как они описывают, «понять нервную систему человека и построить искусственные системы, которые действуют так же, как мы, хотя бы немного». Итак, в 1940-х годах загадки человеческой нервной системы стали также загадками вычислительного мышления и искусственного интеллекта.

Подводя итог этой длинной истории, автор компьютерных наук Ларри Хардести отметил что глубокое обучение в форме нейронных сетей «входит и выходит из моды уже более 70 лет». В частности, добавляет он, эти «нейронные сети были впервые предложены в 1944 году Уорреном Маккалоком и Уолтером Питтсом, двумя исследователями из Чикагского университета, которые перешли в Массачусетский технологический институт в 1952 году в качестве основателей того, что иногда называют первым отделом когнитивных наук».

В другом месте, 1943 иногда эта дата считается первым годом внедрения технологии. В любом случае, в течение примерно 70 лет отчеты показывают, что нейронные сети то входили, то выходили из моды, часто ими пренебрегали, но иногда они закреплялись и переходили в более распространенные приложения и дискуссии. Неопределенность сохранялась. Эти первые разработчики часто описывают важность своих исследований как упущенную из виду, пока они не нашли свою цель часто годы, а иногда и десятилетия спустя.

Переходя от 1960-х к концу 1970-х годов, мы можем найти новые истории о неизвестных свойствах этих систем. Даже тогда, спустя три десятилетия, нейронной сети еще предстояло найти смысл. Дэвид Румельхарт, который имел опыт работы в области психологии и был соавтором ряда книг, опубликованных в 1986 году, которые позже снова привлекли внимание к нейронным сетям, обнаружил, что участвует в разработке нейронных сетей. со своим коллегой Джеем Макклелландом.

Помимо того, что они были коллегами, они также недавно встретились на конференции в Миннесоте, где доклад Румельхарта о «понимании истории» вызвал некоторую дискуссию среди делегатов.

После этой конференции Макклелланд вернулся с мыслью о том, как разработать нейронную сеть, которая могла бы объединять модели, чтобы сделать их более интерактивными. Здесь важно то, Воспоминания Румельхарта о «часах, часах и часах работы на компьютере».

Мы сели и проделали все это в компьютере и построили эти компьютерные модели, но мы их просто не понимали. Мы не понимали, почему они работали или почему они не работали, и что в них было критического.

Как и Тейлор, Румельхарт начал возиться с системой. Они тоже создали функционирующую нейронную сеть и, что особенно важно, не были уверены, как и почему она работает именно так, по-видимому, обучаясь на данных и находя ассоциации.

Имитация мозга – слой за слоем

Возможно, вы уже заметили, что при обсуждении происхождения нейронных сетей образ мозга и сложность, которую он вызывает, никогда не за горами. Человеческий мозг выступал своего рода шаблоном для этих систем. В частности, на ранних стадиях мозг – все еще один из величайших неизвестных – стал моделью того, как может функционировать нейронная сеть.

Таким образом, эти экспериментальные новые системы были смоделированы на основе чего-то, функционирование которого само по себе было в значительной степени неизвестно. Инженер нейрокомпьютеров Карвер Мид говорил откровенно концепции «когнитивного айсберга», которая показалась ему особенно привлекательной. Это лишь верхушка айсберга сознания, который мы осознаем и который видим. Масштаб и форма остального остаются неизвестными под поверхностью.

В 1998, Джеймс Андерсон, который какое-то время работал над нейронными сетями, отметил, что когда дело дошло до исследований мозга, «нашим главным открытием, похоже, стало осознание того, что мы на самом деле не знаем, что происходит».

В подробном отчете в Файнэншл Таймс в 2018 годуТехнологический журналист Ричард Уотерс отметил, что нейронные сети «моделируются на основе теории о том, как работает человеческий мозг, передавая данные через слои искусственных нейронов до тех пор, пока не появится идентифицируемая закономерность». По мнению Уотерса, это создает проблему, поскольку «в отличие от логических схем, используемых в традиционных программах, не существует способа отслеживать этот процесс, чтобы точно определить, почему компьютер выдает тот или иной ответ». Вывод Уотерса заключается в том, что эти результаты нельзя игнорировать. Применение этой модели мозга, в которой данные проходят через множество слоев, означает, что ответ невозможно легко найти. Многослойность является хорошей причиной этого.

Жесткий также заметил, что эти системы «во многом смоделированы на человеческом мозге». Это вызывает стремление усложнять обработку данных, чтобы попытаться соответствовать мозгу. Результатом этой цели является нейронная сеть, которая «состоит из тысяч или даже миллионов простых вычислительных узлов, тесно связанных между собой». Данные перемещаются через эти узлы только в одном направлении. Хардести заметил, что «отдельный узел может быть подключен к нескольким узлам нижнего уровня, от которых он получает данные, и нескольким узлам верхнего уровня, которым он отправляет данные».

Модели человеческого мозга были частью того, как эти нейронные сети были задуманы и спроектированы с самого начала. Это особенно интересно, если учесть, что мозг сам по себе был загадкой того времени (и во многом остается загадкой).

«Адаптация – это вся игра»

Такие ученые, как Мид и Кохонен, хотели создать систему, которая могла бы по-настоящему адаптироваться к миру, в котором она оказалась. Оно будет реагировать на его условия. Мид ясно понимал, что ценность нейронных сетей заключается в том, что они могут облегчить адаптацию такого типа. В то время, размышляя об этих амбициях, Медовуха добавлена что создание адаптации «это вся игра». Эта адаптация необходима, по его мнению, «из-за природы реального мира», который, по его мнению, «слишком изменчив, чтобы сделать что-то абсолютное».

С этой проблемой нужно было считаться, тем более, что, по его мнению, это «нервная система давно выяснила». Эти новаторы не только работали с изображением мозга и его неизвестного, они сочетали это с видением «реального мира» и неопределенностей, неизвестных и изменчивости, которые это приносит. Системы, по мнению Мида, должны быть способны реагировать и адаптироваться к обстоятельствам. без инструкцию.

Примерно в то же время, в 1990-х годах, Стивен Гроссберг – эксперт по когнитивным системам, работающим в области математики, психологии и биомедицинской инженерии – также утверждал, что адаптация станет важным шагом в долгосрочной перспективе. Гроссберг, работая над моделированием нейронных сетей, подумал про себя, что все дело «в том, как биологические системы измерения и управления устроены так, чтобы быстро и стабильно адаптироваться в реальном времени к быстро меняющемуся миру». Как мы видели ранее на примере «мечты» Кохонена о «самоорганизующейся» системе, понятие «реального мира» становится контекстом, в котором реакция и адаптация кодируются в этих системах. То, как этот реальный мир понимается и воображается, несомненно, определяет то, как эти системы предназначены для адаптации.

Скрытые слои

По мере увеличения количества слоев глубокое обучение проникало в новые глубины. Нейронная сеть обучается с использованием обучающих данных, которые Хардести объяснил, «подается на нижний слой – входной слой – и проходит через последующие слои, умножаясь и складываясь сложными способами, пока, наконец, не достигнет радикально преобразованного выходного слоя». Чем больше слоев, тем сильнее преобразование и тем больше расстояние от входа до выхода. Развитие графических процессоров (GPU), например, в играх, добавил Хардести, «позволило однослойным сетям 1960-х годов и двух-трехуровневым сетям 1980-х годов превратиться в десять, пятнадцать или даже пятьдесят многоуровневые сети сегодня».

Нейронные сети становятся глубже. Действительно, именно это добавление слоев, по мнению Хардести, и есть «то, что подразумевается под словом «глубокое» в термине «глубокое обучение». Это важно, полагает он, потому что «в настоящее время глубокое обучение отвечает за наиболее эффективные системы практически во всех областях исследований искусственного интеллекта».

Но тайна становится еще глубже. По мере того, как слои нейронных сетей накапливались выше, их сложность росла. Это также привело к росту так называемых «скрытых слоев» внутри этих глубин. Дискуссия об оптимальном количестве скрытых слоев в нейронной сети продолжается. Теоретик СМИ Беатрис Фази написала что «из-за того, как работает глубокая нейронная сеть, полагаясь на скрытые нейронные слои, зажатые между первым слоем нейронов (входной слой) и последним слоем (выходной слой), методы глубокого обучения часто непрозрачны или неразборчивы даже для программисты, которые изначально их установили».

По мере увеличения слоев (в том числе и скрытых слоев) они становятся еще менее объяснимыми – даже, как оказывается, опять же, для тех, кто их создает. Выражая аналогичную точку зрения, выдающийся междисциплинарный мыслитель новых медиа Кэтрин Хейлс также отметил что существуют пределы того, «сколько мы можем знать о системе, результат, относящийся к «скрытому слою» в нейронных сетях и алгоритмах глубокого обучения».

В погоне за необъяснимым

В совокупности эти длительные разработки являются частью того, что социологи технологий Тайна Бучер назвал «проблемой неизвестного». Расширяя свои влиятельные исследования научных знаний в области искусственного интеллекта, Гарри Коллинз указал, что Цель нейронных сетей состоит в том, чтобы они могли создаваться человеком, по крайней мере первоначально, но «после того, как программа написана, она как бы живет своей собственной жизнью; без огромных усилий то, как именно работает программа, может остаться загадкой». Это отголоски давних мечтаний о самоорганизующейся системе.

Я бы добавил к этому, что неизвестное и, возможно, даже непознаваемое рассматривалось как фундаментальная часть этих систем с самых ранних стадий их существования. Есть большая вероятность, что чем большее влияние искусственный интеллект окажет на нашу жизнь, тем меньше мы будем понимать, как и почему.

Но сегодня это не устраивает многих. Мы хотим знать, как работает ИИ и как он приходит к решениям и результатам, которые влияют на нас. Поскольку развитие ИИ продолжает формировать наши знания и понимание мира, того, что мы открываем, как с нами обращаются, как мы учимся, потребляем и взаимодействуем, этот импульс к пониманию будет расти. Когда дело доходит до объяснимого и прозрачного ИИ, история нейронных сетей говорит нам, что в будущем мы, скорее всего, отойдём от этой цели, а не приблизимся к ней.

Дэвид Бир, Профессор социологии, Университет Йорка

Эта статья переиздана из Беседа под лицензией Creative Commons. Прочтите оригинал статьи.