Современная классификация ИИ. На пути к сильному ИИ.

Автор. Мазин Василий Александрович, кандидат физико-математических наук, Mind-Simulation AGI Laboratory (mind-simulation.com), CRO

Аннотация. В статье рассматривается современное значение термина Искусственный интеллект, его разбиение на отдельные группы в зависимости от развития интеллектуальных способностей. Описываются этапы создания искусственного интеллекта, где конечная цель — сильный искусственный интеллект.

Ключевые слова: искусственный интеллект; Narrow AI; Wide AI; AGI; Strong AI.

В настоящее время, когда используется термин «искусственный интеллект», не всегда понятно, какой именно смысл вкладывает говорящий в этот термин. Широкое использование этого сочетания слов в различных контекстах размыло его исходное значение. В работе предложена классификация современных представлений ИИ в виде этапов его развития.

Проблема понимания термина «искусственный интеллект» заключается в слове «интеллект». Не существует единого, устраивающего всех исследователей, термина «интеллект». Комплексное целенаправленное исследование этого феномена началось еще в XIX веке, и в настоящее время исследованием интеллекта занимаются такие науки, как психология, философия, антропология, биология, лингвистика, компьютерные науки. Сформировались отдельные направления исследований в каждой из наук. И хотя уже есть предпосылки для создания единой теории интеллекта на основе синтеза всех научных результатов, человечество находится только в начале пути понимания этого феномена.

Давайте абстрагируемся от широкого понятия «интеллект» и сосредоточимся на том, что понимается под термином «искусственный Интеллект». Коннотация этого термина сильно изменилась с момента его появления. Первоначальное его значение было установлено во время знаменитого Дартмутского семинара по вопросам ИИ в 1956 году. Вот выдержка из заявки на проведение семинара [1]:

«Исследование основано на предположении, что всякий аспект обучения или любое другое свойство интеллекта может в принципе быть столь точно описано, что машина сможет его симулировать. Мы попытаемся понять, как обучить машины использовать естественные языки, формировать абстракции и концепции, решать задачи, сейчас подвластные только людям, и улучшать самих себя».

Долгое время, в общих чертах, под ИИ понималась система, обладающая вышеперечисленными возможностями. Но в последние десятилетия, особенно в связи с новой волной интереса к теме, распространением технологии глубокого обучения, широким медийным освещением значение термина в массовом сознании изменилось. Теперь он используется практически в любых ситуациях и часто вызывает путаницу понятий. Следует заметить, что ни одна существующая система не может называться ИИ в классическом смысле. Но так как мы уже не сможем изменить массовое сознание, то следует рассмотреть отдельные понимания того, что называется ИИ.

Расположим отдельные термины ИИ на горизонтальной оси, где предположим увеличение некоторого «показателя» интеллекта слева направо. Не будем углубляться, что это за «показатель», просто предположим, что те интеллектуальные системы, которые расположены правее, более интеллектуальны, чем системы, расположенные слева.

Как видно, при максимальной детализации существующих понятий ИИ, можно выделить 4 отдельных термина (этапа развития) ИИ. Причем, к классическому определению относятся только AGI и Strong AI, а под современное трактование попадают и системы, находящиеся левее Narrow AI. Рассмотрим каждую веху развития ИИ отдельно. Заметим, что четких границ перехода от этапа к этапу нет.

К самым простым интеллектуальным системам можно отнести системы с обратной связью. То есть системы, которые принимают некоторые сигналы от внешнего мира и подстраивают свою работу под изменяющиеся условия. Примером может быть светофор, который, получая данные от камер, подстраивает свою работу в зависимости от количества машин, ожидающих проезда перекрестка. Такая система может использовать алгоритмы нечеткой логики. Стоит заметить, что даже система, построенная на большом количестве операторов условия, может демонстрировать «интеллектуальное» поведение. Есть даже прецеденты получения высоких баллов такими программами на соревнованиях по искусственному интеллекту.

Все существующие системы ИИ относятся к группе Narrow AI (узкий или слабый ИИ). Такие системы строятся на одном из методов ИИ: чаще всего это нейронные сети глубокого обучения, но могут быть и экспертные системы, генетические алгоритмы, нечеткие системы и др. Они решают какую-то одну определенную задачу в строго заданных граничных условиях. И уже во многих случаях, лучше и быстрее, чем человек. Проблема только в границах применения. Они довольно узки. Кроме того, при внедрении узких интеллектуальных систем возникла проблема применимости их решений. Больше всего на слуху сейчас системы, основанные на глубоком обучении, а они в настоящее время не могут объяснить, как приняли то или иное решение. Поэтому в Китае отключают нейросеть, вычисляющую коррупционеров, в рекрутинговых агентствах — подбор персонала, в банках — системы принятия выдачи кредитов. Обучение таких сетей привело к появлению дискриминационных решений по полу и расе.

Следующая ступень, к которой сейчас продвигаются многие исследователи искусственного интеллекта, — Wide AI. Главная задача таких систем — преодолеть узость применимости. Есть список проблем, которые должны быть решены в таких системах. Вот только некоторые из них:

  • объяснимость ИИ (explainable AI) — должно быть понимание принимаемых ИИ решений. Только понимая механизмы вывода, можно верифицировать, дорабатывать и дообучать ИИ;
  • передача знаний (transfer learning) — две системы должны иметь возможность обучать и дообучать друг друга, определять разность знаний и противоречия в них;
  • быстрое обучение (few-shot learning) — система должна обучаться на небольшом объеме материала и за малое число итераций;
  • решение проблемы катастрофического забывания (structured prediction and learning) — при дообучении система не должна терять уже имеющиеся способности.
  • инкрементальное обучение (incremental learning) — система должна иметь возможность постоянно накапливать знания, интегрируя их с уже изученными.

Как видно, цель этого шага — расширить возможности существующих систем ИИ, позволить им постоянно обучаться, обмениваться знаниями и расширять границы применения в решении все еще достаточно «узких» задач. Примером может быть ИИ, играющий в определенный класс игр (логические, карточные, настольные), причем для того чтобы начать играть в новую игру того же класса, ему достаточно прочитать правила. Или системы, управляющие сложными процессами, должны иметь возможность «на лету» встраивать новые параметры и алгоритмы поведения, не теряя возможности управления. Этот класс ИИ, скорее всего, будет построен с использованием гибридного подхода, когда отдельные технологии построения ИИ работают совместно, дополняя друг друга.

Следующий этап развития ИИ — общий искусственный интеллект (AGI). AGI – это способность системы решать любые задачи в сложных средах с ограниченными ресурсами.

Это определение максимально широкое и требует дополнительного уточнения, что такое любые задачи, какими должны быть сложные среды, о каких ресурсах идёт речь и насколько они ограничены. Увы, нет четкого понимания, что представляет собой такая система. Упрощенно можно сказать, что по своим интеллектуальным способностям она должна находиться на уровне человека. И здесь возникает вопрос уже не как этого добиться, а как это проверить. Во-первых, нужно выработать некоторый набор критериев, достижение которых будет означать, что мы создали AGI. Во-вторых, было бы хорошо иметь некоторые числовые показатели, по которым можно сравнить две системы искусственного интеллекта и определить, какая из них более интеллектуальна. Обе задачи до сих пор не решены даже приблизительно. В качестве критерия достижения часто предлагаются задачи или вызовы, которые, предположительно, нельзя решить с помощью Narrow AI и даже Wide AI. Это могут быть:

Кофе-тест. Стив Возняк предложил создать машину, которая может войти в любой среднестатистический американский дом, найти в нем кофемашину, кофе и кружку, набрать воду и заварить кофе.

Тест студента Бена Герцеля. Искусственный интеллект поступает в университет, где посещает те же занятия, что и обычные студенты, выполняет те же задания и получает соответствующую степень.

Тест на профпригодность Нилса Джон Нильссона. Машина выполняет экономически важную работу на том же уровне, что и профессионалы в данной области.

Artificial Scientist Test – совершение оригинального открытия.

Noble Prize Test – получение Нобелевской премии.

Действительно хорошего практического решения проблемы метрики развития AGI в настоящее время не существует. Некоторые авторы полагают, что измерение частичного прогресса в AGI в целом крайне проблематично, упрощенно говоря, потому что система AGI не будет проявлять свойств AGI до тех пор, пока она не будет построена целиком. Но попытки разработать такую метрику принимаются. Это и Коэффициент Универсального Ителлекта [2], Коэффициент Алгоритмического Интеллекта [3], General AI Challenge [4], тест Abstractive Reasoning Corpus.

Еще больше вопросов возникает с последним этапом развития ИИ — сильным искусственным интеллектом. Часто этот термин употребляют в значении AGI. Но правильнее будет охарактеризовать такой интеллект как многократно превосходящий по уровню развития человеческий. Наиболее широко распространена идея, что если ИИ достигнет уровня человеческого, то он на этом не остановится, а будет циклически развивать себя, увеличивая свои возможности на каждой итерации. Такое развитие будет экспоненциальным, неконтролируемым и, вообще, может представлять собой экзистенциальную проблему для человечества. Здесь мы упираемся в отсутствие проработанных теорий и моделей интеллекта, и приведенные выше утверждения пока ничем не подтверждены. Если интеллект строит модели реальности, то построение всё более сложных моделей потребует всё больших ресурсов. Абсолютная точность не может быть достигнута, и всегда будут противоречия. Количество ресурсов к точности модели находятся в экспоненциальной зависимости. И, соответственно, рост искусственного интеллекта в длительной перспективе без учета скачков при смене материальной базы, скорее, соответствует линейному или логарифмическому закону.

Предложенная классификация позволяет точнее определить значения термина ИИ в каждом контексте его употребления, и, соответственно, ограничить круг задач и требований, предъявляемых к нему на каждом этапе, что, в свою очередь, улучшит коммуникацию между специалистами, использующими это понятие. Мы находимся лишь в начале пути к сильному искусственному интеллекту, и еще предстоит решить множество теоретических и практических проблем его понимания и создания.

Список литературы

1. McCarthy, J., Minsky, M., Rochester, N., Shannon, C.E., A Proposal for the Dartmouth Summer Research Project on Artificial Intelligence., http://raysolomonoff.com/dartmouth/boxa/dart564props.pdf August, 1955

2. Shane Legg, Marcus Hutter. Universal intelligence: A definition of machine intelligence. Minds and machines, 17(4):391-444, 2007

3. Shane Legg, Joel Veness. An Approximation of the Universal Intelligence Measure - Algorithmic Probability and Friends. Bayesian Prediction and Artificial Intelligence pp 236-249, 2011

4. https://www.general-ai-challenge.org/