Набор методов которые позволяют ии системе понимать речь человека
Перейти к содержимому

Набор методов которые позволяют ии системе понимать речь человека

  • автор:

Что такое диалоговый искусственный интеллект

Диалоговый искусственный интеллект (ИИ) – это технология, позволяющая программному обеспечению понимать голосовые или текстовые человеческие разговоры и реагировать на них. Традиционно общение человека с программным обеспечением ограничивалось предварительно запрограммированными входящими потоками, когда пользователи вводят заранее определенные команды или произносят их. Диалоговый искусственный интеллект выходит далеко за рамки этого. Он может распознавать все типы речи и ввода текста, имитировать человеческое общение, понимать запросы на разных языках и отвечать на них. Организации используют диалоговый искусственный интеллект для различных сценариев службы поддержки клиентов, поэтому программное обеспечение отвечает на запросы клиентов персонализированным образом.

В чем преимущества диалогового искусственного интеллекта?

Технология искусственного интеллекта для диалогов дает ряд преимуществ командам по обслуживанию клиентов организации.

Улучшенное качество обслуживания клиентов

Чат-боты искусственного интеллекта для диалогов могут обеспечивать круглосуточную поддержку и мгновенное реагирование клиентов – услуги, которую современные клиенты предпочитают и ожидают от всех онлайн-систем. Мгновенный ответ повышает как удовлетворенность клиентов, так и частоту взаимодействия с брендом.

Кроме того, вы можете интегрировать прошлые данные о взаимодействии с клиентами в искусственный интеллект для диалогов, чтобы персонализировать взаимодействие со своими клиентами. Например, он может давать рекомендации на основе прошлых покупок клиентов или поисковых запросов.

Повышенная операционная эффективность

Вы можете использовать решения на основе искусственного интеллекта для диалогов, чтобы оптимизировать рабочие процессы обслуживания клиентов. Они могут отвечать на часто задаваемые вопросы или другие повторяющиеся входные данные, что позволит сотрудникам сосредоточиться на более сложных задачах.

Вы также можете получить масштабную экономическую выгоду. Создание круглосуточных групп обслуживания клиентов в разных часовых поясах может обойтись дорого. Гораздо эффективнее использовать ботов для непрерывной поддержки клиентов по всему миру.

Более широкая доступность

Искусственный интеллект для диалогов можно использовать для улучшения доступности для клиентов с ограниченными возможностями. Он также может помочь клиентам с ограниченными техническими знаниями, разными языковыми навыками или нетрадиционными задачами. Например, технологии искусственного интеллекта для диалогов могут помочь пользователям перемещаться по веб-сайтам или работать с приложениями. Они могут отвечать на запросы и помогать находить необходимую информацию людям, не имеющим больших технических знаний.

Каковы некоторые варианты использования ИИ для диалогов?

Искусственный интеллект для диалогов применяется различными способами в бизнес-процессах и взаимодействии с клиентами. Мы разделили эти варианты использования на четыре большие категории.

Информационная

В информационном контексте искусственный интеллект для диалогов в первую очередь отвечает на запросы клиентов или предлагает рекомендации по конкретным темам. Например, ваши пользователи могут спрашивать чат-ботов службы поддержки клиентов о погоде, запрашивать сведения о продукте или рецепты с пошаговыми инструкциями. Другим примером могут служить виртуальные помощники, управляемые искусственным интеллектом, которые отвечают на запросы пользователей, предоставляя информацию в реальном времени – от мировых фактов до обновлений новостей.

Захват данных

Вы можете использовать инструменты искусственного интеллекта для диалогов, чтобы собирать важные сведения о пользователях или отзывы. Например, при адаптации новых сотрудников взаимодействие может быть больше похожим на общение с живым человеком. Другой сценарий – чаты для общения после покупки или обслуживания, в которых диалоговые интерфейсы собирают отзывы о личном опыте клиента – его впечатлениях и предпочтениях, а также возможных причинах неудовлетворенности.

Сопровождение транзакций

В транзакционных сценариях искусственный интеллект для диалогов облегчает выполнение задач, связанных с любой транзакцией. Например, клиенты могут использовать чат-ботов с искусственным интеллектом для размещения заказов на платформах электронной коммерции, бронирования билетов или жилья. Некоторые финансовые учреждения применяют чат-ботов на базе искусственного интеллекта, чтобы пользователи могли проверять баланс счетов, переводить деньги или платить по счетам. Такое использование удобно для ваших клиентов и улучшает их впечатления.

Проактивность

Когда вы активно используете искусственный интеллект для диалогов, система инициирует разговоры или действия на основе определенных триггеров или прогнозной аналитики. Например, приложения искусственного интеллекта для диалогов могут отправлять пользователям оповещения о предстоящих встречах, напоминать им о незавершенных задачах или предлагать продукты на основе поведения в Интернете. Агенты искусственного интеллекта для диалогов могут активно обращаться к посетителям веб-сайта и предлагать помощь. Или же они могут предоставлять вашим клиентам обновленную информацию о перебоях в доставке или обслуживании, и клиенту не придется ждать агента-человека.

Как работает искусственный интеллект для диалогов?

Искусственный интеллект для диалогов работает с использованием трех основных технологий.

Обработка естественного языка

Обработка естественного языка (NLP) – это набор методов и алгоритмов, которые позволяют машинам обрабатывать, анализировать и понимать человеческий язык. Человеческий язык имеет несколько особенностей, таких как сарказм, метафоры, вариативность структуры предложений, а также исключения из правил грамматики и словоупотребления. Алгоритмы машинного обучения (ML) для NLP позволяют моделям искусственного интеллекта для диалогов непрерывно учиться на обширных текстовых данных и распознавать различные лингвистические закономерности и нюансы.

Понимание естественных языков

Понимание естественных языков (NLU) связано с аспектом понимания системы. Оно гарантирует, что модели искусственного интеллекта для диалогов будут обрабатывать языковые данные, понимать намерения и контекст пользователя. Например, одно и то же предложение может иметь разные значения в зависимости от контекста, в котором оно используется.

NLU использует машинное обучение для распознавания контекста, различения значений и понимания беседы людей. Это особенно важно, когда виртуальным агентам приходится отправлять сложные запросы агенту-человеку. NLU делает переход плавным и основано на точном понимании потребностей пользователя.

Генерация естественного языка

После понимания введенных пользователем данных система формулирует последовательный и контекстуально соответствующий ответ. Генерация естественного языка (NLG) позволяет виртуальным агентам составлять предложения, похожие на написанные человеком, – четкие, уместные и естественно звучащие. NLG использует мощные алгоритмы глубокого обучения для формулирования ответов в контексте. Более того, по мере того как чат-боты с искусственным интеллектом все больше взаимодействуют с пользователями и агентами-людьми, они все более гибким образом формулируют все более совершенные ответы.

В чем разница между искусственным интеллектом для диалогов и генеративным искусственным интеллектом?

Генеративный искусственный интеллект — это тип ИИ, который может создавать новый контент и идеи, включая разговоры, истории, изображения, видео и музыку. Как и любой искусственный интеллект, генеративный ИИ основан на моделях машинного обучения. В частности, он использует очень большие модели, предварительно обученные на огромных объемах данных и обычно называемые базовыми моделями (FM).

Помимо создания контента, вы можете использовать генеративный искусственный интеллект для улучшения качества цифрового изображения, редактирования видео, создания производственных прототипов и дополнения данных синтетическими наборами данных.

Сравнение искусственного интеллекта для диалогов с генеративным искусственным интеллектом

У ИИ для диалогов и генеративного ИИ разные конечные цели. Цель ИИ для диалогов – понять человеческую речь и поток беседы. Его можно настроить так, чтобы он реагировал соответствующим образом на запросы разных типов и не отвечал на вопросы, выходящие за рамки.

Напротив, генеративный искусственный интеллект направлен на создание нового оригинального контента и для этого обучается на существующих данных клиента. В каком-то смысле он будет отвечать только на нестандартные вопросы новыми оригинальными способами. Качество ответа может быть не таким, как вы ожидаете, и он может не так понимать намерения клиентов, как искусственный интеллект для диалогов.

При этом важно отметить, что многие инструменты искусственного интеллекта сочетают в себе как искусственный интеллект для диалогов, так и технологии генеративного искусственного интеллекта. Система обрабатывает вводимые пользователем данные с помощью искусственного интеллекта для диалогов и реагирует с помощью генеративного искусственного интеллекта. Это решает проблемы в сценариях использования, выходящих за рамки искусственного интеллекта для диалогов.

Как AWS может удовлетворить ваши требования к искусственному интеллекту для диалогов?

Amazon Web Services (AWS) предоставляет множество вариантов поддержки вашей работы с искусственным интеллектом для диалогов.

Amazon Lex – это полностью управляемый сервис искусственного интеллекта с усовершенствованными моделями естественного языка. Его можно использовать для проектирования, сборки, тестирования и развертывания диалоговых интерфейсов в приложениях. Работает на том же диалоговом движке, что и Alexa, и обеспечивает высококачественное распознавание речи и понимание языка. С помощью Amazon Lex вы можете добавлять в новые и существующие приложения сложных чат-ботов на базе искусственного интеллекта.

Amazon Kendra – это простой в использовании сервис диалогового поиска. Он позволяет обнаруживать информацию в огромном количестве контента, хранящегося во всей вашей компании. Например, вы можете найти данные из руководств, исследовательских отчетов, часто задаваемых вопросов, документации по управлению персоналом и руководств по обслуживанию клиентов. Когда вы вводите вопрос, Amazon Kendra понимает контекст и возвращает наиболее релевантные результаты, будь то точный ответ или весь документ.

Библиотека решений AWS позволяет легко настраивать чат-ботов и виртуальных помощников. Вы можете создать свой диалоговый интерфейс с помощью генеративного искусственного интеллекта от сбора данных до предоставления результатов. Используйте базовую модель, которая наилучшим образом соответствует вашим потребностям, в частной и безопасной вычислительной среде с выбранными вами данными для обучения.

Начните использовать искусственный интеллект для диалогов на AWS, создав учетную запись уже сегодня.

Системы искусственного интеллекта для чайников: виды, методы, примеры использования

Искусственный интеллект — технология, которая позволяет программе воспроизводить и даже превосходить возможности человеческого разума. Последние несколько лет наглядно показали, насколько стремительно развивается это направление, приближая к реальности сцены из фантастических романов. Эта статья — краткий гид по миру искусственного интеллекта. В ней мы дадим определение технологии, перечислим основные типы, преимущества и недостатки, а также тренды развития и примеры применения ИИ.

Что такое искусственный интеллект

Искусственный интеллект или ИИ (англ. Artificial Intelligence, AI) определяется, как набор программных алгоритмов, позволяющий имитировать ряд функциональных возможностей человеческого мозга в динамической вычислительной среде. Алгоритмы искусственного интеллекта используют несколько технологий, которые позволяют машинам ощущать, понимать, планировать, действовать и учиться, подобно тому, как это делают люди.

Системы искусственного интеллекта воспринимают окружающую среду, распознают объекты, способствуют принятию решений, решают сложные проблемы, извлекают уроки из прошлого опыта и имитируют шаблоны. Эти способности могут комбинироваться для выполнения таких задач, как беспилотное вождение автомобиля или распознавание лиц при разблокировке экранов устройств.

ИИ в первую очередь развивается за счет исследования механизмов работы и способностей человеческого мозга для последующего применения этих знаний к «умным» машинам. Основной целью искусственного интеллекта является разработка технологии, позволяющей компьютерным системам работать независимо от человека и принимать решения на полноценной интеллектуальной основе.

История искусственного интеллекта

София — самообучающейся гуманоидный робот с ИИ, созданный Hansen Robotics в 2016 году.

  • 1942 год — немецкая шифровальная машина Enigma взломана с помощью ИИ.
  • 1950 год — создан тест на машинный интеллект Алана Тьюринга.
  • 1955 год — американский ученый-компьютерщик Джон Маккарти придумал термин «искусственный интеллект», который он озвучил официально на конференции год спустя.
  • 1958 год — был разработан первый высокоуровневый язык программирования Lisp для исследований ИИ.
  • 1959 год — пионер в области компьютерных игр Артур Сэмюэль придумал термин «машинное обучение».
  • 1961 год — на сборочной линии General Motors в Нью-Джерси внедрен первый промышленный робот Unimate.
  • 1966 год — в лаборатории искусственного интеллекта Массачусетского технологического института появился первый чат-бот ELIZA.
  • 1970 год — в японском университете Васэда был разработан первый антропоморфный робот WABOT-1.
  • 1986 год — совершил поездку первый беспилотный автомобиль, фургон Mercedes-Benz.
  • 1995 год — создан компьютер ALICE (Artificial Linguistic Internet Computer Entity), способный к сбору выборочных данных на естественном языке.
  • 1997 год — ИИ компьютера IBM DeepBlue побеждает чемпиона мира по шахматам.
  • 1998 год — создан первый робот с «эмоциями» Kismet.
  • 2002 год — первый автономный робот-пылесос Roomba.
  • 2008 год — у iPhone и Siri появилась функция распознавания голоса.
  • 2010 год — Microsoft выпустила Kinect для Xbox 360, первое игровое устройство, отслеживающее движение человеческого тела с помощью 3D-камеры и инфракрасного излучения.
  • 2011 год — в телевизионной викторине «Jeopardy!» компьютерная система IBM Watson обыгрывает двух экс-чемпионов.
  • 2014 год — Apple выпустила первого встроенного персонального помощника с голосовым управлением Siri.
  • 2016 год — появился первый робот-гражданин София.
  • 2017 год — первый композитор с искусственным интеллектом Amper.
  • 2020 год — революционная языковая модель GPT-3 (Generative Pre-trained Transformer) научилась самостоятельно генерировать качественный текст на заданную тему, применяя предварительно обученные алгоритмы.
  • 2022 год — компания OpenAI, разработавшая GPT-3, создала на основе этой модели продвинутый чат-бот с искусственным интеллектом ChatGPT, способный поддерживать диалог с запросами на естественных языках.
  • 2023 год — крупнейшие игроки ИТ-рынка начинают интегрировать алгоритмы ChatGPT в свои флагманские продукты. Уже в начале года чат-бот взяли «на борт» такие компании, как Google (браузер Chrome), Microsoft (поисковая система Bing, браузер Edge, сервис для совместной работы Teams) и Kunlun Tech (браузер Opera).

Развитие систем искусственного интеллекта продолжается стремительными темпами, меняя окружающую действительность на наших глазах. Мы уже увидели умные беспилотные автомобили, чипы с ИИ, мощные онлайн-инфраструктуры Azure-Microsoft на базе искусственного интеллекта и множество других блестящих изобретений. Подробнее о том, какие изменения могут принести нам технологии ИИ в ближайшее время, мы поговорим чуть ниже.

Как работает искусственный интеллект

Система искусственного интеллекта принимает входные данные в виде речи, текста, изображения, а затем обрабатывает их, применяя различные правила и алгоритмы. После обработки система выдает результат, т. е. успех или неудачу, при вводе данных.

Затем результат оценивается посредством анализа, открытия и обратной связи. Наконец, система использует свои оценки для корректировки входных данных, правил и алгоритмов, а также целевых результатов. Этот цикл продолжается до тех пор, пока не будет достигнут желаемый результат.

Ключевые области искусственного интеллекта

Ландшафт ИИ распространяется на множество передовых технологий, которые позволяют компьютерным системам понимать человеческий язык, учиться на примерах и делать прогнозы. Хотя каждый из компонентов ИИ развивается независимо, в сочетании с другими технологиями, данными, аналитикой и автоматизацией, они могут найти применение в любой производственной задаче — от оптимизации цепочек поставок до улучшения обслуживания клиентов.

  • �� Машинное обучение или ML (Machine learning) — приложение на основе ИИ, которое автоматически учится и совершенствуется на основе предыдущих наборов данных без необходимости явного программирования. Машинное обучение применяется для создания всех инструментов с искусственным интеллектом — от приложений для автоматического распознавания письма и речи до сложных ситсем компьютерного зрения, встроенных в роботы или беспилотные машины.
  • �� Глубокое обучение или DL (Deep learning) — подмножество машинного обучения, в котором обработка обучающих данных происходит с помощью искусственных нейронных сетей. Глубокое обучение используется при создании таких решений, как чат-боты и виртуальные помощники, маркетинговые рекомендательные ситсемы, автоматические переводчики с иностранных языков.
  • �� Нейронная сеть (Neural network) — это компьютерная система или системы, которые в общих чертах моделируют нейронные связи в человеческом мозге и обеспечивают глубокое обучение. Существует несколько основных типов нейронных сетей (НС), включая НС прямого распространения (FFNN), сверточные НС (CNN), рекуррентные НС (RNN). Они используются для таких задач, как распознавание голоса, изображений, речи, образов, языкового перевода, классификация и обнаружение аномалий.
  • �� Когнитивные вычисления (Cognitive computing) направлены на воссоздание мыслительного процесса человека в компьютерной модели. Технология стремится имитировать логику работы человеческого сознания и улучшить взаимодействие между людьми и машинами. Это происходит, например, через распознавание ИИ человеческого языка и значения изображений для последующего самообучения. Реализовать систему когнетивных вычислений сегодня возможно только в таких сложных машинах, как суперкомпьютер IBM Watson.
  • �� Обработка естественного языка или NLP (Natural language processing) — технология, которая позволяет компьютерам понимать, распознавать, интерпретировать и воспроизводить человеческий язык и речь. Самым ярким примером реализации технологии NLP сегодня служат продвинутые модели обработки естественного языка, такие как GPT от компании OpenAI.
  • ��️ Компьютерное зрение или CV (Computer vision) использует глубокое обучение и идентификацию шаблонов для интерпретации содержимого изображения — фото, растровой и векторной графики, таблиц, PDF и видео. На компьютерном зрении основана работа автопилотов самоуправляемых транспортных средств (например, Tesla Autopilot), а также системы ИИ, обрабытывающие информацию с дорожных камер.
  • ⚙️ Роботизированная автоматизация процессов или RPA (Robotic process automation) — дисциплина искусственного интеллекта, которая помогает частично или полностью автоматизировать повторяющиеся ручные операции с помощью настройки робота или ПО, способного к интерпретации, передаче и анализу данных. RPA-системы применяются в таких областях, как бухгалтерский учет (обработка счетов), HR (наем и адаптация персонала), розничная торговля (управление запасами) и организация служб технической поддержки.

Типы искусственного интеллекта

Технологии искусственного интеллекта можно условно разделить на две большие категории: ИИ на основе возможностей, ИИ на основе функциональности. Каждая из этих разновидностей, в свою очередь, делится на более специализированные подкатегории.

На основе возможностей

Узкий ИИ

Узкий или слабый искусственный интеллект (Narrow AI, NAI или Artificial Narrow Intelligence, ANI) — это узкоспециализированный ИИ, обученный выполнять конкретную задачу. Слабый ИИ работает в рамках ограниченного и заранее определенного набора параметров, ограничений и контекстов.

Примерами использования NAI могут служить пользовательские рекомендации по видео/аудио контенту в популярных онлайн-кинотеатрах или соцсетях, предложения о покупке на сайтах электронной коммерции, автономные автомобили, а также системы распознавания речи и изображений.

Общий ИИ

Общий или сильный искусственный интеллект (General AI, GAI или Artificial General Intelligence, AGI) — версия ИИ, которая выполняет любую интеллектуальную задачу с человеческой эффективностью. Целью общего ИИ является разработка системы, способной думать самостоятельно, как это делают люди. В настоящее время общий ИИ все еще находится в стадии исследования, и предпринимаются усилия по разработке машин с расширенными когнитивными способностями.

Супер ИИ

Искусственный суперинтеллект (Super AI, SAI) — это версия ИИ, которая превосходит людской интеллект и может выполнять любую задачу лучше, чем человек. Возможности машины с супер-ИИ включают следующие виды самостоятельной деятельности:

  • мышление;
  • аргументация;
  • решение головоломок;
  • вынесение суждений;
  • обучение;
  • общение.

Сегодня это гипотетическая концепция, но она представляет собой будущее ИИ.

На основе функциональности

Реактивные машины

Реактивные машины (Reactive machines) — базовая разновидность ИИ, представители которой не хранят прошлый опыт или воспоминания для будущих действий. Такие системы фокусируются на текущих сценариях и реагируют на них, основываясь на наилучших возможных действиях. Популярные примеры реактивных машин включают шахматный суперкомпьютер Deep Blue от IBM и программа для игры в го AlphaGo от Google.

Машины с ограниченной памятью

Машины с ограниченной памятью (Limited memory machines) могут хранить и использовать прошлый опыт или данные в течение короткого периода времени. Например, беспилотный автомобиль может хранить информацию о скорости транспортных средств поблизости, их соответствующих расстояниях, ограничениях скорости и другую важную информацию для навигации в пробках.

ИИ с теорией разума

Теория разума или теория сознания (Theory of mind) относится к типу ИИ, который может понимать человеческие эмоции и убеждения и способен к социальному взаимодействию по человеческому подобию. Этот вид искусственного интеллекта еще не разработан и существует только в концепции.

Самосознающий ИИ

Концепция искусственного интеллекта с самосознанием (Self-aware AI) относится к сверхразумным машинами с их сознанием, чувствами, эмоциями и убеждениями. Ожидается, что такие системы будут умнее человеческого разума и могут превзойти нас в поставленных задачах.

Преимущества искусственного интеллекта

Более эффективное решение

Исследования ИИ сосредоточены на разработке алгоритмов решения сложных задач, способных делать логические выводы и имитировать человеческие рассуждения. Такие виды искусственного интеллекта, как системы прогнозирования фондового рынка, предлагают методы решения неопределенных ситуаций или головоломок с неполной информацией, основывающиеся на практическом использовании теории вероятности.

Облегчение планирования

С помощью ИИ человек может делать прогнозы и выяснять отдаленные последствия своих действий в будущем, чтобы принимать верные решения в настоящем. Планирование на основе искусственного интеллекта позволяет более эффективно достигать целей и оптимизирует общую производительность с помощью инструментов предиктивной аналитики, анализа данных, прогнозирования и моделей оптимизации. Это особенно актуально для робототехники, автономных систем, когнитивных помощников и кибербезопасности.

Развитие творчества

ИИ может обрабатывать огромные объемы данных, рассматривать варианты и альтернативы, чтобы находить новые направления творческой мысли или возможности для общественного прогресса. Например, система искусственного интеллекта может предоставить несколько вариантов дизайна интерьера для трехмерной планировки квартиры или предложить несколько неожиданных решений в оформлении фирменного стиля компании.

Возможность непрерывного обучения

Машинное обучение подразумевает способность компьютерных алгоритмов улучшать знания ИИ посредством наблюдений и прошлого опыта. Искусственный интеллект в основном использует две модели обучения — контролируемую и неконтролируемую, основное различие между которыми заключается в использовании различных наборов данных.

Поскольку системы ИИ обучаются независимо, они требуют минимального вмешательства человека или вообще могут обходиться бег него. Например, технология ML предполагает непрерывный автоматизированный процесс обучения.

Создание системы представления знаний

Исследования ИИ вращаются вокруг идеи представления знаний (knowledge representation) и инженерии знаний (knowledge engineering). Это относится к представлению «того, что известно» машинам с онтологией для создания набора объектов, отношений и понятий.

Представление знаний раскрывает информацию, которую компьютер использует для решения сложных практических проблем, таких как диагностика медицинских заболеваний или взаимодействие с людьми на естественном языке. Исследователи могут использовать представленную информацию для расширения базы знаний ИИ, а также для тонкой настройки и оптимизации своих моделей ИИ.

Поощрение социального интеллекта

Аффективные вычисления, также называемые «эмоциональным ИИ» (EAI), — это ветвь ИИ, которая распознает, интерпретирует и моделирует человеческий опыт, чувства и эмоции. С их помощью компьютеры могут считывать выражения лица, язык тела и тон голоса, чтобы позволить системам ИИ взаимодействовать и общаться на человеческом уровне. Исследовательские усилия в направлении «эмоционального ИИ» в перспективе приведут к появлению у машин социального интеллекта.

Недостатки искусственного интеллекта

Предвзятость алгоритмов

Системы ИИ работают с обученными данными, а значит их качество напрямую зависит от качества использованных данных, что неизбежно вызывает предвзятость. Этот недостаток может возникать из-за расовых, гендерных, социальных или культурных предубеждений, которые были свойственны людям, а позже перенеслись на алгоритмы, обученные на созданном человеком контенте. Предвзятость искусственного интеллекта может повлиять на такие жизненно важные решения, как выбор подходящих кандидатов во время собеседования или определение права на получение кредита.

Проблема «черного ящика»

Алгоритмы искусственного интеллекта похожи на «черные ящики» — методы их работы надежно скрыты от пользователей и специалистов. Мы можем увидеть, какой прогноз дала система, но не знаем, как она пришла к этому выводу, что снижает уровень доверия.

Требуется высокая вычислительная мощность

Чем больше алгоритмов ИИ участвуют в рабочем процессе, тем больше им требуется дополнительных ядер и графических процессоров. Ограничения, задаваемые «железом» — один из главных факторов, препятствующих повсеместному проникновению систем искусственного интеллекта во все области хозяйства.

Сложная интеграция

Интегрировать ИИ в существующую корпоративную инфраструктуру сложнее, чем добавить плагины на веб-сайты или изменить таблицы Excel. Важно убедиться, что текущее ПО и оборудование совместимы с требованиями системы искусственного интеллекта, а значит интеграция не понизит текущую производительность. Кроме того, необходимо внедрить интерфейс ИИ, чтобы упростить управление его инфраструктурой.

Юридические вопросы

Такие тонкие вопросы как массовая обработка конфиденциальных данных или ответственность за действия машин под управлением ИИ, могут стать причиной противоречий с действующими нормами законов. Хотя само понятие «искусственный интеллект» введено в российское правовое поле президентским указом № 490 и последующим федеральным законом № 123-ФЗ, детальное регулирование использования ИИ — задача ближайшего будущего.

Применение искусственного интеллекта — основные тренды

Информационная безопасность

Неумолимая статистика специалистов по информационной безопасности (ИБ) показывает, что количество киберугроз увеличивается с каждым днем. Согласно официальному заявлению МИД России, только за прошлый год число кибератак на отечественные веб-ресурсы возросло на 80 %. И главной целью часто становились сайты крупных организаций, предприятий и объекты критической информационной инфраструктуры (КИИ).

Клиенты не могут войти на сайт из-за DDoS? Хватит терпеть убытки! Подключите интеллектуальную DDoS-защиту CyberFlow и забудьте о проблемах!

Искусственный интеллект может эффективно дополнить усилия экспертов по кибербезопасности, сняв с них часть нагрузки. Машины отлично справляются с быстрой обработкой больших данных и успешно обнаруживаю любую странную или подозрительную активность. Конечно, даже самый продвинутый ИИ не сможет полностью заменить человеческий интеллект, но вместе они смогут создать более совершенные инструменты для решения ключевых задач ИБ, включая:

  • Выявление и прогнозирование — модели искусственного интеллекта могут обнаруживать даже малейшие потенциальные угрозы безопасности, уязвимости и вредоносные действия, чтобы превентивно останавливать их.
  • Сетевая безопасность — с помощью шаблонов сетевого трафика, ИИ может помочь автоматизировать такие важнейшие аспекты ИБ сетей, как параметры безопасности и топография сетей.
  • Защита паролем и аутентификация — хотя наличие надежного пароля остается обязательным условием сохранения кибербезопасности, технологии ИИ с биометрическими проверками (например, Face ID в iPhone) могут добавить к этому дополнительный уровень надежности.
  • Уменьшение влияния «человеческого фактора» — по статистике, человеческая ошибка при выполнении рутинных операций становится одной из наиболее частых причин утечки данных. ИИ поможет избежать проблемы, так как идеально точно справляется с повторяющимися задачами.
  • Борьба с угрозами ИБ на базе ИИ — после того, как было обнаружено, что первая кибератака с использованием искусственного интеллекта по модели Text-to-SQL достигла 100 % эффективности, стало очевидно, что противостоять подобным нападениям можно только с привлечением ресурса нейронных сетей.

Пример реализации: система защиты от DDoS-атак на базе искусственного интеллекта CyberFlow. Использование ИИ позволило эффективно выявлять и предотвращать любые разновидности распределенных атак типа «отказ в обслуживании» на всех уровнях сетевой модели OSI, а также создавать уникальный защитный профиль для каждого пользовательского аккаунта.

Чат-боты и виртуальные помощники

Еще одна тенденция ИИ, которая «сделала» прошлый год и перешла в этот — более умные чат-боты и виртуальные помощники. Старт этому дала пандемия COVID-19, вынудившая бизнес всех отраслей и размеров спешно оснащать своих сотрудников удаленными рабочими местами.

Большинство чат-ботов и виртуальных помощников используют технологии глубокого обучения (DL) и обработки естественного языка (NLP) для автоматизации рутинных задач. Одним из самых перспективных направлений применения этой разновидности ИИ является языковое моделирование, которое позволяет компьютерам понимать семантику языка, составлять предложения с помощью предсказания слов и преобразовывать текст в компьютерные коды.

Пример реализации: мы постоянно сталкиваемся с «умными» чат-ботами при попытке обратиться в колл-центр банка или крупной организации, а также пользуемся голосовыми помощниками от лидеров ИТ-индустрии (например, Алисой от Яндекса или Siri от Apple). Прорывом в данной области стала модель нейронной сети GPT-3 (Generative Pre-trained Transformer 3) от OpenAI, которая использует глубокое обучение на 175 миллиардах параметров для обработки и генерации человекоподобного языка. GPT-3 может создавать стихи, прозу, новости, посты и шутки, переводить с иностранного, решать примеры, давать описания, отвечать на вопросы о прочитанном, структурировать информацию и даже программировать.

На улучшенной версии этой языковой модели GPT-3.5 основан самый нашумевший ИИ-продукт последнего времени от OpenAI — чат-бот с искусственным интеллектом ChatGPT. Проект, официально запущенный 30 ноября 2022, смог всего за два месяца собрать рекордную по скорости роста аудиторию в 100 млн пользователей.

Уже в феврале 2023 года корпорация Microsoft внедрила нейросеть ChatGPT в два своих флагманских продукта — браузер Edge и поисковик Bing. Модель обработки естественного языка GPT, лежащая в основе ChatGPT, также станет базой для разрабатываемой Microsoft No-Code платформы Microsoft 365 Copilot. Эта технология генеративного искусственного интеллекта будет использоваться для автоматизации различных задач в популярных офисных приложениях Word, Excel, Teams, PowerPoint, Outlook, Power Platform и Viva.

Ожидается, что модель GPT-4, которая была представлена и запущена в тестовом режиме 14 марта 2023 год, будет иметь в 500 раз больше параметров анализа и обработки естественного языка, чем GPT-3, а главное — обладать мультимодальностью, то есть уметь работать не только с текстом, но также с изображениями и видео.

Google анансировала скорый выпуск аналога и ближайшего конкурента ChatGPT — нейросети Bard на основе собственной языковой модели LaMDA. Позденее ИТ-гигант заявил, что планирует в ближайшее время внедрить ИИ для генерации текста и изображений во все пользовательские продукты Google Workspace, включая Google Docs, Gmail, Sheets и Slides.

Генеративный ИИ

Генеративный искусственный интеллект — технология, которая использует ИИ и алгоритмы машинного обучения, чтобы создавать новый контент. Ее применение охватывает обширную область — от создания визуальных, аудио-, видео-материалов и программного кода до стресс-тестирования ПО и разработки продвинутых лекарственных препаратов.

Аналитики таких ведущих технологических изданий, как Gartner и Info-Tech включили генеративный ИИ в основные тренды искусственного интеллекта на ближайшие годы, в том числе за счет повышенного общественного интереса и хорошей коммерциализации.

Однако у широкого распространения генеративного ИИ есть и свои риски. Главный из них на сегодня — увеличение угроз, которые создают так называемые дипфейки (от англ. deep fake, «глубинная подделка»). Эти реалистичные имитации облика человека, часто медийной знаменитости или бизнес-персоны могут успешно использоваться для обмана, дезинформации или финансового мошенничества. Особенно опасные в этом плане дипфейки в реальном времени или лайв-дипфейки (real-time deepfakes). Такие инструменты на основе ИИ, как нейросеть VALL-E от Microsoft, которя может имитировать человеческий голос всего за три секунды ввода звука, способны открыть новую эру киберпреступности

Пример реализации: прошедший году стал по-настоящему «взрывным» для генеративных ИИ, отодвинув на задний план лидировавшее ранее в общественном мнении технологии метавселенных или криптовалюты. Благодаря таким сервисам, как Midjourney, DALL-E 2, Prisma Lab и Stable Diffusion интернет оказался буквально наводнен крайне реалистичными изображениями, созданными искусственным интеллектом по «заказу» пользователей. А исследования, которые проводят с генеративными ИИ крупные компании, вроде музыкального проекта MusicLM от Google, способны революционизоровать текущий подход к созданию любого интернет-контента.

Кстати. Появилась своя генеративная нейросеть и в России. Мультиязычная диффузионная модель Kandinsky для создания изображений по текстовому описанию, разработанная специалистами по искусственному интеллекту из Sber AI, содержит более 2 млрд параметров. Протестировать «русский Midjourney» можно на всех смарт-устройствах от Сбера (команда «Запусти художника»), в мобильном приложении Салют, а также в веб-версии на сайте FusionBrain.

Технологии с компьютерным зрением

Термин «компьютерное зрение» или «машинное зрение» относится к ИИ, который использует алгоритмы машинного обучения для воспроизведения человеческого зрения. Модели обучены идентифицировать шаблон на изображениях реального мира и классифицировать объекты на основе распознавания.

Эта технология находит применение в таких отраслях, как сфера обслуживания, здравоохранение, сельское хозяйство, промышленное производство, автономные транспортные средства и системы безопасности. Например, с помощью компьютерного зрения может сканировать запасы на складах в розничном секторе или автоматически определять местоположение пешеходов на видео с дорожных камер при проектировании систем защиты умных городов.

Пример реализации: самая продвинутая на сегодня комплексная система компьютерного зрения Tesla Vision, созданная с помощью платформы параллельных вычислений NVIDIA CUDA. Программное обеспечение поддерживает новейшее поколение автопилотов Tesla (Tesla Autopilot) и технологии автономного вождения.

Автономные транспортные средства

Поскольку все больше и больше производителей автомобилей продолжают инвестировать в автономные транспортные средства, ожидается, что проникновение беспилотных автомобилей на рынок значительно возрастет. Согласно прогнозам авторитетной некоммерческой организации Victoria Transport Policy Institute, к 2030-м, 2040-м годам автономные транспортные средства прочно займут свое место в парке общественных автобусов и грузовиков, а к 2045 году их число может составить половину от общего парка новых автомобилей.

Пример реализации: самоуправляемые автомобили с компьютерным зрением уже тестируются такими компаниями, как Tesla, Uber, Google, Ford, GM, Aurora и Cruise. В августе 2021 года Tesla представила чип Dojo, разработанный для обработки больших объемов изображений, собранных системами компьютерного зрения, встроенными в беспилотные автомобили. А в декабре 2022 компания Waymo (экс Google Self-Driving Car Project) подала финальную заявку на разрешение эксплуатировать полностью автономные такси в Калифорнии.

Цифровые двойники

Термин «цифровой двойник» (Digital Twin) относится к идеально синхронизированным, физически точным виртуальным копиям реальных объектов, процессов или сред. Эта прорывная технология цифровизации и цифровой трансформации всегда шла рука об руку с искусственным интеллектом. ИИ улучшает цифровые двойники, позволяя технологии анализировать вероятностные сценарии и запускать симуляции, предоставляя исследователям больше данных для анализа, что позволяет увеличить эффективность в принятии решений.

Пример реализации: масштабный проект «Цифровой двойник Москвы» включает в себя не только оцифровку улиц российской столицы, но и отображение в реальном времени транспортных потоков и состояния дорожной инфраструктуры. Это помогает городским властям автоматизировать многие области своей деятельности и принимать более объективные решения при планировании, опирающиеся на реальные данные.

Улучшение качества преподавания

В своей нашумевшей статье «Эпоха ИИ началась», Билл Гейтс заявил, что одним из важнейших прорывов, которые совершит искусственный интеллект в ближайшем будущем, станет кардинальное улучшение качества и доступности образования. По прогнозам основателя Microsoft, в ближайшие 5-10 лет программное обеспечение на основе ИИ, наконец, сможет революционизировать процесс обучения даже сильнее, чем в свое время это сделало повсеместное распространение ПК. Такие прорывные инструменты, как ChatGPT смогут помочь ученикам лучше разобраться в сложных терминах и выбрать предметные области для углубленного изучения, а учителям повысить качество оценки знаний при проверке письменных заданий.

Пример реализации: с 2023 года в России стартует тестовое испытание проекта по выборочной провере школьных сочинений с помощью искусственного интеллекта. Как сообщили «РИА-Новости» со ссылкой на пресс-службу Национальной технологической инициативы (НТИ), применение ИИ для оценки работ по русскому языку, литературе и истории предположительно позволит сэкономить до 20% рабочего времени учителя и значительно повысить точность обнаружения ошибок.

Разработка инновационных лекарств

Широкое привлечение искусственного интеллекта к созданию медицинских препаратов может по-настоящему революционизировать фармокологичекую отрасль. Благодаря огромной скорости и точности обработки данных, а также новым подходам к прогнозированию результатов, ИИ способен совершить прорыв в критических областях, от которых зависят жизни миллионов людей. Применение машинного интеллекта спсобно не только дать надежду победить неизлечимые сегодня заболевания, но и сделать более эффективно существующую систему здравоохранения, повсеместно внедрив в нее автоматизацию и принципы цифровой трансформации.

Пример реализации: система на основе алгоритмов глубокого обучения AlphaFold, разработанная компанией DeepMind, способна моделировать в 3-D среде поведение белковых структур человечекого тела. В начале 2023 года авторитетный британский научный журнал Chemical Science опубликовал исследование, в котором утверждалось, что с помощью AlphaFold всего за 30 дней работ ученым удалось вплотную приблизиться к созданию лекарства от рака печени.

Заключение

По мере того как роль искусственного интеллекта повышается во всех аспектах жизни общества, науки и бизнеса, мы видим все больше примеров блестящей реализации этой технологической парадигмы. Сегодня «машины» помогают людям автоматизировать производство, анализировать большие объемы данных, улучшать качество обслуживания клиентов или находить новые вдохновляющие идеи творчества.

Подобный качественный переход стал возможен, поскольку ИИ, машинное обучение, глубокое обучение и нейронные сети стали доступны не только крупным компаниям, но также малым предприятиям и даже обычным пользователям в виде готовых сервисов, работающих по принципу «кликнул и готово».

Вопреки распространенному мнению о том, что ИИ заменит людей на всех должностях, в ближайшие годы можно ожидать только более высокой степени интеграции между людьми и машинами. Подобное сотрудничество будет однозначно полезно для человека. По мере повышения доступности, ИИ будет улучшать наши когнитивные навыки и способности, а также повысит общую производительность труда и эффективность в принятии решений.

Современное состояние искусственного интеллекта Текст научной статьи по специальности «Компьютерные и информационные науки»

ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ / МАШИННОЕ ОБУЧЕНИЕ / РИСКИ ПОЯВЛЕНИЯ СУПЕРИНТЕЛЛЕКТА / РЫНОК СИСТЕМ ИИ / ARTIFICIAL INTELLIGENCE / MACHINE LEARNING / RISKS OF SUPER-INTELLIGENCE APPEARANCE / THE MARKET OF AI SYSTEMS

Аннотация научной статьи по компьютерным и информационным наукам, автор научной работы — Пройдаков Эдуард Михайлович

В статье приведена краткая история работ в области искусственного интеллекта (ИИ), охарактеризованы направления ИИ, дается общий обзор современного состояния исследований и разработок систем ИИ, перечислены основные тенденции НИОКР в области ИИ, показаны возможности использования систем ИИ в области государственного управления.

i Надоели баннеры? Вы всегда можете отключить рекламу.

Похожие темы научных работ по компьютерным и информационным наукам , автор научной работы — Пройдаков Эдуард Михайлович

Тенденции развития искусственных нейронных сетей в цифровой экономике
Перспективы нейронных сетей и глубокого машинного обучения в создании решений для здравоохранения
Зарождение и развитие искусственного интеллекта: характеристика исследовательских направлений
Технологии искусственного интеллекта как фактор цифровизации экономики России и мира
Искусственный интеллект в банках сегодня: опыт и перспективы
i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.
i Надоели баннеры? Вы всегда можете отключить рекламу.

Current state artificial intelligence

The article gives a brief history of works in the field of artificial intelligence (AI), characterizes the directions of AI, provides an overview of the current state of research and development of AI systems, lists the main trends of research and development in the field of AI, shows the possibilities of using AI systems in public administration.

Текст научной работы на тему «Современное состояние искусственного интеллекта»

СОВРЕМЕННОЕ СОСТОЯНИЕ ИСКУССТВЕННОГО ИНТЕЛЛЕКТА

Аннотация. В статье приведена краткая история работ в области искусственного интеллекта (ИИ), охарактеризованы направления ИИ, дается общий обзор современного состояния исследований и разработок систем ИИ, перечислены основные тенденции НИОКР в области ИИ, показаны возможности использования систем ИИ в области государственного управления.

Abstract. The article gives a brief history of works in the field of artificial intelligence (AI), characterizes the directions of AI, provides an overview of the current state of research and development of AI systems, lists the main trends of research and development in the field of AI, shows the possibilities of using AI systems in public administration.

Ключевые слова: искусственный интеллект; машинное обучение; риски появления суперинтеллекта; рынок систем ИИ.

Keywords: artificial intelligence; machine learning; risks of superintelligence appearance; the market of AI systems.

Что такое ИИ и немного истории

Искусственный интеллект — что это такое? Наиболее сложной сущностью в мире является человек. Стремление познать сложность человека — существовало всегда и проявлялось в разных формах. Сейчас это стало еще более актуально. Развитие компьютерных технологий привело к появлению множества работ, связанных с попытками научиться распознавать и синтезировать челове-

ческую речь, создать системы технического зрения, которые могут опознавать лица людей не хуже, а уже лучше, чем глаза человека, научить автомашины ездить самостоятельно без водителя-человека и т.д. Системы, проявляющие поведение, свойственное человеку, называются системами искусственного интеллекта (ИИ). На самом деле изучение этих систем — самостоятельное научное направление, объединяющее многие научные дисциплины.

Согласно одному из определений, искусственный интеллект -это наука и технология, включающая набор средств, позволяющих компьютеру на основании накопленных знаний давать ответы на вопросы и делать на базе этого экспертные выводы, т.е. получать знания, которые в него не закладывались разработчиками. Наука под названием «искусственный интеллект» входит в комплекс компьютерных наук, а создаваемые на ее основе технологии относятся к информационным технологиям. Есть множество других определений, менее устойчивых к критике.

Соответственно, системы ИИ определяют как компьютерные системы, использующие в своей работе технологии ИИ. При этом в большинстве случаев до получения результата неизвестен алгоритм решения задачи.

Системы ИИ условно делятся на два класса — сильный (или общий) ИИ и слабый (или прикладной) ИИ. Определим сильный, или универсальный, искусственный интеллект как ИИ, сравнимый с человеческим, т.е. ИИ, который может учиться, как это делают люди, и не уступает по уровню развития большинству людей, а во многих смыслах даже превосходит их. Есть множество более строгих определений, но для понимания данного определения достаточно.

Все остальные системы, в том числе системы ИИ, которые окружают нас сейчас, называются слабым ИИ, поскольку они могут делать только одно дело, например осуществлять поиск по запросам в Интернете, ставить диагноз по конкретному заболеванию и т.д. Помощь такого ИИ делает жизнь более комфортной, а работу — более производительной. Такие системы в ближайшем будущем будут все больше совершенствоваться, уже сейчас многие конкретные виды работ системы с ИИ делают лучше, чем люди. Следует отметить, что в процессе работы над проектами со слабым ИИ проделывается громадная подготовительная работа. Машины учат таким интеллектуальным занятиям, как поиск информации, распознавание речи, обработка естественного языка, распознавание лиц, логический вывод и др. По отдельности это

всего лишь мощные инструменты, но они быстро развиваются, год от года продвигая технологии ИИ вперед и приближая создание сильного ИИ.

В связи со слабым ИИ следует упомянуть о так называемом эффекте ИИ (AI Effect). Он заключается в том, что как только с помощью ИИ реально достигается немыслимый ранее результат, то такую задачу критики перестают считать задачей ИИ, т.е. девальвируют ее значение. Этот эффект сформулирован в формуле Ларри Теслера: «ИИ — это все, что не сделано до сих пор».

Для обеспечения систем ИИ ученым пришлось заняться таким вопросом, как представление знаний, — это позволило создать так называемые экспертные системы (ЭС, системы, которые на основе баз знаний помогают в принятии решений); очень важными стали методы самообучения машин (появились интеллектуальные обучающие системы); попытки повторить работу нервной системы человека. Последнее вылилось в создание искусственных нейронных систем (ИНН). Таким образом, в основе всех исследований по ИИ лежит идея моделирования процессов человеческого мышления с помощью компьютера. Сам ИИ как наука относится к когнитивным наукам, т.е. к наукам, связанным с приобретением (сбором, накоплением, восприятием) знаний.

Предполагается, что ИИ, сравнимый с интеллектом человека, будет иметь неограниченную сферу применения и кардинально изменит наше существование.

В январе 2016 г. основатель Всемирного экономического форума в Давосе Клаус Шваб назвал искусственный интеллект одной из основных движущих сил четвертой промышленной революции. «Эта четвертая промышленная революция идет на нас, как цунами, а ее основной движущей силой являются достижения в области искусственного интеллекта, робототехники, нанотехно-логий, «интернета вещей» и других областей науки».

Сейчас происходит качественный переход от вычислительной эры к эре когнитивной (в терминах футурологов, Second Machine Age), когда компьютеры нового типа быстро учатся работать со структурированными, неструктурированными и нечетко структурированными данными, начинают замещать труд людей при решении большого количества когнитивных задач [2].

Три волны искусственного интеллекта

ИИ имеет уже более чем полувековую историю, в которой были как пики интереса к нему, так и периоды почти полного его исчезновения.

Первые работы по ИИ относятся к 1950-м годам. Начались они с попыток решения двух задач:

1) создание программы для игры в шахматы (в 1954 г. аналитики корпорации REND А. Ньюэлл, Дж. Шоу и Г. Саймон начали писать программу игры в шахматы. Помочь им вызвались А. Тьюринг и К. Шеннон, а также группа голландских психологов. В 1957 г. шахматная программа (NSS) была написана. В основе ее работы лежали эвристики, т.е. правила выбора решения в отсутствие теоретических оснований [23]);

2) создание программ машинного перевода с одного естественного языка на другой. В СССР первые экспериментальные системы перевода с английского и китайских языков разрабатывались в 1954-1957 гг. на ЭВМ БЭСМ-2 в ИТМиВТ под руководством Л.Н. Королёва. В 1954 г. в корпорации IBM под руководством профессора Леона Достерта перевели на английский язык 60 русских фраз на основе словаря, состоящего из 250 пар слов, и шести правил грамматики. Результаты казались многообещающими, но проблема оказалась намного сложнее, чем предполагалось. Суть перевода заключалась в обучении компьютеров не только правилам, но и исключениям, а технические средства компьютеров того времени никак не позволяли реализовать эту задачу. Тем не менее попытки создания таких систем дали мощный толчок развитию математической лингвистики. К этому же периоду относится и появление первых программ для игры в шахматы.

Третьей областью, которая зародилось в то время, а впоследствии получила большое развитие, стало автоматическое доказательство теорем. В 1960 г. появилась программа, которую назвали «Универсальным решателем задач» (GPS), которая позволяла автоматически доказывать теоремы из планиметрии, находить решения алгебраических задач и др. [23].

Среди множества работ по ИИ первой волны следует отметить создание в 1963 г. Джоном Маккарти первого языка для программирования задач ИИ — языка ЛИСП. Появление этого языка открыло функциональное программирование. Заметим, что первые языки высокого уровня (ЯВУ) того времени были процедурными.

Вторая волна ИИ, начавшаяся с конца 60-х годов, была связана с появлением логического программирования (язык Prolog, 1971 г.) и бумом вокруг так называемых экспертных систем (ЭС). Это тоже были зачатки искусственного интеллекта, но в ЭС специалист по управлению знаниями, опрашивая экспертов в предметной области, вручную наполнял базу знаний (БЗ), а машина могла делать логический вывод в рамках того «пони-

мания», которое человек в нее заложил, т.е. полностью отсутствовал такой важный элемент, как самообучение. Кроме того, возникали проблемы с экспертами, которые не делились своими знаниями или переставали это делать, как только понимали, что внедрение ЭС понизит их профессиональный статус, поскольку любой начинающий специалист с помощью ЭС может добиться высоких результатов. Следует отметить, что создание ЭС породило большой интерес к проблеме представления знаний в компьютерных системах. В это время появились семантические сети, системы фреймов, продукционные системы (системы, основанные на правилах) и их комбинации.

Между тем работы над системами машинного перевода текстов продолжались и существенно продвинулись. Развитие таких систем стало особенно актуальной задачей во времена холодной войны, когда в США поступало огромное количество материалов на русском языке, но не хватало человеческих ресурсов для их быстрого перевода. «В 1990-х годах в проекте компании IBM Candide был задействован десятилетний опыт переводов стенограмм заседаний канадского парламента, опубликованных на французском и английском языках, — около 3 млн предложений. Поскольку это официальные документы, их переводы были выполнены с соблюдением чрезвычайно высоких требований. По меркам того времени количество данных было огромным. Эта технология, получившая известность как «статистический машинный перевод», превратила задачу перевода в одну большую математическую задачу» [18]. Однако повышение качества машинного перевода на этом застопорилось.

Ко второй волне относится также создание продвинутых программ для игры в шашки и шахматы. Прошли первые чемпионаты мира по игре машин в шахматы между собой. Здесь следует отметить победу на чемпионате мира в 1974 г. советской шахматной программы «Каисса» (М. Донской, А. Арлазаров, А. Битман, А. Усков). Успех «Каиссы» оказался мировой сенсацией, поскольку все предрекали победу американской программе. Как вспоминал М.В. Донской, «Каисса» играла в силу второго шахматного разряда, т.е. до программ, которые обыгрывают гроссмейстеров, было еще далеко.

Системы первой и второй волны получили шуточное название «старый добрый ИИ», или «символьный ИИ». В целом они были основаны на формальной логике, которая хорошо применима для формализуемых задач, типа логических игр, но в ней трудно представить системы реального мира.

Нынешнее возрождение интереса к ИИ — уже третье по счету и отличается от предыдущих как амплитудой, так и охватом, поскольку сейчас для решения задач ИИ имеются как необходимые технические средства, повсеместно распространившиеся беспроводные сети, Интернет,

так и далеко продвинувшиеся работы в этой области. Начало третьей волне положила знаменитая победа в матче из шести партий американской программы «Дип Блю» (2,5:3,5) над чемпионом мира по шахматам среди людей Гарри Каспаровым.

В программировании в начале третьей волны появилось так называемое генетическое программирование. Оно позволяет, имитируя процесс мутаций, работающий в биологических системах, решать определенные классы задач, например при поиске оптимальных решений.

В области ИИ действует своя мода на то или иное направление. Очень много внимания одно время уделялось программным агентам. Интеллектуальный программный агент — это активная программная или программно-аппаратная система (например, робот), обладающая автономностью в выполнении той функции (или набора функций), для которой она создана. Основные проблемы: коммуникация интеллектуальных агентов, разработка языков для этой цели, координация поведения агентов, распределение ролей в коалициях агентов, коллективное поведение агентов [23].

Для современного этапа характерно очень быстрое развитие технологий искусственных нейронных сетей (ИНС) — сетей, имитирующих работу биологических нейронов живых существ. Простейшая ИНС состоит из трех слоев искусственных нейронов — на первый слой поступают сигналы из внешнего мира, во внутреннем слое они обрабатываются и передаются в выходной слой, в котором формируется результат. Внутренних, скрытых слоев может быть много.

Развиваются на базе новых технологий также и системы, появившиеся во время первых волн развития ИИ, — системы машинного перевода, достигшие вполне приемлемого качества, ЭС и др. В 2006 г. появилась система Google Переводчик, основанная на Больших данных. Корпус из триллиона слов, выпущенный Google в 2006 г., состоял из разбросанных фрагментов интернет-контента. Он стал «обучающим набором», по которому вычислялась вероятность того, что именно последует за тем или иным английским словом. В систему можно добавлять новые слова, которые появляются в естественном языке, и удалять устаревшие. «Ее переводы точнее, хотя и весьма далеки от совершенства: к середине 2012 г. она охватила более 60 языков, а теперь даже способна принимать голосовой ввод на 14 языках для моментального перевода» [18].

Один из вопросов к современной ИИ состоит в том, завершится ли эта третья волна очередным разочарованием и снижением интереса к ИИ, или в результате нынешних колоссальных усилий мирового научного сообщества будет достигнут необратимый прогресс в данной области.

По мнению автора, ставки на ИИ сейчас очень высоки и это направление будет интенсивно развиваться.

Научная дисциплина «Искусственный интеллект» — зонтичная. Внутри ИИ делится на множество направлений. Вот основные из них:

— Машинное обучение (приобретение знаний, анализ данных и порождение гипотез).

— Обработка естественных языков.

— Инструментальные средства ИИ.

Каждая из перечисленных ветвей ИИ в свою очередь делится на десятки других направлений, особенно робототехника (несколько десятков направлений).

Как видим, из-за обширности ИИ ученому невозможно охватить все его ветви, требуется специализация.

Что достигнуто в ИИ к настоящему времени?

1. Громадное количество научных работ по ИИ посвящено компьютерному зрению. Это направление ИИ связано с развитием глубинного обучения (о нем ниже). Впервые компьютеры стали способны выполнять некоторые визуальные задачи классификации лучше, чем люди. Например, заявленная точность назначения оптимального лечения раковых заболеваний легких у компьютера IBM Watson составляет 90%, т.е. превышает на 40% качество диагностики, проводимой врачами-онкологами.

2. Важным понятием в ИИ является «машинное обучение» (его называют также статистическим обучением). Основу данной технологии в 1959 г. заложил Артур Самюэль, когда предложил работать над обучением компьютеров, не используя определенно запрограммированные алгоритмы. В простейшем смысле программа обучается, когда в ней происходит изменение, позволяющее во второй раз выполнить определенное задание лучше.

Машинное обучение — это технология, в рамках которой создается база обучающих примеров, по которой компьютер или нейросеть настраивается (обучается) и затем может правильно распознавать и классифицировать поступающие новые данные, т.е.

это совокупность алгоритмов и методов, позволяющих научить компьютеры делать выводы на основании имеющихся данных. Добавление обучающих примеров позволяет улучшить результаты распознавания. Таким образом происходит как бы самообучение программы. По этой технологии по большой базе фотографий компьютер научили распознавать лица, причем он делает это точнее, чем человек. Настоящий прорыв в обучении машин произошел в начале 2016 г., когда программа Google AlphaGo сумела обыграть в игру го ее абсолютного чемпиона Ли Седоля. Эта игра является наиболее интеллектуально сложной игрой в мире, намного сложнее шахмат (в го доска 19 х 19 клеток и возможных позиций намного больше, чем в шахматах), в которой для победы необходимо не просто перебирать всевозможные ходы. Добиться победы в го над ее чемпионом позволила технология «глубинного машинного обучения» (deep learning, DL), которая сейчас является самым трендовым направлением развития искусственного интеллекта. Этот термин применяемся к искусственным нейронным сетям (ИНС), где используется больше одного скрытого слоя, поэтому формально «глубинный» указывает еще и на более многослойную архитектуру нейронной сети (см. с. 134). Уникальным для глубинного обучения является то, что машина сама находит признаки (ключевые черты чего-либо, по которым легче всего отделить один класс объектов от другого) и структурирует их иерархично: из более простых складываются более сложные. У термина «глубинное обучение» нет формального определения, поскольку он объединяет целую группу различных технологий [29]. Таким образом, компьютер учится на примерах и своем собственном опыте. Программа AlphaGo сначала проанализировала 29,4 млн ходов в 160 тыс. партий профессиональных игроков, а затем две копии программы начали играть одна с другой, добавляя новые партии в обучающую выборку. Сыграв миллионы партий, программа научилась оценивать наиболее выгодное положение камней на доске для достижения победы [12].

Технология глубинного обучения сейчас является неотъемлемой частью исследований в области распознавания речи, изображений, при создании систем управления беспилотными автомобилями, диагностике заболеваний и решении других сложных задач. Развитием технологии глубинного обучения стала реализованная IBM летом 2017 г. технология распределенного глубинного обучения (DDL), позволяющая на порядок сократить время обучения искусственной нейронной сети.

Следует отметить, чего не может современный ИИ и что отделяет его от общего ИИ:

— отсутствует запоминание ранее приобретенных навыков при обучении новым;

— ИИ не может при обучении новым навыкам опираться на ранее приобретенные, т.е. отсутствует обобщение накопленных знаний и использование их в разных контекстах.

Массовое распространение смартфонов породило широкое использование речевых помощников, в которых реализуются элементы ИИ. Такие приложения помогают пользователю в его повседневной деятельности. Среди них такие известные приложения, как Siri (компании Apple), Cortana (Microsoft), Google Now (Google), Echo (Amazon), «Алиса» (Яндекс) и др., которым уже пользуются десятки миллионов людей. Данные приложения реализуются также на планшетах, ноутбуках и персональных компьютерах. Со временем эти программы станут все интеллектуальнее и незаменимее.

Важным направлением работ по ИИ является выявление структуры мозга человека. Такие проекты весьма дорогостоящие, и потому их реализацию могут позволить себе немногие страны и гигантские корпорации.

Анализ структуры мозга — это обратное проектирование, которое предполагает, что сначала нужно разобраться до тонкостей в человеческом мозге, а затем представить то, что мозг делает, в виде аппаратного и программного обеспечения. В итоге ученые надеются создать компьютер, обладающий ИИ человеческого уровня. Несколько громадных проектов (с инвестициями в миллиарды долларов) нацелено на достижение этого результата. Моделированию человеческого мозга посвящен международный проект Human Brain Project (HBP), который ведет команда из швейцарской Федеральной политехнической школы в Лозанне под руководством профессора Генри Маркрама (Henry Markram) и в котором участвует более 100 научных групп со всего мира. Цель проекта — синтезировать все знания, полученные людьми о мозге, в единую полноценную модель мозга внутри суперкомпьютера. Завершение проекта предполагается в 2023 г. Американский проект Brain Activity Map Project («Карта активности мозга», 2013 г.) рассчитан на то, за 10 лет американским ученым удастся зафиксировать и картографировать активность каждого нейрона в человеческом мозге.

Есть еще около десятка менее емких, но не менее важных проектов по изучению мозга. Весьма интересен проект Blue Brain,

базирующийся в Швейцарии, в котором ученые изучают работу ансамблей нейронов. Проект SyNAPSE, финансируемый DARPA и корпорацией IBM, ставит задачу создания физической копии мозга, воплощенной в виде специальных микросхем с искусственными нейронами. Это направление получило название нейроморфная электроника [1]. Аналогичные проекты развивает Китай. Тем не менее в настоящий момент исчерпывающее моделирование мозга невозможно в силу ограниченных возможностей современных суперкомпьютеров (для этого требуется производительность в десятки эксафлопс, т.е. на 3-4 порядка больше нынешней).

Из других глобальных проектов, в которых предполагается использовать методы ИИ и системную аналитику, следует отметить продолжение проекта «Геном человека», в котором планируется определить ДНК-последовательности всех живых существ планеты. Например, Amazon Third Way разрабатывает проект под названием «Банк кодов Земли» [16].

Почему вокруг ИИ такой ажиотаж (ожидания)

1. Проводившаяся более полувека компьютеризация производства и практически всех аспектов деятельности человека породила некоторый тупик, связанный с обработкой и анализом всего растущего объема ежедневно появляющихся данных. По ходу борьбы с ними появились хранилища данных, оперативный анализ данных, облачные вычисления, Большие данные (Big Data). А с другой стороны — новые модные технологии, которые будут генерировать на порядки большие потоки данных, — Интернет вещей, Индустрия 4.0, Общество 5.0 и т.п. Развитие систем ИИ — это стремление перенести высокоуровневую обработку накопленных данных с человека на компьютерные системы, транзисторные и / или нейроморфные. Мировые ИТ-лидеры ведут гонку в создании специализированных процессоров и суперкомпьютеров для обучения нейронных сетей. В идеале их обучение должно происходить в реальном времени, но сейчас это занимает недели.

2. Эра компьютеров как двигателя полупроводниковой индустрии, заканчивается. Сейчас все надежды на то, что таким двигателем станут ИИ и робототехника. Здесь уже сформировались громадные по объемам сегменты: промышленная, сервисная и военная робототехника, беспилотные транспортные средства, медицинская робототехника и др. Однако без систем ИИ полноценное развитие этих направлений невозможно. Таким образом, робото-

техника сейчас сильно стимулирует исследования в области ИИ. Например, появление беспилотных транспортных средств — это потенциально бизнес в триллионы долларов, поэтому все автомобильные гиганты и другие корпорации вкладывают миллиарды долларов в разработку таких систем.

3. Как в свое время расшифровка генома человека дала экономике США 3% прироста ВВП (каждый вложенный в нее доллар принес 140 долл. прибыли), ожидается, что успехи в создании ИИ дадут громадный прирост бизнесу стран, развивающих исследования в этой области. Поэтому ряд стран, в частности Китай, Южная Корея, а также Евросоюз поставили работы по ИИ в ряд важнейших государственных задач.

4. Более конкретно: ожидается, что ИИ приведет к улучшению процессов управления, развитию отношений производителей с потребителями, оптимизации всех бизнес-процессов, совершенствованию планирования и кадровой работы, превращению продуктов в сервисы и смене бизнес-модели многих бизнесов. Пример -компания Uber.

Крайне трудно в наш век неопределенности делать прогнозы. Все перечисленные ниже прогнозы называют сильно завышенные объемы рынка ИИ на ближайшие годы. Рост его, по нашему мнению, будет весьма значительным, но не столь ошеломляющим, как предсказывают аналитические агентства (см. табл.).

Основные области применения систем искусственного интеллекта (%)

Системы исследований и рекомендаций в сфере управления качеством 10,3

Диагностические и лечебные системы 10,0

Автоматизированные службы поддержки клиентов 9,8

Автоматизированные системы предотвращения угроз 9,8

Системы анализа и расследования мошенничества 9,0

Источник: IDC, 2017 [31].

Искусственный интеллект стал ключевым технологическим трендом 2016 г., и объем глобальных инвестиций в него превышает 500 млн долл.

Согласно прогнозу IDC, продажи когнитивных систем и систем искусственного интеллекта в 2017 г. в мире вырастут на 59,3% и достигнут 12,5 млрд долл. [31].

По прогнозам международной исследовательской компании Markets and Markets, к 2020 г. рынок ИИ вырастет до 5 млрд долл. за счет применения технологий машинного обучения и распознавания естественного языка в рекламе, розничной торговле, финансах и здравоохранении.

В агентстве Gartner считают, что к 2020 г. около 40% всех взаимодействий с виртуальными голосовыми помощниками будет опираться на данные, обработанные нейронными сетями [15].

Консалтинговая компания Tractica считает, что динамика ИИ будет основываться на шести фундаментальных технологиях: машинное обучение, глубинное обучение, компьютерное зрение, обработка естественного языка, машинная аргументация и сильный ИИ. Хотя в перспективе 10 лет ИИ-технологии повлияют практически на каждый бизнес, основными драйверами рынка станут секторы потребительских продуктов, бизнес-услуг, рекламы и обороны. Tractica предсказывает рост рынка ИИ с 643,7 млн долл. в 2016 г. до 38,8 млрд долл. к 2025 г. [15].

Ключевым драйвером этого рынка является уход всех процессов как в бизнесе, так и в потребительском сегменте в облака, а также рост влияния Интернета, смартфонов, социальных медиа. Акторами этого рынка являются такие крупные корпорации, как NEC, Google, Honeywell, Hitachi и Qualcomm Technologies. Также присутствует множество меньших по размеру игроков, таких как LTU Technologies, Attrasoft, Blippar и SLYCE, и таких вендоров, как Catchoom и Wikitude.

Мировой рынок распознавания речи оценен BCC Research в колоссальные 90,3 млрд долл. в 2015 г. Ожидается, что этот рынок вырастет с 104,4 млрд долл. в 2016 до 184,9 млрд долл. в 2021 г. со средними темпами (CAGR) на уровне 12,1% за период 2016-2021 гг.

Рынок обработки естественного языка (Natural Language Processing, NLP) оценивается Market And Markets в 7,63 млрд долл. в 2016 г. и вырастет до 16,07 млрд долл. к 2021 г., с CAGR на уровне 16,1%. Основными драйверами компания считает возрастающий спрос на более продвинутый уровень пользовательского опыта,

рост пользования умными девайсами, рост инвестиций в здравоохранение, растущее применение сетевых и облачных бизнес-приложений и рост М2М-технологий.

BoA предполагает, что к 2020 г. рынок ИИ-решений будет эквивалентен 153 млрд долл., из которых 83 млрд долл. составят роботы и робототехника и 70 млрд долл. — аналитические решения на основе ИИ.

В результате так называемая «революция роботов», о которой говорят экономисты и аналитики крупнейших банков, позволит мировой экономике повысить производительность на 30% при снижении производственных затрат на рабочую силу от 18 до 33%. В общей сложности на мировом рынке работает порядка 400 компаний, занимающихся производством робототехники [15].

Гонку за искусственным интеллектом китайцы начали не вчера, а как минимум пятилетку назад — Baidu, Alibaba и Tencent создали центры развития ИИ в это время. Результаты значительные — более 8000 патентов в данной области за 2010-2015 гг. Частный бизнес уже давно участвует в этой гонке [19].

Как видно из приведенных оценок, прогнозы аналитических агентств достаточно пестрые, с большим разбросом показателей, но с хорошими перспективами роста во всех секторах ИИ.

Основные международные программы и центры разработки

Работами в области ИИ сейчас заняты практически все крупные зарубежные компании, университеты и научные агентства. Существует список из более чем 1000 стартапов, работающих в этой области. Лидерами являются такие известные бренды, как Google, IBM, Microsoft, Amazon, Apple, DARPA и др.

Например, огромный скачок в распознавания речи сделала Microsoft, которая объявила, что ее система распознавания речи теперь так же точна, как распознавание речи живым человеком. Довести систему распознавания речь до такого высокого уровня удалось в том числе с помощью метода, разработанного резидентом «Сколково», компанией «ЦРТ-инновации» (группа «Центр речевых технологий»), который был представлен на международной конференции Interspeech сентябре 2016 г. в Сан-Франциско [15].

При этом корпорации тесно сотрудничают с ведущими университетами. Так, в начале сентября 2017 г. IBM объявила о заключении 10-летнего соглашения о партнерстве с университетом

i Не можете найти то, что вам нужно? Попробуйте сервис подбора литературы.

на сумму 250 млн долл. В этих работах будут задействованы более 100 исследователей из обеих организаций, которые будут сотрудничать в продвижении ключевых областей в области ИИ, таких как алгоритмы глубокого обучения, взаимосвязь между машинным обучением и квантовыми вычислениями и применение суперкомпьютера Watson в здравоохранении и кибербезопасности.

Китайские программы развития ИИ базируются на широком финансировании исследований в университетах, государственной поддержке работ отечественных компаний, создании в КНР совместных с западными странами исследовательских и разработ-ческих центров. Отметим, что 2017 г., согласно отчету компании CB Insights, Китай впервые обошел США по объему инвестиций в стартапы, разрабатывающие системы искусственного интеллекта. На долю США пришлось 38% мировых инвестиций в ИИ-стар-тапы, а на долю Китая — 48% [7].

Состояние работ по ИИ в РФ

Россия вступила в третью волну ИИ с существенным запозданием.

Финансированием исследований в области ИИ занимаются Российский фонд фундаментальных исследований (РФФИ), Российский научный фонд (РНФ), однако из-за отсутствия координирования работ финансирование исследований и разработок в целом недостаточное и выглядит лоскутным. Наилучшее положение в России сейчас у разработчиков военных роботов.

В РФ в настоящее время разрабатываются проекты по распознаванию речи, распознаванию лиц и распознавании образов, системы автономного вождения автомобилей и др. приложения ИИ.

Крупные российские компании уже используют ИИ для своего бизнеса. C помощью технологий машинного обучения компания МТС прогнозирует желание абонента воспользоваться тем или иным сервисом. Ему делается предложение еще до того, как абонент сам обратится к компании за подключением услуги. Это экономит время клиента и одновременно повышает уровень продаж [32].

«Сбербанк» совместно с МФТИ разрабатывает проект по использованию технологии ИИ в колл-центре. Задача этого проекта, который называется «Нейроинтеллект iPavlov», — разработка алгоритмов глубинного машинного обучения для создания разговор-

ного ИИ. Данная технология должна снизить нагрузку на сотрудников и повысить качество работы с клиентами [32].

Компания «Яндекс» разрабатывает ИИ-приложения для оптимизации производства в промышленности. Кроме того, компанией представлен метод машинного обучения CatBoost — это наследник метода «Матрикснет», который применяется почти во всех сервисах «Яндекса» [32].

Компания ABBYY использует технологии ИИ в решении ABBYY FlexiCapture, универсальной платформе для интеллектуальной обработки информации. Она определяет тип документа, извлекает из него данные и отправляет их в информационные системы: в CRM, в учетные системы, в системы управления закупками [32].

Приложения ИИ разрабатываются для роботов и БПЛА; так, например, разрабатывается ИИ для семейства беспилотников «Фрегат», создаваемых группой «Кронштадт». Академическая и вузовская наука проводит отдельные исследования по тематике ИИ, однако масштабные и скоординированные НИОК по ИИ практически полностью отсутствуют.

Наибольшую озабоченность вызывает состояние обучения когнитивным наукам. По многим из них просто нет квалифицированных преподавателей. Программы обучения катастрофически отстают от потребностей рынка труда.

В целом в стране существует около десятка сильных коллективов, занимающихся ИИ.

Следует отметить разработки Федерального исследовательского центра «Информатика и управление» (ФИЦ ИУ РАН) [23]:

EXACTUS EXPERT — система для семантического поиска и анализа качества научных публикаций;

EXACTUS PATENT — для семантического поиска и анализа патентной информации;

EXACTUS LIKE — для обнаружения близких текстов и вычисления степени семантической близости;

TEXT Appliance — информационно-аналитическая система анализа неструктурированной информации.

Главная проблема в том, что в России очень мало фундаментальных хороших исследований доходят до готового продукта. Существует разрыв между фундаментальной наукой, которая выжила в «лихие 90-е», и реализацией ее наработок в конкретном продукте [17].

Основные направления работ в области ИИ

Работы в области ИИ сейчас ведутся во многих странах и развернуты широким фронтом. Они группируются вокруг следующих направлений.

1. Глубинное обучение. Здесь усилия направлены на существенное сокращение времени обучения нейросети и уменьшение объема обучающей выборки. В идеале нейросеть должна обучаться в реальном времени.

2. Синтез роботом ответов, исходя из того корпуса знаний, который в него загрузили, в привязке к контексту и последовательности слов. Робот должен научиться соотносить поступающую информацию со своей базой знаний и обучаться [20].

3. Разработка нейроморфных микросхем и компьютеров на их базе. Такие микросхемы уже выпустили корпорации IBM и Intel. Пока они содержат до 4096 искусственных нейронов и до 256 млн синапсов, но направление весьма перспективно.

4. Продолжатся работы по картрированию мозга человека и моделированию его работы.

5. Разработка систем распознавания и понимания речи. Многие сервисы используют речевой интерфейс, требующий хорошего распознавания речи. Наряду с этим важно и понимание сказанного пользователем. В этом плане очень важно понимание такими системами контекста сказанного, поскольку контекст -важнейшая часть естественного языка. В этой части исследования также смещаются в направлении разработки систем, способных взаимодействовать с людьми через диалог, а не просто реагировать на стилизованные запросы. Передача поисковым системам и ряду популярных приложений запросов голосом, особенно со смартфонов, уже стала обыденным явлением, и объем таких запросов будет только увеличиваться.

6. Развитие интерфейсов мозг — компьютер. Бурно стартовавшие в этом направлении работы сейчас замедлились, но будут продолжены.

7. Изучение систем группового поведения роботов и взаимодействия роботов и людей в ходе выполнения каких-либо операций. Усилия исследователей направлены на изучение эффективного распределения задач между людьми и машинами. Это направление важно как для военных роботов, так и для сервисных роботов, а также и для производственной сферы.

8. Внедрение ИИ в Интернет вещей (IoT), Индустрию 4.0 и другие современные направления типа цифровой экономики, поскольку обработка громадных объемов данных, генерируемых в таких системах, без ИИ столкнется с большими трудностями.

9. Навигация автономных транспортных средств в среде обитания человека. Это наиболее перспективное с рыночной точки зрения направление должно обеспечить начало широкого внедрения начиная с 2022-2025 гг. беспилотных автомобилей и автомобилей, в которых действия водителя полностью контролируются системой автономного управления.

10. Возможно развитие совершенно нового класса систем типа «человеческий интеллект по требованию», услуги роботов по требованию (RaaS) и т.п.

11. Гиперперсонализация услуг. Так как сейчас пользователь постоянно подключен к сети, то на основе его прошлых данных и модели поведения приложения с ИИ должны будут уметь делать предположения о том, какие сервисы ему следует предложить в данных обстоятельствах, какие решения для него будут оптимальны.

12. Борьба с эффектом «катастрофического забывания». Когда система с ИИ сталкивается с тем, чему она никогда не была обучена, то без переобучения она постоянно будет повторять одни и те же ошибки. Попытка переобучить сегодняшние системы как раз и приводит к феномену, называемому «катастрофическим забыванием», т.е. к ситуации, когда изучение нового предмета нарушает знание ранее изученных вещей [26].

13. Разработка нормативно-правовой базы использования роботов. «Роботы как субъекты права еще законодательно не оформлены ни в одной стране мира, поскольку для этого нужно официально признать, что робот — это не просто вещь, а создание, наделенное пусть и искусственным, но интеллектом, а также собственной волей. Поэтому в мире еще нет законов, которые что-то предписывают либо запрещают роботам напрямую. Перед законодателями лежит отнюдь не простая задача — обеспечить баланс между интересами технического прогресса, безопасности общества и государства, потребностями отдельно взятого человека. В Южной Корее в 2008 г. приняли «Закон о содействии развитию и распространению умных роботов». В феврале 2017 г. Европар-ламентом принята резолюция Civil Law Rules on Robotics — Нормы гражданского права о робототехнике [25].

14. Развитие таких направлений, как понимание текста, рассуждения, основанные на прецедентах, и др.

По мнению ряда экспертов, текущим разработкам в области ИИ не хватает программно-аппаратных средств физического контакта с окружающим миром, для того чтобы складывалось понимание различия или сходства между виртуальным и реальным мирами. Это направление развивается в робототехнике, например тактильная поверхность рук роботов.

Тенденции использования систем ИИ в области государственного управления

1. Наиболее востребован ИИ в силовых структурах, поскольку позволяет полиции анализировать в городах видео с множества камер и разыскивать преступников. Компьютерные программы способны сами формировать документы для прокуратуры и обвинительные заключения.

2. ИИ может оказать серьезное влияние на контроль и управление дорожным движением в городах. В ряде стран такие работы уже проводятся.

3. ИИ для МЧС. Например, управлять работой пожарных, предсказывать развитие пожара.

4. Применение в ИИ в судебной системе. Ассистенты судей.

5. Анализ социальных сетей, чтобы предотвращать возможные антигосударственные акции радикальных группировок.

6. В образовании — отслеживание успехов каждого учащегося, целевая помощь в планировании образования и трудовой карьеры.

7. ИИ в системах поддержки принятия государственных решений в экономике и банковской сфере.

Ключевые вызовы и угрозы развития систем ИИ

Скепсис по поводу безопасного развития искусственного интеллекта (ИИ) подогревается СМИ и подогревался отдельными группами исследователей и бизнесменов, в частности Биллом Гейтсом, Илоном Маском и Стивеном Хокингом.

Популярно утверждение со ссылкой на недавний опрос, проведенный Институтом будущего человека (РН1) из Оксфордского университета в Великобритании, который показал, что «Скайнет» как настоящий искусственный интеллект человеческого уровня

может возникнуть около 2028 г. Можно упорно спорить, будет ли это 2028 или 2035 г., или же событие перенесется на более поздний период, однако сама такая возможность вызвала ряд опасений, публичных дискуссий и появление исследований, впрочем, весьма гипотетических. Здесь верно следующее утверждение: «. расхождение во взглядах ИИ в основном идет по временной шкале: различаются оценки скорости движения, а не его направления. Мало кто сомневается, что машины будут все больше и больше превосходить нас в плане способностей, характерных именно для людей, или же смогут усиливать их посредством кибернетических технологий» [5].

Опасение первое: Полная зависимость от компьютеров

С каждым днем мир все сильнее и сильнее зависит от компьютеров. Во многих автоматизированных системах решение принимают уже не люди, а компьютеры, — люди просто не успевают это сделать. Миллиарды компьютеров и микроконтроллеров (их уже на порядки больше, чем обычных компьютеров) — например, управляющие производственными процессами, системами связи, вооружениями, системами жизнеобеспечения и т.д. — работают автономно, без участия человека. Развитие систем с ИИ приведет к появлению таких систем в качестве руководителей (менеджеров), которые будут руководить работой сотрудников-людей. Плюсы таких решений очевидны — это рост производительности труда и качества продукции, обеспечение безопасности, повышение комфортности жизни и многое другое. Опасения у экспертов вызывает то, что этот процесс цифровизации продолжается и сейчас речь идет об Интернете вещей, Индустрии 4.0 (цифровой экономике). Таким образом, незаметная передача машинам возможности принимать решения продолжается, но последствия данного процесса из-за масштаба системы совершенно не просчитаны.

Опасение второе: Непредсказуемость

Совершенно очевидно, что технический прогресс приводит к неконтролируемому созданию новых и совершенствованию существующих опасных технологий. Судьба и жизнь множества людей (а может быть, и всего человечества) может зависеть от действий небольших групп ученых и разработчиков. Возник специальный термин для обозначения возможного этапа развития технологий.

Технологическая сингулярность — гипотетический момент, по прошествии которого, по мнению сторонников данной концепции, технический прогресс станет настолько быстрым и сложным, что окажется недоступным человеческому пониманию. Основным представителем этой идеи является Рэй Курцвейл, футуролог и изобретатель, автор книги «Сингулярность близко», а ныне технический директор области машинного обучения и обработки естественного языка Google. При этом Курцвейл весьма идеализированно утверждает, что «интеллект по своей природе не поддается контролю».

Данную концепцию поддерживают далеко не все ученые, утверждая, что развитие технологий происходит по S-кривой и в конце прошлого века началось замедление процесса ускорения.

Переход к принятию решений компьютерами был бы безопасным, но основные опасения вызывает непредсказуемость систем, обладающих самосознанием, а также влияние на них разного рода случайностей.

Это осложняется грядущим неминуемым «интеллектуальным взрывом». Всё дело в потенциальной скорости самоусовершенствования ИИ. Множество разговоров, касающихся ИИ, основано на том, что, обладая способностью к самообучению, ИИ с некоторого момента превращается в искусственный сверхразум, опыта переговоров с которым у человечества нет; и, кроме кнопки выключения электропитания, средств воздействия на него также пока не создано.

Опасение третье: Использование боевых роботов

Ссылки на четыре известных закона робототехники писателя-фантаста Айзека Азимова, которым должны подчиняться системы ИИ, вопреки распространенному мнению, не решают проблему (первоначально этих законов было три, потом добавится четвертый «Робот не может нанести вред человечеству»). Уже сейчас понятно, что эти законы не будут реализовываться в каждой ИИ-системе, например в боевых роботах и кибероружии (около 60 стран мира имеют или разрабатывают боевых роботов). Конкретные аргументы против автономных боевых роботов заключаются, например, в том, что они могут игнорировать «белый флаг», означающий намерение сдаться в плен, не смогут достоверно отличить мирных граждан от военнослужащих, что может привести к дополнительным человеческим жертвам при использовании таких роботов во время боевых действий, и др.

Призыв к тому, чтобы прежде чем развивать технологии, которые рано или поздно приведут к созданию сверхразума, поставить вопрос о его отношении к человеку и человечеству, — остается гласом вопиющего в пустыне — слишком большое преимущество получают государства, внедряющие ИИ в робототехнику, системы оружия, медицину, производство и управление. В последнее время в боевых роботах отрабатываются алгоритмы поведения, использующие ложь и обман. Такие методы помогут им обмануть потенциальных врагов — людей и других роботов. Однако при этом возникают этические проблемы, а попадание подобных систем в руки террористов может привести к катастрофическим последствиям.

После того как Китай провозгласил лидерство в ИИ своим национальным приоритетом, между ведущими мировыми державами началась борьба за развитие ИИ.

Опасение четвертое: Социальные риски

Искусственный интеллект несет определенные социальные риски — в первую очередь прогнозируемое исчезновение целого ряда профессий (например, водителей, младшего медперсонала и даже журналистов), разобщение людей, а возможно, даже потерю естественных навыков человека. Развитие техники постоянно идет по пути исключения человека из выполняемых им производственных действий. Процессы эти сложные, потому что с исчезновением старых профессий появляются новые, связанные с новой цифровой экономикой, внедрением и поддержанием новой инфраструктуры. Однако в целом потребности в рабочей силе должны сильно уменьшиться, поскольку машины могут заменить человека в большинстве видов активной (не творческой) деятельности. Интеллектуализация, цифровизация и роботизация могут привести как к появлению в обществе социальной напряженности, так и к внедрению мер для замедления указанных процессов.

Внедрение компьютерных технологий уже привело к изменению ментальности людей — появлению так называемой клиппо-вости сознания, компьютерной зависимости, уходу в виртуальную реальность и другим негативным явлениям. В настоящее время трудно оценить глобальные последствия подобных факторов, но не учитывать их нельзя.

Опасение пятое: Ошибки в системах ИИ

В различных системах, управляемых ИИ, рано или поздно могут проявляться ошибки, допущенные при их создании. Это, в частности, связано с проблемами машинного обучения, поскольку большинство широко используемых методов машинного обучения далеки от совершенства и очень требовательны к данным. Небольшие изменения входных данных могут привести к крупным и странным изменениям в некоторых шаблонах [4]. Поскольку жизни людей все больше доверяются интеллектуальным системам, то проявление ошибок — это только вопрос времени; ошибки будут происходить и при решении ответственных задач, связанных с безопасностью людей. При этом уже сейчас не всегда понятно, каким образом система ИИ выбрала то или иное решение. Для систем с суперинтеллектом такое понимание может оказаться принципиально невозможным, как и исправление ошибочных решений системы.

У органического мозга есть химические и метаболические пределы, ограничивающие его размер и вычислительную мощность. Поэтому, по мнению отдельных исследователей, «в долгосрочной эволюционной перспективе люди и все, о чем они когда-либо думали, станут всего лишь примитивной переходной формой, предшествовавшей более глубокому мышлению новой машино-ориентированной культуры, простирающейся в отдаленное будущее и далеко за пределы Земли» [5]. Понятно, что подобный сценарий касается достаточно отдаленного будущего при отсутствии развития человеческих рас и крайне нежелателен.

«На теме искусственного интеллекта сейчас слишком много спекулируют, и в этом кроется серьезная проблема. Сфабрикованные успехи люди принимают за чистую монету, после чего реальные технологии уже не соответствуют их гиперожиданиям. Сначала робот София ездит по всему миру, якобы самостоятельно отвечая на любые вопросы, хотя на самом деле за нее пишут ответы люди, а потом оказывается, что японский Пеппер, подключенный к суперкомпьютеру Watson, не может ответить на простейший запрос покупателя в магазине. Опять же на волне выступлений Маска об угрозах искусственного интеллекта создается впечатление, что умные машины могут захватить нас уже завтра» [20].

Здесь перечислены только основные риски, но список ими не ограничивается.

Когда-то считалось, что одна из основных философских проблем в области ИИ — возможность или невозможность моделирования мышления человека, т. е. вопрос о том, обретет ли искусственный интеллект сознание. Вопрос уже не совсем гипотетический и очевидно имеющий большое значение для прогнозирования ближайшего будущего не только России, но и большей части жителей планеты Земля. Полувековая история развития ИИ все больше убеждает нас в том, что принципиальных препятствий на пути достижения такого результата нет. Скорее всего, ИИ можно сделать и не на нейросетях. Просто нейросети в некотором плане уже освоенное природой решение.

1. Баррат Дж. Последнее изобретение человечества: Искусственный интеллект и конец эры Homo sapiens. — М.: Альпина нонфикшн, 2015. — 304 с.

2. Белов С., Катькало В. Дефицит искусственного интеллекта. — Режим доступа: https://www.vedomosti.ru/opinion/articles/2017/03/21/681987-defitsit-iskusstvennogo-intellekta

3. Бессмертный И.А. Искусственный интеллект — СПб: СПбГУ ИТМО, 2010. -132 с.

4. Бринк Х., Ричардс Д., Феверолф М. Машинное обучение. — СПб.: Питер, 2017. -336 с.: ил. — (Серия «Библиотека программиста»).

5. Брокман Д. Что мы думаем о машинах, которые думают: Ведущие мировые ученые об искусственном интеллекте. М.: — Альпина нон-фикшн, 2017. — 552 с.

6. Васильева Д. Тенденции в развитии искусственного интеллекта. — Режим доступа: http://robotoved.ru/iskusstvennii_intellket_development/

7. В прошлом году Китай потратил на исследования и разработки 279 млрд долл. — Режим доступа: https://hightech.fm/2018/02/27/279-billion-on-rd

8. Демченко Д. Карта применения технологий искусственного интеллекта: Медицина, образование, транспорт и другие сферы. — Режим доступа: https:// vc.ru/p/ai-map

Набор методов которые позволяют ии системе понимать речь человека

NLP (Natural Language Processing, обработка естественного языка) — это направление в машинном обучении, посвященное распознаванию, генерации и обработке устной и письменной человеческой речи. Находится на стыке дисциплин искусственного интеллекта и лингвистики.

Освойте профессию «Data Scientist»

Инженеры-программисты разрабатывают механизмы, позволяющие взаимодействовать компьютерам и людям посредством естественного языка. Благодаря NLP компьютеры могут читать, интерпретировать, понимать человеческий язык, а также выдавать ответные результаты. Как правило, обработка основана на уровне интеллекта машины, расшифровывающего сообщения человека в значимую для нее информацию.

Процесс машинного понимания с применением алгоритмов обработки естественного языка может выглядеть так:

  1. Речь человека записывается аудио-устройством.
  2. Машина преобразует слова из аудио в письменный текст.
  3. Система NLP разбирает текст на составляющие, понимает контекст беседы и цели человека.
  4. С учетом результатов работы NLP машина определяет команду, которая должна быть выполнена.

Профессия / 24 месяца
Data Scientist

Дата-сайентисты решают поистине амбициозные задачи. Научитесь создавать искусственный интеллект, обучать нейронные сети, менять мир и при этом хорошо зарабатывать. Программа рассчитана на новичков и плавно введет вас в Data Science.

Group 1321314349 (1)

Кто использует NLP

Приложения NLP окружают нас повсюду. Это поиск в Google или Яндексе, машинный перевод, чат-боты, виртуальные ассистенты вроде Siri, Алисы, Салюта от Сбера и пр. NLP применяется в digital-рекламе, сфере безопасности и многих других.

Технологии NLP используют как в науке, так и для решения коммерческих бизнес-задач: например, для исследования искусственного интеллекта и способов его развития, а также создания «умных» систем, работающих с естественными человеческими языками, от поисковиков до музыкальных приложений.

Как устроена обработка языков

Раньше алгоритмам прописывали набор реакций на определенные слова и фразы, а для поиска использовалось сравнение. Это не распознавание и понимание текста, а реагирование на введенный набор символов. Такой алгоритм не смог бы увидеть разницы между столовой ложкой и школьной столовой.

NLP — другой подход. Алгоритмы обучают не только словам и их значениям, но и структуре фраз, внутренней логике языка, пониманию контекста. Чтобы понять, к чему относится слово «он» в предложении «человек носил костюм, и он был синий», машина должна иметь представление о свойствах понятий «человек» и «костюм». Чтобы научить этому компьютер, специалисты используют алгоритмы машинного обучения и методы анализа языка из фундаментальной лингвистики.

Курс для новичков «IT-специалист
с нуля» – разберемся, какая профессия вам подходит, и поможем вам ее освоить

Задачи NLP

Распознавание речи. Этим занимаются голосовые помощники приложений и операционных систем, «умные» колонки и другие подобные устройства. Также распознавание речи используется в чат-ботах, сервисах автоматического заказа, при автоматической генерации субтитров для видеороликов, голосовом вводе, управлении «умным» домом. Компьютер распознает, что сказал ему человек, и выполняет в соответствии с этим нужные действия.

Обработка текста. Человек может также общаться с компьютером посредством письменного текста. Например, через тех же чат-ботов и помощников. Некоторые программы работают одновременно и как голосовые, и как текстовые ассистенты. Пример — помощники в банковских приложениях. В этом случае программа обрабатывает полученный текст, распознает его или классифицирует. Затем она выполняет действия на основе данных, которые получила.

Извлечение информации. Из текста или речи можно извлечь конкретную информацию. Пример задачи — ответы на вопросы в поисковых системах. Алгоритм должен обработать массив входных данных и выделить из него ключевые элементы (слова), в соответствии с которыми будет найден актуальный ответ на поставленный вопрос. Для этого требуются алгоритмы, способные различать контекст и понятия в тексте.

Анализ информации. Это схожая с предыдущей задача, но цель — не получить конкретный ответ, а проанализировать имеющиеся данные по определенным критериям. Машины обрабатывают текст и определяют его эмоциональную окраску, тему, стиль, жанр и др. То же самое можно сказать про запись голоса.

Анализ информации часто используется в разных видах аналитики и в маркетинге. Например, можно отследить среднюю тональность отзывов и высказываний по заданному вопросу. Соцсети используют такие алгоритмы для поиска и блокировки вредоносного контента. В перспективе компьютер сможет отличать фейковые новости от реальных, устанавливать авторство текста. Также NLP применяется при сборе информации о пользователе для показа персонализированной рекламы или использования сведений для анализа рынка.

Станьте аналитиком данных и получите востребованную специальность

Генерация текста и речи. Противоположная распознаванию задача — генерация, или синтез. Алгоритм должен отреагировать на текст или речь пользователя. Это может быть ответ на вопрос, полезная информация или забавная фраза, но реплика должна быть по заданной теме. В системах распознавания речи предложения разбиваются на части. Далее, чтобы произнести определенную фразу, компьютер сохраняет их, преобразовывает и воспроизводит. Конечно, на границах «сшивки» могут возникать искажения, из-за чего голос часто звучит неестественно.

Генерация текста не ограничивается шаблонными ответами, заложенными в алгоритм. Для нее используют алгоритмы машинного обучения. «Говорящие» программы могут учиться на основе реальных данных. Можно добиться того, чтобы алгоритм писал стихи или рассказы с логичной структурой, но они обычно не очень осмысленные.

Автоматический пересказ. Это направление также подразумевает анализ информации, но здесь используется и распознавание, и синтез.Задача — обработать большой объем информации и сделать его краткий пересказ. Это бывает нужно в бизнесе или в науке, когда необходимо получить ключевые пункты большого набора данных.

Машинный перевод. Программы-переводчики тоже используют алгоритмы машинного обучения и NLP. С их использованием качество машинного перевода резко выросло, хотя до сих пор зависит от сложности языка и связано с его структурными особенностями. Разработчики стремятся к тому, чтобы машинный перевод стал более точным и мог дать адекватное представление о смысле оригинала во всех случаях.

Машинный перевод частично автоматизирует задачу профессиональных переводчиков: его используют для перевода шаблонных участков текста, например в технической документации.

Как обрабатывается текст

Алгоритмы не работают с «сырыми» данными. Большая часть процесса — подготовка текста или речи, преобразование их в вид, доступный для восприятия компьютером.

Очистка. Из текста удаляются бесполезные для машины данные. Это большинство знаков пунктуации, особые символы, скобки, теги и пр. Некоторые символы могут быть значимыми в конкретных случаях. Например, в тексте про экономику знаки валют несут смысл.

Препроцессинг. Дальше наступает большой этап предварительной обработки — препроцессинга. Это приведение информации к виду, в котором она более понятна алгоритму. Популярные методы препроцессинга:

  • приведение символов к одному регистру, чтобы все слова были написаны с маленькой буквы;
  • токенизация — разбиение текста на токены. Так называют отдельные компоненты — слова, предложения или фразы;
  • тегирование частей речи — определение частей речи в каждом предложении для применения грамматических правил;
  • лемматизация и стемминг — приведение слов к единой форме. Стемминг более грубый, он обрезает суффиксы и оставляет корни. Лемматизация — приведение слов к изначальным словоформам, часто с учетом контекста;
  • удаление стоп-слов — артиклей, междометий и пр.;
  • спелл-чекинг — автокоррекция слов, которые написаны неправильно.

Методы выбирают согласно задаче.

Векторизация. После предобработки на выходе получается набор подготовленных слов. Но алгоритмы работают с числовыми данными, а не с чистым текстом. Поэтому из входящей информации создают векторы — представляют ее как набор числовых значений.

Популярные варианты векторизации — «мешок слов» и «мешок N-грамм». В «мешке слов» слова кодируются в цифры. Учитывается только количество слова в тексте, а не их расположение и контекст. N-граммы — это группы из N слов. Алгоритм наполняет «мешок» не отдельными словами с их частотой, а группами по несколько слов, и это помогает определить контекст.

Применение алгоритмов машинного обучения. С помощью векторизации можно оценить, насколько часто в тексте встречаются слова. Но большинство актуальных задач сложнее, чем просто определение частоты — тут нужны продвинутые алгоритмы машинного обучения. В зависимости от типа конкретной задачи создается и настраивается своя отдельная модель.

Алгоритмы обрабатывают, анализируют и распознают входные данные, делают на их основе выводы. Это интересный и сложный процесс, в котором много математики и теории вероятностей.

Аналитик данных

Аналитики влияют на рост бизнеса. Они выясняют, какой товар и в какое время больше покупают. Считают юнит-экономику. Оценивают окупаемость рекламной кампании. Поэтому компании ищут и переманивают таких специалистов.

картинка (73)

Статьи по теме:
Упор на практику, доступность, гибкость и другие плюсы дистанционной магистратуры

Рассказываем про обновленные поисковики Microsoft и Google и смотрим в будущее интеллектуального поиска

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *