Новая реальность: цифровые двойники и искусственный интеллект
В эпоху становления цифровой экономики традиционные представления о числах и данных существенно изменились.
В эпоху становления цифровой экономики традиционные представления о числах и данных существенно изменились. Возникла даже целая отрасль науки о больших данных (Data Science). О новых понятиях и тенденциях в этой науке, а также ее связи с искусственным интеллектом, и роли научно-исследовательской лаборатории искусственного интеллекта в их развитии рассказала заместитель заведующего НИЛ ИИ ПГУТИ Оксана Захарова.
Большие числа — большие проблемыФормального определения больших данных не существует. Более 60 лет назад один из крупнейших математиков ХХ века Андрей Колмогоров объяснил научному сообществу, что такое маленькие, средние и большие числа.
Вот один пример того, как появляются большие данные (Big Data). К электрической лампочке присоединено три выключателя, каждый из которых может находиться в левом или в правом положении. Существует восемь возможных вариантов совместных положений выключателей. Проводку к ним можно подвести таким образом, чтобы в каждом из восьми положений лампочка или горела, или не горела. Получится 256 возможных комбинаций. Если выключателей, допустим, пять, комбинаций будет уже 4 294 967 296. А если шесть, то число комбинаций превысит количество атомов во Вселенной.
А теперь представим, что на одну из лекций пришла тысяча человек, и лектор решил с каждым из них поздороваться за руку. При личном контакте он получит информацию о человеке (пол, примерный возраст, рост и т. д.), на основе которой можно определить, например, процентное соотношение мужчин и женщин, их средний возраст (в науке о данных это называется "разметкой данных"). Если же попросить всю тысячу присутствующих обменяться друг с другом рукопожатиями, то нашему мозгу не под силу будет сосчитать общее число контактов и тем более обработать в разы увеличившееся количество сведений. Получается, тысяча — это среднее число, потому что мы осознанно не можем проанализировать такое количество элементов.
Сверхсущность или обычная ЭВМ?Человеческий мозг с легкостью может строить теории, делать выводы и принимать решения при малом наборе сведений. А вот большие объемы данных, и даже средние, люди уже не в силах проанализировать. Для этого и создан искусственный интеллект, который формально определяют как набор методов, алгоритмов, сред и технологий для обработки данных любого типа.
Цель обработки — составление всевозможных прогнозов, разработка классификаций, выявление аномалий, а также получение нового знания, обнаружение новых интересных закономерностей в данных. И компьютер с этим справится гораздо лучше человека. Но все же надо помнить, что у машины всегда есть вероятность, пусть и минимальной, погрешности. Поэтому слепо доверять ей не стоит.
Все мы знаем о существовании "трех китов" информатики: это данные, информация и знания. "Сырые" данные мы превращаем в информацию. А из нее, в свою очередь, извлекаем знания — неизвестные ранее сведения. С позиции искусственного интеллекта, информация — структурированные данные. А знания — структурированная информация. Сейчас ученые работают над автоматизацией процессов структуризации.
Однако популярность термина "искусственный интеллект" во многом объясняется его ошибочным толкованием, в частности когда им обозначают некую искусственную сущность, наделенную разумом, которая якобы в состоянии конкурировать с людьми. Эта мысль из области древних легенд и преданий, звучащая как миф о Големе, с недавних пор реанимируется такими нашими современниками, как британский физик Стивен Хокинг (1942–2018 гг.), американский предприниматель Илон Маск и американский инженер Рэй Курцвейл, а также сторонниками создания так называемого сильного или общего ИИ.
Не будем, впрочем, говорить о данном понимании этого термина, ибо оно скорее представляет собой появившийся под влиянием научной фантастики продукт богатого воображения, а не осязаемую научную реальность, подтвержденную опытами и эмпирическими наблюдениями.
Сплели нейронные сетиЕсли говорить об ИИ, нельзя не упомянуть такое популярное в наше время понятие, как нейронные сети. Нейронные сети были придуманы лет 60 назад. Сегодня они стали основным инструментом глубокого обучения (Deep Learning) — методов машинного обучения, основанных на имитации работы человеческого мозга в процессе обработки данных. Мы знаем, что в нашем мозге есть нейроны (нервные клетки), соединенные друг с другом аксонами (длинными цилиндрическими отростками нервной клетки).
А нейронная сеть с точки зрения информатики — это математическая модель, в которой искусственные нейроны (простые процессоры) объединены в систему и взаимодействуют друг с другом. Так, каждый процессор периодически получает сигналы от других процессоров, а также посылает сигналы сам. И такая с виду простая сеть способна выполнять довольно сложные задачи.
Схема работы нейросети выглядит так: входные нейроны получают исходные данные, скрытые нейроны обрабатывают информацию, а выходные нейроны выводят готовый результат. Таким образом, в зависимости от характера задачи, определенное количество нейронов получает входные данные, а затем передает их на скрытый средний слой. Машина ищет закономерности среди огромного количества нейронных связей и "принимает" решение.
От физического тела — к цифровому двойникуА что потом? Data Science уже начала менять наш мир. Мы никуда не денемся от цифровизации. Окружающие нас вещи будут постепенно лишаться физического тела и переходить в виртуальность под лозунгом: "Все, что может быть лишено физического тела, будет его лишено, превратившись в цифрового двойника".
Можно предположить, что в недалеком будущем после полной цифровизации геномов белковых тел, станет вероятным отправлять их цифровую копию по электронной почте. Кстати, уже сейчас наблюдается тенденция падения спроса на программистов, стали востребованы другие специалисты — компьютерные лингвисты, специалисты по машинному обучению, архитекторы виртуальности, аналитики Big Data. Особенно этот процесс будет ускоряться в связи с появлением ChatGPT.
ПГУТИ создает кадры для цифровой экономики будущегоВ России в последние два года сделан серьезный шаг вперед, совершен скачок и на уровне регионов, и на уровне правительства для того, чтобы создать условия для развития искусственного интеллекта практически во всех сферах. Сегодня явно виден растущий интерес к развитию и внедрению технологии искусственного интеллекта.
Поволжский государственный университет телекоммуникаций и информатики является одним из первых образовательных учреждений региона, которое оценило перспективы развития данных технологий.
В январе 2020 года в ПГУТИ была создана Научно-исследовательская лаборатория искусственного интеллекта (НИЛ ИИ). Возглавил ее Сергей Левашкин, выпускник МГУ им. М. В. Ломоносова, ученый с более чем 20-летним опытом работы в университетах и компаниях России, Северной Америки и Европы.
В контексте национальной программы "Цифровая экономика РФ" и "Плана 2030", создание НИЛ ИИ является стратегическим проектом, поскольку наука о данных, искусственный интеллект и бизнес-интеллект являются ключевыми факторами цифровой трансформации экономики.
На сегодняшний день лаборатория занимает лидирующее положение в НИР и НИОКР университета по ИИ и решает самые разнообразные задачи, включая ведение научно-исследовательской работы в области науки о данных, искусственного интеллекта и машинного обучения, а также подготовку высококвалифицированных кадров для цифровой экономики.
Искусственный интеллект хорошо работает в интересах и на благо людей, если его создает и применяет грамотный, хорошо подготовленный человек.
Лаборатория обеспечивает содержанием факультатив и магистерскую программу "Наука о данных и искусственный интеллект", а также коммерческий курс "Бизнес-интеллект".
Студенческий курс содержит популярное введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Он мотивирует студентов старших курсов для поступления в магистратуру "Наука о данных и искусственный интеллект", но доступен также студентам младших курсов и самой широкой публике.
Коммерческий курс — введение в науку о больших данных и основные методы искусственного интеллекта для их обработки. Курс рассчитан на повышение цифровой грамотности управленцев, представителей коммерческих компаний и т. д. Содержит примеры приложений методов искусственного интеллекта в различных областях экономики, бизнеса, управления и т. д.
В 2022 году на базе НИЛ ИИ ПГУТИ впервые был осуществлен прием в магистратуру по профилю "Прикладной искусственный интеллект и наука о данных" по программе МГУ.
В рамках реализации программы осуществляется подготовка специалистов в области искусственного интеллекта и науки о данных, способных применять фундаментальные знания математических и естественных наук, программирования и информационных технологий при решении прикладных задач различного уровня сложности с целью удовлетворения потребностей промышленности, бизнеса и науки, муниципального и государственного управления, решения иных задач.
Активно ведется студенческая научная работа. Студенты и магистранты уже с самых ранних курсов обучения имеют возможность работать над реальными практическими задачами, осваивать новые компетенции в области искусственного интеллекта и науки о данных, принимая участие в научной и грантовой деятельности лаборатории.
Лаборатория активно ведет НИР и выигрывает различные гранты — от математического моделирования распространения вирусных заболеваний до разработки модулей для системы "Умные дороги".
Кроме того, лаборатория НИЛ ИИ входит в состав Рабочего комитета "Искусственный интеллект" НОЦ "Инженерия будущего" — это научно-образовательный центр, объединяющий науку и реальный сектор экономики. Основным направлением от ПГУТИ в области искусственного интеллекта является разработка инфокоммуникационных технологий на основе анализа BigData. Куратор направления — заведующий лаборатории Сергей Левашкин.
В горизонте текущего десятилетия задача лаборатории — обеспечить массовое внедрение искусственного интеллекта. Оно должно охватить все отрасли экономики, социальной сферы и систему госуправления.
Научный поиск НИЛ ИИ ПГУТИ Программное обеспечение формализации и извлечения знаний о сложных информационных объектах Алгоритмы и программное обеспечение машинного обучения (machine learning) Аналитическое программное обеспечение нового поколения (next-generation analytics) Мультиязычные (инвариантные к исходным языкам) и мультимодальные (инвариантные к типу контента) системы извлечения и формализации информации (nlp) Алгоритмы и программное обеспечение для формализации и извлечения знаний из слабоструктурированной и неструктурированной информации. Математические модели распространения вирусных заболеваний и их исследование методами искусственного интеллекта Семантико-ассоциативный анализ и синтез телекоммуникационных данныхИсточник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ
Реализованные гранты НИЛ ИИ ПГУТИ (2022 год) "Вирусы I": Многофакторное моделирование с применением технологий искусственного интеллекта структурно-динамического равновесия социально-экономической системы РФ при распространении пандемии (РФФИ/РНФ) "Вирусы II": Математическое моделирование распространения вирусных заболеваний (Минобраз/РосАтом) "Умные дороги": Разработка модуля интеллектуальной обработки данных системы мониторинга оптоволоконных сигналов (Haulmont). "СМАРТ продукты": Применение алгоритмов ИИ для компьютерного моделирования новых продуктов, товаров и услуг с заданными свойствами (Минцифры РФ).Источник: Научно-исследовательская лаборатория искусственного интеллекта ПГУТИ
Ссылки: https://ai.psuti.ru/
https://t.me/laboratoria_psuti
https://vk.com/nil_ai_psuti
Автор выражает благодарность за помощь в подготовке статьи заведующему НИЛ ИИ Сергею Павловичу Левашкину.
Последние новости
Машины медиков в больнице Самарской области загорались одна за другой
Погибших и пострадавших на пожаре нет. Сегодня, 15 января, в середине дня в Самарской области случился крупный пожар.
Взлет неизбежен: как изменятся в 2025 году цены на бензин
Участники рынка ожидают ужесточения санкционного режима. Эксперты считают, что в 2025 году в России розничные цены на бензин и дизель будут расти быстрее, чем общая инфляция.
Повода для паники нет, но ситуацию под Сызранью медики назвали тревожной
Новый год начался с роста заболеваемости. Новый год в Самарской области начался с роста заболеваемости коронавирусной инфекцией.
Преобразователь частоты
Все преобразователи проходят контроль и имеют сертификаты с гарантией