АИП Институт ведет работы в направлении разработки нейросетевой контент единицы АИП для применения совместно с технологиями Искусственного Интеллекта (ИИ) на основе больших Языковых Моделей (БЯМ), как например: YaLM (Yandex), GPT-3 (OpenAI), BERT (Google AI).
Основными особенностями таких нейросетевых информационных блоков АИП являются возможность хранения контролируемых структур информации в блоке АИП и с помощью нейросетевых технологий получение множественных представлений информации в ограниченном контексте верифицированных специалистами знаний. В отличии от мультизадачных ИИ общего назначения, которые скорее направлены на задачу ответа на запрос пользователя в “любом случае” и имеющих проблемы с сохранением уникальных слаборепрезентативных знаний, наша разработка направлена на сохранение и контроль информации, заключающейся в ответах пользователю в конкретной предметной области, как образование, корпоративные системы или для систем человеко-машинного взаимодействия. В подобных системах передачи информации важной составляющей является соответствие стандартам и верификация экспертами той выдачи, которую получает пользователь при взаимодействии с ИИ, что на сегодня считается одной из проблем, открытых ИИ как ChatGPT. Разрабатываемая технология предметно-ориентированной малой нейросетевой языковой модели так же позволяет генерировать различные представления информации с учетом параметров пользовательского профиля и возможностей конечного устройства для оценки и передачи информации.
Цели использования ИИ технологий
- Полная или частичная автоматизации процесса структурирования информации на основе неструктурированных источников данных для применения в системах передачи информации на основе АИП методологии;
- Оптимизация процесса генерации различных представлений информации (знаний) в ограниченном контексте предметной области;
- Создание рекомендательной системы на основе анализа графовых структур пользовательского профиля и общей Онтологии когниграфических данных (Базы знаний);
- Развитие методов оценки текущего состояния пользователя для выделения параметров персонализации процесса передачи информации в зависимости от имеющихся знаний, физических возможностей и возможностей конечных устройств передачи информации.
Задачи решаемые с помощью технологий ИИ и инструментов ADANEC
Интеллектуальный неструктурированной информации (документации, образовательных методичек и др. источников) по предметной области для:
- Генерация контекста для блоков сценариев передачи информации в АИП в рамках заданной предметной области с помощью выборки документов;
- Создание онтологии предметной области на основе выделения именованных сущностей, фактов, ключевых понятий в виде ключевых слов и словосочетаний;
- Установление семантических связей между сущностями в онтологии когниграфических данных на основе анализа контекста из набора документов по заданной предметной области и оценки близости между ключевыми понятиями (ключевых слов/словосочетаний), именованными сущностями, фактами;
- Преобразование форматов данных в из текста в изображение (Text-to-Image), текст в видео (Text-to-Video), видео в текст (Video-to-Text), описание изображения (Image-to-Text).
Создание различных представлений контекста в системах передачи информации, как для пользователей, так и для межсистемного взаимодействия (например передача команд роботу):
- Генерация последовательности блоков информации в виде сценариев для передачи информации пользователю или другой информационной системе;
- Генерация тестовых заданий на основе контекста предметной области;
- Генерация инструкций в виде последовательности действий необходимых к выполнению пользователем.
Создание визуальных форм представления информации в пользовательских интерфейсах различного типа:
- Генерация визуального представления информационных блоков сценариев (контента) в виде исполняемого кода с заданными параметрами интерфейса отображения/передачи информации;
- Генерация форм для тестирования и оценки знаний в ограниченном контексте информационного блока сценария или набора блоков;
- Генерация иллюстраций, графиков и видео контента на основе контекста информационных блоков сценариев.