Логико-лингвистическое управление как введение в управление знаниями1
Татьяна Гаврилова
Введение
Работа Дмитрия Александровича Поспелова «Логико лингвистические модели в системах управления» [Поспелов, 1981] произвела «тихую революцию» в умах кибернетического научного сообщества в начале 80- ых. Для неофитов же это было то «Слово», которое вызвало ментальный резонанс, и привлекший к эти исследованиям новых молодых исследователей, среди них был и автор этой статьи.
Принципиальная новизна логико-лингвистического подхода была в ее гениальной простоте. Для моделирования кибернетических систем предлагался не очередной математический монстр, понятный лишь автору и его ближайшему окружению, а набор вполне прозрачных нотаций для описания объектов системы управления и связей между ними. Впервые отчетливо прозвучала мысль, что существуют задачи, где строгая математика бессильна, но где логика, обогащенная лингвистическими моделями, может дать результативное и ясное описание.
Логико-лингвистические модели преставления знаний
Идеи логико-лингвистического управления, на первый взгляд, казались совершенно естественными – нельзя управлять сложными объектами без привлечения информации, которая не может быть выражена количественно. Это семантическая или смысловая , качественная информация. Логико-лингвистические модели, развивая идеи ситуационного управления [Поспелов, 1986], впервые позволили создавать модели, описывающие знания специалистов в сложных недерминированных предметных областях с нечеткой логикой и размытыми определениями. По явно неслучайному совпадению примерно в это же время подоспела нечеткая логика Лотфи Заде [Заде, 1972].
Фактически ситуационное управление было первым случаем практического использования логико-лингвистических моделей в управлении. Первая задача такого рода была решена в еще 1967 году при автоматизации диспетчерской службы на шлюзованных участках водных путей. Затем эти модели были успешно прменены при управлении дислокационными оперциями в рыбном морском порту, при управлении обжигом цементного клинкера, управлении заготовками и др.
Модели в RХ-кодах, использованные в этих задачах, по сути были «советскими семантическим сетями», так как отображали объекты{Х} и отношения между ними {R}. Только появились эти модели на 10 лет раньше, чем семантические сети на Западе.
Таким образом, в отечественной науке был создан аппарат для работы со знаниями, хотя и называлось это иначе. Вообще советская научная школа искусственного интеллекта всегда шла своим нелегким путем. Молодым ученым третьего тысячелетия трудно представить, что само слово «интеллектуальный» и «знания» долгое время были затабуированы в научных кругах, и например, автору этой статьи пришлось назвать свою диссертацию «Логико-лингвистическая модель предметной области» вместо «Пирамида знаний экспертной системы». Работы Д.А. Поспелова и его школы были тем тараном, который расчищал путь молодой науке, объясняя на языке традиционных кибернетических моделей те новые, часто пугающие и шокирующие идеи, что она несла.
Ситуация усугублялась тем, что как известно, трудно быть пророком в своем отечестве, а «железный занавес» тех времен не позволял отслеживать в режиме реального времени те стремительные изменения, которые происходили в искусственном интеллекте на Западе и лишь с заметным запаздыванием в 3-5 лет приходили к нам работы в этой области. Так термин «инженерия знаний» (knowledge engineering), родившаяся сразу вслед за появлением первых систем , основанных на знаниях DENDRAL и MYCIN, пришел в отечественные работы по ИИ на 10 лет позднее, чем даже языки представления знаний (knowledge representation languages).
Отдельно следует отметить феномен влияния идей логико-лингвистического управления на образование уникальной междисциплинарной школы специалистов в области искусственного интеллекта. Так как работы Поспелова расширили область и методы моделирования в сторону гуманитарных наук к этому научному направлению примкнули и лингвисты и психологи и физиологи.
Трудно переоценить вклад в развитие новой науки соратников и учеников Дмитрия Александровича – В.Н.Вагина, Л.С. Загадской, Л.Т.Кузина, А.С.Нариньяни, Г. С. Осипова, Э. В. Попова, М.Г.Гаазе-Раппопорта, В. Л. Стефанюка, В. Ф. Хорошевского и многих других. Огромную поддержку «движению» оказывал академик Г.С. Поспелов.
В 1988 году ими создается АИИ — Ассоциация Искусственного Интеллекта. Ее членами являются более 300 исследователей. Президентом Ассоциации единогласно избирается Дмитрий Александрович Поспелов.
Сейчас уже никому не нужно доказывать актуальность систем, основанных на знаниях, более того знания стали модным флагом, под которым стремительно набирает обороты новая ветвь информационных технологий – управление знаниями.
Системы управления знаниями
Термин управление знаниями также пришел к нам с Запада. (КМ — Knowledge Management) в середине 90-ых годов. В крупных корпорациях, где проблемы обработки информация приобрели особую остроту и стали критическими [Wiig, 1996], стало очевидным, что основным узким местом является обработка знаний, накопленных специалистами компании, так как именно знания обеспечивают преимущество перед конкурентами.
KM трактуется как совокупность процессов, которые управляют созданием, распространением, обработкой и использованием информации внутри предприятия. Всем тем, чем традиционно должны были заниматься сотни отечественных АСУ, но которым явно не хватало внутренней цельности и согласованости, всего того, что могли привнести логико-лингвистические модели, обобщающие информацию с использованием знаний специалистов. Можно сказать, что логико-лингвистические модели несколько опередили время, и только сейчас они могли бы быть понятыми в полной мере.
«Мостиком» к интеллектуальным технологиям в КМ является понятие «знания», которое трактуется пока крайне свободно и широко. Так ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, включают руководства, письма, новости, информацию о заказчиках, сведения о конкурентах и технологии, накопившиеся в процессе разработки. Сами эти ресурсы могут находиться в различных местах: в базах данных, базах знаний, в картотечных блоках, у специалистов и могут быть рассредоточены по всему предприятию. При этом часто одна часть предприятия дублирует работу другой просто потому, что невозможно найти и использовать знания, находящиеся в соседних подразделениях.
Таким образом системы КМ должны (но это пока только декларация) интегрировать разнообразные технологии:
-
электронная почта и Интернет;
-
базы и хранилища данных (Data Warehouse);
-
системы групповой работы с информацией;
-
системы поддержки принятия решения;
-
локальные корпоративные системы автоматизации;
-
системы документооборота и workflow;
-
контекстный поиск.
При этом, ни одна из этих технологий не включает «знания» в контексте интеллектуальных (экспертных) систем, т.е. баз знаний.
Фактически системы, позиционирующие себя как СУЗ – системы управления знаниями (Fulcrum, Documentum i4, Knowledge Station, etc.)[Попов, 2001]
реализуют лишь отдельные элементы вышепреведенного списка. Все они работают либо с неструктурированной информацией, либо с данными (первый и второй столбцы на рис.1). Это ситуация as is (как есть).
Поэтому естественным первым инструментарием КМ стали хранилища данных, которые работают по принципу центрального склада. Как правило, хранилища содержат многолетние версии обычной БД, физически размещаемые в той же самой базе. Когда все данные содержатся в едином хранилище, изучение и анализ связей между отдельными элементами может быть более плодотворным. В дальнейшем идея хранилища была развита в понятие корпоративной памяти (corporate memory) [Kuhn, Abecker, 1998], которая по аналогии с человеческой памятью позволяет накапливать информацию из предыдущего опыта и, якобы, избегать повторения ошибок, что является чисто декларативным утверждением.
Корпоративная память хранит информацию из различных источников предприятия и делает эту информацию доступной специалистам для решения производственных задач.
Лишь третий столбец на рис.1 действительно иллюстрирует, что корпоративная память в идеале включает и знания специалистов.
Корпоративная память должна не позволять исчезнуть знаниям выбывающих специалистов (уход на пенсию, увольнение и пр.) и хранить большие объемы данных, информации и знаний из различных источников предприятия. То есть ситуация to be (как надо) должна выходить за рамки данных к знаниям. Тогда можно будет выделить два уровня корпоративной памяти:
Уровень 1. Уровень эксплицитной или явной информации — это данные и знания, которые могут быть найдены в документах организации в форме сообщений, писем, статей, справочников, патентов, чертежей, видео- и аудио-записей, программного обеспечения и т. д. Это первый и второй столбцы рисунка 1.
Уровень 2. Уровень имплицитной или скрытой информации — это персональное знание, неотрывно связанное с индивидуальным опытом. Оно может быть передано через прямой контакт — «с глазу на глаз» через процедуры извлечения знаний. Именно скрытое знание — то практическое знание, которое является ключевым при принятии решении и управлении технологическими процессами.
В действительности эти два типа информации, подобные двум сторонам одной и той же медали, одинаково важны в структуре корпоративной памяти.
При разработке систем КМ можно выделить следующие этапы:
-
Накопление. Стихийное и бессистемное накопление информации в организации.
-
Извлечение. Процесс обнаружения источников данных и знаний, их “добыча” и описание. Это один из наиболее сложных и трудоемких этапов. От его успешности зависит дальнейшая жизнеспособность системы.
-
Структурирование. На этом этапе должна быть выделены основные понятия, выработана структура представления информации, обладающая максимальной наглядностью, простотой изменения и дополнения.
-
Формализация и программная реализация. Представление структурированной информации в форматах машинной обработки — то есть на языках описания данных и знаний и организация автоматизированной обработки и поиска информации по запросу.
-
Обслуживание. Коррекция формализованных данных и знаний (добавление, обновление): «чистка», то есть удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям.
Правила проведения первых четырех этапов подразумевают владение инструментами инженерии знаний, довольно молодой науки, родившейся при разработке интеллектуальных систем.
Уже классической ошибкой практически всех (без исключения!) автоматизированных систем является главенство и доминирование этапа 4, т.е. программной реализации над предметной постановкой этапов 1-3. В системах КМ это особенно опасно, так как именно предметные знания являются ядром таких систем.
Фактически KM – это модный лозунг в менеджменте и его связь с инженерией знаний (knowledge engineering) пока явно недостаточна.
Онтологии
Онтологический инжиниринг – ядро концепции «управления знаниями». Существуют различные подходы, модели и языки описания данных и знаний. Однако все большую популярность последнее время приобретают онтологии. Онтология – по определению Грубера [Gruber,1997], есть спецификация концептуализации, формализованное представление основных понятий и связей между ними. Ранее этот философский термин означал учение о бытии, затем он переместился в область точных наук, где полу-формализованные концептуальные модели всегда сопутствовали математически строгим определениям. Под определение онтологии подпадают многие понятийные структуры: иерархия классов в объектно-ориентированном программировании, концептуальные карты (concept maps), семантические сети, и, конечно же, знаменитый «слоеный пирог» из логико-лингвистического и ситуационного управления [Поспелов, 1981,1986].
Нам представляется, что можно еще шире трактовать онтологию – например, как сценарий или процесс, как нечто структурирующее хаос.
Онтология — это структурная спецификация некоторой предметной области, ее формализованное представление, которое включает словарь (или имена) указателей на термины предметной области и логические выражения, которые описывают, как они соотносятся друг с другом. Например, рис.2 и 3 показывают переход от хаоса (для неофита) имен великих итальянских мастеров к стройной историко-художественной онтологии.
Таким образом, онтологии обеспечивают словарь для представления и обмена знаниями о некоторой предметной области и множество связей, установленных между терминами в этом словаре.
Для описания онтологий существуют различные языки и системы, однако, наиболее перспективным представляется визуальный подход, позволяющий специалистам непосредственно «рисовать» онтологии, что помогает наглядно сформулировать и объяснить природу и структуру явлений. Визуальные модели, например, графы обладают особенной когнитивной (т.е. познавательной) силой. Любой программный графический пакет от PaintBrush до Visio можно использовать как первичный инструмент описания онтологий.
Однако, проектирование и разработка онтологий, т.е онтологический инжиниринг, не является тривиальной задачей. Он требует от разработчиков профессионального владения технологиями инженерии знаний – от методов извлечения знаний до структурирования и формализации [Гаврилова, Хорошевский, 2000].
Онтологический инжиниринг должен и может стать “путеводной нитью” для всего процесса структурирования комплексных систем автоматизации, так как он объединяет две основные технологии проектирования больших систем – объектно-ориентированный и структурный анализ. Недаром онтологический анализ вошел в стандарт IDEF5, который является основным средством спецификации КИC и моделирования бизнес-процессов сегодня.
Программные средства онтологического инжиниринга
При явном интересе к онтологическому инжинирингу на сегодня не существует промышленных систем проектирования онтологий. Однако, любой графический редактор от Paintbrusha до Visio может быть полезным. Можно также упомянуть несколько специальных программных продуктов CAKE (Сомputer Aided Knowledge Engineering) [Воинов, Гаврилова, Данцин, 1996], ВИКОНТ — ВИзуальный Конструктор ОНТологий [Гаврилова, Лещева, 20000] и VITA (VIsual onTology-based hypertext Authoring tool)[Gavrilova, Geleverya, 2001, позволяющих визуально проектировать онтологии различных предметных областей. Онтология строится как дерево или сеть, состоящая из концептов и связей между ними. Связи могут быть различного типа, например, "является", "имеет свойство" и т. п. Концепты и связи имеют универсальный характер для некоторого класса понятий предметной области. Можно выбрать некоторое понятие из этого класса и для него "заполнить" онтологию, задавая конкретные значения атрибутам.
Рис.4 Онтологии "who is who" из истории ИИ
Само построение онтологии, иначе визуальный онтологический инжиниринг является мощным когнитивным инструментом, позволяющим сделать видимыми структуры как индивидуального, так и корпоративного знания.
Как основным девизом логико-лингвистического управления было "использование логических средств обработки для преобразования данных и знаний, представленных в лингвистической форме"[Поспелов, 1981], так девиз онтологического инжиниринга "использование структурно-логических средств представления данных и знаний предметной области".
Прозрачна и логико-лингвистическая суть простейшего алгоритма онтологического инжиниринга (фактически все те же RX-коды):
- выделение концептов – базовых понятий данной предметной области;
- определение "высоты дерева онтологий" – числа уровней абстракции;
- распределение концептов по уровням;
- построение связей между концептами – определение отношений и взаимодействий базовых понятий;
- консультации с различными специалистами для исключения противоречий и неточностей.
Заключение
Логико-лингвистическое управление, опередив время, пыталось создать аппарат для моделирования сложных систем, включающих логические, временные, пространственные, технологические и человеческие компоненты в их подлинной сложности, а не в рамках "игрушечных" математических моделей. Теперь уже пришло понимание, что каждая сложная система уникальна, и только опыт и знания специалистов позволяет справиться с такими задачами.
И хотя общих решений не найдено, пришло время работы со знаниями. И российские специалисты оказались готовы к этому гораздо в большей степени, чем западные, потому что модели для работы со знаниями у нас появились еще 30 лет назад. Эти модели, пусть с другим названием, позволили заложить основы онтологического инжиниринга как целостного подхода к автоматизации предприятия. Этот подход включает:
- системность — онтология представляет целостный взгляд на предметную область;
- единообразие — материал, представленный в единой форме гораздо лучше воспринимается и воспроизводится;
- научность — построение онтологии позволяет восстановить недостающие логические связи во всей их полноте.
Стоит еще раз подчеркнуть, что онтология, как логико-лингвистическая модель не только цель, но и средство формирования систем управления знаниями.
В заключении, автору очень хочется еще раз выразить глубокую признательность Дмитрию Александровичу Поспелову за рождение науки, вовремя не понятой, многократно поносимой и ругаемой, но такой захватывающе интересной и нужной, что она еще привлечет под свои знамена новых молодых адептов.
Литература
1. Воинов А., Гаврилова Т. А., Данцин Е. Я., 1996. Язык визуального представления знаний и его место в САКЕ-технологии // Журнал Известия РАН, Теория и системы управления, N2. – c.146-151.
2. Гаврилова ТА., Хорошевский В.Ф., 2000. Базы знаний интеллектуальных систем / Учебник для вузов. – СПб, Изд-во "Питер", 2000.
3. Гаврилова Т.А., Лещева И.А., Лещев Д.В., 2000. Использование онтологий в качестве дидактического средства // Ж."Искусственный интеллект" N3. – с.34-39.
4. Заде Л., 1972. Лингвистическая переменная. – М., Физматгиз.
5. Попов Э.В., 2001. Корпоративные системы управления знаниями. Ж."Новости ИИ",N1.
6. Поспелов Д.А. Логико лингвистические модели в системах управления. – М.: Энергоиздат, 1981.
7. Поспелов Д.А. Ситуационное управление. – М.: Наука, 1986.
8. Borghoff U., Pareschi R., 1998. Information Technology for Knowledge Management. – Springer-Verlag, Bln.
9. Gavrilova T., Geleverya T., 2001. VITA: Using PYTHON for Visual Design of Web-based Tutorials// Proc. of the Tenth International PEG Conference "Intelligent Computer and Communications Technology – Learning in On-Line Communities", Tampere, Finland. – pp.44-50.
10. Kuhn O., Abecker A., 1998. Corporate Memories for Knowledge Management in Industrial Practice: Prospects and Challenges.
11. Gruber T. R. A translation approach to portable ontologies. Knowledge Acquisition, 5(2):199-220, 1993.
12. Tschaitschian B., Abecker A. and Schmalhofer, 1997. A. Putting Knowledge Into Action: Information Tuning With KARAT. // In 10th European Workshop on Knowledge Acquisition, Modeling, and Management (EKAW-97).
13. Wiig К., 1996. Knowledge management is no illusion! // Proc. of the First International Conference on Practical Aspects of Knowledge Management. – Zurich, Switzerland: Swiss Information Society.
Примечание
1 Работа поддержана Российским Фондом фундаментальных исследований грантом 01-01-00224.
|