Извлечение знаний:
"пассивные" методы
Татьяна Гаврилова - д.т.н., консультант по информационным
технологиям управления знаниями,
[email protected]
Одна из ведущих тенденций на рынке корпоративных
информационных систем - это особое внимание, уделяемое проблеме интеграции и
структурировании разнородной информации, часть которой составляют бесценный опыт
и знания специалистов фирмы.
Управление знаниями (knowledge
management, KM) - это совокупность процессов, которые управляют
созданием, распространением, обработкой и использованием информации предприятия.
Рассмотрев в предыдущих статьях цикла (см.
Enterprise Partner №8(25) 2001 и
Enterprise Partner №10(27) 2001) основные теоретические аспекты
инженерии знаний - науки, изучающей закономерности работы со знаниями, мы,
однако, в явном виде не определили, каким образом эти знания получены.
Предполагалось, что происходит некоторое взаимодействие аналитиков-разработчиков
ИС и экспертов-специалистов в форме непосредственного живого общения.
Основной принцип классификации методов извлечения знаний - по
источнику знаний. Палитра методов, описанная в данной классификации, позволит
аналитикам в зависимости от конкретной задачи и ситуации выбрать подходящий
метод.
Коммуникативные методы охватывают способы и процедуры
контактов аналитика с непосредственным источником знаний - специалистами и
экспертами предприятия, а текстологические включают методы извлечения
знаний из документов (методик, регламентов, служебных руководств) и специальной
литературы (статей, монографий, учебников). Разделение методов на верхнем уровне
классификации не означает их антагонистичности; обычно аналитик комбинирует
различные методы.
Коммуникативные методы, в свою очередь, можно разделить на
две группы. Пассивные методы подразумевают, что ведущая роль в процедуре
извлечения передается эксперту, а аналитик только протоколирует рассуждения
эксперта во время его реальной работы по принятию решений или записывает то, что
эксперт считает нужным самостоятельно рассказать в форме лекции.
В активных методах, напротив, инициатива переходит к
аналитику, который активно контактирует с экспертом - в играх, диалогах, беседах
"за круглым столом" и т. д.
Следует подчеркнуть, что и активные, и пассивные методы могут
чередоваться даже в рамках одного сеанса извлечения знаний. Например, если
аналитик застенчив и не имеет большого опыта, то вначале он может использовать
пассивные методы, а постепенно, ближе знакомясь с экспертом, захватывать
инициативу и переходить в "наступление".
Пассивные методы на первый взгляд просты, но на самом деле
требуют от аналитика умения четко анализировать "поток сознания" эксперта и
выявлять в нем значимые фрагменты знаний. Отсутствие обратной связи (пассивность
аналитика) значительно ослабляет эффективность этих методов, чем и объясняется
то, что обычно они играют вспомогательную роль.
Активные методы можно разделить на две группы в зависимости
от числа экспертов-специалистов. Если экспертов больше одного, то целесообразно,
помимо серии индивидуальных контактов с каждым, применять и методы групповой
работы. Такие групповые методы обычно активизируют мышление участников дискуссий
и позволяют выявлять весьма нетривиальные аспекты их знаний. В свою очередь,
индивидуальные методы на сегодняшний день остаются ведущими, поскольку столь
деликатная процедура, как "отъем знаний", не терпит лишних свидетелей.
Игровые методы сейчас используются в социологии,
экономике, менеджменте, педагогике, для подготовки руководителей и политиков.
Игра - это особая форма деятельности и творчества, где человек раскрепощается и
чувствует себя свободнее, чем в обычной трудовой деятельности.
О выборе метода
На выбор метода влияют три фактора: личностные особенности
аналитика и эксперта и характеристика предметной области.
Одна из возможных классификаций людей по психологическим
характеристикам выделяет три их типа:
мыслитель (познавательный тип);
собеседник (эмоционально-коммуникативный тип);
практик (практический тип).
Мыслители ориентированы на интеллектуальную работу,
учебу, теоретические обобщения и обладают аналитическим способностями.
Собеседники - это общительные, открытые люди, готовые к сотрудничеству.
Практики предпочитают действие разговорам, хорошо реализуют замыслы других,
направлены на результативность работы. В соответствии с этой классификацией
практикующий аналитик может подобрать для себя наиболее подходящие методы.
Для характеристики моделируемых знаний можно предложить
следующую классификацию:
хорошо документированные;
среднедокументированные;
слабодокументированные.
Эта классификация связана с соотношением двух видов знаний Z1
и Z2, где Z1 - это экспертное "личное" знание, a Z2 - материализованное в
документах "общее" знание в данной конкретной области.
Кроме этого, бизнес-процессы, характеризующие деятельность
предприятия, можно разделить по критерию структурированности знаний. Под
структурированностью будем понимать степень выявленности основных
закономерностей и принципов, действующих в данной предметной области.
По степени структурированности знаний предметные области
могут быть:
хорошо структурированными - с четкими определениями,
устоявшейся технологией и терминологией;
среднеструктурированными - с определившейся терминологией,
развивающейся технологией, явными взаимосвязями между процессами;
слабоструктурированными - с размытыми определениями, часто
меняющейся структурой, скрытыми взаимосвязями, с большим количеством "белых
пятен".
Приведенные классификации методов и предметных областей
помогут разработчикам ИС, четко определив свою предметную область, соотнести ее
с предложенными типами и наметить подходящий метод или группу методов извлечения
знаний. Заметим, однако, скорее всего, реальная работа полностью зачеркнет его
выбор, и окажется, что хорошо документированная область на самом деле - слабо
документированная, а метод наблюдений надо срочно заменять играми!
Такова реальная сложность процедур извлечения знаний.
Пассивные методы
В соответствии с классификацией рассмотрим подробнее одну из
разновидностей коммуникативных методов: пассивные методы. Термин "пассивные" не
должен вызывать иллюзий, поскольку он введен в противовес "активным" методам. В
реальности же пассивные методы требуют от аналитика не меньшей отдачи, чем такие
активные методы, как игры и диалог.
Согласно классификации, к этой группе относятся наблюдения;
анализ протоколов "мыслей вслух"; лекции.
Сравнительная характеристика пассивных методов извлечения
знаний представлена в таблице.
Пассивные методы извлечения знаний
Метод |
Достоинства |
Недостатки |
Желаемые
качества эксперта |
Требования к аналитику |
Характерис-тики предметной области |
Наблю-дения |
Отсутствие субъективного влияния аналитика
Приближение аналитика к процессу |
Нет обратной связи
Фрагментар-ность |
"Мыслитель"/ "практик" |
"Мыслитель" |
Слабо- и средне-структуриро-ванные;
слабо- и средне-документиро-ванные |
"Мысли вслух" |
Обнаженность структур знаний
Свобода самовыраже-ния для специалиста |
Нет обратной связи
"Зашумлен-ность" лишней информа-цией |
"Собеседник"/ "мыслитель" |
"Мыслитель"/ "собеседник" |
То же |
Лекции |
Высокая концентрация знаний
Отсутствие субъективного влияния аналитика |
Мало хороших лекторов
Слабая обратная связь |
"Мыслитель" с лекторскими способностями |
"Мыслитель" |
Слабо-документиро-ванные и слабо-структуриро-ванные |
Наблюдения
В процессе наблюдений аналитик находится непосредственно
рядом с экспертом во время его профессиональной деятельности. При подготовке к
сеансу извлечения знаний эксперту-специалисту необходимо объяснить цель
наблюдений и попросить комментировать свои действия.
Во время сеанса аналитик записывает действия эксперта, его
реплики и объяснения. Можно сделать и видеозапись. Непременное условие этого
метода - невмешательство аналитика в работу эксперта. Именно метод наблюдений -
единственный "чистый" метод, исключающий вмешательство аналитика и навязывание
им своих представлений эксперту.
Существуют две разновидности проведения наблюдений:
наблюдение за реальным процессом и наблюдение за имитацией процесса (обычно
используются обе). Сначала аналитику полезно понаблюдать за реальным процессом,
чтобы глубже понять специфику бизнес-процесса. Это необходимо для проектирования
эффективного интерфейса пользователя. Ведь будущая ИС должна работать именно в
контексте такого реального административного или производственного процесса.
Кроме того, наблюдение позволит аналитику увидеть процесс, а, как известно,
лучше один раз увидеть, чем сто раз услышать.
Наблюдение за имитацией процесса проводят обычно за рабочим
местом эксперта, но сам процесс деятельности запускается специально для
аналитика. Преимущество этого варианта в том, что эксперт менее напряжен, чем в
первом случае, когда он работает на "два фронта": и ведет профессиональную
деятельность, и демонстрирует ее. Недостаток совпадает с преимуществом: именно
меньшая напряженность влияет на результат - раз работа ненастоящая, то и решение
может отличаться от настоящего.
Наблюдения за имитацией проводят также, когда наблюдения за
реальным процессом по каким-либо причинам невозможны (например, профессиональная
этика юриста может не допускать присутствия постороннего).
Сеансы наблюдений могут потребовать от аналитика:
овладения техникой стенографии для фиксации действий
эксперта;
ознакомления с методиками хронометража для четкого
структурирования производственного процесса по времени;
развития навыков "чтения по глазам", т.е. наблюдательности
по отношению к жестам, мимике и другим невербальным компонентам общения;
серьезного предварительного знакомства с предметной
областью, так как из-за отсутствия "обратной связи" иногда в действиях
экспертов многое непонятно.
Протоколы наблюдений после сеансов в ходе "домашней работы"
расшифровываются, а затем обсуждаются с экспертом.
Таким образом, наблюдения - один из наиболее распространенных
методов извлечения знаний на начальных этапах разработки. Обычно он применяется
не самостоятельно, а в совокупности с другими методами.
Анализ протоколов "мыслей вслух"
Протоколирование "мыслей вслух" отличается от наблюдений тем,
что эксперта-специалиста просят не просто прокомментировать свои действия и
решения, но и объяснить, как это решение было найдено, т.е. продемонстрировать
всю цепочку рассуждений. Во время рассуждений специалиста все его слова, весь
"поток сознания" протоколируется; при этом отмечаются даже паузы и междометия.
Иногда этот метод называют "вербальные (словесные) отчеты".
Вопрос об использовании диктофонов является спорным,
поскольку запись иногда действует на специалиста парализующе, разрушая атмосферу
доверительности, которая может и должна возникать при непосредственном общении.
Основная трудность при протоколировании "мыслей вслух"
состоит в том, что человеку принципиально сложно объяснить, как он думает.
Существуют экспериментальные психологические доказательства того факта, что люди
не всегда в состоянии достоверно описывать мыслительные процессы. Кроме того,
некоторые знания, хранящиеся в невербальной форме (например, различные
процедурные знания типа "как завязывать шнурки"), вообще слабо коррелируют с их
словесным описанием. Один из пионеров разработки интеллектуальных систем М.
Минский (США) считает, что "только как исключение, а не как правило, человек
может объяснить то, что он знает".
Расшифровку полученных протоколов аналитик проводит
самостоятельно с коррекциями на следующих сеансах извлечения знаний. Удачно
проведенное протоколирование "мыслей вслух" - один из наиболее эффективных
методов, поскольку в нем эксперт может проявить себя максимально ярко, он ничем
не скован, свободен в потоке собственных умозаключений и рассуждений, имея
возможность блеснуть эрудицией, продемонстрировать глубину своего опыта. Для
многих экспертов это приятный и лестный способ извлечения знаний.
Метод "мысли вслух" требует от аналитика тех же умений, что и
метод наблюдений. Обычно "мысли вслух" дополняются потом одним из активных
методов для реализации обратной связи.
Лекции
Лекция - очень старый способ передачи знаний. Лекторское
искусство издревле высоко ценилось во всех областях. Но нас сейчас интересует не
столько способность к подготовке и чтению лекций, сколько способность эту лекцию
слушать, конспектировать и усваивать. Если эксперт имеет опыт преподавателя, то
можно воспользоваться таким концентрированным фрагментом знаний, как лекция.
В лекции эксперту предоставлено много степеней свободы для
самовыражения; однако, аналитик должен сформулировать эксперту тему и задачу
лекции. Например, тема цикла лекций может звучать как "Заключение контракта -
подготовка документации", тема конкретной лекции "Подготовка соглашения о
намерениях", задача - передать знания по преддоговорной деятельности. При такой
постановке опытный лектор может заранее структурировать свои знания и ход
рассуждений. От аналитика в этой ситуации требуется лишь грамотно
законспектировать лекцию и в конце ее задать необходимые вопросы.
Студенты знают, что конспекты лекций в группе существенно
различаются. Люди, умело ведущие конспект, - обычно сильные студенты (именно их
конспект копируют остальные).
Искусство ведения конспекта заключается в
"помехоустойчивости": записывать главное, опускать второстепенное, выделять
фрагменты знаний (параграфы, подпараграфы), записывать только осмысленные
предложения, уметь обобщать.
Хороший вопрос по ходу лекции помогает и лектору, и
слушателю. Серьезные и глубокие вопросы могут существенно поднять авторитет
аналитика в глазах эксперта.
Опытный лектор знает, что вопросы можно условно разбить на
три группы:
умные вопросы, углубляющие лекцию;
глупые вопросы или вопросы не по существу;
вопросы "на засыпку", или провокационные.
Если аналитик задает вопросы второго типа, то возможны две
реакции. Вежливый эксперт-специалист будет разговаривать с таким аналитиком, как
с ребенком, который сейчас ничего не понимает и все равно уже не поймет.
Заносчивый эксперт просто выйдет из контакта, не желая терять время. Если же
аналитик захочет продемонстрировать свою эрудицию вопросами третьего типа, то
ничего, кроме раздражения и отчуждения, он, по-видимому, в ответ не получит.
Продолжительность лекции рекомендуется стандартная - от 40 до
50 мин и через 5-10 мин - еще столько же.
Метод извлечения знаний в форме лекций, как и все пассивные
методы, используют в начале разработки как эффективный способ быстрого
погружения аналитика в предметную область.
И в заключение шесть советов аналитику, как правильно слушать
лекции:
-
К лекции подготовьтесь, т. е. познакомьтесь с
деятельностью предприятия.
-
Слушайте с максимальным вниманием, для этого устраните
мешающие факторы (скрип двери, шорохи) и удобно устройтесь.
-
Дайте отдохнуть Вашему вниманию - делайте паузы
(например, когда лектор приводит незначительные факты).
-
Слушайте одновременно и лектора, и самого себя
(параллельно с мыслями лектора по ассоциации возникают собственные мысли).
-
Записывайте сокращенно, используя условные значки, и
расшифруйте записи в тот же день.
-
Не спорьте с лектором в процессе лекции.
Заключение
Современный интерес к системам управления знаниями со стороны
разработчиков корпоративных ИС справедливо обусловлен следующими причинами:
-
работники предприятия тратят слишком много времени на поиск
необходимой информации;
-
опыт ведущих и наиболее квалифицированных сотрудников
используется только ими самими;
-
ценная информация захоронена в огромном количестве
документов и данных, доступ к которым затруднен;
-
дорогостоящие ошибки повторяются из-за недостаточной
информированности и игнорирования предыдущего опыта.
Изучение же и овладение практическими методами и приемами
инженерии знаний может существенно повысить качество проектируемых
информационных систем.
|