В настоящее время курс «Основы искусственного интеллекта» является базовым при подготовке учителей информатики по специальности 030100.00 информатика. Это обусловлено тем, что передовые информационные технологии всё более широко используют методы решения проблем и задач, развиваемые в такой научной дисциплине, как искусственный интеллект. Все современные устройства, использующие цифровую обработку информации уже применяют те или иные алгоритмы искусственно-интеллектуальной обработки. А тенденция развития техники и информационных технологий таковы, что интеллектуализация систем, устройств и программного обеспечения будет усиливаться. Поэтому учителю информатики необходимо быть готовым ответить на вызов времени, и быть способным ориентироваться в современных интеллектуальных технологиях обработки информации, и иметь представление об их основах. Это позволит ему уверенно чувствовать себя как в общении с современными широко информированными школьниками, так и в преподавании основ информатики, поскольку здание информатики, построенное на этих основах уже в достаточной степени пропитано интеллектуальными технологиями, методами и подходами.
Существующий базовый курс за индексом ДПП.Ф.10, опирающийся на государственный образовательный стандарт высшего профессионального образования от 2000г., предусматривает некоторое знакомство учащихся с основами представления знаний и построения экспертных систем. В стандарте оговорено следующее содержание по этому вопросу: «Система знаний. Модели представления знаний: логическая, сетевая, фреймовая, продукционная». Но для применения конкретных схем и языков представления знаний и построения баз знаний необходимо эти знания извлечь из различных носителей, например, людей-экспертов или текстовых описаний. Этот момент является очень существенным и не формальным. Есть много методов и технологий извлечения знаний. Они настолько обширны, что образуют целую отдельную научно-практическую область – инженерию знаний. К тому же среди всех этих методов и технологий нет универсальных, они лишь дополняют друг друга, и на практике необходимо комбинировать и сочетать самые различные подходы.
Но у инженерии знаний есть другой аспект, который не лежит на поверхности, и в некоторой степени является побочным эффектом. Это педагогически-дидактический аспект, т.е. возможности, технологий и инструментов инженерии знаний, которые позволяют их использовать в качестве средств обучения. Известны примеры такого использования [1].
Но не только поэтому этот раздел можно считать очень важным именно для будущих учителей информатики. С одной стороны учитель должен знать, как могут быть структурированы и представлены в формальном виде знания, которые мы традиционно привыкли видеть представленными в виде текстов на естественном языке, или в виде знаний, умений и навыков конкретных людей. С другой стороны особенно важно будет для будущего учителя познакомиться с методами извлечения знаний из эксперта альтернативные педагогическим методам «извлечения знаний из учащегося».
Всё это позволит будущему учителю с одной стороны углубить своё понимание в области формирования и приобретения знаний обучаемым, а с другой – даст ему возможность расширить свой педагогический арсенал приёмами выявления и структуризации знаний, применяемыми в инженерии знаний.
Но необходимо иметь ввиду, что данный раздел искусственного интеллекта – «инженерия знаний» представляет собой достаточно обширную и сложную область, поэтому является некоторой проблемой
дать её адекватное представление за небольшое количество часов будущим учителям информатики, изучающим базовый курс «Основы искусственного интеллекта».
В связи с вышесказанным в данной работе была поставлена следующая цель
: исследовать возможность адекватного изучения темы «Инженерия знаний» студентами, обучающимися по специальности «учитель информатики», при изучении курса «Основы искусственного интеллекта».
При этом была выдвинута следующая гипотеза
: возможно разработать в поддержку курса «Основы искусственного интеллекта» курс по выбору по теме «Инженерия знаний» такой, что его изучение позволит обучающимся по специальности «учитель информатики» получить адекватное представление о современном состоянии данного раздела информатики.
Объектом исследования
в данной работе являлся процесс обучения учащихся по специальности 030100.00-информатика, предметом исследования
– изучение возможности построения курса по выбору по теме «Инженерия знаний» удовлетворяющего цели и гипотезе исследования.
Для выполнения поставленной цели было необходимо решить следующие задачи
:
1. Ознакомиться с таким разделом искусственного интеллекта, как инженерия знаний.
2. Определить разделы, темы, понятия и методы области «инженерия знаний», представляющие значимость для освоения учащимися и формирования их взгляда на эту область.
3. Собрать материалы по теме «инженерия знаний», имеющие ценность для построения учебного курса и обучения.
4. Определить и найти программное обеспечение, позволяющее на практике закрепить необходимые знания по инженерии знаний.
5. Разработать тематическое планирование и рабочую программу курса по выбору, позволяющие при проведении занятий по ним достичь заявленную цель и доказать заявленную гипотезу.
6. Разработать лабораторные работы, упражнения и контрольные вопросы по темам курса.
В случае успешного выполнения задач и реализации цели данной работы ожидается получение следующих результатов
: подтверждение положения о возможности построения курса «Инженерия знаний» в поддержку базового курса «Основы искусственного интеллекта» так, что будущие учителя информатики смогут познакомиться с методами и технологиями этой области исследований в искусственном интеллекте.
Знания являются неотъемлемой и существенной составляющей деятельности человека. Что такое знания и их свойства можно определять по-разному, но все эти определения не взаимоисключающие, но дополняющие друг-друга. Приведём некоторые из них.
Знание
– проверенный практикой и удостоверенный логикой результат познания действительности, отраженный в сознании человека в виде представлений, понятий, суждений и теорий. Знания формируются в результате целенаправленного педагогического процесса, самообразования и жизненного опыта. По Д.А.Поспелову для знаний характерны внутренняя интерпретируемость, структурированность, связанность и взаимная активность.
Можно выделить здравый смысл и научное знание. Здравый смысл
– основанные на повседневном опыте знания и взгляды психически здоровых людей на окружающую среду и самих себя. Научное знание
– система знаний о законах природы, общества, мышления. Научное знание составляет основу научной картины мира и отражает законы его развития. Научное знание:
· является результатом постижения действительности и когнитивной основой человеческой деятельности;
· социально обусловлено;
· обладает различной степенью достоверности.
Научные знания добываются путём научной деятельности (науки). Научная деятельность – это интеллектуальная деятельность, направленная на получение и применение новых знаний для:
· решения технологических, инженерных, экономических, социальных, гуманитарных и иных проблем;
· обеспечения функционирования науки, техники и производства как единой системы.
Можно выделить также формальные знания
или знания – в информатике. Знания – в информатике – вид информации, отражающей опыт специалиста (эксперта) в определенной предметной области, его понимание множества текущих ситуаций и способы перехода от одного описания объекта к другому.
Кроме знаний существует также индивидуальный опыт. Опыт
– это совокупность знаний и умений, приобретенных индивидом на основе и в процессе непосредственного практического взаимодействия с внешним миром. Часть индивидуального опыта является повседневное знание. Повседневное знание
– это знание:
· основанное на здравом смысле и повседневном опыте;
· являющееся ориентировочной основой поведения человека в обыденной жизни.
Повседневное знание – в феноменологической социологии – основа научного знания и теоретических абстракций.
Существует также и здравый смысл
– основанные на повседневном опыте знания и взгляды психически здоровых людей на окружающую среду и самих себя.
Следует отличать от знаний информацию
. Например, по законодательству РФ, информация – это сведения о лицах, предметах, фактах, событиях, явлениях и процессах независимо от формы их представления. Информация уменьшает степень неопределенности, неполноту знаний о лицах, предметах, событиях и т.д.
Но в информатике более популярно другое определение. Информацией (от лат. Informatio — «научение», «сведение», «оповещение») называется опосредованный формами связи результат отражения изменяемого объекта изменяющимся с целью сохранения их системной целостности. Информация первична и содержательна — это категория, поэтому в категориальный аппарат науки она вводится портретно — описанием, через близкие категории: материя, система, структура, отражение. В материальном мире (человека) информация материализуется через свой носитель и благодаря нему существует. Сущность материального мира предстаёт перед исследователем в единстве формы и содержания. Передаётся информация через носитель. Материальный носитель придаёт информации форму. В процессе формообразования производится смена носителя информации. Определения термин информация не имеет, так как не является понятием. Существует информация в каналах связи систем управления. Не следует путать категорию информация с понятием знание. Знание определяется через категорию информация.
В XX веке слово «информация» стало термином во множестве научных областей, получив особые для них определения и толкования.
Также, наряду с понятиями знание и информация существует понятие «данные». Данные
– это сведения:
· полученные путем измерения, наблюдения, логических или арифметических операций;
· представленные в форме, пригодной для постоянного хранения, передачи и (автоматизированной) обработки.
Данные — это представление фактов и идей в формализованном виде, пригодном для передачи и обработки в некотором информационном процессе. Данные – это выделенная (из системы, благодаря обособленности существования носителя) информация.
Для передачи знаний человеку используется обучение. Обучение
– это целенаправленный и планомерный процесс передачи и усвоения знаний, умений, навыков и способов познавательной деятельности человека. Обучение – относительно постоянное изменение в человеческом поведении или способностях, являющееся следствием опыта.
От обучения можно отделить понятие «научение». Научение
– в широком смысле – это класс психологических процессов, обеспечивающих формирование новых приспособительных реакций. Научение – в узком смысле – процесс и результат приобретения индивидуального опыта. Путем научения приобретаются:
· знания, умения и навыки у человека;
· новые формы поведения у животных.
Существует также инструментальное научение
– научение, происходящее:
· за счет спонтанного порождения организмом множества разнообразных реакций на один и тот же стимул или ситуацию
· с последующим закреплением только тех реакций, которые оказались наиболее удачными с точки зрения полученного эффекта.
В процессе научения вырабатываются навыки. Навык
– это последовательность развертывания во времени и пространстве действий и операций:
· выработанная в процессе обучения и тренировки;
· доведенная до автоматизма;
· оптимальная для некоторого вида деятельности.
В основе формирования навыка лежит образование динамического стереотипа. Устойчивость навыка зависит от особенностей памяти. Различают двигательные, сенсорные и интеллектуальные навыки.
Существуют различные определения понятия «знания». В одном из наиболее емких определений под знаниями понимают формализованную информацию, на которую ссылаются или которую используют в процессе решения задачи. Знание о предметной области включает описание объектов, их окружения, необходимых явлений, фактов, а также отношений между ними. Общение с ЭВМ на уровне знания предопределяет возможность ввода в машину и использование ею некоторой совокупности взаимосвязанной информации. Сложность понятия «знание» заключена в множественности его носителя и неразрывности с понятием «данные». Выделяют несколько уровней формализации знания о предметной области: знания в памяти человека; знания в форме языковой модели предметной области, используемые человеком и зафиксированные на физических носителях с использованием контекстно-зависимых языков, графических образов и т. п.; знания, формализованные для их представления при использовании в ЭВМ; фактографические сведения или данные.
Фактические и стратегические знания
Знания определяются как «...основные закономерности предметной области, позволяющие человеку решать конкретные производственные, научные и другие задачи, то есть факты, понятия, взаимосвязи, оценки, правила, эвристики (иначе фактические знания), а также стратегии принятия решения в этой области (иначе стратегические знания)».
Факты и эвристики
Некоторые авторы разделяют знания на две большие категории: факты и эвристики. Первая категория (факты) указывает на хорошо известные в той или иной предметной области обстоятельства. Такие знания еще называют текстовыми, имея в виду достаточную их освещенность в специальной литературе и учебниках. Вторая категория знаний (эвристики) основывается на индивидуальном опыте специалиста (эксперта) в предметной области, накопленном в результате многолетней практики. Эта категория нередко играет решающую роль при построении интеллектуальных программ. Сюда относятся такие знания, как «способы удаления бесполезных гипотез», «способы использования нечеткой информации», «способы разрешения противоречий» и т. п.
Декларативные и процедурные знания
Под декларативными знаниями подразумевают знания типа «А это В», и они характерны для баз данных. Это, например, такие факты, как «в час пик на улице много машин», «зажженная плита — горячая», «скарлатина — инфекционное) заболевание»...
К процедурным знаниям относятся сведения о способах оперирования или преобразования декларативных знаний.
Интенсиональные и экстенсиональные знания
Интенсиональные знания — это знания о связях между атрибутами (признаками) объектов данной предметной области. Они оперируют абстрактными объектами, событиями и отношениями.
Экстенсиональные знания представляют собой данные, характеризующие конкретные объекты, их состояния, значения параметров в пространстве и времени.
Глубинные и поверхностные знания
В глубинных знаниях отражается понимание структуры предметной области, назначение и взаимосвязь отдельных понятий (глубинные знания в фундаментальных науках — это законы и теоретические основания). Поверхностные знания обычно касаются внешних эмпирических ассоциаций с каким-либо феноменом предметной области.
Например, для разговора по телефону требуется лишь поверхностное знание того, что, сняв трубку и правильно набрав номер, мы соединимся с нужным абонентом. Большинство людей не испытывает необходимости в глубинных представлениях о структуре телефонной связи, конструкции телефонного аппарата, которыми, безусловно, пользуются специалисты по телефонии.
Отмечается, что большинство экспертных систем основано на применении поверхностных знаний. Это, однако, нередко не мешает достигать вполне удовлетворительных результатов. Вместе с тем, опора на глубинные представления помогает создавать более мощные, гибкие и интеллектуальные адаптивные системы. Наглядным примером может служить медицина. Здесь молодой и недостаточно опытный врач часто действует по поверхностной модели: «Если кашель — то пить таблетки от кашля, если ангина — то эритромицин» и т. п. В то же время опытный врач, основываясь на глубинных знаниях, способен порождать разнообразные способы лечения одной и той же болезни в зависимости от индивидуальных особенностей пациента, его состояния, наличия доступных лекарств в аптечной сети и т. д.
Глубинные знания являются результатом обобщения первичных понятий предметной области в некоторые более абстрактные структуры. Степень глубины и уровень обобщенности знаний непосредственно связаны с опытом экспертов и могут служить показателем их профессионального мастерства.
Жесткие и мягкие знания
Жесткие знания позволяют получать однозначные четкие рекомендации при заданных начальных условиях. Мягкие знания допускают множественные, «размытые» решения и различные варианты рекомендаций (рис. П.16).
Характеристика различных предметных областей по глубине и жесткости дает возможность проследить тенденцию развития интеллектуальных систем.
Рис. П.16. Тенденция развития интеллектуальных систем
Как видно из рисунка, область практического применения интеллектуальных систем все более смещается в сферу задач с преобладанием глубинных и мягких знаний. Такие задачи еще называют трудно формализуемыми. Для них характерна одна или несколько следующих особенностей:
· задача не может быть определена в числовой форме (требуется символьное представление);
· алгоритмическое решение задачи не известно (хотя, возможно, и существует), или не может быть использовано из-за ограниченных ресурсов (памяти компьютера, быстродействия);
· цели задачи не могут быть выражены в терминах точно определенной целевой функции или не существует точной математической модели задачи
Системы, основанные на знаниях, не отвергают и не заменяют традиционных подходов к решению формализованных задач. Они отличаются тем, что ориентированы на решение трудно формализуемых задач. Интеллектуальные системы особенно важны там, где наука не может создать конструктивных определений, область определений меняется, ситуации зависят от контекстов и языковая (описательная) модель доминирует над алгоритмической.
Наиболее распространенными моделями представления знаний являются:
· продукционные системы;
· логические модели;
· фреймы;
· семантические сети.
Продукционные системы
В продукционных системах знания представляются в виде совокупности специальных информационных единиц.
В общем случае продукционная система включает следующие компоненты:
· базу данных, содержащую множество фактов;
· базу правил, содержащую набор продукций;
· интерпретатор (механизм логического вывода) или правила работы с продукциями.
База правил и база данных образуют базу знаний. Факты в базе данных представляют собой краткосрочную информацию и в принципе могут изменяться в ходе работы продукционной системы по мере накопления опыта. Правила являются более долговременной информацией и предназначены для порождения гипотез (новых фактов) из того, что уже известно.
Продукционные системы делят на два типа — с прямыми и обратными выводами. При прямом выводе рассуждение ведется от данных к гипотезам, а при обратном производится поиск доказательства или опровержения некоторой гипотезы. Часто используются комбинации прямой и обратной цепи рассуждений.
Продукции по сравнению с другими формами представления знаний имеют следующие преимущества:
· модульность;
· единообразие структуры (основные компоненты продукционной системы могут применяться для построения интеллектуальных систем с различной проблемной ориентацией);
· естественность (вывод заключения в продукционной системе во многом аналогичен процессу рассуждений эксперта);
· гибкость родовидовой иерархии понятий, которая поддерживается только как связи между правилами (изменение правила влечет за собой изменение в иерархии).
Однако продукционные системы не свободны от недостатков:
· процесс вывода менее эффективен, чем в других системах, поскольку большая часть времени при выводе затрачивается на непроизводительную проверку применимости правил;
· этот процесс трудно поддается управлению;
· сложно представить родовидовую иерархию понятий.
Представление знаний с помощью продукций иногда называют «плоским», так как в продукционных системах отсутствуют средства для установления иерархии правил. Объем базы знаний продукционных систем растет линейно, по мере включения в нее новых фрагментов знаний, в то время как в традиционных алгоритмических системах, использующих деревья решений, зависимость между объемом базы знаний и количеством собственно знаний является логарифмической.
Логические модели
Логические модели представления знаний реализуются средствами логики предикатов.
Предикатом называется функция, принимающая только два значения — истина и ложь — и предназначенная для выражения свойств объектов или связей между ними. Выражение, в котором утверждается или отрицается наличие каких-либо свойств у объекта, называется высказыванием. Константы служат для именования объектов предметной области. Логические предложения или высказывания образуют атомарные формулы. Интерпретация предиката — это множество всех допустимых связываний переменных с константами. Связывание представляет собой подстановку констант вместо переменных. Предикат считается общезначимым, если он истинен на всех возможных интерпретациях. Говорят, что высказывание логически следует из заданных посылок, если оно истинно всегда, когда истинны посылки.
Наиболее простым языком логики является исчисление высказываний, в котором отсутствуют переменные. Любому высказыванию можно приписать значение истинно или ложно. Отдельные высказывания могут соединяться связками И, ИЛИ, НЕ, которые называются булевыми операторами. Основу исчисления высказываний составляют правила образования сложных высказываний из атомарных.
Здесь переменные обозначают логические высказывания, о которых можно сказать, что они истинны или ложны. Логические операторы имеются в большинстве языков программирования. Однако исчисление высказываний — недостаточно выразительное средство для обработки знаний, поскольку в нем не могут быть представлены предложения, включающие переменные с кванторами.
Исчисление предикатов с кванторами (логика предикатов) является расширением исчисления высказываний, в котором для выражения отношений между объектами предметной области могут использоваться предложения, включающие не только константы, но и переменные.
В общем случае модели, основанные на логике предикатов, описываются формальной системой, которая задается четверкой:
М = (Т, Р, А, П),
где Т — множество базовых элементов или алфавит формальной системы; Р — множество синтаксических правил, с помощью которых можно строить синтаксически корректные предложения; А — множество аксиом или некоторых синтаксически правильных предложений, заданных априорно; П — правила продукций (правила вывода или семантические правила), с помощью которых можно расширять множество А, добавляя в него синтаксически правильные предложения.
Главное преимущество логических моделей представления знаний заключается в возможности непосредственно запрограммировать механизм вывода синтаксически правильных высказываний. Примером такого механизма служит, в частности, процедура вывода, построенная на основе метода резолюций. Однако с помощью правил, задающих синтаксис языка, нельзя установить истинность или ложность того или иного высказывания. Причем это распространяется абсолютно на все языки. Высказывание может быть построено синтаксически правильно, но оказаться совершенно бессмысленным.
Логические модели представления и манипулирования знаниями были особенно популярны в 70-х годах. Тогда казалось, что с появлением языков программирования типа ПРОЛОГ процедуры логического вывода в исчислении предикатов будут достаточны для решения всех типов задач в интеллектуальных системах. Вместе с тем, по мере того как в поле зрения исследователей включались все новые интеллектуальные задачи, стало ясно, что говорить о доказательном выводе можно только в небольшом числе случаев, когда проблемная область, в которой решается задача, формально описана и полностью известна. Но большинство задач, где интеллект человека позволяет находить нужные решения, связано с областями, где знания принципиально неполны, неточны, некорректны и характеризуются еще немалым числом характеристик, начинающихся с частицы «не». При таких условиях речь может идти только о правдоподобном выводе, при котором окончательный результат получается лишь с некоторой оценкой уверенности в его истинности. Кроме того, специалисты, работающие в плохо формализованных областях (например, в медицине), рассуждают совсем не так, как представители точных наук. Для них весомым аргументом в пользу принятия какого-либо положения может быть мнение ряда признанных в этих областях авторитетов или, например, сходство доказываемого положения с другим, для которого решение уже известно. Поэтому дальнейшее развитие баз знаний пошло по пути работ в области индуктивных логик, логик «здравого смысла», логик веры и других логических систем, имеющих мало общего с классической математической логикой.
Фреймы
Фрейм чаще всего определяют как структуру данных для представления стереотипных ситуаций. Модель представления знаний на основе фреймов использует концепцию организации памяти, понимания и обучения человека, предложенную М. Минским (1979). Фрейм (дословно — «рамка») — это единица представления знаний, детали которой могут изменяться в соответствии с текущей ситуацией. Фрейм в любой момент может быть дополнен различной информацией, касающейся способов применения данного фрейма, последствий этого применения и т. п.
Структура фрейма состоит из характеристик описываемой стереотипной ситуации и их значений, которые называются, соответственно, слотами и заполнителями слотов.
Имя фрейма:
Имя первого слота, значение первого слота
Имя второго слота, значение второго слота
Имя К-го слота, значение К-го слота
Незаполненный фрейм называется протофреймом, а заполненный — экзофреймом. Роль протофрейма как оболочки в экзофрейме весьма важна. Эта оболочка позволяет осуществлять процедуру внутренней интерпретации, благодаря которой данные в памяти системы не безлики, а имеют вполне определенный, известный системе смысл.
Слот может содержать не только конкретное значение, но и имя процедуры, позволяющей вычислить его по заданному алгоритму, а также одну или несколько продукций (эвристик), с помощью которых это значение определяется. В слот может входить не одно, а несколько значений. Иногда этот слот включает компонент, называемый фасетом, который задает диапазон или перечень его возможных значений. Фасет указывает также граничные значения заполнителя слота.
Как уже отмечалось, помимо конкретного значения в слоте могут храниться процедуры и правила, которые вызываются при необходимости вычисления этого значения. Среди них выделяют процедуры-демоны и процедуры-слуги. Первые запускаются автоматически при выполнении некоторого условия, а вторые активизируются только по специальному запросу. Если, например, фрейм, описывающий человека, включает слоты ДАТА РОЖДЕНИЯ и ВОЗРАСТ и в первом из них находится некоторое значение, то во втором слоте может стоять имя процедуры-демона, вычисляющей возраст по дате рождения и текущей дате и активизирующейся при каждом изменении текущей даты.
Совокупность фреймов, моделирующая какую-либо предметную область, представляет собой иерархическую структуру, в которую фреймы собираются с помощью родовидовых связей. На верхнем уровне иерархии находится фрейм, содержащий наиболее общую информацию, истинную для всех остальных фреймов. Фреймы обладают способностью наследовать значения характеристик своих родителей, находящихся на более высоком уровне иерархии. Эти значения могут передаваться по умолчанию фреймам, находящимся ниже них в иерархии, но если последние содержат собственные значения данных характеристик, то в качестве истинных принимаются именно они. Это обстоятельство позволяет без затруднений учитывать во фреймовых системах различного рода исключения.
Различают статические и динамические системы фреймов. В системах первого типа фреймы не могут быть изменены в процессе решения задачи, а в системах второго типа это допустимо.
О системах программирования, основанных на фреймах, говорят, что они являются объектно-ориентированными. Каждый фрейм соответствует некоторому объекту предметной области, а слоты содержат описывающие этот объект данные, то есть в слотах находятся значения признаков объектов. Фрейм может быть представлен в виде списка свойств, а если использовать средства базы данных, то в виде записи.
Наиболее ярко достоинства фреймовых систем представления знаний проявляются в том случае, если родовидовые связи изменяются нечасто и предметная область насчитывает немного исключений. Во фреймовых системах данные о родовидовых связях хранятся явно, как и знания других типов. Значения слотов представляются в системе в единственном экземпляре, поскольку включаются только в один фрейм, описывающий наиболее общие понятия из всех тех, которые содержит слот с данным именем. Такое свойство систем фреймов обеспечивает экономное размещение базы знаний в памяти компьютера. Еще одно достоинство фреймов состоит в том, что значение любого слота может быть вычислено с помощью соответствующих процедур или найдено эвристическими методами. То есть фреймы позволяют манипулировать как декларативными, так и процедурными знаниями.
К недостаткам фреймовых систем относят их относительно высокую сложность, что проявляется в снижении скорости работы механизма вывода и увеличении трудоемкости внесения изменений в родовидовую иерархию. Поэтому большое внимание при разработке фреймовых систем уделяют наглядным способам отображения и эффективным средствам редактирования фреймовых структур.
Семантические сети
Семантическая сеть описывает знания в виде сетевых структур. В качестве вершин сети выступают понятия, факты, объекты, события и т. п., а в качестве дуг сети — отношения, которыми вершины связаны между собой. Так, семантическая сеть, представляющая знания об автомобиле гр. Васильева, показана на рис. П. 17.
Семантические сети часто рассматривают как общий формализм для представления знаний. Частным случаем таких сетей являются сценарии, в которых в качестве отношений выступают каузальные отношения или отношения типа «цель — средство».
Вершины сети соединяются дугой, если соответствующие объекты предметной области находятся в каком-либо отношении. Самыми распространенными являются следующие типы отношений:
БЫТЬ ЭЛЕМЕНТОМ КЛАССА (ЯВЛЯТЬСЯ) - означает, что объект входит в состав данного класса, например: ВАЗ 2106 является автомобилем;
ИМЕТЬ — позволяет задавать свойства объектов, например: жираф имеет длинную шею;
ЯВЛЯТЬСЯ СЛЕДСТВИЕМ — отражает причинно-следственные связи, например: астеническое состояние является следствием перенесенного простудного заболевания;
ИМЕТЬ ЗНАЧЕНИЕ — задает значение свойств объектов, например: пациент может иметь двух братьев.
Как и в системе, основанной на фреймах, в семантической сети могут быть представлены родовидовые отношения, которые позволяют реализовывать наследование свойств от объектов-родителей. Это обстоятельство приводит к тому, что семантические сети приобретают все недостатки и достоинства представления знаний в виде фреймов. Преимущества заключаются в простоте и наглядности описания предметной области. Однако последнее свойство с усложнением семантической сети теряется и, кроме того, существенно увеличивается время вывода. Также к недостаткам семантических сетей относят сложность обработки различного рода исключений.
Другие методы представления знаний
Из других методов представления знаний популярностью пользуется представление знаний по примерам. Работая с системой такого типа, пользователь задает ей несколько примеров решения задач из актуальной предметной области. На основе этих примеров система самостоятельно строит базу знаний, которая затем применяется для решения других задач. При создании базы знаний пользователь имеет возможность в любой момент вызвать на экран дисплея матрицу, состоящую из примеров задач и их решений, с тем чтобы установить в ней наличие пустых мест, которые необходимо заполнить недостающими примерами «задача—решение».
Знания в такой системе могут храниться в различной форме. Это может быть, например, интенсиональная форма, когда пользователь вводит в систему правила операций с атрибутами объектов предметной области, приводящие к требуемому решению. Также это может быть экстенсиональная форма, при которой каждый пример детально описывается пользователем и представляется в памяти компьютера в виде совокупности значений выделенных атрибутов. Возможно сочетание и той, и другой форм. В результате получается матрица примеров, которая может быть расширена или изменена лишь путем корректировки примеров, содержащихся в матрице, или их добавлением.
Основным достоинством представления знаний по примерам является простота данного способа, поскольку пользователь может не иметь ни малейшего представления о продукционных правилах, исчислении предикатов, фреймах и семантических сетях. Вместе с тем, в качестве недостатков метода представления знаний по примерам отмечают отсутствие гибкости процесса построения интеллектуальной системы. Пользователь оказывается отстраненным от собственно создания базы знаний и поэтому не может контролировать связи между содержащимися в ней понятиями.
Выбор способа представления знаний осуществляется инженером по знаниям после того, как им достигнуто понимание природы данных моделируемой области. При решении сложных задач возможны ситуации, когда источники знаний различаются по типам, и, соответственно, представление таких знаний требует использования разных способов (смешанное представление). Тогда для продуктивного функционирования интеллектуальной системы нередко применяют принцип доски объявлений, с помощью которого реализуется взаимодействие различных независимых источников знаний.
Извлечение знаний – процесс взаимодействия инженера по знаниям с источником знаний (экспертом), в результате которого становятся явными процесс рассуждений специалистов при принятии решения и структура их представлений о предметной области. Занимается извлечением знаний инженер по знаниям. Инженер по знаниям – это специалист по искусственному интеллекту, проектирующий и создающий экспертную систему. Обычно инженер по знаниям выступает в роли посредника между экспертом и базой знаний.
Для получения знаний инженером по знаниям ему необходим эксперт. Эксперт – это специалист, который за годы обучения и практической деятельности научился эффективно решать задачи, относящиеся к конкретной предметной области. Эксперт – это специалист, который может делать экспертные оценки. Экспертные оценки – это основанные на суждениях специалистов количественные или бальные оценки процессов или явлений, не поддающихся непосредственному измерению.
Понятие «управление знаниями» (Knowledge Management, КМ) родилось в середине 90-х годов в крупных корпорациях, где проблемы обработки информации приобрели особую остроту, став критическими. Выяснилось, что основное узкое место - это обработка знаний, накопленных специалистами компании (именно такие знания обеспечивают ей преимущество перед конкурентами). Знание, которое не используется и не возрастает, и в конечном счете устаревает и становится бесполезным, точно так же, как деньги, которые хранятся, не превращаясь в оборотный капитал, в конечном счете обесцениваются. Знание же, которое распространяется, приобретается и обменивается, наоборот, генерирует новое знание. Существуют десятки определений знания, но в системах KM знания - это фундаментальный ресурс, базирующийся на практическом опыте специалистов и на данных, используемых на конкретном предприятии.
Ресурсы знаний различаются в зависимости от отраслей индустрии и приложений, но, как правило, в них входят методики, технологии, процедуры обработки информации, накопившиеся в процессе функционирования предприятия; руководства, письма, новости, сведения о заказчиках и конкурентах, схемы, чертежи и другие данные. Традиционно проектировщики систем КМ ориентируются в основном на менеджеров, хотя есть и тенденция принимать в расчет более широкий круг работников организации.
Для интеграции в единый комплекс системы KM используют ряд технологий:
· традиционные системы автоматизации и информационно-поисковые системы;
· электронную почту, корпоративные сети и Интернет-сервисы;
· базы и хранилища данных (data warehouse);
· системы электронного документооборота;
· специализированные программы обработки данных (например, статистического анализа);
· экспертные системы и базы знаний.
При разработке систем КМ можно выделить следующие этапы.
Накопление. Стихийное и бессистемное накопление информации в организации.
Извлечение. Процесс переноса компетентности специалистов на аналитика. Это один из наиболее сложных и трудоемких этапов, от его успешности зависит дальнейшая жизнеспособность системы.
Структурирование и формализация. На этом этапе должны быть выделены основные понятия, выработана структура представления информации. Она должна быть максимально наглядной и такой, чтобы ее было легко изменять и дополнять. Именно на этом этапе создаются описания и модели бизнес процессов и структуры потоков информации.
Проектирование системы. Предметная постановка задачи, разработка архитектуры и спецификаций для программирования.
Программная реализация. Разработка собственно программного комплекса системы.
Обслуживание. Под ним понимается корректировка формализованных данных и знаний (добавление, обновление); «чистка» - удаление устаревшей информации; фильтрация данных и знаний для поиска информации, необходимой пользователям.
Это не единственно возможное описание процесса разработки, но оно позволяет понять, что происходит при создании реальных систем управления знаниями. В литературе достаточно подробно описаны лишь этапы проектирования и реализации, при том, что основную сложность представляют этапы извлечения и структурирования. Мало кто из разработчиков знает, что существует наука под названием «инженерия знаний» (knowledge engineering), возникшая в русле разработки интеллектуальных систем, или систем, основанных на знаниях, примерно 15-20 лет назад.
Поскольку основная проблема инженерии знаний - это процесс извлечения знаний, разработчикам систем KM и в первую очередь аналитику необходимо четко понимать природу и особенности этих процессов. Можно выделить три основных аспекта процесса извлечения знаний:
A = {A1, А2, А3} = {психологический, лингвистический, гносеологический}.
Следует отметить, что даже если речь идет о разработке традиционной информационной системы, а не системы KM, проблемы инженерии знаний не теряют своей актуальности.
Из трех аспектов извлечения знаний наиболее важен психологический (А1), поскольку он определяет успешность и эффективность взаимодействия (общения) аналитика с основным источником знаний - специалистами предприятия.
Существует определение термина приобретение знаний: "Передача и преобразование опыта решения проблем, полученного от некоторого источника знаний, в программу".
Термин приобретение знаний носит обобщенный характер и совершенно нейтрален к способу передачи знаний. Например, передача может осуществляться с помощью специальной программы, которая в процессе обработки большого массива историй болезни устанавливает связь между симптомами и заболеваниями. А вот термин извлечение знаний относится именно к одному из способов передачи знаний — опросу экспертов в определенной проблемной области, который выполняется аналитиком или инженером по знаниям. Последний затем создает компьютерную программу, представляющую такие знания (или поручает это кому-нибудь другому, обеспечивая его всей необходимой информацией).
Этот же термин применяется и для обозначения процесса взаимодействия эксперта со специальной программой, целью которого является:
· извлечь каким-либо систематическим способом знания, которыми обладает эксперт, например, предлагая эксперту репрезентативные задачи и фиксируя предлагаемые способы их решения;
· сохранить полученные таким образом знания в некотором промежуточном виде;
· преобразовать знания из промежуточного представления в вид, пригодный для практического использования в программе, например в набор порождающих правил.
Преимущество использования такой программы — снижение трудоемкости процесса, поскольку перенос знаний от эксперта к системе осуществляется в один прием.
Стадии приобретения знаний
Можно выделить несколько стадий приобретения знаний.
(1) Идентификация. Анализируется класс проблем, которые предполагается решать с помощью проектируемой системы, включая данные, которыми нужно оперировать, и критерии оценки качества решений. Определяются ресурсы, доступные при разработке проекта, — источники экспертных знаний, трудоемкость, ограничения по времени, стоимости и вычислительным ресурсам.
(2) Концептуализация. Формулируются базовые концепции и отношения между ними. Сюда же входят и характеристика различных видов используемых данных, анализ информационных потоков и лежащих в их основе структур в предметной области в терминах причинно-следственных связей, отношений частное/целое, постоянное/временное и т.п.
(3) Формализация. Предпринимается попытка представить структуру пространства состояний и характер методов поиска в нем. Выполняется оценка полноты и степени достоверности (неопределенности) информации и других ограничений, накладываемых на логическую интерпретацию данных, таких как зависимость от времени, надежность и полнота различных источников информации.
(4) Реализация. Преобразование формализованных знаний в работающую программу, причем на первый план выходит спецификация методов организации управления процессом и уточнение деталей организации информационных потоков. Правила преобразуются в форму, пригодную для выполнения программой в выбранном режиме управления. Принимаются решения об используемых структурах данных и разбиении программы на ряд более или менее независимых модулей.
(5) Тестирование. Проверка работы созданного варианта системы на большом числе репрезентативных задач. В процессе тестирования анализируются возможные источники ошибок в поведении системы. Чаще всего таким источником является имеющийся в системе набор правил. Оказывается, что в нем не хватает каких-то правил, другие не совсем корректны, а между некоторыми обнаруживается противоречие.
В этом разделе рассмотрены особенности процедуры взаимодействия инженера по знаниям с источником знаний (экспертом), позволяющей сделать явными рассуждения специалистов при принятии решений и структуру их представлений о предметной области.
Процедура взаимодействия инженера по знаниям с экспертом
Известен парадоксальный факт Джонсона о том, что по мере накопления опыта специалист-эксперт все больше утрачивает умение словесно выражать свои знания. Имеются достаточно убедительные психологические доказательства того, что люди далеко не всегда в состоянии достоверно описать свои мыслительные процессы. Теоретик искусственного интеллекта Марвин Минский писал, что «самосознание — это сложная, но тщательно сконструированная иллюзия...» и что «.. .только как исключение, а не как правило, человек может объяснить то, что он знает».
Другое психологическое положение состоит в том, что опыт эксперта — это интуиция, которая трудно поддается выражению в форме правил типа «ЕСЛИ — ТО». Широко известно высказывание Лао-Цзы («старого учителя»): «Кто скажет, тот не знает, кто знает, тот не скажет».
Тем не менее, инженерия знаний предлагает определенные методы (приемы, способы) работы с экспертами. Эти методы направлены на «раскручивание» лабиринтов памяти экспертов, в которых хранятся знания, часто имеющие невербальный характер.
Классификация методов работы с экспертами
В основу излагаемого материала положена классификация коммуникативных методов работы инженера по знаниям.
Под коммуникативными методами понимают все виды контактов инженера по знаниям с живым источником знаний — экспертом. Среди этих методов выделяют две большие группы: активные и пассивные (рис. П.21).
Пассивные методы подразумевают, что ведущая роль в процедуре извлечения знаний принадлежит эксперту. При этом инженер по знаниям главным образом протоколирует рассуждения и действия эксперта.
В активных методах инициатива полностью в руках инженера по знаниям. Он ведет с экспертом беседу, предлагает различные «игры», организует «круглый стол» и т. д.
Пассивные методы на первый взгляд просты. Вместе с тем, они требуют от инженера по знаниям умения анализировать «поток сознания» эксперта и выделять в нем ценные фрагменты знания.
Активные методы разделяют на две группы в зависимости от числа экспертов, участвующих в процедуре извлечения знаний. В групповых методах большое значение имеет дискуссия между экспертами, в которой нередко выявляются нетривиальные аспекты знаний. В то же время, ведущую роль на сегодняшний день играют индивидуальные методы. В значительной степени это связано с деликатностью процедуры «отъема знаний».
Пассивные методы
Наблюдение
Метод наблюдения является единственным «чистым» методом, где инженер по знаниям не вмешивается в процесс работы эксперта и не навязывает ему какие-либо собственные представления. Выделяют две разновидности наблюдений:
· Наблюдение за реальным процессом.
· Наблюдение за имитацией процесса.
Сначала обычно применяют первую разновидность и наблюдают за реальным процессом на рабочем месте эксперта. Это помогает глубже понять предметную область и отметить все внешние особенности процедуры принятия решений, необходимые для проектирования интерфейса пользователя.
На втором этапе эксперт имитирует процесс. В таком режиме он менее напряжен и работает на «два фронта» — ведет профессиональную деятельность и одновременно демонстрирует ее.
Сеансы наблюдений предъявляют к инженеру по знаниям следующие требования:
· Владение техникой стенографии.
· Знакомство с методиками хронометрирования для четкого структурирования производственного процесса во времени.
· Развитые навыки «чтения по глазам», то есть наблюдательность к жестам, мимике и другим невербальным компонентам общения.
· Предварительное знакомство с предметной областью.
Протоколы наблюдений после проведения сеансов тщательно расшифровываются, а затем обсуждаются с экспертом.
Анализ протоколов «мыслей вслух»
При протоколировании «мыслей вслух» эксперта просят раскрыть всю цепочку рассуждений, объясняющих его действия и решения. При таком протоколировании считается важным зафиксировать не только весь «поток сознания» эксперта, но даже паузы и междометия в речи эксперта. Иногда данный метод называют «вербальными отчетами».
При протоколировании «мыслей вслух» эксперт может проявить себя максимально ярко. Он ничем не скован, ему никто не мешает, он как бы свободно парит в потоке собственных рассуждений и умозаключений, может блеснуть своей эрудицией и продемонстрировать глубину познаний. Для большого числа экспертов это самый приятный и лестный способ извлечения знаний.
Вместе с тем, как отмечалось выше, далеко не каждый специалист, даже из числа умеющих произносить впечатляющие монологи о своей работе, оказывается в состоянии формализовать и структурировать рассуждения. Однако существуют люди, склонные к рефлексии, способные к конструктивному изложению мыслей. Такие люди — находка для инженера по знаниям.
Лекции
Лекторский дар встречается нечасто. Опытный лектор хорошо структурирует свои знания и ход рассуждений. Но бывает, некоторые люди обладают лекторским
даром, но не подозревают о его присутствии. В любом случае инженеру по знаниям стоит попробовать озадачить эксперта подготовкой лекции на интересующую тему. Если эксперт сумеет преодолеть специфический психологический барьер и войти в образ педагога, это может оказаться весьма эффективным для решения задачи извлечения знаний.
Хороший вопрос инженера по знаниям по ходу лекции имеет важное значение. Серьезные, глубокие и интересные вопросы, с одной стороны, стимулируют творческое воображение лектора, и с другой — повышают авторитет инженера по знаниям.
Продолжительность лекций рекомендуется стандартная — от 40 до 50 минут, и через 5-10 минут — еще столько же. Весь курс должен занимать, как правило, от двух до пяти лекций.
Метод извлечения знаний в форме лекций, как и все пассивные методы, применяют в начале многоэтапной процедуры извлечения знаний из памяти эксперта. Он способствует быстрому погружению инженера по знаниям в предметную область.
Активные индивидуальные методы
Анкетирование
Анкетирование является наиболее стандартизированным методом. Составление анкеты — достаточно тонкий и ответственный момент. Вот несколько рекомендаций:
· анкета не должна быть монотонной и однообразной, чтобы не вызывать скуку и усталость. Для этого вопросы должны варьироваться, тематика меняться. Кроме того, нередко в анкету вставляют специальные вопросы-шутки и игровые вопросы;
· анкета должна быть приспособлена к языку экспертов;
· следует учитывать, что вопросы влияют друг на друга. Поэтому последовательность вопросов должна быть хорошо продумана;
· анкета должна иметь «хорошие манеры». Ее нужно излагать ясным, понятным и предельно вежливым языком. Методическим мастерством составления анкеты можно овладеть только на практике.
Процедура анкетирования может проводиться двумя способами. В первом аналитик вслух задает вопросы и сам заполняет анкету по ответам эксперта. Во втором эксперт заполняет анкету самостоятельно после предварительного инструктирования.
Выбор способа зависит от ряда условий (в частности от оформления анкеты, ее понятности, готовности эксперта). Вместе с тем, второй способ представляется предпочтительным, так как у эксперта появляется неограниченное время на обдумывание вопросов и снижается так называемый эффект присутствия.
Интервью
Перед проведением интервью неплохо спросить себя: «А умеем ли мы задавать вопросы?» В философии эта проблема обсуждается с древности. Рассмотрим классификацию вопросов (рис. П.22).
Открытый вопрос обозначает тему или предмет, предоставляя эксперту свободу по форме и содержанию ответа.
При закрытом вопросе эксперту предлагается набор ответов, среди которых он должен сделать выбор.
Закрытые вопросы легче обрабатываются, но они в определенной мере «программируют» ответ эксперта и «закрывают» ход его рассуждений. Поэтому при составлении сценария интервью обычно чередуют открытые и закрытые вопросы и особенно тщательно продумывают «меню» и содержание закрытых вопросов.
Личный вопрос апеллирует к индивидуальному опыту эксперта. Личные вопросы обычно активизируют мышление эксперта, «играют» на его самолюбии, украшают интервью.
Безличный вопрос нацелен на выявление наиболее распространенных и общепринятых закономерностей предметной области.
При подготовке вопросов учитывают, что языковые возможности эксперта, как правило, ограничены. Кроме того, имеют в виду, что из-за замкнутости, скованности и робости отдельные эксперты не могут сразу высказать свое мнение и предоставить требуемые! знания. Поэтому часто используют не прямые вопросы, которые непосредственно указывают на предмет или тему, а косвенные, опосредованно направляющие внимание на актуальную проблему. Иногда в интересах дела приходится задавать несколько косвенных вопросов вместо одного прямого.
Вербальные вопросы — это традиционные устные вопросы.
Вопросы с использованием наглядного материала разнообразят интервью и снижают утомляемость эксперта. В качестве наглядного материала используют фотографии, рисунки и карточки.
Разделение вопросов по функции на основные, зондирующие и контрольные связано с тем, что нередко эксперт по каким-то причинам уходит в сторону от вопроса и основные вопросы интервью оказываются непродуктивными. Тогда аналитик применяет зондирующие вопросы, концентрирующие внимание эксперта в нужном направлении. Контрольные вопросы используют для проверки достоверности и объективности полученной информации.
Нейтральные вопросы носят беспристрастный характер. В то же время, наводящие вопросы заставляют эксперта прислушаться или даже принять во внимание позицию интервьюера.
Кроме приведенных в классификации на рис. П.22, полезно различать и включать в интервью следующие виды вопросов:
· контактные («ломающие лед» между аналитиком и экспертом);
· буферные (для разграничения различных тем интервью);
· оживляющие память экспертов (для реконструкции отдельных случаев из практики);
· «провоцирующие» (для получения спонтанных, неподготовленных ответов).
Свободный диалог
При свободном диалоге инженера по знаниям с экспертом отсутствует какой-либо регламентированный план. Однако эта форма извлечения знаний требует самой серьезной предварительной подготовки. На рис. П.23 показана одна из рекомендуемых схем такой подготовки.
Квалифицированная подготовка к диалогу — подлинная драматургия. В ее сценарии предусматривают плавное развитие процедуры извлечения знаний от приятного впечатления в начале беседы к профессиональному контакту через пробуждение интереса и завоевание доверия эксперта.
Для обеспечения желания эксперта продолжать беседу обычно производят «поглаживания» типа: «Я Вас понимаю...», «...Это очень интересно» и т. п. При этом поведение аналитика должно быть искренним, ведь давно известно, что лучшая уловка — избегать всяких уловок и относиться к собеседнику с истинным уважением и настоящим интересом.
Существует каталог свойств идеального интервьюера: «Он должен выглядеть здоровым, спокойным, уверенным, внушать доверие, быть искренним, веселым, проявлять интерес к беседе, быть опрятно одетым, ухоженным».
Активные групповые методы
Активные групповые методы сами по себе не могут служить источником более или менее полного знания. Они выступают как дополнительные и служат хорошей «приправой» к индивидуальным методам извлечения знаний, активизирующей мышление и поведение экспертов.
«Круглый стол»
Метод круглого стола предполагает равноправное обсуждение интересующей проблемы несколькими экспертами. Задача дискуссии — коллективно, с разных точек зрения, под разными углами исследовать спорные проблемы предметной области. Для остроты на «круглый стол» приглашают представителей различных научных направлений и поколений. Число участников дискуссии обычно колеблется от трех до пяти-семи.
Перед началом дискуссии ведущему (инженеру по знаниям) необходимо убедиться, что все участники правильно понимают задачу. Затем нужно установить регламент и четко сформулировать тему.
По ходу дискуссии важно проследить, чтобы слишком эмоциональные и разговорчивые эксперты не подменяли тему и чтобы критика позиций друг друга была обоснованной. Определенные усилия ведущий должен приложить для уменьшения «эффекта фасада», когда у участников превалирует желание произвести впечатление на других и они говорят совсем не то, что сказали бы в нормальной обстановке.
«Мозговой штурм»
«Мозговой штурм» или «мозговая атака» — один из наиболее популярных методов раскрепощения и активизации человеческого мышления. Впервые этот метод был использован в 1939 году А. Осборном в США для генерации новых идей. Основное положение штурма — отделение процедуры генерации идей в замкнутой группе специалистов от процесса их анализа и оценки.
Обычная продолжительность штурма — порядка 40 минут. Количество участников — до 10 человек. Этим участникам предлагается высказать на заданную тему любые мысли, в том числе шутливые, фантастические и ошибочные. Критика запрещена. Регламент — до 2 минут на выступление.
Из опыта известно, что число высказанных идей часто превышает 50. Наиболее существенный момент штурма — наступление пика (ажиотажа), когда идеи начинают буквально «фонтанировать». Последующий анализ, который проводит группа сторонних экспертов, как правило, показывает, что всего лишь 10-15 % идей разумны, но среди них встречаются весьма оригинальные.
Искусство инженера по знаниям, проводящего «мозговой штурм», заключается в способности задавать вопросы аудитории, «подогревая» аудиторию. Вопросы служат своеобразным «крючком», которым извлекаются идеи.
Экспертные игры
Плодотворность моделирования реальных ситуаций в играх сегодня подтверждена практически во всех областях науки и техники. Ниже рассмотрены различные виды экспертных игр в соответствии с классификацией.
Игры с экспертом
В играх с экспертом инженер по знаниям берет на себя какую-либо роль в моделируемой ситуации. Например, это может быть роль Ученика, который на глазах у эксперта (Учителя), поправляющего Ученика, выполняет работу на заданную тему. Такая игра — хороший способ разговорить застенчивого эксперта. Другой пример — игра в Специалиста (инженер по знаниям) и Консультанта (эксперт). Эта игра дает иногда впечатляющие результаты.
Для выявления скрытых пластов знания применяется игра, в которой специалист делает прогнозы в профессиональных ситуациях и дает им обоснования. Затем по истечении определенного времени специалисту предъявляют его собственные обоснования и просят произвести по ним прогнозы. Как оказывается, такой простой прием нередко позволяет обнаружить пропущенные шаги в рассуждениях эксперта.
В игре «фокусировка на контексте» эксперт выполняет роль экспертной системы, а инженер по знаниям — роль пользователя. Моделируется ситуация консультации. Первые реакции эксперта концентрируются вокруг наиболее значимых понятий и самых важных аспектов проблемы.
В целом по играм с экспертом даются следующие основные советы инженеру по знаниям:
· Играйте смелее, придумывайте игры сами.
· Не навязывайте игру эксперту, если он не расположен.
· Не «давите» на эксперта, не забывайте цели игры.
· Не забывайте о времени и о том, что игра утомительна для эксперта.
· Играйте весело, нешаблонно.
Ролевые игры в группе
В каждой групповой игре заранее составляется сценарий, распределяются роли, готовятся портреты-описания ролей и разрабатывается система оценивания игроков.
Известны различные способы проведения ролевых игр. В одних играх участники придумывают себе новые имена и выступают под ними. В других все игроки переходят на «ты». В третьих роли выбирают игроки, в четвертых для распределения ролей вытягивается жребий.
Обычно в игре, предназначенной для получения знания, принимают участие от трех до шести экспертов. В случае большего числа экспертов они разбиваются на группы, между которыми организуется состязание: чей диагноз окажется ближе к истинному, чей план рациональнее использует ресурсы, кто быстрее определить неисправность в техническом блоке и т. п.
Создание игровой обстановки требует фантазии и выдумки от инженера по знаниям. Главное, чтобы эксперты в игре максимально погрузились в ситуацию, действительно «заиграли», раскрепостились и «раскрыли свои карты».
Игры с тренажерами
Тренажеры широко применяются для обучения профессиям, требующим динамического реагирования на изменяющуюся производственную ситуацию. Сюда относятся профессии летчиков, судоводителей, операторов атомных станций и др. Применение тренажеров для извлечения знаний позволяет фиксировать фрагменты так называемых летучих знаний. Эти знания сиюминутны и, как правило, трудно воспроизводимы и выпадают из памяти в обычной обстановке при выходе из моделируемой ситуации.
1.3.4. Извлечение знаний: психологический аспект
Психологические проблемы извлечения знаний
Как известно, в процессе человеческого общения воспринимается далеко не вся возможная информация. В связи с этим актуальна проблема увеличения информативности общения аналитика и специалистов предприятия за счет использования психологических знаний.
Модель общения при извлечении знаний включает такие структурные компоненты: участники общения (партнеры); средства общения (процедура); предмет общения (знания). В соответствии с этой структурой выделим три «слоя» психологических проблем, возникающих при извлечении знаний.
Контактный слой
Разработка корпоративных систем - это коллективный процесс, для которого небезразлична атмосфера в группе разработчиков. Проводились эксперименты, результаты которых неоспоримо показывают, что дружеская атмосфера в коллективе больше влияет на результат, чем индивидуальные способности членов группы. Особенно важно, чтобы в коллективе разработчиков складывались кооперативные, а не конкурентные отношения.
Прогнозировать совместимость в общении со 100 %-ной гарантией невозможно. Однако можно выделить те факторы, черты личности, характера и другие особенности участников разработки, которые, несомненно, оказывают влияние на эффективность процедуры.
Пол и возраст. Значения этих параметров хотя и влияют на эффективность контакта, но не являются критическими. В литературе отмечается ,что хорошие результаты дают гетерогенные (смешанные) пары мужчина/женщина. Что касается соотношения возрастов, лучше, когда оно подчиняется следующей зависимости:
20 > (Вэ - Ва) > 5
где Вэ - возраст эксперта-специалиста; Ва - возраст аналитика.
Характеристики личности и темперамента
. Под личностью обычно понимается устойчивая система психологических черт, характеризующая индивидуальность человека. Рекомендуемые составляющие для аналитика: доброжелательность, аналитичность, хорошая память, внимание, наблюдательность, воображение, впечатлительность, большая собранность, настойчивость, общительность, находчивость.
Со времен Галена и Гиппократа, выделивших четыре классических типа темперамента, используются понятия холерик, сангвиник, меланхолик, флегматик. Для эффективной работы аналитика предпочтительны сангвинический и холерический темперамент.
Мотивация
. На эффективность коллективного решения задач влияет и мотивация участников - их стремление к успеху. Аналитик в зависимости от условий разработки должен изыскивать разнообразные стимулы для экспертов-специалистов. Эксперт передает аналитику один из самых дорогих в мире продуктов - знания. И если одни люди делятся опытом добровольно и с удовольствием, то другие весьма неохотно приоткрывают свои профессиональные тайны. Иногда оказывается полезно возбудить в эксперте дух соперничества, конкуренции (не нарушая, естественно, обстановки кооперативности в коллективе).
Процедурный слой
Параметры процедурного слоя описывают процесс проведения процедуры извлечения знаний.
Ситуация общения
(место, время, продолжительность). Беседу с экспертом лучше всего проводить в небольшом помещении наедине, поскольку посторонние люди нарушают доверительность беседы и могут породить эффект «фасада». Рабочее место эксперта - не лучший вариант, так как его могут отвлекать телефонные звонки, сотрудники и пр. Американский психолог И. Атватер считает, что для делового общения наиболее благоприятна дистанция между собеседниками от 1,2 до 3 м. Минимальным «комфортным» расстоянием можно считать 0,7-0,8 м. Реконструкция знаний- трудоемкий процесс, и поэтому длительность одного сеанса обычно не превышает 1,5-2 часов. Лучше выбрать эти два часа в первой половине дня, если эксперт относится к типу «жаворонок», и во второй, если он «сова». Известно, что взаимная утомляемость партнеров при беседе наступает обычно через 20-25 минут, поэтому в сеансе нужно делать паузы.
Оборудование
(вспомогательные средства, освещенность, мебель). Одно из основных средств увеличения эффективности процесса извлечения знаний - использование наглядного материала. При этом учитывается, что большую часть информации человек получает при помощи зрения. Совет активнее пользоваться схемами и рисунками можно считать универсальным. Для протоколирования результатов сейчас используются следующие способы:
запись на бумагу непосредственно по ходу беседы;
запись на диктофон, помогающая аналитику проанализировать весь ход сеанса и свои ошибки;
запоминание с последующей записью после.
Наиболее распространен первый способ. Наибольшая опасность при этом - потеря знаний, поскольку любая запись ответов - это уже интерпретация, привносящая субъективное понимание предмета. Значения параметров освещенности очевидны и связаны с влиянием внешних факторов на эксперта.
Профессиональные приемы
(темп, стиль, методы и др.). Учет индивидуального темпа и стиля эксперта позволяет аналитику снизить напряженность процедуры извлечения знаний. Типичная ошибка - навязывание собственных темпа и стиля.
На успешность также влияет длина фраз, которые произносит аналитик. Это было установлено американскими учеными - лингвистом Ингве и психологом Миллером - при исследовании причин низкой усвояемости команд на военно-морском флоте США. Причиной оказалась длина команд. Выяснилось, что человек лучше всего воспринимает предложения глубиной (или длиной) 7±2 слова. Эта величина получила название «число Ингве -- Миллера». Можно считать его мерой «разговорности» речи.
Большая часть информации поступает к аналитику в форме предложений на естественном языке. Однако внешняя речь эксперта есть воспроизведение его внутренней речи (мышления), которая гораздо богаче и многообразнее. Для передачи этой внутренней речи эксперт использует и невербальные средства, такие, как интонация, мимика, жесты. Опытный аналитик старается по возможности записывать в протоколы (в форме ремарок) и эту дополнительную интонацию.
Kогнитивный слой
Для эффективного моделирования когнитивных (от англ. cognition - познание), или познавательных, процессов необходимо учитывать их природу. На сегодняшний день эти вопросы наименее исследованы и требуют изучения так называемых когнитивных стилей. Под когнитивным стилем человека понимается совокупность критериев предпочтения при решении задач и познании мира, специфическая для каждого индивида. Когнитивный стиль определяет не столько эффективность деятельности, сколько способ достижения результата. Это способ познания, который позволяет людям с разными способностями добиваться одинаковых результатов в деятельности; система средств и индивидуальных приемов, к которым прибегает человек для организации своей деятельности.
Можно выделить несколько важных характеристик когнитивных стилей.
Полезависимость - поленезависимость
. Поленезависимость позволяет человеку акцентировать внимание лишь на тех аспектах проблемы, которые необходимы для решения конкретной задачи, и отбрасывать все лишнее, т.е. не зависеть от фона или окружающего задачу шумового поля. Эта характеристика коррелирует с такими чертами личности, как невербальный интеллект, аналитичность мышления, способность к пониманию сути. Очевидно, что не только самому аналитику необходимо высокое значение этого параметра; поленезависимый эксперт - это тоже желательный фактор. Однако приходится учитывать, что полезависимые люди лучше общаются, они более контактны. Для общения особенно удачны гетерогенные (смешанные) пары: «полезависимый - поленезависимый».
Поленезависимость - одна из характерных профессиональных черт когнитивного стиля наиболее квалифицированных аналитиков. По некоторым данным, мужчины более поленезависимы, чем женщины.
Импульсивность - рефлективность
(рефлексивность). Под импульсивностью понимается быстрое принятие решения (часто без достаточного обоснования), а под рефлексивностью - склонность к рассудительности. Рефлексивность, по экспериментальным данным, коррелирует со способностью к формированию понятий и продуктивностью стратегий решения логических задач. Таким образом, и аналитику, и эксперту желательно быть рефлексивными, хотя собственный стиль изменяется лишь частично и с большим напряжением.
Ригидность - гибкость
. Этот фактор характеризует способность человека изменять установки и свою точку зрения в соответствии с изменяющейся ситуацией. Ригидные люди не склонны менять свои представления и структуру восприятия; гибкие, напротив, легко приспосабливаются к новой обстановке. Очевидно, что если эксперт еще может позволить себе ригидность (что характерно для долго работающих над одной проблемой специалистов, особенно старшего возраста), то аналитику эта характеристика когнитивного стиля явно противопоказана. Увеличение ригидности с возрастом отмечается многими психологами.
Когнитивная эквивалентность
. Характеризует способность человека к различению понятий и разбиению их на классы и подклассы. Чем уже диапазон когнитивной эквивалентности, тем более тонкую классификацию способен провести индивид, тем большее количество признаков понятий он может выделить. Обычно у женщин диапазон когнитивной эквивалентности уже, чем у мужчин.
Психологические проблемы, рассмотренные в этой статье, далеко не исчерпывают всего комплекса теоретических и практических аспектов проблемы извлечения знаний. О других проблемах мы поговорим в следующих статьях этого цикла.
Приведенное выше разделение на этапы реализованы в среде KADS. В основе этого подхода лежит идея о том, что экспертная система является не контейнером, наполненным представленными экспертом знаниями, а "операционной моделью", которая демонстрирует некоторое нужное нам поведение в столкновении с явлениями реального мира. Приобретение знаний, таким образом, включает в себя не только извлечение специфических знаний о предметной области, но и интерпретацию извлеченных данных применительно к некоторой концептуальной оболочке и формализацию их таким способом, чтобы программа могла действительно использовать их в процессе работы.
В основу оболочки KADS положено пять базовых принципов.
(1) Использование множества моделей, позволяющее преодолеть сложность процессов инженерии знаний.
(2) Четырехуровневая структура для моделирования требуемой экспертности — набора качеств, лежащих в основе высокого уровня работы специалистов.
(3) Повторное использование родовых компонентов модели в качестве шаблонов, поддерживающих нисходящую стратегию приобретения знаний.
(4) Процесс дифференциации простых моделей в сложные.
(5) Важность преобразования моделей экспертности с сохранением структуры в процессе разработки и внедрения.
Первый из принципов, положенных в основу KADS, состоит в том, что оболочка должна содержать множество частных моделей, помогающих найти ответ на эти вопросы. Примерами таких моделей могут служить:
· организационная модель "социально-экономической среды", в которой должна функционировать система, например финансовые услуги, здравоохранение и т.п.;
· прикладная модель решаемой проблемы и выполняемой функции, например диагностика, планирование расписания работ и т.д.;
· модель задач, демонстрирующая, как должна выполняться специфицированная функция, для чего производится ее разбиение на отдельные задачи, например сбор данных о доходах, формирование гипотез о заболеваниях.
Описанные принципы построения оболочки системы приобретения знаний получили дальнейшее развитие в системе CommonKADS. Эта система поддержки инженерии знаний содержит редакторы каждого из перечисленных типов моделей и множество инструментальных средств и компонентов, облегчающих проектирование экспертной системы. Существенную помощь менеджеру проекта при планировании работ должна оказать модель жизненного цикла экспертной системы. В дополнение к тем моделям, которые входили в состав ранних версий оболочки KADS, в новую версию включено несколько новых, в частности модель агента, которая представляет саму экспертную систему, ее пользователей и подключенные вычислительные системы.
В рамках проекта KASTUS онтология и методология оболочки KADS была использована и при построении больших повторно используемых баз знаний. Наименование проекта KASTUS — сокращение от Knowledge about Complex Technical Systems for Multiple Use (знания многоразового применения о сложных технических системах). Цель проекта — создание системы знаний, которую можно было бы использовать в множестве разнообразных приложений.
Как правило, человек-эксперт знает о той предметной области, в которой он является специалистом, гораздо больше, чем может выразить на словах. Вряд ли можно добиться от него многого, задавая вопросы в общем виде, например: "Что вам известно об инфекционных заболеваниях крови?" Гораздо продуктивнее подход, реализованный в программе TEIRESIAS, который предполагает вовлечение эксперта в решение несложных репрезентативных задач из определенной предметной области и извлечение необходимых знаний в процессе такого решения.
Задавшись определенным набором базовых правил, представляющих прототип экспертной системы, TEIRESIAS решает в соответствии с этими правилами какую-нибудь из сформулированных репрезентативных проблем и предлагает эксперту критиковать результаты. В ответ эксперт должен сформулировать новые правила и откорректировать введенные ранее, а программа отслеживает внесенные изменения, анализирует их на предмет сохранения целостности и непротиворечивости всего набора правил, используя при этом модели правил. В процессе анализа используется обобщение правил различного вида.
Проект COMPASS можно считать одним из наиболее ярких примеров использования традиционной методики приобретения знаний, базирующейся на соответствующим образом организованном опросе экспертов. Такая методология "выросла" из предложенной Ньюэллом и Саймоном методики анализа протокола (protocol analysis). В этом разделе мы остановимся на проекте OPAL, в котором использована другая методика, отличающаяся от традиционной в двух важных аспектах.
· Эта методика ориентирована на частичную автоматизацию процесса извлечения знаний в ходе активного диалога интервьюируемого эксперта с программой.
· Методика приобретения знаний предполагает использование стратегии, направляемой знаниями о предметной области.
Мы уже рассматривали программу TEIRESIAS, в которой использовалось множество средств поиска ошибок в существующем наборе правил, редактирования и тестирования откорректированного набора правил. Но для построения начального набора правил или отслеживания изменений в них программа TEIRESIAS не использовала какие-либо знания о предметной области. Программа OPAL, напротив, пытается "вытянуть" из пользователя как можно больше деталей, касающихся представления знаний и их использования. OPAL не является программой общего назначения. Она разработана специально для диагностики онкологических заболеваний и предназначена для формирования правил принятия решений на основе полученных от эксперта знаний о планах лечения в том или ином случае.
Программа OPAL упрощает процесс извлечения знаний, предназначенных для использования в экспертной системе ONCOCIN. Последняя формирует план лечения больных онкозаболеваниями и заинтересована в использовании модели предметной области для получения знаний непосредственно от эксперта с помощью средств графического интерфейса. Понятие модель предметной области можно трактовать в терминах знаний различного вида, которыми обладает эксперт.
Независимо от того, о какой конкретной предметной области идет речь, игре в шахматы или медицинской диагностике, всегда существуют некоторые предварительные условия или предварительный опыт, которыми должен обладать субъект или техническая система, чтобы воспринимать знания об этой предметной области. Если речь идет об игре в шахматы, то по крайней мере нужно знать правила этой игры: как ходят фигуры, в чем цель игры и т.п. Применительно к медицинской диагностике нужно иметь представление о пациентах, заболеваниях, клинических тестах и т.п. Этот вид фоновых, или фундаментальных, знаний иногда в литературе по экспертным системам называют глубокими знаниями, противопоставляя их поверхностным знаниям, которые представляют собой хаотичный набор сведений о связях "стимул — реакция".
При разработке прототипа системы ONCOCIN одной из наиболее сложных оказалась именно проблема приобретения знаний. Ввод информации, необходимой для создания протоколов лечения рака лимфатических узлов, занял около двух лет и отнял у экспертов около 800 часов рабочего времени. Формирование последующих наборов протоколов в процессе развития системы занимало, как правило, несколько месяцев. При этом было отмечено, что эффективность процесса приобретения знаний системой в решающей степени зависит от того, насколько успешно инженер по знаниям справляется с ролью переводчика в процессе передачи знаний от экспертов программе. Желание избавиться от этой зависимости и вдохновило разработчиков на создание программы OPAL, которая помогла бы автоматизировать процесс приобретения знаний.
Используя эту программу, эксперт может сформировать новый протокол в течение нескольких дней. За первый год эксплуатации программы OPAL в систему ONCOCIN было добавлено свыше трех дюжин новых протоколов. Эффективность использованного в этой программе метода заполнения формуляров при вводе новых знаний во многом объясняется тем, что в программу включены базовые знания о той предметной области, в которой она используется. Конечно, включение этих знаний потребовало значительных усилий от инженеров по знаниям, которые ранее занимались общением с экспертами, но эти затраты затем с лихвой окупились. Успешное применение программы OPAL показало преимущество представления знаний о предметной области на нескольких уровнях абстракции по сравнению с подходом, предполагающим переключение основного внимания на детали реализации.
Технология извлечения знаний о предметной области у эксперта посредством опроса через терминал в последнее время стала использоваться во множестве экспертных систем. В большинстве из них эксперту предлагается заполнить экранные формуляры, информация из которых затем считывается в структурированные объекты, аналогичные фреймам. Примерами таких систем могут служить ETS.
Но далеко не во всех системах такого рода имеется столь развитый графический интерфейс, как в программе OPAL, и существует возможность компилировать полученные знания непосредственно в правила принятия решений. Реализация этих возможностей в OPAL существенно облегчается особенностями структурирования планов лечения больных, на что обращали внимание и авторы этой разработки.
Опыт, приобретенный в ходе разработки программы OPAL, был затем использован при создании PROTEGE — системы более общего назначения.
Последняя версия этой системы, PROTEGE-II, представляет собой комплект инструментальных средств, облегчающих создание онтологии предметной области и формирование программ приобретения знаний, подобных OPAL, для различных приложений. Вместо того чтобы разрабатывать инструментальные средства общего назначения с нуля, авторы этой разработки пошли по пути повышения уровня абстракции ранее разработанного и успешно используемого приложения, как это было сделано при разработке системы EMYCIN на основе MYCIN.
Практическим полем применения баз знаний являются экспертные системы (ЭС). Экспертная система – это система искусственного интеллекта, включающая знания об определенной слабо структурированной и трудно формализуемой узкой предметной области и способная предлагать и объяснять пользователю разумные решения. Экспертная система состоит из базы знаний, механизма логического вывода и подсистемы объяснений. Её основным компонентом является база знаний. База знаний – это семантическая модель, описывающая предметную область и позволяющая отвечать на такие вопросы из этой предметной области, ответы на которые в явном виде не присутствуют в базе. База знаний является основным компонентом интеллектуальных и экспертных систем.
Для построения базы знаний необходим интеллектуальный редактор базы знаний. Интеллектуальный редактор базы знаний – это программа, предоставляющая инженеру по знаниям возможность создавать базу знаний в интерактивном режиме. Интеллектуальный редактор включает в себя систему шаблонов языка представления знаний, подсказки и другие сервисные средства, облегчающих работу с базой.
Основной режим работы экспертной системы – консультационный режим. Консультационный режим – это интерактивный режим эксплуатации базы знаний, при котором пользователь продвигается к решению задачи.
Вторым существенным компонентом ЭС является машина логического вывода или дедуктивная машина (или блок логического вывода, или решатель). Машина логического вывода – это программа, моделирующая механизм рассуждений и оперирующая знаниями и данными с целью получения новых данных из знаний и других данных, имеющихся в рабочей памяти. Обычно машина логического вывода использует программно реализованный механизм дедуктивного логического вывода или механизм поиска решения в сети фреймов или семантической сети.
Для контакта с пользователем ЭС должна обладать подсистемой общения и подсистемой объяснений. Подсистема общения – это программа:
- входящая в состав экспертной системы;
- служащая для ведения диалога с пользователем, в ходе которого ЭС запрашивает у пользователя необходимые факты для процесса рассуждения;
- предоставляющая возможность пользователю в определенной степени контролировать и корректировать ход рассуждений экспертной системы.
Подсистема объяснений – это программа, позволяющая пользователю получить ответы на вопросы:
- "Как было получено то или иное решение?"; обычно ответ на этот вопрос представляет собой трассировку всего процесса вывода решения с указанием использованных фрагментов базы знаний; и
-"Почему было принято такое решение?"; обычно ответ на этот вопрос есть ссылка на умозаключение, непосредственно предшествовавшее полученному решению.
Хорошо если ЭС обладает подсистемой приобретения знаний. Подсистема приобретения знаний – это программа, предназначенная для корректировки и пополнения базы знаний.
Подсистема приобретения знаний - в простейшем случае - интеллектуальный редактор базы знаний. Подсистема приобретения знаний - в более сложных случаях - средства для извлечения знаний:
- из баз данных;
- из неструктурированного текста;
- из графической информации и т.д.
ЭС создаётся и существует для пользователя. Пользователь – это проблемный специалист, для которого предназначена экспертная система. Считается, что квалификация пользователя недостаточно высока, и поэтому он нуждается в помощи и поддержке своей деятельности со стороны экспертной системы.
ЭС является системой, основанной на знаниях. Система, основанная на знаниях – это система искусственного интеллекта, в которой предметные знания представлены в явном виде и отделены от прочих знаний системы.
Визуальные методы спецификации и проектирования баз знаний и разработка концептуальных структур являются достаточно эффективным гносеологическим инструментом или инструментом познания. Использование методов инженерии знаний в качестве дидактических инструментов и в качестве формализмов представления знаний способствует более быстрому и более полному пониманию структуры знаний данной предметной области, что особенно ценно для новичков на стадии изучения особенностей профессиональной деятельности.
Методы визуальной инженерии знаний можно широко использовать в различных учебных заведениях — от школ до университетов — как для углубления процесса понимания, так и для контроля знаний. Большинство учеников и студентов овладевают навыками визуального структурирования в течение нескольких
От понятийных карт к семантическим сетям
Было предложено определение поля знаний, которое позволяет инженеру по знаниям трактовать форму представления поля достаточно широко, в частности семантические сети или понятийные карты (concept maps) являются возможной формой представления. Это означает, что сам процесс построения семантических сетей помогает осознавать познавательные структуры.
Программы визуализации являются инструментом, позволяющим сделать видимыми семантические сети памяти человека. Сети состоят из узлов и упорядоченных соотношений или связей, соединяющих эти узлы. Узлы выражают понятия или предположения, а связи описывают взаимоотношения между этими узлами. Поэтому разработка семантических сетей подразумевает анализ структурных взаимодействий между отдельными понятиями предметной области.
В процессе создания семантических сетей эксперт и аналитик вынуждены анализировать структуры своих собственных знаний, что помогает им включать новые знания в структуры уже имеющихся знаний. Результатом этого является более осмысленное использование приобретенных знаний.
Визуальные спецификации в форме сетей могут использоваться новичками и экспертами в качестве инструментов для оценки изменений, произошедших в их мышлении. Если согласиться, что семантическая сеть является достаточно полным представлением памяти человека, то процесс обучения с этой точки зрения можно рассматривать как реорганизацию семантической памяти.
Kozma, один из разработчиков программы организации семантической сети Learning Tool, считает, что эти средства являются инструментами познания, усиливающими и расширяющими познания человека. Разработка семантических сетей требует от учеников:
· реорганизации знаний;
· исчерпывающего описания понятий и связей между ними;
· глубокой обработки знаний, что способствует лучшему запоминанию и извлечению из памяти знаний, а также повышает способности применять знания в новых ситуациях;
· связывания новых понятий с существующими понятиями и представлениями, что улучшает понимание;
· пространственного изучения посредством пространственного представления понятий в изучаемой области.
Полезность семантических сетей и карт понятий, пожалуй, лучше всего демонстрируется их связями с другими формами мышления высшего порядка. Они тесно связаны с формальным обоснованием в химии и способностью аргументировать свои высказывания в биологии. Также было показано, что семантические сети имеют связь с выполнением исследований.
База знаний как познавательный инструмент
Когда семантическая сеть создается как прообраз базы знаний, разработчик должен фактически моделировать знания эксперта. Особенно глубокого понимания ' требует разработка функциональной структуры.
Определение структуры ЕСЛИ-ТО области знаний вынуждает четко формулировать принципы принятия решения. Нельзя считать, что просто разработка поля знаний системы обязательно приведет к получению полных функциональных знаний в данной области.
Разработка экспертных систем стала использоваться как инструмент познания сравнительно недавно. Lippert, который является одним из пионеров применения экспертных систем в качестве инструментов познания, утверждает, что задания по созданию небольших базисов правил являются очень / полезными для решения педагогических проблем и структурирования знаний для учеников от шестого класса до взрослых. Изучение при этом становится более осмысленным, так как ученики оценивают не только сам процесс мышления, но также и результаты этого процесса, то есть полученную базу знаний. Создание базы знаний требует от учеников умения отделять друг от друга факты, переменные и правила, относящиеся к связям между составляющими области знаний.
Например, Lai установил, что после того, как студенты-медики создадут медицинскую экспертную систему, они повышают свое умение в плане аргументации и получают более глубокие знания по изучаемому предмету. Шесть студентов-первокурсников физического факультета, которые использовали экспертные системы для составления вопросов, принятия решений, формулировки правил и.объяснений относительно движения частицы в соответствии с законами классической физики, получили более глубокие знания в данной области благодаря тщательной работе, связанной с кодированием информации и обработкой большого материала для получения ясного и связного содержания, а следовательно, и большей семантической глубины.
Таким образом, создание базы знаний экспертной системы способствует более глубокому усвоению знаний, а визуальная спецификация усиливает прозрачность и наглядность представлений.
Когда компьютеры используются в обучении как инструмент познания, а не как контрольно-обучающие системы (обучающие компьютеры), они расширяют возможности автоматизированных обучающих систем (АОС), одновременно развивая мыслительные способности и знания учеников. Результатом такого сотрудничества учащегося и компьютера является значительное повышение эффективности обучения. Компьютеры не могут и не должны управлять процессом обучения. Скорее, компьютеры должны использоваться для того, чтобы помочь ученикам приобрести знания.
Исследуя проблему представления за небольшое количество часов будущим учителям информатики темы «Инженерия знаний», необходимо иметь в виду цель такого изучения. Этот раздел можно считать очень важным именно для будущих учителей информатики по следующим причинам. С одной стороны учитель должен знать, как могут быть структурированы и представлены в формальном виде знания, которые мы традиционно привыкли видеть представленными в виде текстов на естественном языке, или в виде знаний, умений и навыков конкретных людей. С другой стороны особенно важно будет для будущего учителя познакомиться с методами извлечения знаний из эксперта альтернативные педагогическим методам «извлечения знаний из учащегося». Всё это позволит будущему учителю с одной стороны углубить своё понимание в области формирования и приобретения знаний обучаемым, а с другой – даст ему возможность расширить свой педагогический арсенал приёмами выявления и структуризации знаний, применяемыми в инженерии знаний.
Поэтому необходимо разработать курс по выбору по теме «Инженерия знаний» такой, что его изучение позволит обучающимся по специальности «учитель информатики» получить адекватное представление о современном состоянии данного раздела информатики. При этом необходимо избежать излишних технических подробностей.
Изучая построение курса, выделим темы, подлежащие изучению.
Во-первых, необходимо рассмотреть основы инженерии знаний. В данном разделе надо раскрыть следующие понятия: данные и знания, базы знаний, основные сферы применения баз знаний – экспертные системы, структура и классификация экспертных систем, этапы разработки экспертных систем, коллектив разработчиков экспертных систем.
Далее необходимо рассмотреть теоретические аспекты извлечения знаний. В данном разделе надо раскрыть следующие понятия: стратегии получения знаний, психологический аспект, лингвистический аспект, гносеологический аспект.
Следующая тема – когнитивная психология в инженерии знаний. В данном разделе надо раскрыть следующие понятия: основы когнитивной психологии, семантическая репрезентация знаний, образная репрезентация, восприятие информации, организация памяти.
Основные темы курса начинаются с темы «методы извлечения знаний». В данном разделе надо раскрыть следующие понятия: классификация методов, пассивные методы, активные индивидуальные методы, активные групповые методы, экспертные игры, текстологические методы.
Далее идёт тема «методология структурирования знаний». В данном разделе надо раскрыть следующие понятия: поле знаний, стадии структурирования, методы структурирования, психосемантика и методы многомерного шкалирования.
Следующая тема – машинно-ориентированные приобретение и формирование знаний. В данном разделе надо раскрыть следующие понятия: автоматическое формирование знаний, системы автоматического формирования знаний.
Цель и задачи курса
Цель – дать студентам систематическое представление о возможностях современных методов извлечения и представления знаний для ориентирования в современных информационных технологиях, и проведения аналогий с приобретением знаний у учащихся. Задача – дать студентам умения работы со знаниями, их извлечения и структуризации.
Требования к уровню освоения содержания курса
В результате изучения дисциплины студенты должны:
· Иметь представление о современных методах извлечения знаний
· Иметь практические умения работы со знаниями
· Иметь умения извлекать знания из экспертов и текстов
· Уметь организовать процесс извлечения знаний различными способами
·
Учебный план
|
Тема
|
Содержание
|
Часов
|
Лекций
|
Практических
|
1
|
основы инженерии знаний
|
данные и знания, базы знаний, основные сферы применения баз знаний – экспертные системы, структура и классификация экспертных систем, этапы разработки экспертных систем, коллектив разработчиков экспертных систем
|
2
|
2
|
2
|
модели представления знаний
|
семантические сети, фреймы, логические представления, продукции
|
2
|
2
|
3
|
теоретические аспекты извлечения знаний
|
стратегии получения знаний, психологический аспект, лингвистический аспект, гносеологический аспект
|
2
|
2
|
4
|
когнитивная психология в инженерии знаний
|
основы когнитивной психологии, семантическая репрезентация знаний, образная репрезентация, восприятие информации, организация памяти
|
2
|
2
|
5
|
методы извлечения знаний
|
классификация методов, пассивные методы, активные индивидуальные методы, активные групповые методы, экспертные игры, текстологические методы
|
2
|
2
|
6
|
методология структурирования знаний
|
поле знаний, стадии структурирования, методы структурирования, психосемантика и методы многомерного шкалирования
|
2
|
2
|
7
|
машинно-ориентированные приобретение и формирование знаний
|
автоматическое формирование знаний, системы автоматического формирования знаний
|
2
|
2
|
|
|
|
14
|
14
|
|
|
Всего часов
|
28
|
Всего курсом предусматривается 14 часов лекций, 14 часов практических занятий, и 54 часа самостоятельной работы.
В качестве учебных пособий можно рекомендовать следующие книги.
Гаврилова Т. А., Червинская К. Р. Извлечение и структурирование знаний для экспертных систем — М.: Радио и связь, 1992. — 200с. Книга посвящена одному из важнейших и недостаточно исследованных аспектов теории и практики искусственного интеллекта — извлечению и структурированию знаний при разработке экспертных систем. При создании так систем наибольшую трудность вызывает домашинный этап, на котором разработчики выявляют знания специалистов в конкретной предметной области и структурируют их для последующей формализации и ввода в ЭВМ. Как и все исследования по искусственному интеллекту, данная тема носит междисциплинарный характер, и поэтому в книге освещены различные аспекты этой проблемы, (включая вопросы когнитивной психологии, психологии общения, лингвистики, гносеологии и др. Рассмотрены основные этапы разработки экспертных систем с акцентом на практические приемы и методы инженерии знаний, в том числе извлечение знаний из текстов, экспертные игры, техника интервьюирования и анкетирования и т. д. Введена классификация методов извлечения знаний и предложена методология структурного анализа знаний, которая проиллюстрирована на примере трех экспертных систем — АВТАНТЕСТ, АВ-ТАНКЛИП и МИКРОЛЮШЕР. Дан обзор современного состояния других способов создания баз знаний экспертных систем, включающий анализ систем индуктивного формирования знаний и автоматизированных систем приобретения знаний в прямом диалоге «эксперт-ЭВМ».
Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем: Учебник для вузов. СПб: Питер,2001 год, 384 стр. Учебник для технических вузов по входящим в различные дисциплины вопросам разработки интеллектуальных систем. Актуальность предмета определяется стремительно развивающейся сферой применения инженерии знаний и системного анализа в различных областях деятельности. Особенностью изложения является его практическая направленность: освоения имеющегося материала должно быть достаточно для начала самостоятельной работы над созданием интеллектуальной системы, основанной на знаниях. В учебнике учтена все возрастающая роль Интернета и потому подробно рассматривается применение инженерии знаний в Сети.
Из рассмотренных выше специализированных средств работы со знаниями для проведения практических работ была выбрана система Prot?g?.
Prot?g? – локальная, свободно распространяемая Java-программа, разработанная группой медицинской информатики Стенфордского университета (первая версия – 1987, последняя Prot?g?-3.0 – июнь 2004). Программа предназначена для построения (создания, редактирования и просмотра) онтологий прикладной области. Её первоначальная цель – помочь разработчикам программного обеспечения в создании и поддержке явных моделей предметной области и включение этих моделей непосредственно в программный код. Prot?g? включает редактор онтологий, позволяющий проектировать онтологии разворачивая иерархическую структуру абстрактных или конкретных классов и слотов. Структура онтологии сделана аналогично иерархической структуре каталога. На основе сформированной онтологии, Prot?g? может генерировать формы получения знаний для введения экземпляров классов и подклассов. Инструмент имеет графический интерфейс, удобный для использования неопытными пользователями, снабжен справками и примерами.
Prot?g? основан на фреймовой модели представления знания OKBC и снабжен рядом плагинов, что позволяет его адаптировать для редактирования моделей хранимых в разных форматах (стандартный текстовый, в базе данных JDBC, UML, языков XML, XOL, SHOE, RDF и RDFS, DAML+OIL, OWL).
Prot?g? имеет 3-х уровневую архитектуру, где существует четкое разделение между хранением онтологий, модулями бизнес-логики логики приложений и приложениями интерфейса пользователя. Эти инструменты обладают большими возможностями по наращиванию (например, при помощи плагинов). Большинство инструментов хранит свои онтологии в текстовых файлах, что ограничивает размер онтологий. Только Prot?g? (и WebODE) могут хранить свои онтологии в базах данных и таким образом управлять большими онтологиями. Наконец, большинство инструментов реализовано на Java.
Prot?g? обеспечивает графические средства редактирования и просмотра онтологий, где классы обычно представлены узлами на графах, а отношения - дугами между ними. Дополнительно к этим графическим функциям, Prot?g? предоставляет некоторую поддержку в написании формальных аксиом и сложных выражений.
Описание Prot?g? – 2000
Prot?g?-2000 – это интегрированное инструментальное программное средство, которое используется разработчиками систем и экспертами по предметным областям для разработки систем, основанных на знаниях. Приложения, разработанные при помощи Prot?g?-2000, используются при решении задач и принятии решений в конкретной предметной области.
В то время как в более раннем средстве Prot?g?/Win, как в классической системе баз данных, отдельно определялись классы информации (схема) и хранились экземпляры этих классов, Prot?g?-2000 облегчает работу и с классами, и с экземплярами. Так, отдельный экземпляр может быть использован на уровне описания класса, а класс можно хранить, как экземпляр. Подобным образом, слоты, которые ранее использовались только внутри классов, сейчас поднялись до уровня, на котором находятся классы. Используя эту новую модель знаний, также обеспечивается соответствие протоколу ОКВС (Open Knowledge Base Connectivity) для доступа к базам данных, хранящимся в системах представления знаний. В конечном счете, приложения из этих компонентов также исполняются внутри интегрированной среды Prot?g?-2000.
Средство Prot?g?-2000 получает доступ ко всем этим частям при помощи унифицированного графического интерфейса пользователя, верхний уровень которого включает перекрывающиеся вкладки для компактного представления частей и удобного их совместного редактирования. Такой дизайн верхнего уровня со вкладками позволяет интеграцию (1) моделирования онтологии классов, описывающей определенную дисциплину, (2) создания средства приобретения знаний для сбора информации, (3) ввода отдельных экземпляров данных и создание базы знаний и (4) выполнения приложений. Онтология определяет набор понятий и их отношения. Средство приобретения знаний разрабатывается специально для предметной области, позволяя экспертам по предметной области легко и свободно вводить свои знания в предметной области. Конечная база знаний затем может быть использована вместе с методом поиска решения задач для ответа на вопросы и решения задач в предметной области. В конечном счете, приложение является конечным продуктом, созданным, когда база знаний используется для решения задачи конечного пользователя с использованием подходящих методов поиска решения задач, методов «эксперт-система» или методов поддержки принятия решений.
Основное предположение в Prot?g?-2000 – это то, что системы баз знаний обычно очень дорого строить и поддерживать. Например, предполагается, что разработкой системы, основанной на знаниях, занимается команда, включая как разработчиков, так и экспертов по предметной области, которые могут быть в меньшей степени знакомы с компьютерным ПО. Prot?g?-2000 предназначено для того, чтобы вести разработчиков и экспертов по предметной области в процессе разработки системы. Prot?g?-2000 предназначено для того, чтобы позволить разработчикам повторно использовать онтологии предметных областей и методы поиска решения задач, таким образом уменьшая время, необходимое для разработки и поддержки программы. Несколько приложений могут использовать одну и ту же онтологию предметной области для решения различных задач; один и тот же метод поиска решения задач может быть использован с различными онтологиями. Более подробно о построении систем, основанных на знаниях, и о подходе, используемом в Prot?g?-2000, можно узнать в разделе Планирование Проекта Prot?g?-2000.
В настоящее время Prot?g?-2000 используется в клинической медицине и биометрических науках, хотя ее можно использовать в любой области, в которой понятия можно представить в виде иерархии классов.
По всем темам курса:
· основы инженерии знаний
· модели представления знаний
· теоретические аспекты извлечения знаний
· когнитивная психология в инженерии знаний
· методы извлечения знаний
· методология структурирования знаний
· машинно-ориентированные приобретение и формирование знаний
были разработаны лабораторные работы.
Например, работа по теме «методы извлечения знаний» приведена ниже.
Заполнить семантическую сеть
. Решите, про что будет сеть. Например, "Меня беспокоят мои отношения с моими друзьями или коллегами. Значит, цель моей сети - "Мои отношения с коллегами ". Если я выбраю себе автомобиль, цель решетки - "Какие бывают автомобили". Чтобы перейти к вводу элементов - кнопка "Стоп!"
Напишите 8-15 людей или предметов, отвечающих названию сети. Лучше, если вам поможет составить список элементов ваш консультант. Если работаете самостоятельно, постарайтесь, чтобы введенные элементы примерно равномерно описывали проблему. Для примера, здесь лежит список ролей, предложенный самим Дж.Келли. Можете, воспользовавшись им, подставить свои значения. Далее переходим к выявлению конструктов.
Сравните три предъявленных элемента, расположите их так, чтобы два элемента отличались от одного, по наиболее важному, на ваш взгляд, качеству. Если это качество вам нравится, запишите его в графу "конструкт". Если не нравится - в графу "контраст". Затем, стараясь не использовать частицу не-, сформулируйте качество по значению противоположное записанному, запишите его в свободное окно и нажмите кнопку "Добавить".
Этап называется "Ранжирование". Предполагается, что все, по очереди предъявляемые элементы, вы отнесете к более соответствующему полюсу конструкта.
После этого вы увидите новую тройку элементов. Проделайте с ней все то же самое, но следите, чтобы записываемые вами конструкты-контрасты не повторялись. Предполагается, что таким образом вы выявите примерно столько же конструктов, сколько у вас было записано элементов.
Посмотрим, что получилось. Если вы все сделали правильно, вы получите два кластерных дерева. Одно образовано связями между элементами, другое - между конструктами. Чем выше уровень связи между элементами или конструктами, тем меньше вы видите различий между ними.
Вот теперь самое время подумать, почему конструкции получились именно такими, какая связь между кластерами - образовавшимися группами конструктов. Если хотите оценить степень влияния какого-то элемента или конструкта, выделите его и нажмите на кнопку "спрятать". Вы увидите, как будет выглядеть ваша система конструктов без этого конкретного. Посмотрите, как изменилось и другое дерево.
По всем темам курса:
· основы инженерии знаний
· модели представления знаний
· теоретические аспекты извлечения знаний
· когнитивная психология в инженерии знаний
· методы извлечения знаний
· методология структурирования знаний
· машинно-ориентированные приобретение и формирование знаний
были разработаны контрольные вопросы.
Например, вопросы по теме «методы извлечения знаний» приведены ниже.
1. Что называется извлечением знаний и в чем состоит его главный аспект?
2. Назовите основные уровни общения. Чем определяются потери информации при общении?
3. Нарисуйте структуру психологического аспекта извлечения знаний.
4. Что такое контактный, процедурный, когнитивный слои извлечения знаний?
5. Назовите основные закономерности проведения процедуры извлечения знаний.
6. В чем состоит лингвистический аспект извлечения знаний?
7. Нарисуйте и объясните схему получения общего кода.
8. В чем заключается неоднозначность проблемы интерпретации?
9. Что такое понятийная структура?
10. Что такое гносеологический аспект извлечения знаний?
11. В чем заключается модальность знаний?
12. Что такое системно-структурный подход к познанию?
13. Нарисуйте структуру познания.
14. В чем состоит установление связей и закономерностей?
15. Для чего необходимо построение идеализированной модели?
16. Назовите пассивные методы извлечения знаний.
17. Назовите активные групповые методы извлечения знаний.
18. Назовите активные индивидуальные методы извлечения знаний.
19. Подготовьте анкету извлечения знаний по лечению простуды народными методами.
20. Назовите текстологические методы извлечения знаний.
21. Что могут потребовать сеансы наблюдений от инженера по знаниям?
22. В чем заключается протоколирование мыслей вслух?
23. Назовите достоинства и недостатки каждого из пассивных методов извлечения знаний.
24. В чем заключается метод анкетирования?
25. В чем заключается метод интервьюирования?
26. Какова схема подготовки к свободному диалогу?
27. Назовите достоинства и недостатки каждого из активных индивидуальных методов извлечения знаний.
28. В чем заключается метод круглого стола?
29. Что такое мозговой штурм?
30. Дайте классификацию экспертных игр.
31. Что такое игры с экспертом?
32. Что такое ролевые игры?
33. Назовите достоинства и недостатки каждого из видов экспертных игр.
34. Нарисуйте схему извлечения знаний из текста.
35. Как образуется семантическая структура текста?
36. Что такое набор ключевых слов?
37. Что называется структурированием знаний?
38. Что представляет собой концептуальная и функциональная струкгура предметной области?
39. Опишите концептуальную структуру для экспертной системы "Как делать подарки".
40. Создайте функциональную структуру, отражающую модель рассуждении эксперта по выбору подарка.
В результате выполнения данной работы была исследована возможность построения курса обучения основам инженерии знаний для будущих учителей информатики. Для этого были реализованы следующие задачи:
· Было проведено ознакомление с таким разделом искусственного интеллекта как инженерия знаний.
· Были определены разделы, темы, понятия и методы области «инженерия знаний», представляющие значимость для освоения учащимися и формирования их взгляда на эту область.
· Были собраны материалы по теме «инженерия знаний», имеющие ценность для построения учебного курса и обучения.
· Было определено и найдено программное обеспечение, позволяющее на практике закрепить необходимые знания по инженерии знаний.
· Было разработано тематическое планирование и рабочая программа курса, позволяющие при проведении занятий по ним достичь заявленную цель и доказать заявленную гипотезу.
· Были разработаны лабораторные работы, упражнения и контрольные вопросы по темам курса.
В результате чего было подтверждение положения о возможности построения курса «Инженерия знаний» в поддержку базового курса «Основы искусственного интеллекта» так, что будущие учителя информатики смогут познакомиться с методами и технологиями этой области исследований в искусственном интеллекте.
1. Гаврилова Т. А., Хорошевский В. Ф. Базы знаний интеллектуальных систем: Учебник для вузов. СПб: Питер,2001 год, 384 стр.
2. Осипов Г.С. Приобретение знаний интеллектуальными системами. М.: Наука, 1997.
3. Частиков А.П., Гаврилова Т.А., Белов Д.Л. Разработка экспертных систем. Среда CLIPS. BHV-Санкт-Петербург, 2003
4. Дюк В. А., Самойленко А. П. Data Mining (+CD). Учебный курс 1-е издание, 2001 год, 368 стр.
5. Осуга С., Обработка знаний; М., 1989.
6. Уэно Х., Каямо Т.,. Окомото Т. Представление и использование знаний / Под ред. Х. Уэно, М. Исидзухо.- М.: Мир, 1989.- 205 с.
7. Осуга С., Саэки Ю. Приобретение знаний. Пер. с япон. 1990. 304 с.
8. Э.Дзуки Введение в методологию социально-психологического исследования, Милан-Новосибирск, 1997
9. В.А.Дюк "Компьютерная психодиагностика", С.-Петербург, 1994
10. Франселла, Банниствер "Новый метод исследования личности",М., 1987
11. Дж.Келли "Психология личности, теория личных конструктов",С-Петербург, 2000
12. Петренко В.Ф. "Психосемантика сознания", М.,1988
13. Н.Л.Иванова "Репертуарные личностные методики", Ярославль, 1995,
14. Дж.Келли "Психология личности, теория личных конструктов", С-Петербург, 2000,
15. В.В.Семенова Качественные методы в социологии, 1998
16. Р.Л.Солсо Когнитивная психология, 1996
17. Шкуратова И.П, "Руководоство по применнению репертуарного текста Дж.Келли",
18. Алексеевская М.А., Недоступ А.В Диагностические игры в медицинских задачах. Вопросы кибернетики. Задачи медицинской диагностики и прогнозирования с точки зрения врача. 1988. N112.
19. Величковский Б.М. Когнитивная психология. М.: Наука, 1987.
20. Гаврилова Т.А., Червинская К.Р. Извлечение и структурирование знаний для экспертных систем. М.: Радио и связь, 1992.
21. Гинкул Г.П. Игровой подход к приобретению знаний и его реализация в системе КАПРИЗ. Проблемы применения экспертных систем в народном хозяйстве. Тез. докл. респ. школы-семинара. Кишинев. 1989.
22. Мицич П.П. Как проводить деловые беседы. - М.: Экономика, 1987.
23. Нейлор К. Как построить свою экспертную систему. М.: Атомиздат, 1991.
24. Ноэль Э. Массовые опросы: Пер. с нем. М.: Прогресс, 1978.
25. Погосян Г.А. Метод интервью и достоверность социологической информации. Ереван: АНАрм.ССР, 1985.
26. Построение экспертных систем / Под. ред. Ф.Хейсс-Рота, Д.Уотермена, Д.Лената., М.: Мир, 1987.
27. Соколов А.Н. Внутренняя речь и мышление. М.: Просвещение, 1968.
28. Таунсенд К., Фохт Д. Проектирование и реализация экспертных систем на ПЭВМ. М., Финансы и статистика, 1991.
29. Шепотов Е.Г., Шмаков Б.В., Крикун П.Д. Методы активизации мышления. Челябинск: ЧПИ, 1985
30. Шумилина Т.В. Интервью в журналистке. М.: МГУ, 1973.
31. Вассерман Л. И., Дюк В. А., Иовлев Б. В., Червинская К. Р. Психологическая диагностика и новые информационные технологии. — СПб.: СЛП, 1997.
32. Гаврилова Т. А., Червинская К. Р. Извлечение и структурирование знаний для экспертных систем. — М.: Радио и связь, 1992.
33. Коов М. И., Мацкин М. Б., Тыугу Э. X. Интеграция концептуальных и экспертных знаний в САПР//Изв. АН СССР. Техн. кибернетика. — 1988. — №5.- С. 108-118.
34. Минский М. Фреймы для представления знаний. — М.: Мир, 1979. Попов Э. В. Экспертные системы. Решение неформализованных задач в диалоге с ЭВМ. — М.: Наука.
35. Поляков А. О. Технология интеллектуальных систем: Учеб. пособие. — СПб.: СПбГТУ, 1995.
36. Ю.Попов Э. В. Особенности разработки и использования экспертных систем// Искусственный интеллект. Кн. 1. Системы общения и экспертные системы. — М.: Радио и связь, 1990.
37. П.Поспелов Д. А. Данные и знания. Представление знаний//Искусственный интеллект. Кн. 2. Модели и методы: Справочник/Под ред. Д. А. Поспелова. — М.: Радио и связь, 1990. - С. 7-13.
38. Представление и использование знаний/Под ред. К. Уэно, М. Исидзука. — М.: Мир, 1989.
39. Таунсенд К., Фохт Д. Проектирование и программная реализация экспертных систем на персональных ЭВМ. — М.: Финансы и статистика, 1990.
40. Франселла Ф., Баннистер Д. Новый метод исследования личности. — М.: Прогресс, 1987.
|