Московский авиационный институт
(государственный технический университет)
Факультет прикладной физики и математики
Кафедра вычислительной математики и программирования
Реферат на тему
«Представление знаний»
Преподаватель: Д.В. Сошников
Студент: Ю.М. Сергукова
Группа: 08-406
Москва, 2010
Содержание
1 Введение ................................................................................................................................. 1
2 Представление знаний. Теоретическая часть..................................................................... 2
1 Данные, информация и знания............................................................................................ 2
2 Классификация знаний.......................................................................................................... 4
3 Особенности представления знаний внутри ИС................................................................. 4
4 Модели представления знаний............................................................................................ 6
4.1 Продукционная модель....................................................................................................... 7
4.2 Логическая модель.............................................................................................................. 7
4.3 Сетевая модель.................................................................................................................... 8
4.4 Формальные грамматики.................................................................................................... 8
4.5 Фреймовые модели............................................................................................................. 9
4.6 Комбинаторные модели..................................................................................................... 9
4.7 Ленемы................................................................................................................................ 10
4.8 Алгебраические модели.................................................................................................... 10
4.9 Нейронные сети, генетические алгоритмы..................................................................... 11
3 Заключение ........................................................................................................................... 12
В повседневной жизни, порой не замечая этого, человек постоянно обрабатывает информацию: получает ее, запоминает, вспоминает, делает выводы, анализирует, вносит поправки в свои суждения, строит на основе полученных знаний и предположений свое поведение. Поэтому логично предположить, что, задавшись целью создать искусственный интеллект равный по мощности (или даже превосходящий) человеческому, захочется наделить этот новый разум аналогичными способностями (как минимум) к восприятию окружающей среды, речи, анализу ситуации, построению выводов, предположений, обладанию «характером», памятью. Некоторые из этих пунктов весьма и весьма спорны, однако, все во многом зависит от того, какими именно чертами мы хотим наделить искусственный интеллект. Так, например, имитация характера и настроения совсем не обязательна и может даже мешать достижению поставленных целей и объективной оценке, в то время как для прохождения теста Тьюринга она может быть необходима.
Но среди перечисленных «способностей» есть несколько, которые качественно отличали бы искусственный разум от простого суперкомпьютера. Они касаются получения и обработки информации, умения пользоваться полученными знаниями и применять их.
Таким образом мы подходим к одной из основных проблем — как «научить» машину хранить и обрабатывать знания, не пользуясь помощью человека в их подготовке, а получая их на основе собственной деятельности. Эта проблема решается 6 различными направлениями в теории искусственного интеллекта:
1) Представление знаний.
2) Манипулирование знаниями.
3) Общение.
4) Восприятие.
5) Обучение.
6) Поведение.
Рассмотрим первую из них, а именно — представление знаний.
Прежде, чем рассуждать о представлении знаний в доступном и «понятном» машине виде, требуется определиться с терминологией. Это в достаточной степени проблематично, так как такие термины, как «информация», «данные» и «знания» не имеют четкого определения, а то множество определений, что были созданы человечеством, иногда не просто частично пересекаются, а даже противоречат одно другому. Перечислим некоторые из них, которые более точно описывают нашу предметную область.
Данные |
— факты и идеи, представленные в некотором, четко формализованном виде, в котором их можно использовать для передачи в информационном процессе;
— сведения, представленные в определенной знаковой системе и на определенном материальном носителе для обеспечения возможностей хранения, передачи, приема и обработки.
|
Информация |
— данные, определенным образом организованные, имеющие для своего получателя смысл, значение и ценность, необходимые ему для принятия решений, а также реализации других функций;
— это данные, сопровождающиеся смысловой нагрузкой, помещенные в некоторый контекст; данные, как-либо оцениваемые получателем информации. При этом то, что для одних является данными, для других может оказаться информацией.
|
Знания |
— проверенная информация и/или та информация, которой доверяют, результаты принятия решений, поведения, обобщенные в виде теорем и законов, совокупности взглядов;
— зафиксированная и проверенная практикой информация, которая может многократно использоваться людьми для решения тех или иных задач.
|
Таким образом, мы получаем следующие закономерности:
При этом на данной диаграмме при движении слева направо уменьшается формализованность представления. И стоящая перед нами задача — представление знаний, самой неформальной сущности.
Можно найти и другие критерии для классификации знаний, но уже этого достаточно, чтобы показать разнородность человеческих знаний. Так, эмпирическое знание может быть одновременно и процедурным и личностным.
Логично предположить, что для описания той или иной категории лучше подходят определенные средства, в то время как другие значительно понижают эффективность хранения и/или использования. Остановимся на общих моментах, абстрагировавшись от вида категории знаний.
Представление знаний в памяти ЭВМ или на внешних носителях должно иметь особенности, отличающие знания от данных, например, такие как:
∙ внутренняя интерпретируемость;
∙ структурированность;
∙ связность;
∙ семантическая метрика;
∙ активность;
∙ конвертируемость.
Сперва следует отдельно указать, что обрабатываемой единицей для знаний является факт, а не запись данных. Факт — это некоторая запись, наделенная семантикой.
Теперь рассмотрим каждый вышеобозначенный пункт в отдельности.
Внутренняя интерпретируемость.
Каждая информационная единица должна иметь уникальное имя, по которому ИС находит ее, а также отвечает на запросы, в которых это имя упомянуто. Роль «имени» может выполнять набор аттрибутов. Смысл такого расширения данных — идентифицировать данные и их назначение должна уметь не только посторонняя программа, которая обладает информацией о том, как правильно расшифровать эти данные, но и сама система.
Структурированность.
Информационные единицы должны обладать гибкой структурой. Для них может выполняться рекурсия — вложимость одних информационных единиц в другие. Иначе говоря, должна существовать возможность произвольного установления между отдельными информационными единицами отношений типа «часть—целое», «род—вид» или «элемент—класс».
Связность.
Между информационными единицами должна быть предусмотрена возможность установления связей различного типа. Семантика отношений может носить декларативный или процедурный характер. Например, две и более информационные единицы могут быть связаны отношением «одновременно», две информационные единицы — отношением «причина—следствие» или «быть рядом».
Семантическая метрика.
На множестве информационных единиц в некоторых случаях полезно задавать отношение, характеризующее их ситуационную близость, т.е. силу ассоциативной связи. Отношение релевантности при работе с информационными единицами позволяет находить знания, близкие к уже найденным, но не имеющие с ними прямой связи. Этот пункт считается критичным для моделирования человеческих воспоминаний, построения ассоциаций, моделирования процесса генерации идей.
Активность.
Данные обычно пассивны и используются командами в случае необходимости. Для ИС выполнение программ должно наоборот инициироваться текущим состоянием системы.
Конвертируемость.
Содержание знаний не должно зависить от его записи. Поэтому форма представления, уровень детализации и степень неопределенности информации о предметной области может трансформироваться в процессе перехода к очередному этапу решения интеллектуальной задачи. Это свойство, в отличие от предыдущих, отражает динамичность знаний и связано с обучением системы.
Среди множества разработанных моделей представления знаний можно выделить два основных подхода: эмпирический и теоретический.
Эмпирический подход основывается на исследовании сознания человека, изучении принципов организации памяти и моделировании механизмов решения задач.
Другой подход — теоретический, можно также назвать теоретически обоснованным. Он «гарантирует» правильность решений. В рамках этого подхода до настоящего времени удавалось решать только сравнительно простые задачи из узкой предметной области.
Кроме моделей, разработанных в рамках каждого из этих подходов, отдельно выделяют (относя к обоим подходом сразу) бионическое направление, представленное генетическими алгоритмами и нейронными сетями.
В каждом подходе мы увидим свое отношение и к тому, что является знанием, и к тому, как его представлять. Если в теоретических моделях знания строго формализованы, то эмпирические призваны дать некоторую свободу. Однако, ценой за эту свободу будет потенциальная невыводимость некоторых решений и невозможность найти ответ на поставленный вопрос, когда теоретические модели это гарантируют.
Рассмотрим каждую из моделей.
Это одна из самых распространенных моделей представления знаний. В ее основе лежит набор правил вида «если условие, то действие», описывающих знания. Оперируя этими правилами можно построить прямой или обратный вывод. Прямой вывод — это поиск действия по заданному условию, обратный — поиск возможных условий, которые могли бы привести к указанному действию.
Продукционная модель понятна и с ее помощью можно легко записать поведение или даже построение выводов, однако при достаточном количестве правил возникает противоречивость некоторых из них, которая приводит модель в негодность. Также к ее недостаткам можно отнести неясность взаимных отношений правил и сложность оценки базы знаний.
Вся информация в логической модели рассматривается как совокупность фактов и связывающих их утверждений, которые представляются как формулы в некоторой логике. Знания при этом представляются набором подобных утверждений, а построение выводов и получение новых знаний сводится к реализации процедуры логического вывода. Этот процесс может быть строго формализован, так как в его основе лежит классический аппарат математической логики.
Сложности могут возникнуть при описании неоднородных миров (объекты относятся к разным категориям и их связывают различные отношения). Для преодоления этой и других сложностей в конкретных предметных областях используют расширенные модели, использующие нечеткую логику, оперирующие эмпирическими кванторами.
Такие расширенные модели объединяют возможности логического и лингвистического подходов, в результате чего называются логико-лингвистическими моделями данной предметной области.
Сетевая модель (или семантическая сеть) в инженерии знаний представляется направленным графом, узлы которого соответствуют понятиям и объектам, а дуги — отношениям между ними. В сетевой модели основными отношениями являются is-a и part-of, с помощью которых можно описать большой объем знаний.
Семантическая сеть позволяет снизить объем хранимых данных, обеспечивает реализацию ассоциативных связей. Проблема гибкости модели и существования бесконечного множества возможных связей решается добавлением новых типов отношений. В проектах, посвященных моделированию человеческой памяти, также было предложено при использовании расширяемой подобным образом семантической сети также строить модель, хранящую все типы соединений и отношения подобия и взаимозаменяемости между ними.
Форальная грамматика (теория) состоит из алфавита (словаря), множества синтаксических правил, которые позволяют определить истинность или ложность выражений, построенных в данном языке, базовой системы подобных выражений, которые всегда истинны и называются аксиомами, множества правил вывода, позволяющих преобразовывать одно выражение в другое.
В основе этой модели лежит исчисление высказываний, которое можно считать классическим примером аксиоматических систем. Эта система хорошо исследована и имеет разработанную модель логического вывода. Эти свойства переносятся и на модель, ее использующую.
Главным недостатком является отсутствие гибкости системы. В случае модификации или расширения модели может потребоваться перестроить всю систему, что для практических систем неприемлемо. Как следствие, формальные грамматики используются в тех предметных областях, которые хорошо локализуются и мало зависят от внешних факторов.
Фреймовая модель основана на концепции Марвина Мински — профессора Массачусетского технологического института, основателя лаборатории искусственного интеллекта, автора ряда фундаментальных работ. Фреймовая модель представляет собой систематизированную психологическую модель памяти человека и его сознания. В отличие от других моделей в ней фиксируется жесткая структура информационных единиц, которая называется протофреймом (конкретным фреймом).
Сам фрейм представляет собой структуру данных для представления некоторого объекта. Информация, относящаяся к фрейму, содержится в составляющих его слотах. Значением слота может быть практически что угодно: числа или математические соотношения, тексты на естественном языке или программы, правила вывода (в случае терминального слота), либо ссылки на другие фреймы. Это позволяет реализовать систему отношений между фреймами и даже рекурсию.
Каждый фрейм состоит из произвольного числа слотов, причем несколько из них обычно определяются самой системой для выполнения специфических функций, а остальные определяются пользователем.
Иерархия фреймов может описывать либо объект (тогда фреймы — составные части объекта, а слоты описывают его свойства), либо ситуацию или процесс (тогда фреймы — факты или этапы, а в слотах содержатся еще и вызываемые процедуры).
Комбинаторные модели основаны на рассмотрении дискретных объектов, конечных множеств и заданном на них отношении порядка. В рамках комбинаторики также рассматриваются все возможные изменения, перестановки и сочетания, в рамках заданных множеств.
Комбинаторные модели используются в задачах топологии (например, поиск пути), задачах прогнозирования поведения автоматов, при изучении деревьев решений, частично упорядоченных множеств.
Основная проблема указана еще в определении этой модели: она оперирует только дискретными объектами и конечными множествами, связанными однородными отношениями.
Ленемы представляют собой смешанный тип модели, являющийся как бы «развитием» других моделей (фреймы, семантические сети и т.д.).
Ленема предназначена для структурного комплексного описания понятий предметной области. По изобразительным возможностям ленемы более совершенны, чем такие традиционные модели представления знаний, как семантическая сеть, фрейм, система продукций. Однако, для некоторых понятий модель представления знаний на основе ленем может быть неудобной и даже неприемлемой. Например, это такие понятия, в описании которых очень большую роль играет внутренняя динамика. Модель, созданная на базе ленем, позволяет объединить на пользовательском уровне три существующие в настоящее время парадигмы представления знаний:
1) логическую (продукционная и логическая модели);
2) структурную (семантические сети и фреймы); 3) процедурную.
Для некоторых ситуаций это очень удобно, так как при реализации сложных моделей, включающих знания различных типов, возникает необходимость совмещения в одном языке представления знаний различных концепций.
Алгебраическая модель подразумевает представление знаний в виде некоторых алгебраических примитивов, над которыми определено множество действий (некоторые из которых можно задать таблично). Для набора знаний представленного в таком виде действуют правила алгебраических множеств, такие как аксиоматизация, определение подсистем и отношений эквивалентности. Также возможно построение цепей множеств (множества, для которых определен порядок отношения «быть подсистемой»).
Изначально предполагалось использовать подобную модель в качестве формализованной системы построения аналогий (за счет определения эквивалентности). Однако, на эту формальную модель очень сложно отобразить весь набор знаний, поэтому от этой идеи отказались.
Эти модели нельзя строго отнести к эмпирическому или теоретическому подходам. Их относят, как было сказано ранее, к бионическому направлению. Оно основывается на предположении о том, что если в искусственной системе воспроизвести структуры и процессы человеческого мозга, то и результаты решения задач такой системой будут подобны результатам, получаемым человеком.
Так, в нейронных сетях моделируются персептроны и их поведение, призванные скопировать дейтельность мозга, а генетические алгоритмы несут в себе принципы естественного отбора и эволюции (за счет внесения изменений через мутации и смешение наследственностей).
Особенностью моделей этого типа является широкое использование эвристик, что в каждом случае требует доказательства правильности получаемых решений.
Мы рассмотрели основные подходы к построению моделей представления знаний. У каждой из них есть свои достоинства и свои недостатки, которые делают каждую из них наиболее эффективной в конкретной области и при определенных условиях.
Однако, после рассмотрения этих моделей становится очевидно, что создание интеллекта, подобного человеческому в плане самостоятельных обработки информации и использования знаний, пока невозможно. По крайней мере, не в чистых моделях. Логично предположитель, что требуется совместить некоторые из этих моделей для получения основных качеств, свойственных человеческому разуму.
Но даже в случае создания подобного интеллекта останется еще несколько качеств, которые практически невозможно запрограммировать (о чем неоднократно говорят, например, создатели и исследователи экспертных систем) — такие как неординарность мышления и способность к творчеству, умение строить предположения и догадки, создавать теории и идеи. И, как ни странно, именно эти качества в свое время подтолкнули человечество к идее создания искусственного интеллекта.
Список литературы
[1] http://ru.wikipedia.org/
[2] http://aiportal.ru/
[3] http://makhfi.com/
[4] http://uni-dubna.ru/~mazny/students/upr_zn/
[5] http://hr-portal.ru/
|