ИНФОРМАЦИОННЫЕ СИСТЕМЫ И ТЕХНОЛОГИИ

 

Деятельность отдельных людей, групп, коллективов и организаций зависит от их информированности и способности эффективно использовать имеющуюся  информацию. Прежде  чем  предпринять  какие-то  действия  необходимо провести большую работу по сбору и переработке информации,  ее осмыслению и анализу.  Отыскание рациональных решений в любой сфере требует обработки больших объемов  информации,  что невозможно  без привлечения специальных технических средств. Современные сферы деятельности все больше нуждаются в  соответствующем  информационном обслуживании.

Происходит информационный  взрыв и вместе с тем информационный кризис. Проявляются противоречия между ограниченными возможностями человека по восприятию и переработке  информации и существующими мощными потоками и массивами хранящейся информации.  Циркулирует большое количество  избыточной информации, которая затрудняет восприятие информации, полезной для потребителя. Существует проблема отбора качественной и достоверной информации. Общество создает экономические, политические, социальные барьеры, препятствующие распространению информации. В мире накоплен  громадный  информационный  потенциал,  но люди не могут им воспользоваться в полном объеме в силу ограниченности  своих  возможностей.

Необходимо подготовить человека к быстрому восприятию и обработке больших объемов информации, овладению им современными средствами,  методами и технологией работы.  Новые условия порождают зависимость информированности одного человека от  информации,  приобретенной  другими  людьми.  Поэтому  уже недостаточно уметь самостоятельно осваивать и накапливать  информацию,  а  надо научиться такой технологии работы с информацией, когда подготавливаются и принимаются решения на основе коллективного знания. Залог успеха  -  в  умении извлекать информацию из разных источников (из периодической печати, электронных  коммуникаций), представлять ее в понятном виде и уметь эффективно использовать.

Информатизация характеризуется возрастанием объема и роли информации и широким использованием технических средств для производства, переработки, хранения, распределения и использования информации.

Информационные ресурсы  -  это знания,  подготовленные людьми для социального использования в обществе и зафиксированные на  материальных носителях.  Как  и   при   использовании   традиционных ресурсов  и продуктов,  важно знать:  где находятся информационные ресурсы,  сколько они стоят, кто ими владеет, кто в них нуждается, насколько они доступны.  Совокупность средств,  методов и условий, позволяющих использовать информационные ресурсы, составляет информационный потенциал  общества.

В настоящее время в России быстрыми темпами идет формирование рынка информационных продуктов и услуг.  Развитие рыночных отношений в информационной деятельности обострило проблему защиты информации как объекта интеллектуальной собственности  и  имущественных прав. Приняты Законы: "Об информации, информатизации и защите информации"; "Об авторском праве и смежных правах"; "О правовой охране программ для ЭВМ и баз данных". В Уголовный кодекс включена глава о компьютерных преступлениях.

Информатика - это область человеческой деятельности,  связанная с процессами преобразования информации с помощью  компьютеров  и  их взаимодействием со средой применения. Одна из ее главных задач как фундаментальной науки - выяснение, что такое информационные системы,  какое место они занимают,  какую должны иметь структуру,  как функционируют, какие общие закономерности им свойственны.

Под системой  понимают "множество элементов,  находящихся в отношениях  и связях друг с другом,  которое образует определенную целостность,  единство"  [БСЭ.  М.,  1976,  т.23,  с.1376]).  Системный  подход применим к любому объекту,  рассматриваемому одновременно и как единое целое,  и  как  объединенная  в  интересах достижения поставленных целей совокупность разнородных элементов.

Информационная система (ИС)  -  взаимосвязанная  совокупность средств, методов  и персонала,  используемых для сбора,  хранения, обработки и выдачи информации в интересах достижения  поставленной цели.   Компьютеры,  оснащенные  специализированными  программными средствами, служат технической базой и инструментом для информационных  систем.  Т.е.  современная  информационная  система - человеко-компьютерная.

Структура информационной  системы - это взаимосвязанная совокупность ее частей, называемых обеспечивающими подсистемами.  Среди них обычно выделяют информационное, техническое, математическое, программное, организационное и правовое обеспечение.

Информационное обеспечение  -  совокупность  единой классификации и кодирования информации, унифицированных систем документации, схем информационных потоков.

Техническое обеспечение - комплекс технических средств, предназначенных для  работы  информационной  системы,  а  также  соответствующая документация  на  эти  средства и технологические процессы.

Математическое и программное обеспечение - совокупность математических методов,  моделей, алгоритмов и программ для реализации целей и задач информационной системы, а также нормального функционирования комплекса технических средств.

Организационное обеспечение - совокупность методов и средств, регламентирующих взаимодействие    работников    с    техническими средствами и  между собой в процессе разработки и эксплуатации информационной системы.

Правовое обеспечение - совокупность правовых норм, определяющих создание, юридический статус и функционирование информационных систем, регламентирующих   порядок   получения,  преобразования  и использования информации.

Различают три типа задач, для которых создаются информационные системы: структурированные (формализуемые),  неструктурированные (неформализуемые) и частично структурированные.

Структурированная (формализуемая) задача - в которой известны все ее элементы и взаимосвязи между ними.  В такой задаче  удается выразить ее содержание в форме математической модели, имеющей точный алгоритм решения.  Подобные задачи  обычно  приходится  решать многократно и они носят рутинный характер.  Использование информационной системы для решения структурированных  задач  обеспечивает полную автоматизацию их решения.

Неструктурированная (неформализуемая)  задача -  в которой невозможно выделить элементы и установить связи между ними.  Решение этих задач связано с большими трудностями из-за невозможности создания математического описания и разработки алгоритма. Возможности использования информационной системы  невелики.  Решение  в  таких случаях  принимается человеком на основе своего опыта (из эвристических соображений) и косвенной информации из разных источников.

На практике  сравнительно немного полностью структурированных или совершенно неструктурированных задач.  В большинстве задач известна  лишь часть их элементов и связей между ними.  Такие задачи называются частично структурированными. В этих условиях можно создать информационную систему.  Получаемая в ней информация анализируется человеком, который играет определяющую роль. Такие информационные системы являются автоматизированными, т.к. в их функционировании принимает участие человек.

ИС классифицируются по различным основаниям.

Информационные системы,  используемые  для  решения  частично структурированных задач, подразделяются на два вида:

- создающие  управленческие  отчеты и ориентированные главным образом на обработку данных (поиск,  сортировку,  агрегатирование, фильтрацию);

- разрабатывающие  возможные  альтернативы решения.

Информационные системы,  создающие   управленческие   отчеты, обеспечивают информационную   поддержку  пользователя,  предоставляют доступ к информации в базе данных и ее частичную  обработку. Информационные системы,  разрабатывающие альтернативные решения, могут быть модельными или экспертными.

Тип информационной системы зависит от того,  чьи интересы она обслуживает и на каком уровне управления. Информационные системы  специалистов  помогают в работе с данными, повышают продуктивность и производительность работы. Задача подобных ИС - интеграция новых сведений и помощь  в обработке документов. По функциональному назначению для различных категорий специалистов выделяют: ИС офисной автоматизации; ИС менеджеров среднего звена; управленческие ИС; ИС поддержки  принятия  решений.

ИС офисной автоматизации вследствие своей простоты и  многопрофильности активно  используются работниками любого организационного уровня.  Наиболее часто их применяют работники средней квалификации. Основная цель - обработка данных, повышение эффективности их работы и упрощение канцелярского труда.  ИС офисной автоматизации в основном охватывают управление документацией,  коммуникации и т.п.

ИС менеджеров среднего звена - для  мониторинга  (постоянного слежения), контроля, принятия решений и администрирования. Некоторые ИС обеспечивают принятие нетривиальных решений. В случае, когда  требования к информационному обеспечению определены не строго, они способны отвечать на вопрос:  "что будет,  если ...?" На  этом уровне выделяют два типа ИС:  управленческие (для менеджмента) и системы поддержки принятия решений.

Управленческие ИС  имеют небольшие аналитические возможности. Они полезны для ежедневной  (еженедельной  и  т.д.)  информации  о состоянии  дел и периодического составления сводных типовых отчетов.

Системы поддержки  принятия  решений   обслуживают   частично структурированные задачи,  результаты  которых трудно спрогнозировать заранее.  Они имеют  более  мощный  аналитический  аппарат  с несколькими моделями.  Эти системы полезны всем, кто принимает решения.

По характеру использования информации различают информационно-поисковые и информационно-решающие системы.

Информационно-поисковые системы вводят, систематизируют, хранят, выдают информацию по запросам пользователя без сложных преобразований данных.

Информационно-решающие системы  осуществляют все операции  переработки информации по определенному алгоритму.  Среди них проводят классификацию по степени воздействия выработанной информации на  процесс  принятия  решений  и  выделяют  два класса: управляющие и советующие.

Управляющие ИС вырабатывают информацию,  на основании которой человек принимает  решение.  Для  этих систем характерны задачи расчетного характера и обработка больших объемов данных.

Советующие ИС  вырабатывают  информацию,  которая принимается человеком к сведению и не превращается немедленно в серию конкретных действий.  Эти  системы обладают более высокой степенью интеллекта, для них характерна обработка знаний, а не данных.

Технология при переводе  с  греческого  (techne)  означает искусство, мастерство,  умение, т.е. процессы. Под процессом понимают определенную последовательность действий,  направленных на достижение поставленной цели. Процесс определяется выбранной стратегией и реализуется совокупностью различных средств и методов.

Информационная технология -  процесс,  использующий  совокупность средств  и методов сбора,  обработки и передачи данных (первичной информации) для  получения  информации  нового  качества (информационного продукта). Современный этап развития информационной технологии характеризуется внедрением персональных компьютеров и применением телекоммуникационных  средств  связи.

Принципы компьютерной  информационной технологии: интерактивный (диалоговый) режим работы с компьютером; интеграция  (стыковка,  взаимосвязь) программных средств; гибкость изменения задач и данных.

Технологический процесс  переработки информации представляется в виде  иерархической  структуры. Его   уровни (снизу вверх): элементарные манипуляции; действия; операции; этапы.  Освоение информационной технологии и ее использование сводятся к следующему.  Нужно сначала овладеть набором элементарных манипуляций,  число которых ограничено.  Из их различных комбинаций составляются действия,  а из действий,  также в разных комбинациях,  составляются операции, которые определяют технологический этап. Совокупность технологических этапов образует технологический процесс (технологию).

Информационные продукты, как никакие другие виды материальных товаров, имеют чрезвычайно высокую скорость сменяемости новыми видами или версиями.  Периоды сменяемости колеблются  от  нескольких месяцев до одного года. Неудачи с внедрением информационной технологии обычно связывают с несовершенством технических средств, тогда  как  основной  причиной  неудач является отсутствие или слабая проработанность методологии использования информационной  технологии.

Информационные технологии классифицируются по типам ИС.

Информационная технология  обработки данных предназначена для решения хорошо структурированных задач, по которым имеются необходимые входные  данные  и  известны  алгоритмы и другие стандартные процедуры их обработки.  Эта технология применяется на уровне исполнительской  деятельности персонала невысокой квалификации  целях автоматизации некоторых рутинных постоянно повторяющихся операций. Основные компоненты: сбор, обработка, хранение данных, создание отчетов (документов).

Обработка данных включает типовые операции: классификация или группировка; сортировка,  с  помощью  которой упорядочивается последовательность записей;  вычисления, включающие математические и логические операции; укрупнение (агрегатирование), служащее для уменьшения количества данных  и реализуемое в форме расчетов итоговых или средних значений.

Информационная  технология управления ориентирована на работу при худшей структурированности решаемых задач. Информация должна быть представлена  в  агрегированном  виде  так, чтобы просматривались тенденции изменения данных,  причины возникших отклонений и возможные решения. Решаются следующие задачи: оценка планируемого состояния объекта управления;  оценка отклонений от планируемого состояния; выявление причин отклонений;  анализ возможных решений и действий.

Информационная технология автоматизированного офиса - для организации и поддержки коммуникационных процессов как внутри фирмы, так  и  с  внешней средой на базе компьютерных сетей и других современных средств передачи и работы с информацией. Основные компоненты: текстовый и табличный процессоры, электронная почта и т.п.

Информационная технология поддержки принятия решений организует взаимодействие человека и компьютера.  Выработка решений происходит в результате циклического процесса, в котором участвуют: система  поддержки  принятия решений в роли вычислительного звена и объекта управления; человек  как  управляющее звено,  задающее входные данные и оценивающее полученный результат вычислений на компьютере. Ее отличительные характеристики: ориентация на решение плохо структурированных (слабо формализованных) задач; - сочетание традиционных методов доступа и  обработки  компьютерных данных  с  возможностями математического моделирования; направленность  на  непрофессионального пользователя; высокая адаптивность - приспосабливаемость к особенностям  используемого  технического  и  программного обеспечения, требованиям пользователя.

В состав системы поддержки принятия решений входят три  главных компонента:  база данных, база моделей и программная подсистема, которая состоит из системы  управления  базой  данных  (СУБД), системы управления  базой  моделей (СУБМ) и системы управления интерфейсом (взаимодействием между пользователем и компьютером).

Существует множество типов моделей и способов их  классификации: по цели использования,  области возможных приложений, способу оценки переменных и т.п.      По цели  использования модели подразделяются на оптимизационные  и  описательные,  описывающие  поведение  соответствующей системы.

По способу оценки модели классифицируются на детерминистские, использующие оценку переменных одним числом при конкретных  значениях исходных  данных,  и  стохастические,  оценивающие переменные несколькими параметрами, когда исходные данные заданы вероятностными характеристиками.  Детерминистские модели более популярны,  чем стохастические, они менее дорогие, их легче строить и использовать, с их помощью получается достаточная информация для принятия решения.

По области возможных приложений модели разделяются на специализированные, используемые  только  одной системой, и универсальные - для использования несколькими системами. Специализированные  модели более дорогие,  они обычно применяются для описания уникальных систем и обладают большей точностью.

Система управления интерфейсом во многом  определяет эффективность и гибкость информационной технологии. Интерфейс характеризует: язык пользователя;  язык сообщений компьютера, организующий диалог на экране дисплея; знания пользователя.

Язык пользователя - это  те  действия,  которые  пользователь производит в  отношении  системы  путем использования возможностей клавиатуры, "мыши" и т.п. Наиболее прост язык пользователя в форме входных и выходных документов.  Выведя на экран входную форму (документ),  пользователь заполняет его необходимыми данными и вводит в компьютер. Система поддержки принятия решений производит необходимый  анализ и выдает результаты в виде выходного документа установленной формы.  Значительно возрастает популярность визуального интерфейса.  С помощью манипулятора "мышь" пользователь выбирает представленные ему  в  форме  картинок на экране объекты и команды, реализуя таким образом свои действия. Ожидается появление систем поддержки принятия  решений, использующих речевой ввод информации.

Язык сообщений - это то,  что пользователь  видит  на  экране дисплея (символы,  графика, цвет), данные, полученные на принтере, звуковые выходные сигналы и т.п.

Важный показатель  эффективности используемого интерфейса - форма диалога между пользователем и системой. Распространены следующие формы диалога: запросно-ответный режим, командный режим, режим меню, режим заполнения пропусков в выражениях,  предлагаемых  компьютером. Каждая форма в зависимости от типа задачи,  особенностей пользователя и принимаемых решений имеет свои достоинства и недостатки.

Знания пользователя - это то,  что пользователь должен знать, работая с системой. К ним относятся не только план действий, находящийся в голове  пользователя,  но и учебники, инструкции, справочные данные, выдаваемые компьютером.

Наибольший прогресс среди компьютерных ИС отмечен  в  области разработки экспертных    систем,   основанных   на   использовании искусственного интеллекта. Экспертные системы дают возможность менеджеру или  специалисту  получать консультации экспертов по любым вопросам, о которых этими системами накоплены знания. Основные компоненты информационной технологии,  используемой в экспертной системе: интерфейс пользователя, база знаний, интерпретатор, модуль создания системы.

Сходство информационных технологий, используемых в экспертных системах и системах поддержки принятия решений, состоит в том, что обе они  обеспечивают  высокий уровень поддержки принятия решений. Однако имеются и существенные различия. Решение  проблемы  в  рамках систем поддержки принятия решений отражает уровень ее понимания пользователем и его возможности  получить и осмыслить решение.  Технология экспертных систем,  наоборот, предлагает пользователю принять  решение,  превосходящее  его возможности. Другое  отличие  указанных  технологий  выражается  в способности экспертных систем пояснять свои рассуждения в процессе получения решения.  Часто  эти  пояснения оказываются более важными для пользователя, чем само решение. Третье отличие связано с использованием  нового  компонента  информационной  технологии - знаний.

 

 СИСТЕМЫ УПРАВЛЕНИЯ БАЗАМИ ДАННЫХ

 

Современные информационные системы (ИС),  реализующие  интеграцию данных, характеризуются огромными объемами хранимых  данных,  сложной организацией, необходимостью удовлетворять разнообразные требования  многочисленных  пользователей.  Лекция   дает представление о базах данных (БД),  возможностях систем управления   базами данных (СУБД) и их использовании.  Основные  функциональные возможности  и технологические операции работы в СУБД рассматриваются без привязки к конкретному типу программного продукта. Подобные систематизированные знания являются базовыми для практического освоения любых СУБД.

Цель информационной системы - обработка данных об объектах реального  мира.  В  широком смысле база данных - это совокупность сведений о конкретных объектах реального мира в  какой-либо  предметной области. Под предметной областью принято понимать часть реального мира, подлежащего изучению. Создавая базу данных,  пользователь стремится упорядочить информацию по различным признакам и быстро извлекать выборку с  произвольным сочетанием признаков.  Это возможно сделать, если данные структурированы. Структурирование - введение соглашений о способах представления данных.

Пользователями базы  данных  могут  быть различные прикладные программы, а также специалисты предметной области, выступающие  в  роли  потребителей или источников данных, называемые конечными пользователями.

В современной технологии баз данных предполагается,  что создание базы данных,  ее поддержка и обеспечение доступа пользователей к  ней  осуществляется  централизованно с помощью специальных программных средств - системы управления базами данных.

База данных  (БД) - это поименованная совокупность структурированных данных, относящихся к определенной предметной области.

Система управления  базами данных (СУБД) - это комплекс программных и языковых средств,  необходимых для создания баз  данных, поддержания их  в  актуальном состоянии и организации поиска в них необходимой информации.

Централизованный характер  управления  данными  в базе данных предполагает необходимость существования некоторого  лица  (группы лиц), на  которое  возлагаются  функции администрирования данными, хранимыми в базе.

Классификация баз данных

По технологии обработки  данных БД подразделяются на централизованные и распределенные. Централизованная база  данных хранится в памяти  одной  вычислительной  системы.  Если  эта  вычислительная система является компонентом  сети  ЭВМ,  возможен  распределенный доступ  к такой базе.  Такой способ использования баз данных часто применяется в  локальных  сетях  ПК.  Распределенная  база  данных состоит из нескольких,  возможно пересекающихся или даже дублирующих друг друга частей, хранимых в различных ЭВМ вычислительной сети. Работа с такой базой осуществляется с помощью системы управления распределенной базы данных (СУРБД).

По способу доступа  к данным БД разделяются на БД  с локальным доступом и БД с удаленным (сетевым) доступом.

Системы централизованных БД с сетевым  доступом  предполагают различные архитектуры подобных систем:

- файл-сервер;

- клиент-сервер.

Архитектура файл-сервер предполагает выделение одной из машин сети в качестве центральной (сервер файлов).  На такой машине хранится совместно используемая централизованная БД. Все другие машины сети выполняют функции рабочих станций,  с помощью которых поддерживается доступ пользовательской системы к централизованной базе данных. Файлы БД в соответствии с пользовательскими  запросами передаются на рабочие станции, где в основном и производится обработка. Пользователи  могут также создавать на рабочих станциях локальные БД, которые используются ими монопольно.

В архитектуре клиент-сервер подразумевается,  что помимо хранения  централизованной  БД  центральная машина (сервер БД) должна обеспечивать выполнение основного объема обработки данных.  Запрос на данные, выдаваемый клиентом (рабочей станцией), порождает поиск и извлечение данных на сервере.  Извлеченные данные (но  не  файлы)  передаются по сети от сервера к  клиенту.

Структурные элементы БД: поле, запись, файл (таблица).

Поле -  элементарная  единица  логической организации данных, которая соответствует неделимой единице  информации  -  реквизиту. Для описания поля используются следующие характеристики:

имя, например, ФИО

тип, например, символьный, числовой, календарный;

длина, определяемая  максимально возможным количеством символов, например, 15 байт;

точность для числовых данных.

Запись -  совокупность  логически связанных полей.  Экземпляр записи - отдельная реализация записи, содержащая конкретные значения ее полей.

Файл (таблица)  -  совокупность  экземпляров  записей   одной структуры.

В структуре записи файла указываются поля, значения которых являются ключами: первичными (ПК), которые идентифицируют экземпляр  записи,  и вторичными (ВК),  которые выполняют роль поисковых или группировочных признаков (по значению вторичного  ключа можно найти несколько записей).

Виды моделей данных

Ядром любой БД является модель данных - совокупность структур данных и операций их  обработки.

СУБД основывается на использовании иерархической, сетевой или реляционной модели, а также на комбинации этих моделей.

Иерархическая модель данных -  древовидная.  Объекты  связаны иерархическими отношениями подобно перевернутому дереву.  К основным понятиям иерархической структуры относятся:  уровень,  элемент (узел), связь. Узел - это совокупность атрибутов данных, описывающих некоторый объект.  Каждый узел на более низком  уровне  связан только с одним узлом,  находящимся на более высоком уровне. Иерархическое дерево имеет только одну вершину (корень дерева), не подчиненную  никакой  другой  вершине  и находящуюся на самом верхнем (первом) уровне. Зависимые (подчиненные) узлы находятся на втором, третьем и т.д.  уровнях. В каждой записи БД существует только один (иерархический) путь от корневой записи.

В сетевой  модели  данных  при тех же основных понятиях (уровень, узел, связь) каждый элемент может быть связан с любым другим элементом.

Реляционная модель данных (англ.  relation - отношение) отличается простотой  структуры данных,  удобным для пользователя табличным представлением. Эта модель ориентирована на организацию данных в виде двумерных таблиц.  Каждая реляционная таблица представляет собой двумерный массив и обладает следующими свойствами:

- каждый элемент таблицы - один элемент данных;

- все столбцы в  таблице  однородные,  т.е.  все  элементы  в столбце имеют одинаковый тип (числовой, символьный и т.д.) и длину;

- каждый столбец имеет уникальное имя;

- одинаковые строки в таблице отсутствуют;

- порядок следования строк и столбцов может  быть  произвольным.

Отношения представлены в виде таблиц,  строки  которых  соответствуют записям  (кортежам),  а столбцы - полям  (атрибутам отношений, доменам).  Поле, каждое значение которого однозначно определяет  соответствующую запись,  называется простым ключом  (ключевым полем).  Если записи однозначно определяются значениями нескольких полей, то такая таблица БД имеет составной ключ. Чтобы связать две реляционные таблицы,  необходимо  ключ  первой  таблицы  ввести  в состав  ключа второй таблицы (возможно совпадение ключей);  в противном случае нужно ввести в структуру первой таблицы внешний ключ - ключ второй таблицы.

Информационный  объект  -  это описание реального объекта,  явления,  процесса,  события в виде совокупности логически связанных реквизитов  (информационных элементов).

Информационный объект определенного  реквизитного  состава  и структуры образует класс (тип),  ему присваивается уникальное имя (символьное обозначение).

Информационный объект  имеет множество реализаций - экземпляров, каждый из которых представлен совокупностью конкретных значений реквизитов и идентифицируется значением ключа (простого - один реквизит или составного - несколько реквизитов).  Остальные реквизиты информационного объекта являются описательными. Одни и те же реквизиты в одних информационных объектах могут быть  ключевыми, а  в  других - описательными.  Информационный объект может иметь несколько ключей.

Одни и  те  же данные могут группироваться в таблицы (отношения) различными способами, т.е. возможна организация различных наборов отношений  взаимосвязанных информационных объектов.  Группировка атрибутов в отношениях должна быть рациональной,  т.е. минимизирующей дублирование данных и упрощающей процедуры их обработки и обновления.  Определенный  набор  отношений   обладает   лучшими свойствами при включении,  модификации,  удалении данных,  чем все остальные возможные наборы отношений, если он отвечает требованиям нормализации отношений.

Нормализация отношений  -  формальный  аппарат ограничений на формирование отношений (таблиц),  который позволяет устранить дублирование, обеспечивает непротиворечивость хранимых в базе данных, уменьшает трудозатраты на ведение (ввод, корректировку) БД.

Все информационные  объекты  предметной области связаны между собой. Связь один к одному (1:1) предполагает, что в каждый момент времени одному экземпляру информационного объекта А соответствует не более одного экземпляра информационного объекта В и наоборот. При связи один ко многим (1:М) одному экземпляру информационного объекта А соответствует 0, 1 или более экземпляров объекта В, но каждый экземпляр объекта В связан не более чем с  1  экземпляром объекта А. Связь многие ко многим (М:М) предполагает, что в каждый  момент времени одному экземпляру информационного объекта А соответствует 0, 1 или более экземпляров объекта В и наоборот.

БД и  программные средства их создания и ведения (СУБД) имеют многоуровневое строение. Различают концептуальный, внутренний и внешний уровни представления данных БД,  которым соответствуют модели аналогичного назначения.      Концептуальный уровень  соответствует   логическому представлению данных  предметной  области  в обобщенном виде. Концептуальная модель состоит из логически структурированных  различных типов данных. Внутренний уровень  отображает организацию данных в среде хранения  и  соответствует физическому представлению данных.  Внутренняя модель  состоит из  отдельных записей, физически хранимых во внешних носителях. Внешний уровень  поддерживает  частные  представления данных,    требуемые конкретным пользователем.  Внешняя модель  является частью (подмножеством) концептуальной модели. С помощью внешних моделей поддерживается санкционированный доступ к  различным приложениям. Проектирование БД состоит в построении  комплекса  взаимосвязанных моделей данных.

Важнейшим этапом проектирования БД является разработка  инфологической (информационно-логической)  модели  предметной области, не ориентированной на конкретную СУБД.  Эта модель отражает предметную область в виде совокупности информационных объектов и их структурных связей. Инфологическая модель  предметной  области  строится  первой. Затем на ее основе строятся концептуальная (логическая), внутренняя (физическая) и внешняя модели.

СУБД  - это программная  система,  предназначенная для создания  на ЭВМ общей БД,  используемой для решения множества задач.  Подобные системы служат  для  поддержания  БД  в  актуальном состоянии и обеспечивают эффективный доступ пользователей к содержащимся в ней данным в рамках предоставленных пользователям полномочий. СУБД  предназначена  для  централизованного управления БД в интересах всех работающих в этой системе.

По степени универсальности различают два класса СУБД:

- системы общего назначения;

- специализированные системы.

СУБД общего назначения не ориентированы на  какую-либо  предметную область или на информационные потребности какой-либо группы пользователей. Каждая система такого рода  реализуется  как  программный продукт, способный функционировать на некоторой модели ЭВМ в определенной операционной системе и поставляется многим  пользователям как  коммерческое изделие.  Такие СУБД обладают средствами настройки на работу с конкретной базой данных.  Этим СУБД  присущи развитые  функциональные  возможности и даже определенная функциональная избыточность.  Использование СУБД общего назначения в  качестве средства для создания автоматизированных информационных систем,  основанных на технологии БД, позволяет существенно сокращать сроки разработки, экономить ресурсы. Специализированные СУБД создаются в редких случаях при  невозможности  или нецелесообразности использования СУБД общего назначения.      СУБД общего  назначения  - это сложные программные комплексы, предназначенные для выполнения всей совокупности функций,  связанных с созданием и эксплуатацией БД.  Рынок программного обеспечения персональных компьютеров предлагает разнообразные  по  своим функциональным возможностям коммерческие СУБД общего назначения, а также средства их окружения практически для всех массовых  моделей машин  и  для  различных операционных систем.  СУБД - лидеры рынка программ:  dBASE IV 2.0 и Paradox 4.5 компании Borland International; Microsoft Access 2.0; Microsoft FoxPro 2.6.

Производительность СУБД оценивается:

- временем выполнения запросов;

- скоростью поиска информации в неиндексированных полях и др.

Современные СУБД обладают средствами обеспечения  целостности данных и  надежной  безопасности.

Обеспечение целостности данных на уровне БД  подразумевает наличие  средств,  позволяющих  удостовериться,  что информация в БД всегда остается корректной и полной.  Установлены правила  целостности,  и  они  хранятся  вместе  с БД и соблюдаться на глобальном уровне. Целостность данных должна обеспечиваться независимо от того, каким образом данные заносятся в память.

Access и  Paradox for Windows гораздо ближе других СУБД соответствуют реляционной модели по надежности сохранения  целостности данных на уровне БД;  правила хранятся вместе с БД и автоматически соблюдаются. СУБД dBASE IV и FoxPro не  обладают средствами этого рода, обеспечение целостности возлагается  на  программистов.

Некоторые СУБД имеют средства обеспечения  безопасности  данных. Они обеспечивают выполнение следующих операций:  шифрование прикладных программ и данных;  защиту паролем; ограничение доступа. Самый высокий уровень безопасности данных реализован  в  СУБД dBASE IV.  Администратор может назначать системе  различные  права доступа на уровне файла, поля, а также организовать автоматическое шифрование данных.  Хорошими  характеристиками  обеспечения  безопасности отличается Access 2.0.  Он предусматривает назначение паролей для индивидуальных пользователей или групп  пользователей  и присвоение различных прав доступа отдельно к таблицам, запросам, отчетам, макрокомандам, новым объектам на уровне пользователя или группы.

Практически все современные СУБД предназначены для работы в многопользовательских  средах.  Лучшими  возможностями для этого обладают СУБД Paradox  4.5, Access 2.0, dBASE IV.

Функция импорт-экспорт отражает возможности: обработки СУБД информации, подготовленной другими программными средствами; использования другими программами данных, сформированных средствами рассматриваемой СУБД. Все вышеуказанные СУБД обладают хорошими возможностями импорта-экспорта данных.

Функциональные возможности  моделей данных доступны пользователю СУБД благодаря ее языковым средствам. Эти средства  используются  для выполнения двух основных функций:

- описания представления БД;

- выполнения операций манипулирования данными.

Первая из  этих функций обеспечивается языком описания (определения) данных (ЯОД).  Описание БД (структуры БД,  ограничений целостности и др.) с помощью ЯОД называется схемой базы  данных

Язык манипулирования данными  (ЯМД) позволяет реализовать предусмотренные в системе операции над данными из БД.  Например, язык программирования Access Basic  позволяет  управлять  объектами  из других прикладных программ,  создавать объекты БД (запросы, таблицы),  изменять структуру БД и создавать индексы непосредственно из прикладной программы.

Программы СУБД имеют достаточное количество команд,  у каждой из которых возможны различные параметры (опции). Такая система команд совместно с дополнительными опциями образует меню. Совокупность команд, предоставляемых в распоряжение пользователя некоторой усредненной СУБД,  может быть разбита на  следующие типовые группы: команды для работы с файлами;  редактирования; форматирования;  для работы с окнами; для работы в основных режимах СУБД (таблица, форма, запрос, отчет);  получение справочной информации.

При работе с СУБД на экран выводятся рабочее поле и панель управления.  Последняя включает меню,  вспомогательную область управления и строку подсказки. Строка меню содержит основные режимы программы.  В строке  состояния  (статусной строке) содержатся сведения о текущем режиме работы программы.  Панель инструментов  (пиктографическое меню)  состоит из кнопок (пиктограмм) для быстрого выполнения определенных команд меню и функций программы.

Важная особенность СУБД - использование буфера промежуточного хранения при выполнении ряда операций.  Содержимое буфера сохраняется до тех пор, пока в него не будет записана новая порция данных.

Ввод данных и изменение содержимого любых  полей  таблиц  БД, компонетов экранных  форм  и отчетов производится с помощью команд редактирования,  главными из которых являются  перемещение, копирование, удаление.  Современные СУБД позволяют вставлять диаграммы,  рисунки и т.п.,  включая объекты, созданные в других программных средах,  устанавливать связи между объектами. Среди команд редактирования особое место занимают команды нахождения  и  замены определенного пользователем контекста в пределах всего документа или выделенной его части,  а также отмена  последней введенной  команды (откатка).

Важное значение имеет визуальное представление данных при выводе. Большинство СУБД предоставляют в  распоряжение  пользователя большое число команд, связанных с оформлением выводимой информации.

Современные СУБД  позволяют  открывать одновременно множество окон, организуя "многооконный режим" работы.

СУБД имеют в  своем  составе  электронные  справочники,  предоставляющие пользователю  инструкции  по выполнению  основных операций.  Особенностью получения справочной информации с помощью электронного справочника является то,  что он выдает информацию в зависимости от ситуации, в которой оказался пользователь.

В качестве основных этапов  обобщенной  технологии  работы  с СУБД можно выделить следующие:

- создание структуры базы данных;

- ввод и редактирование данных в таблицах;

- обработка данных, содержащихся в таблицах;

- вывод информации из БД.

Практически все используемые СУБД хранят данные следующих типов: текстовый (символьный),  числовой,  календарный,  логический, примечание.

Если обрабатываемая  БД  включает  несколько  взаимосвязанных таблиц, то необходимо определение ключевого поля в каждой таблице, а  также полей,  с помощью которых будет организована связь между таблицами.

Создание структуры таблицы не связано  с  заполнением  таблиц данными, поэтому эти две операции можно разнести во времени.

Заполнение таблиц данными возможно как непосредственно вводом данных, так и в результате выполнения программ и запросов.

Практически все СУБД позволяют  вводить и корректировать данные в таблицах двумя способами:

- с помощью стандартной формы  в виде таблицы (по умолчанию);

- с помощью экранных форм, специально создаваемых пользователем.

СУБД, работающие с WINDOWS, позволяют вводить в созданные экранные формы рисунки,  узоры,  кнопки.  Возможно построение  форм, включающих записи различных связанных таблиц БД.

Обрабатывать информацию,  содержащуюся в таблицах  БД,  можно путем использования  запросов или в процессе выполнения специально разработанной программы.

Запрос представляет собой инструкцию на отбор записей.

Большинство СУБД разрешают использовать запросы следующих типов:

- запрос-выборка  - для отбора данных,  хранящихся в таблицах, и не изменяющий эти данные;

- запрос-изменение -  для изменения или перемещения  данных  (к этому типу относятся запросы:  на добавление записей, на удаление записей, на создание таблицы, на обновление);

- запрос  с  параметром,  позволяющий  определить  одно   или несколько условий отбора во время выполнения запроса.

Самым распространенным типом запроса является запрос  на  выборку.

Результатом выполнения запроса является таблица  с  временным набором данных (динамический набор).  Записи динамического  набора могут  включать поля из одной или нескольких таблиц БД.  На основе запроса можно построить отчет или форму.

Практически любая СУБД позволяет вывести  на экран  и  принтер информацию, содержащуюся в БД, из режимов таблицы или формы. Такой порядок вывода  данных  может использоваться как черновой вариант, т.к.  позволяет выводить данные только в точно таком виде, в каком они содержатся в таблице или форме.

В СУБД предусмотрены специальные средства создания отчетов  для  вывода данных. Используя их, пользователь получает дополнительные возможности:

- включать в отчет выборочную информацию из таблицы БД;

- включать в отчет информацию из разных связанных таблиц БД;

- добавлять информацию, не содержащуюся в БД;

- при необходимости выводить итоговые данные на основе информации БД;

- располагать выводимую в отчете информацию в удобном виде (вертикальное или горизонтальное  расположение полей).

 

 ИНТЕЛЛЕКТУАЛЬНЫЕ КОМПЬЮТЕРНЫЕ СИСТЕМЫ

 

Одно из актуальных направлений информатики - интеллектуализация информационных технологий. В результате пользователь сможет не только получить сведения на основе обработки данных,  но и использовать по интересующей его проблеме накопленный опыт и знания профессионалов. Интеллектуальные системы и технологии применяются для распространения профессионального опыта и  решения  сложных  научных задач.  Для обработки и моделирования знаний применяются специальные модели и создаются базы знаний.

Идея  создания искусственного подобия человеческого разума для моделирования мыслительной способности известна  с  древнейших времен. В XIV в. пытались создать машину для решения различных задач на основе всеобщей классификации понятий. Однако развитие  искусственного  интеллекта  как  научного направления стало возможным только после создания ЭВМ.  В 40-х  гг.  ХХ  в.  Н.Винер создал  свои основополагающие работы по новой науке - кибернетике.

Термин  искусственнный   интеллект  (artificial  intelligence) предложен в США в 1956 г.  Как отрасль науки искусственный интеллект сразу же разделился на два  основных  направления: нейрокибернетику и кибернетику "черного ящика".  Сейчас наметилась тенденция к объединению этих частей вновь в единое целое.

Основная идея нейрокибернетики: "мыслящее" устройство должно  каким-то образом воспроизводить структуру человеческого мозга. Физиологами установлено,  что основой  человеческого мозга является большое количество (до 10 в 21 степени) связанных между собой и взаимодействующих нервных клеток - нейронов. Поэтому усилия нейрокибернетики были сосредоточены на создании элементов,  аналогичным нейронам,  и их объединении в функционирующие системы. Их принято называть нейронными сетями или нейросетями.

Первые нейросети были созданы в конце 50-х гг.  американскими учеными. Это  были  попытки создать системы,  моделирующее человеческий глаз и его взаимодействие с мозгом. Устройство умело различать буквы алфавита,  но было чувствительно к их написанию. Постепенно  в  70-80  гг.  количество  работ   по   этому   направлению искусственного интеллекта стало снижаться. Авторы объясняли неудачи малой памятью и низким быстродействием существовавших в то время компьютеров.

В середине 80-х гг.  в Японии  в  рамках  проекта  разработки  компьютера V поколения,  основанного на знаниях, был создан компьютер VI поколения или нейрокомпьютер.  К этому времени ограничения по  памяти  и  быстродействию  были  практически сняты.  Появились транспьютеры - параллельные компьютеры с большим количеством  процессоров. Они стали основой  нейрокомпьютеров, моделирующих структуру мозга  человека.  Основная  область  применения нейрокомпьютеров - распознавание образов.

В настоящее время используются три подхода  к  созданию  нейросетей:

- аппаратный - создание специальных компьютеров,  плат расширения, наборов микросхем;

- программный - создание программ и инструментариев,  рассчитанных на высокопроизводительные компьютеры.  Сети создаются в памяти компьютера, всю работу выполняют его собственные процессоры;

- гибридный - комбинация первых двух. Часть вычислений выполняют специальные платы расширения (сопроцессоры),  часть  -  программные средства.

В основу кибернетики "черного ящика" положен принцип,  противоположный нейрокибернетике.  Не имеет значения,  какова структура "мыслящего" устройства.  Главное,  чтобы на заданные входные  воздействия оно реагировало  так  же,  как человеческий мозг.  Это направление искусственного интеллекта было ориентировано на поиски  алгоритмов решения  интеллектуальных  задач на существующих моделях компьютеров. В 50-60 гг. велись интенсивные поиски моделей и алгоритма человеческого мышления и разработка первых программ.  Оказалось, что ни одна из существующих наук - философия,  психология, лингвистика - не может предложить такого алгоритма.  Тогда кибернетики предложили создать собственные модели. Были созданы и опробованы различные подходы.

В конце 50-х гг.  родилась модель лабиринтного поиска - оптимального пути от входных данных к результирующим.  В решении практических задач идея большого распространения не  получила.  Начало 60-х гг. - эпоха эвристического программирования. Эвристика - правило, теоретически не обоснованное, но позволяющее сократить количество переборов в пространстве поиска. Эвристическое программирование - разработка стратегии действий на основе известных, заранее заданных эвристик.  В  60-70 гг.  к решению задач стали подключать методы математической логики.  На основе метода резолюций,  позволившего автоматически доказывать теоремы при наличии набора исходных аксиом, в 1973 г. создается язык  Пролог.

Существенный прорыв в практических приложениях искусственного интеллекта произошел в середине 70-х гг.,  когда на смену  поискам универсального алгоритма  мышления  пришла идея моделировать конкретные знания специалистов-экспертов.  В США появились первые коммерческие системы,  основанные на знаниях, или экспертные системы. Пришел новый подход к решению задач  искусственного  интеллекта  - представление знаний.  Созданы  MYCIN  и  DENDRAL  -  ставшие классическими экспертные системы для медицины и  химии.  Объявлено несколько глобальных программ развития интеллектуальных технологий.

Начиная с  середины  80-х  гг.  происходит   коммерциализация искусственного интеллекта. Растут ежегодные капиталовложения, создаются промышленные экспертные системы. Растет интерес к самообучающимся системам.

В России в 60-80 гг. получает развитие новая наука - ситуационное  управление  (соответствует  представлению знаний в западной терминологии). Разработаны специальные модели представления ситуаций - представления знаний. Функционирует ассоциация искусственного интеллекта. Уровень теоретических исследований по искусственному интеллекту в России не ниже мирового при прогрессирующем отставании в технологии.

Искусственный интеллект  -  одно  из  направлений информатики.  Его цель - разработка аппаратно-программных  средств,  позволяющих пользователю-непрограммисту ставить и решать свои задачи, традиционно считающиеся интеллектуальными,  общаясь с ЭВМ на языке, близком к естественному. 

Основные направления развития искусственного интеллекта:     Представление знаний и разработка систем,  основанных на знаниях - основное направление искусственного интеллекта. Оно связано с созданием моделей представления знаний, баз знаний, образующих ядро экспертных систем (ЭС).

Игры и творчество - игровые  интеллектуальные  задачи.  В  их основе лежит один из ранних подходов - лабиринтная модель плюс эвристики.  Сейчас это скорее коммерческое направление, т.к. в научном плане эти идеи считаются тупиковыми.

Разработка естественноязыковых интерфейсов и машинный перевод. В 50-х гг. одной из популярных тем исследований искусственного интеллекта являлась  область машинного перевода.  Первая программа в этой области - переводчик с английского языка на  русский.  Первая идея -  пословный перевод,  оказалась неплодотворной.  В настоящее время используется более сложная модель,  включающая анализ и синтез переводимых текстов.

Распознавание образов - традиционное направление  искусственного интеллекта.  Каждому  объекту ставится в соответствие матрица (таблица) признаков,  по которой происходит его распознавание. Это направление близко к машинному обучению,  тесно связано с нейрокибернетикой.

Новые структуры компьютеров.  Это  направление  занимается разработкой новых аппаратных решений, направленных на обработку символьных  и  логических  данных.

Интеллектуальные роботы.  Роботы  -  это  электромеханические устройства, предназначенные для автоматизации человеческого труда. Идея создания роботов исключительно древняя. Со времени создания сменилось несколько поколений роботов.  Роботы с  жесткой схемой управления. Практически все современные промышленные роботы принадлежат к первому поколению.  Фактически  это  программируемые манипуляторы.  Адаптивные  роботы с сенсорными устройствами.  Есть образцы таких роботов,  но пока они широко не  используются. Самоорганизующиеся или интеллектуальные роботы. Это - конечная цель развития робототехники.  Основная проблема  при  создании интеллектуальных роботов - машинное зрение.

Специальное программное обеспечение - разработка  специальных языков для решения невычислительных задач. Эти языки ориентированы на символьную обработку информации - LISP, PROLOG, SMALLTALK и др. Помимо этого создаются пакеты прикладных программ, ориентированные на типовую разработку интеллектуальных систем,  или программные   инструментарии   искусственного  интеллекта,  например  KEE, ARTS. Популярно создание так называемых пустых экспертных  систем, или "оболочек",  - EXSYS, M1 и др., в которых можно наполнять базы  знаний, создавая различные системы.

Обучение и   самообучение  -  активно  развивающаяся  область искусственного интеллекта.  Ориентированы на автоматическое накопление знаний на основе анализа и обобщения данных. Включает обучение по примерам (или индуктивное), а также традиционные подходы распознавания образов.

Данные  -  это  отдельные факты,  характеризующие объекты, процессы и явления в предметной области.

Знания - это  выявленные  закономерности  предметной  области   (принципы, связи,  законы).

Для хранения  данных используются базы данных (для них характерны большой объем и относительно  небольшая  удельная  стоимость информации), для хранения знаний - базы знаний (небольшого объема, но исключительно дорогие информационные массивы).  База  знаний  - основа любой интеллектуальной системы.

Знания могут быть классифицированы по следующим категориям:

- поверхностные - о видимых взаимосвязях между отдельными событиями и фактами в предметной обл.;

- глубинные   -  абстракции,  аналогии,  схемы,  отображающие структуру и процессы в предметной области.

Современные экспертные  системы работают в основном с поверхностными знаниями.

Кроме того,  знания можно разделить на процедурные и декларативные. Исторически первыми были процедурные  знания,  представляемые алгоритмами.  Они управляли данными. Сегодня знания приобрели чисто декларативную форму, т.е.   знаниями   считаются   предложения,  записанные  на  языках представления знаний,  приближенных  к  естественному  и  понятных неспециалистам.

Существует множество моделей (или языков) представления знаний для различных предметных областей.  Большинство из них может  быть сведено к следующим классам:

- продукционные модели;

- семантические сети;

- фреймы;

- формальные логические модели.

Продукционная модель  или  модель,  основанная  на правилах, позволяет представить знания в виде предложений типа:  Если (условие), то  (действие).  Под условием  понимается некоторое предложение-образец, по которому осуществляется поиск в базе знаний, а под действием - действия,  выполняемые при успешном исходе поиска (они могут быть промежуточными,  выступающими далее как условия, или оконечными, целевыми, завершающими работу системы).

При использовании продукционной модели база знаний состоит из набора правил. Программа, управляющая перебором правил, называется машиной вывода. Чаще всего вывод бывает прямой (от данных к поиску цели) или обратный (от цели для ее подтверждения - к данным).

Продукционная модель  часто  применяется в экспертных системах.  Она привлекает разработчиков  своей  наглядностью, высокой модульностью,  легкостью внесения дополнений и изменений и простотой механизма логического вывода.

Термин семантическая означает смысловая. Семантика - это наука, устанавливающая отношения между символами и объектами, которые они обозначают, т.е. наука, определяющая смысл знаков.

Семантическая сеть содержит вершины (узлы)  - понятия и дуги -  отношения между ними. Понятия - это обычно абстрактные или конкретные объекты,  а отношения - связи типа:  "это" (is), "имеет частью" (has part),  "принадлежит" и т.д.

Проблема поиска решения в базе знаний типа семантической сети сводится к задаче поиска фрагмента сети.

Основное преимущество  этой модели - в соответствии современным представлениям об организации долговременной памяти  человека. Недостаток модели - сложность поиска вывода из семантической сети.

Фрейм (англ.  frame - каркас,  рамка). Эта модель,  как и семантическая сеть, имеет глубокое психологическое обоснование.  Под фреймом понимается абстрактный  образ или ситуация.  В психологии и философии известно понятие абстрактного образа. Например, слово "комната" вызывает образ комнаты: жилое помещение площадью 6-20 кв.м.  с четырьмя стенами,  полом, потолком,  окнами и дверью.  Из этого описания ничего нельзя  убрать (убрав окна,  получим чулан,  а не комнату), но в нем есть "дырки" или "слоты",  - это незаполненные значения некоторых  атрибутов  - количество окон  и т.д.  Фреймом в теории называется как такой образ, так и формализованная модель для отображения образа.

Различают фреймы-образцы,  или  прототипы,  хранящиеся в базе знаний, и фреймы-экземпляры, которые создаются для отображения реальных ситуаций на основе поступающих данных.

Модель фрейма достаточно  универсальна.

Основное преимущество фреймов как модели представления знаний - способность отражать концептуальную  основу  организации  памяти человека, а также ее гибкость и наглядность.

Традиционно в  представлении знаний выделяют формальные логические модели,  когда  предметная область или задача описывается в виде набора аксиом.  Эта логическая модель применима в основном  в исследовательских системах.

Интерес к экспертным системам в России имеет  слабое материальное подкрепление - нехватка учебников и специальной литературы,  отсутствие символьных процессоров и  рабочих  станций искусственного интеллекта,  ограниченное финансирование исследований в этой области, слабый отечественный рынок программных продуктов для разработки экспертных систем.  Распространяются "подделки" под экспертные системы в виде многочисленных диалоговых  систем  и интерактивных пакетов прикладных программ,  которые дискредитируют в глазах пользователей это чрезвычайно перспективное  направление.

Процесс  создания экспертной системы требует высококвалифицированных специалистов в области искусственного интеллекта. Современные экспертные  системы  призваны распространять опыт и знания ведущих специалистов (экспертов) практически во всех сферах деятельности. Традиционно знания существуют в двух видах - коллективный и личный опыт.  Если большая часть знаний в предметной области представлена  коллективным  опытом, эта предметная область не нуждается в экспертных системах. Если же в  предметной  области большая часть знаний является личным опытом специалистов высокого уровня (экспертов) и если эти  знания  слабо структурированы, такая предметная область скорее всего нуждается в экспертной системе.

Экспертные системы (ЭС) - это сложные программные  комплексы, накапливающие знания  специалистов  в  конкретных  предметных областях и распространяющие этот эмпирический опыт для консультаций  менее квалифицированных пользователей.

Обобщенная структура экспертной системы, основные понятия и определения.

Пользователь -  специалист  предметной области,  для которого предназначена система.  Обычно его квалификация недостаточно высока, и поэтому он нуждается в помощи и поддержке своей деятельности со стороны ЭС.

Инженер по  знаниям - специалист по искусственному интеллекту, выступающий  в  роли  посредника  между экспертом и базой знаний.  Синонимы: когнитолог, инженер-интерпретатор, аналитик.

Интерфейс пользователя - комплекс программ,  реализующих диалог пользователя с ЭС как на стадии ввода информации,  так и получения результатов.

База знаний  (БЗ)  - ядро ЭС,  совокупность знаний предметной области, записанная на машинный носитель в форме, понятной эксперту и  пользователю  (обычно  на  некотором  языке,  приближенном к естественному). Параллельно такому  "человеческому"  представлению существует БЗ во внутреннем "машинном" представлении.

Решатель - программа,  моделирующая ход рассуждений  эксперта на основании знаний, имеющихся в БЗ. Синонимы: дедуктивная машина, блок логического вывода.

Подсистема объяснений  - программа,  позволяющая пользователю получать ответы на вопросы:  "Как была получена  рекомендация?"  и "Почему система  приняла такое решение?".

Интеллектуальный редактор БЗ - программа, предоставляющая инженеру по знаниям возможность создавать БЗ  в  диалоговом  режиме.

В коллектив разработчиков ЭС входят как минимум четыре  человека: эксперт;  инженер  по  знаниям;  программист;  пользователь. Возглавляет коллектив инженер по знаниям,  это ключевая фигура при разработке систем, основанных на знаниях.

Экспертные системы классифицируют по различным критериям.

Классификация ЭС по решаемой задаче.

Интерпретация данных   -   одна  из  традиционных  задач  для экспертных систем.  Под  интерпретацией   понимается   определение смысла  данных,  результаты  которого должны быть согласованными и корректными.  Обычно предусматривается многовариантный анализ данных.

Диагностика - обнаружение   неисправностей,  отклонений  от нормы -  позволяет  с единых позиций рассматривать  неисправность оборудования в технических системах,   заболевания живых организмов,  всевозможные природные и общественные аномалии. При этом требуется понимание функциональной структуры ("анатомии") диагностируемой системы.

Мониторинг -  непрерывная  интерпретация  данных  в  реальном масштабе времени и сигнализация о выходе тех или  иных  параметров за допустимые пределы.

Проектирование -  подготовка  документов на создание объектов, процессов  с заранее определенными свойствами.

Прогнозирование - логический вывод вероятных следствий из заданных ситуаций. Выводимые следствия составляют основу для прогнозов с вероятностными оценками.

Планирование - нахождение планов действий применительно к моделям поведения реальных объектов.

Системы обучения диагностируют ошибки при изучении какой-либо дисциплины с помощью ЭВМ и подсказывают  правильные  решения.  Они накапливают знания  об "ученике" и его характерных ошибках, способны выявить слабости в знаниях обучаемых  и  находить соответствующие средства для их ликвидации. Кроме того,  они планируют акт общения с учеником  в  зависимости от успехов ученика с целью передачи знаний.

В общем случае все системы, основанные на знаниях, можно подразделить на системы,  решающие задачи анализа и синтеза. Задача анализа - это интерпретация данных,  диагностика;  к задачам  синтеза относятся проектирование,  планирование.  Комбинированные  задачи: обучение, мониторинг, прогнозирование.

Классификация ЭС по связи с реальным временем.

Статические ЭС разрабатываются в предметных областях, в которых база  знаний и интерпретируемые данные не меняются во времени. Они стабильны.

Квазидинамические ЭС  интерпретируют ситуацию,  которая меняется с некоторым фиксированным интервалом времени.

Динамические ЭС  работают в сопряжении с датчиками объектов  и процессов в режиме реального времени с непрерывной интерпретацией  поступаемых данных.

Классификация по степени интеграции с другими программами.

Автономные ЭС работают непосредственно в режиме  консультаций с пользователем  для специфически "экспертных" задач,  при решении которых не требуется привлекать традиционные методы обработки данных (расчеты, моделирование и т.п.).

Гибридные ЭС представляют программный комплекс,  агрегирующий стандартные пакеты  прикладных программ (например,  математическую статистику, СУБД и др.) и средства манипулирования знаниями.

Несмотря на  внешнюю  привлекательность гибридного подхода разработка таких систем представляет собой  задачу,  на  порядок  более сложную и дорогую, чем  разработка автономной ЭС.

Инструментальные средства построения экспертных систем.

Традиционные языки программирования слабо подходят для работы с символьными и логическими данными, требуют большой работы квалифицированных программистов.

Языки искусственного  интеллекта - прежде всего Лисп (LISP) и Пролог (Prolog).  Универсальность этих языков меньшая, чем традиционных  языков. Это компенсируется большими возможностями по работе с символьными и  логическими  данными,  что крайне важно для задач искусственного интеллекта.

Специальный программный инструментарий общего назначения -  это библиотеки или надстройки над языком  искусственного интеллекта.

"Оболочки" (shells) - "пустые" версии существующих экспертных систем, т.е. готовые экспертные системы без базы знаний. Достоинство оболочек в том,  что они вообще  не  требуют  программистов  для создания готовой экспертной системы.  Требуется только специалист(ы) в предметной области для заполнения базы знаний. Однако, если  некоторая  предметная область плохо укладывается в модель, используемую в оболочке, заполнить базу знаний в этом случае весьма непросто.

 

Hosted by uCoz