Главная Обратная связь Дисциплины:
Архитектура (936)
|
Проблематика задач создания систем распознавания на описательном уровне
Системы распознавания Центральную задачу распознавания образов представляет построение на основе систематических теоретических и экспериментальных исследований эффективных вычислительных средств (объединяемых в понятии системы распознавания (СР)) для отнесения описаний с объектов, явлений, процессов к соответствующим классам. Круг задач, возлагаемых на СР, определяется приведенным нами определением самого понятия “распознавание” и включает выяснение по разнородной, часто неполной, нечеткой, искаженной и косвенной информации факта, обладают ли изучаемые объекты, явления, процессы, ситуации фиксированным конечным набором свойств, позволяющим отнести их к определенному классу. Сюда входят задачи распознавания и классификации, а также задачи, в результате решения которых на основе распознавания требуется выяснить, в какой области из конечного числа областей будут находиться некоторые процессы через определенный промежуток времени. Отсюда понятно, что к задачам распознавания должны относиться задачи технической и медицинской диагностики, геологического прогнозирования, прогнозирования свойств химических соединений, распознавания свойств динамических и статических объектов в сложной фоновой обстановке и при наличии активных и пассивных помех, прогнозирования урожая, обнаружения лесных пожаров, управления производственными процессами. Разработки СР, начатые с 50-х годов, исчисляются тысячами. Сегодня уже трудно назвать такую отрасль науки и сферы производства, где СР не используются. При этом применение методов распознавания в ряде направлений науки и техники оказывает обратное влияние на эти направления, поистине революционизирующее влияние. Рассмотрим некоторые применения. 1) Системы технической диагностики. Их внедрение - важнейший фактор повышения эффективности использования машин и технологического оборудования, резкого сокращения расходов на эксплуатацию. Исторически сложившаяся тенденция усложнения, а значит удорожания машин постоянно увеличивает затраты на эксплуатацию. Выход - переход к системам технической диагностики, например, безразборный поиск неисправностей. В результате вместо планово-предупредительного ремонта - ремонт по фактической необходимости. Например, в инструкции по эксплуатации автомобиля предусмотрены плановые технические обслуживания через 500 км, 1000 км, 2000 км и т.д. Если же его оснастить СР состояний, то от плановых ТО можно было бы отказаться заменив их обслуживанием отдельных узлов и систем по необходимости. 2) Медицинская диагностика. Системы диагностики в медицине - путь увеличения: широты и глубины охвата симптомов; оперативности; достоверности. 3) Сельское хозяйство. Области применения здесь: распознавание размеров урожая по данным космических наблюдений; уменьшение ручного труда при сортировке плодов по форме, цвету и размерам и т.п. 4) Военное дело. Сложные системы вооружения: автоматический функциональный контроль технического состояния систем и ввод резервирующих; роботы, обслуживающие фазированные антенные решетки радаров. Сегодня СР это: -ПК как один составляющий элемент СР; -технические средства обнаружения распознаваемых объектов (например, патологических изменений того или иного органа человека); -средства измерений параметров обнаруженных объектов (без них не получить признаков распознавания); -математическое обеспечение (методы и алгоритмы обработки измерительной информации; методы и алгоритмы определения признаков распознавания; методы и алгоритмы распознавания объектов, явлений, процессов (построения решающих правил отнесения объектов к тому или иному классу); методы и алгоритмы оптимального управления процессом распознавания; методы и алгоритмы оценки эффективности СР как на стадии проектирования, так и в процессе ее функционирования); -коллектив специалистов, обеспечивающих жизненный цикл существования системы. Рассмотрим подробнее отдельные элементы. а) Средства обнаружения распознаваемых объектов. К ним в разных областях применения относятся: в медицине: рентгеновские аппараты; аппараты УЗИ; ЯМР-томографы; энцефалографы; рентгеновские томографы; кардиографы и т.д. в военном деле: радиолокаторы; оптические (лазерные) локаторы; лазерные дальномеры; приемники гамма-излучения; сонары - ультразвуковые локаторы. б) Средства сопряжения. Для сопряжения средств обнаружения с ПК необходимы специальные электронные устройства аппаратного интерфейса. Эти составные части СР достаточно дорогостоящи. в)Средства измерений параметров распознаваемых объектов, явлений, процессов. Средства измерений часто входят в состав обнаружителей (РЛС - измерение дальностей, углов, Рс/Рш). г) Методы и алгоритмы обработки измерительной информации Часто для получения признаков распознавания или параметров, которые их обусловливают необходима специальная математическая обработка (пример, для РЛС - определение дальностей целей по временной задержке сигналов, угловых координат по разности фаз, коэффициентов лобового сопротивления целей по координатам и их производным и т.п.). Сам процесс назначения признаков - творческий процесс, говорят - эвристический, зависящий от человека. д) Методы и алгоритмы принятия решения о принадлежности объектов распознавания. е) Методы и алгоритмы оптимального управления распознаванием. ж) Методы и алгоритмы оценки эффективности распознавания. Как алгоритмы принятия решений, так и управление распознаванием, так и оценка эффективности определяются сложностью систем распознавания и представляют концентрированное применение комплекса математических операций соответствующего назначения. з) ПК Это обязательный элемент современной СР. Вся обработка измерений с целью выделения признаков распознавания, вся математика классификации, управления и оценки эффективности выполняется ПК. Само развитие теории и методов распознавания обязано появлению ПК. и) Коллектив подготовленных специалистов. Без коллектива подготовленных специалистов трудно обойтись в больших системах, решения которых чрезвычайно ответственны. В таких системах оценка эффективности - это показатель, которым пользуются с момента создания СР и до конца ее существования. При этом пользуются этим показателем специалисты, а не система. А сама необходимость такого использования связана с тем, что в процессе работ появляется возможность повысить эффективность СР за счет получения новых данных и уточнения параметров системы в результате анализа специалистами конкретного случая распознавания с последующим уточнением этими специалистами имеющихся параметров. То есть, система в течение своего жизненного цикла изменяется (динамизм системы). Таким образом, СР - сложная динамическая система, состоящая в общем случае из коллектива специалистов и совокупности технических средств получения и переработки информации, обеспечивающих на основе специальных алгоритмов решение задачи классификации соответствующих объектов, явлений или процессов. После того, как описан состав и функции элементов СР, для завершения общих представлений о проблеме распознавания можно провести и некоторые сравнения технических СР и такой совершенной СР, как человек. Так рецепторы человека - это средства обнаружения, а иногда и измерения характеристик распознаваемых объектов, явлений, процессов. Тут аналогия полнейшая. Далее на пути оперирования с информацией у технических СР стоит устройство сопряжения с ПК. Естественными аналогами его являются биологические средства связи человеческих рецепторов с мозгом, выполняющим роль ПК. Основные вопросы в РО: -какие функции выполняют рецепторы в части первичной обработки результатов обнаружения объектов, явлений; -каковы характеристики передачи данных от рецепторов к мозгу; -какие признаки выделяет система обработки; -какие алгоритмы использует мозг для решения задачи классификации, оптимального управления процессом распознавания; -как человеку удается избавиться от специфичности, свойственной техническим СР и т.д. Проблематика задач создания систем распознавания на описательном уровне Распознавание образов (РО) в технике - необходимый элемент процесса механизации и автоматизации машин, устройств и систем для: -замены человека там, где используется тяжелый физический труд; реализации быстрых реакций в управлении там, где нет времени на раздумье; замены человека в так называемых рутинных операциях, то есть, повторяющихся действиях, не требующих умственных усилий. Эти потребности реализовывались в таких конкретных на приложениях, как создание специализированных роботов, техническая и медицинская диагностика, метеопрогноз, формализованная оценка общественных, экономических и социальных явлений и процессов. В результате сопоставления конкретных решений и разработок оказалось, что несмотря на многообразие и особенности приложений, задачи создания систем распознавания имели много общего, не зависящего от указанной специфики. Вот почему для выработки методических подходов теории РО имело смысл выделять общие повторяющиеся приемы, а их число естественно должно быть ограниченным и легко объединяемым в задачи. Сами же эти задачи должны были явиться ключевыми для создания любой системы распознавания. В результате оказалось, что найденный методический подход к построению систем распознавания образов инвариантен к предметной области. Постараемся осмыслить эту инвариантность построения систем распознавания образов (СРО), рассмотрев простые реализации систем. А. Распознавание стороной А самолетов стороны В. Здесь фактически требуется создать автоматическую систему, обеспечивающую стороне А решение указанной задачи. Понятно, что цель создания такой системы - оборона стороны А от возможного нападения, а следовательно - предотвращение возможного ущерба. Первое, с чего нужно начать эту работу - провести изучение и анализ всей возможной информации об авиации стороны В и собрать необходимые данные. Как эта информация может быть получена: - из открытой печати (часто многие характеристики самолетов не скрываются); - из разведданных; - из экспериментальных наблюдений самолетов стороны В и измерений их характеристик (например, с помощью РЛС); - из экспериментальной обработки данных, полученных по макетам и моделям соответствующих самолетов стороны В - (наземные стенды или электродинамические расчеты); и т.д. Основными характеристиками являются: численность экипажей, высоты полета, крейсерские скорости, дальности полета, число двигателей и т.д. Рассматриваемое изучение позволит обнаружить и способы, которые применяет или предполагает применять сторона В для преодоления противовоздушной обороны (ПВО) стороны А и которые будут ухудшать возможности распознавания. Например, США по программе Стелс разработали бомбардировщик-невидимку для радиолокационных средств - В1). Таким образом нужно получить все мыслимые и существующие характеристики самолетов (признаки). Второй шаг, логично следующий из проведенного изучения - на основе знания тактико-технических характеристик средств противодействия стороне В, имеющихся у стороны А, и знаний авиации стороны В можно выделить ситуации применения ее, существенно отличающиеся по возможному ущербу и по возможности его предотвращения. Это фактически соответствует разделению самолетов стороны В на классы, для каждого из которых стороне А известно, что нужно предпринять. В результате может оказаться, что классов 3 (А1- бомбардировщики, А2 - штурмовики ,А3 - истребители), а средств противодействия - 2 (S1 - ЗУР, S2 - истребители с их вооружением). При этом наиболее эффективно их распределить следующим образом: А1 - S1 А2 - S2 А3 - S1 то есть, классы А1 и А3 с точки зрения противодействия желательно объединить в один класс. Если же средств противодействия - 3 (S1- ЗУР для больших высот, S2 - ЗУР маловысотные, S3 - истребители с их вооружением), то классы можно не объединять, а использовать стратегию А1 - S1 А2 - S2 А3 - S3 Третий шаг по созданию системы распознавания самолетов стороны В - выбор измерителей. Для обозначенных классов авиации из анализа имеющихся у стороны А средств наблюдения за самолетами (РЛС, ОЛС и т.п.) и полного перечня признаков соответствующих самолетов, полученных на первом нашем этапе разработки (например, крейсерские скорости, высоты полета, длины фюзеляжей, размахи крыльев, число двигателей и т.п.) выделить такие, которые могут быть определены по данным имеющихся средств измерений. Здесь возможны и разочарования: может не оказаться таких средств измерений. Тогда принимается решение о их создании. Итак, по каждому самолету есть N характеристик - признаков. Но это ничего не дает для решения задачи. Неизвестно, как разделить самолеты, пользуясь этими признаками по классам. Для этого и нужен 4-й шаг - априорное описание классов. То есть, необходимо на языке выбранных признаков описать каждый класс самолетов или тактических способов их применения. При этом в описании каждого класса должны содержаться сведения о: - наличии или отсутствии признаков качественного характера (тип двигателя, наличие постановщика помех, тип помех и т.п.); - диапазонах или законах распределения признаков, имеющих количественное выражение. Следует заметить, что все выбранные признаки должны получить соответствующее содержание (свое) для каждого класса. На этом подготовительный этап работы заканчивается. Теперь, если с помощью выбранных средств наблюдений за воздушными целями обнаружен неизвестный самолет и измерены (оценены) его признаки, то сопоставление полученных апостериорных данных (по результатам проведенных опытных измерений) с априорными (доопытным описанием классов) позволяет произвести его распознавание (отнесение к соответствующему классу А1,А2 самолетов стороны В). Здесь априорные данные - доопытное признаковое описание классов; апостериорные данные - послеопытный набор признаков классифицируемого самолета. Рассмотрим вторую возможную реализацию СР. Б. Распознавание заболеваний сердца. Требуется построить такого рода автоматическую систему. 1-й шаг создания такой системы - изучение всей информации о заболеваниях сердца. На первый взгляд эта задача кажется более легкой, чем распознавание самолетов, так как все сведения носят открытый характер. Однако в процессе пристального ее изучения может обнаружиться, что некоторые стороны изучения явления человечеству пока еще неизвестны. В результате нужно иметь здесь все возможные характеристики заболеваний (признаки): -зубцы кардиограмм; -поведение пульса; -поведение артериального давления и т.п. 2-й шаг - изучение всего арсенала средств лечения заболеваний и разделения их по классам, для которых известно, что нужно конкретно предпринимать для лечения (Посамолетам - тоже разделение их по классам). В результате может оказаться, что: -число средств лечения (S1, S2, …) больше числа классов заболеваний (А1, А2,....); тогда их просто комплексируют или принимают решение о дополнительном распознавании противопоказаний; -некоторые классы требуют одинаковых средств лечения (например, хирургическое вмешательство); тогда классы объединяют. 3-й шаг - из анализа имеющегося арсенала средств медицинской диагностики (кардиограф, фонокардиограф, УЗИ, рентген, анализ крови и т.д., и т.п.) и признаков классов заболеваний выделяют те признаки, которые реально определить имеющимися средствами ( Здесь возможны и решения о создании новых специальных средств диагностики). Заметим, что те же действия предпринимались и для измерения признаков самолетов стороны В. 4-й шаг - на языке отобранных признаков описывается аналогично самолетам каждый класс заболеваний сердца, то есть, составляется перечень значений признаков каждого класса. При этом для каждого класса должны быть выделены сведения о: - наличии или отсутствии признаков качественного характера; - диапазонах или законах распределения признаков, имеющих количественное выражение. Следует заметить, что все выбранные признаки должны получить соответствующее содержание (свое) для каждого класса. Теперь, если с помощью выбранных средств диагностики состояний сердца оценены признаки, характеризующие его деятельность, то сопоставление полученных апостериорных данных с априорными позволяет произвести распознавание конкретного класса заболеваний или отсутствие заболеваний вообще. Эти два примера показали, что подходы к построению систем распознавания практически ничем не отличаются, несмотря на специфику самих создаваемых систем. В результате получены общие представления о последовательности решения и составляющих задачи создания СР. В результате отмечаем, что несмотря на различие предметных областей подходы к построению СР - одинаковы. СР заболеваний сердца строилась также, как и СР самолетов, но заменить ее она не позволяет. Точно также СР самолетов не может применяться для решения задач распознавания заболеваний сердца. СР объектов (явлений), создаваемые человеком всегда узко специализированы в отличии от его собственных природных возможностей. Что же касается общего подхода к построению любой системы, то теперь, если у нас имеется некоторая совокупность объектов или явлений, которые необходимо распознавать (классифицировать), на основе обобщения действий при создании СР в 2-х рассмотренных примерах мы знаем, что последовательность решения соответствующих задач следующая: -в соответствии с выбранным принципом совокупность объектов или явлений подразделяется на ряд классов (говорят: назначается алфавит классов); -разрабатывается совокупность признаков (говорят: словарь); -на языке словаря признаков описывается каждый класс; -выбираются и (или) создаются средства определения признаков; -реализуется алгоритм сопоставления апостериорных и априорных данных и принимается решение о результатах распознавания. В то же время, несмотря на выполненное определение последовательности действий, проведенное рассмотрение не позволяет ответить на следующие вопросы: -как лучше производить разбиение объектов (самолеты, заболевания и пр.) по классам; -как накапливать и обрабатывать априорную информацию; -из каких соображений выбирать признаки; -как описывать классы на языке признаков; -на основе каких методов сравнивать априорную и апостериорную информацию; -когда и как появляется вся система распознавания. Система должна появляться с самого начала изучения вопроса. Этот вариант ее должен представлять собой модель-прообраз будущей СР. Без такой модели создание СР чаще всего невозможно. Без нее нельзя выбрать ни набор классов, ни перечень признаков, ни средства измерений их, ни решающие правила, обеспечивающие в комплексе, во взаимосвязи требуемое качество решений о принадлежности. Это обусловлено тем, что полная информация для создания СР вначале ее создания отсутствует и без экспериментальной отработки всего процесса принятия решений не всегда ясно, какая информация может вообще потребоваться. Поэтому модель должна позволить методом последовательных приближений внутренней структуры системы к требуемой достигнуть желаемого результата. В то же время вопросы моделирования СР не могут быть рассмотрены на нынешнем уровне полученных знаний. Выводы: 1. Задачи, решаемые в процессе создания СР, инвариантны относительно предметной области, имеют много общего, основываются на едином методологическом подходе. 2. Каждая СР индивидуальна и предназначается только для одного вполне конкретного вида объектов или явлений. Если найдена сфера применения распознавания, то соответствующая система должна разрабатываться заново с учетом новых специфических свойств объектов (явлений), определяющих как систему измерений характеристик, так и словарь признаков, алфавит классов и алгоритм принятия решений. 3. СР должна создаваться методом последовательных приближений внутренней структуры на ее математической модели по мере накопления необходимой информации.
|