12.04.2018

Методы обучения распознаванию образов деталей


Совокупность методов обучения можно разделить на статистические (вероятностные) и детерминированные в соответствии с встречающимися ситуациями (рис. 2.8).

Статистические методы образуют математическую основу статистической теории распознавания образов. Методы предполагают использование аппарата математической статистики, теории вероятностей, теории игр и статистических решений, теории информации.

При использовании детерминированных методов отсутствует необходимость учета законов распределения объектов в заданных классах, что является важным достоинством и делает эти методы универсальными в практическом применении.

Естественны попытки комплексного применения методов, которые обусловили детерминированно-статистический подход к распознаванию образов.

Эвристические методы обучения, появившиеся первыми, реализованы во многих вариантах, прежде всего, это перцептрон.
Э.М. Браверман выдвинул гипотезу о "компактности" образов, состоявшую в том, что реализации одного и того же образа отображаются в геометрически близких друг к другу точках выборочного пространства. На основе этой гипотезы предложена математическая интерпретация работы перцептрона. Перцептрон является реализацией одного из вариантов итерационного алгоритма, решающего систему линейных неравенств.

Серия работ посвящена вопросам обучения распознаванию образов с позиций формального понятия "обобщенного портрета", где построение дискриминантных функций основано на минимизации функции потерь, называемой средним риском. Нахождение "обобщенного портрета" эквивалентно определению весового вектора л1: ф(л1, л2, ..., лn), с которым суммируются возбуждения пороговых ассоциативных элементов в перцептронной схеме.

Известен ряд работ, в которых описаны методы построения оптимальной разделяющей поверхности. Задача выбора параметров линейного дискриминантного правила сводится к решению системы линейных неравенств при помощи аппарата линейного программирования. Модификация рекуррентных алгоритмов построения дискриминантной функции рассмотрена в работах. На практике часто приходится отказываться от перцептронной схемы и искать разделение заданного пространства признаков с помощью более сложных разделяющих поверхностей.

Аппроксимация дискриминантных функций проводится перекрытием заданного пространства признаков набором областей, выделенных с помощью гиперсфер, параметры которых определяются таким образом, чтобы соответствующие им области содержали объекты обучающей выборки только одного класса в каждой области.

Кроме линейных и квадратичных, часто используются полиномиальные дискриминантные функции. В процессе обучения определяется такое количество членов аппроксимирующего полинома с их коэффициентами, чтобы заданный критерий качества обучения достигал оптимального значения при минимальном уровне ошибок. В этом отношении метод группового учета аргументов требует априорного знания только системы элементарных функций. Рассматривая методы обучения распознаванию образов, в основу которых положены сведения о классе дискриминантных функций, отметим, что полной характеристикой векторов обучающей выборки является функция плотности вероятности.

Задачи распознавания образов решаются оптимально по Байесу не только путем задания априорных вероятностей p(f1), р(f2), ..., p(fk) классов f1, f2, ..., fk, но и посредством известных заранее условных функций плотности вероятностей: р(Х/f1), p(X/f2), ...., р(X/fk). Аналитическое решение в минимаксной постановке приведено в работе. При неполноте информации об объектах применение метода затруднительно.

Для распознавания сложных визуальных изображений разработан ряд методов, одним из которых является лингвистический метод, использующий аппарат формальных языков и грамматик для описания структур распознаваемых объектов. Методы применимы только при наличии специальных программ трансляторов для обработки формальных языков.

Теоретические основы принятия решений при распознавании образов формулируют представления о классах как о многомерных случайных процессах. Каждый член класса рассматривается как реализация случайного процесса, представленная в виде n-мерного вектора, каждая координата которого соответствует некоторому физически измеренному свойству процесса. Распознавание образов трактуется как двойственная задача: с одной стороны, изучение свойств класса по совокупности n-мерного вектора (обучение), и с другой стороны, классификация нового вектора, не использованного в процессе обучения (распознавание).

Рассматриваемые методы обучения применимы только в случае полной априорной информации об объектах.

Поскольку для разбиения пространства признаков на области, содержащие компактные группы векторов выборки, используется самообучение распознаванию образов (автоматическая классификация), рассмотрим известные методы.





Яндекс.Метрика