12.04.2018

Методы самообучения распознаванию образов деталей


К методам самообучения прибегают при обработке экспериментальных данных и в случаях классификации объектов при отсутствии или неполноте априорной информации о принадлежности объектов классам. Первая попытка решить задачу самообучения была предпринята Ф. Розенблаттом с помощью перцептрона. Однако возможности перцептронов ограничены, и поэтому данный подход в задачах самообучения не получил дальнейшего развития. Одним из направлений в решении задач самообучения является статистический подход к распознаванию образов. Формальное решение задачи оказывается очень близким к аналогичным задачам обучения и встречается с теми же трудностями, что и описанные методы обучения. Отметим только, что параметры функции плотности вероятностей оцениваются с помощью таких методов, как метод моментов, либо по методу максимального правдоподобия.

Методы таксономии являются другим направлением в решении задач самообучения. Таксономия представляет собой разбиение пространства признаков на области (таксоны), удовлетворяющие заданному критерию качества, который может воспроизводить некоторые эвристические соображения, либо основываться на минимизации или максимизации какого-либо показателя качества. Одним из популярных показателей качества является сумма квадратов ошибки:
где N - число таксонов; Sj - множество образов, относящихся к j-му таксону; mj - вектор выборочных средних значений для S.

Используя подобные критерии, можно ожидать, что более "похожие" векторы будут объединяться в один таксон. Как правило, требование близости или сходства базируется на гипотезе компактности, используемой авторами всех работ кластерного анализа. Основные вопросы, касающиеся выбора количества таксонов и аналитического вида мер сходства, решаются в работах .

Для оценки близости между векторами обычно используют меру сходства, которая может быть положена в основу правила отнесения образов к области, характеризуемой некоторым центром класса; это может быть евклидово расстояние между образами X и Z:
Существуют и другие самостоятельные расстояния, которые в ряде случаев оказываются эффективны, так, например, расстояние Махаланобиса, определяемое для образа X как:
где m - вектор средних значений; [С] - ковариационная матрица совокупности образов.

Меры сходства не исчерпываются расстояниями, известны не метрические меры сходства, такие как:
представляющая собой косинус угла, образованного векторами X и Z, и достигающую максимума при совпадении их направлений.

Двоичным вариантом не метрической меры сходства является мера Танимото, определяемая как:
Некоторые задачи распознавания решаются с помощью факторного анализа. В классической постановке факторный анализ предназначен для оценки влияния некоторых ненаблюдаемых переменных (факторов) и основан на анализе матриц взаимных корреляций. Ограниченное применение факторного анализа объясняется тем, что получение результатов классификации связано с предварительной интерпретацией вычисленных факторов, что затруднительно при недостатке априорной информации.

Наибольшую известность в силу своей универсальности получили алгоритмы самообучения, основанные на методе потенциальных функций, методе "корреляционных плеяд", методе "масок" и ряда других.

Все описанные методы теории распознавания образов достаточно широко применяются на практике в зависимости от природы классифицируемых объектов. Примером этому могут служить работы, посвященные распознаванию графических образов, на основе которых созданы автоматы, способные считывать и воспроизводить печатные и рукописные тексты. Распознавание речевых сигналов и создание автоматов синхронного перевода отражено в работах, в основе которых лежит лингвистический метод распознавания. Разработке систем обработки данных и прогнозирования метеорологических условий с помощью статистических методов распознавания посвящены работы. Методы теории распознавания находят применение в геологии, палеонтологии, социологии, криминалистике, а также технике, медицине и других областях знания.

Проведенный анализ методов показал, что наиболее эффективны аналитические методы, предполагающие построение дискриминантной функции, описывающей разделяющую поверхность между классами образов.

Разделяющие поверхности полностью определяются набором непрерывных дискриминантных функций d1(X), d2(X), ..., dn(X). Построение дискриминантной функции упрощается, если ограничить класс функций, в котором ее определяют. Класс дискриминантных функций определяется с помощью параметров W, называемых весами, от которых она зависит: d(x) = f(X, W1, W2, ..., Wn). Процесс обучения или самообучения заключается в подборе указанных параметров, влияние которых выражается в изменении ориентации разделяющей поверхности в признаковом пространстве.
Одним из классов, нашедших достаточно широкое применение, является класс линейных дискриминантных функций (рис. 2.9). Для распознавания сложных объектов следует использовать класс нелинейных дискриминантных функций.

Распространенным приложением этого класса функций является применение квадратичной функции.

Наиболее универсальным является применение потенциальных функций из нелинейного класса функций. Универсальность методов распознавания, использующих для построения дискриминантных функций потенциальные функции, состоит в том, что они могут быть использованы при решении задач распознавания как в детерминированной, так и в вероятностной постановке.





Яндекс.Метрика