Процесс решения задачи с помощью НС начинается со сбора данных для обучения. Обучающий набор данных представляет собой уже известную информацию, для которой указаны значения входящих и выходящих переменных. Выбор переменных, по крайней мере первоначальный, может осуществляться интуитивно. На первом этапе рассматривается вся совокупность переменных, которые способны оказывать влияние на результат. Затем это множество сокращается.
Ранее мы показали, что оценка кредитоспособности проводится на основе всестороннего анализа деятельности заемщика. Это, например, и расчет финансовых коэффициентов, и определение величины денежного потока, и учет отраслевых особенностей деятельности, макроэкономического положения в стране. Совокупность такой информации о деятельности заемщика и представляет собой набор входящих переменных. Такому набору данных соответствуют уже рассчитанные значения кредитных. рейтингов, т.е. выходящие переменные.
Вопрос о том, какие данные взять в качестве входных для НС,— один из самых сложных. Это объясняется несколькими причинами. Во-первых, при решении реальных задач часто неизвестно, как прогнозируемый показатель связан с имеющимися данными. Поэтому собираются разнообразные данные в больших объемах; среди этих данных предположительно есть и важные, и такие, ценность которых не известна и сомнительна. Во-вторых, в задачах нелинейной природы среди параметров могут быть взаимозависимые и избыточные. Например, каждый из двух параметров может сам по себе ничего не значить, но вместе они несут чрезвычайно важную информацию. Поэтому попытки ранжировать параметры по степени значимости могут оказаться неправильными. И наконец, иногда лучше просто убрать некоторые переменные, в том числе несущие значимую информацию, чтобы уменьшить число входных переменных, а значит, и сложность задачи, и размеры сети. Проблема значительного усложнения расчетов за счет незначительного увеличения числа входящих переменных получила название «проклятие размерности».
Единственный способ получить гарантию того, что входящие данные выбраны наилучшим образом,— перепробовать все возможные варианты входных наборов и выбрать наилучший. На практике сделать это невозможно из-за огромного количества вариантов. Одно из действенных средств решения вопроса генетический алгоритм отбора входных данных.
Теоретические разработки в области нейронных сетей показали возможность использования НС в качестве надежного и действенного инструмента анализа и прогнозирования социально-экономических явлений, в том числе в сфере расчета кредитных рисков индивидуальных заемщиков — физических лиц.
Как уже было показано, процесс анализа кредитоспособности заемщика, другими словами, присвоение кредитного рейтинга, заключается в переходе от нескольких показателей к интегрированному значению — кредитному рейтингу. В течение последних 50 лет в литературе по данной тематике, а также в банковской практике сложилось устойчивое представление о существовании линейной зависимости между кредитным рейтингом и показателями, характеризующими деятельность заемщика. Такое положение приводит к тому, что методики, используемые коммерческими банками при оценке кредитоспособности заемщика, субъективны, не отражают достоверно и в полной мере экономическое положение анализируемого предприятия. Гипотезы о нелинейной зависимости показателей долгое время не могли быть рассмотрены на практике в связи с отсутствием необходимого инструментария. Появление нейронных сетей позволяет открыть новые перспективы в этой области. В данном параграфе речь идет о возможности использования механизма НС для эффективной оценки кредитоспособности заемщика.