Первый способ повышения точности распознавания типов мыслительной деятельности в интерфейсах мозг-компьютер базируется на выделении наиболее представительных/ информативных признаков из общего описания.
Как правило, каждому каналу (отведению) в записи электроэнцефалограммы (ЭЭГ) сопоставляется несколько характерных признаков. При этом чем больше общее число признаков, тем больше примеров требуется для корректного обучения классификатора. Однако на практике получение больших выборок обучающих данных бывает затруднено. В связи с этим отбор информативных признаков является важной операцией, позволяющей выделить признаки, несущие не «шум», а полезную для данной задачи информацию.
Для отбора информативных признаков можно использовать следующие подходы:
- Выбор информативных признаков на основе методов кластеризации. Идея метода заключается в разбиение выборки признаков на кластеры/группы, состоящие из схожих признаков, и выделении в каждой группе по одному наиболее типичному представителю. В качестве метрики на множестве признаков может использоваться, например, коэффициент линейной корреляции.
- Выбор информативных признаков с помощью поисковых методов. Идея метода состоит в применении процедуры направленного перебора для выделения подмножества признаков, превосходящего по полезным свойствам полный набор признаков. Критерием полезности здесь служит точность классификации, достижимая на данном подмножестве. К методам данного класса можно отнести генетический алгоритм.
Второй способ повышения точности классификации основывается на адаптивном выделении характерных признаков, которое учитывало бы индивидуальные особенности пользователей интерфейса (например, учет вариативности сенсомоторных ритмов ЭЭГ).
Данный подход может быть реализован, в частности, с помощью методов автоматического поиска наиболее информативных, с точки зрения разделения классов, частотных диапазонов сигнала ЭЭГ.
Задачу поиска частотных диапазонов в данном случае можно рассматривать, как задачу однокритериальной оптимизации, в которой в качестве варьируемых параметров выступают границы частотных диапазонов, а в качестве целевой функции - оценка достижимой точности классификации. Решение поставленной задачи можно искать с помощью генетического алгоритма.