Визуализация данных в науке и технике. Технология визуализации учебной информации

В последние десятилетия в области передачи визуальной информации произошли почти революционные изменения:

колоссально возросли объем и количество передаваемой информации;

сложились новые виды визуальной информации и способы ее передачи.

Технический прогресс и формирование новой визуальной культуры неминуемо накладывает свой отпечаток на свод требований, предъявляемых к деятельности педагогов.

Одним из средств улучшения профессиональной подготовки будущих учителей, способных к педагогическим инновациям, к разработке технологий проектирования эффективной учебной деятельности школьника в условиях доминирования визуальной среды, считается формирование у них особых умений визуализации учебной информации. Термин «визуализация» происходит от латинского visualis - воспринимаемый зрительно, наглядный. Визуализация информации представление числовой и текстовой информации в виде графиков, диаграмм, структурных схем, таблиц, карт и т.д. Однако такое понимание визуализации как процесса наблюдения предполагает минимальную мыслительную и познавательную активность обучающихся, а визуальные дидактические средства выполняют лишь иллюстративную функцию. Иное определение визуализации дается в известных педагогических концепциях (теории схем - Р.С. Андерсон, Ф. Бартлетт; теории фреймов - Ч. Фолкер, М. Минский и др.), в которых этот феномен истолковывается как вынесение в процессе познавательной деятельности из внутреннего плана во внешний план мыслеобразов, форма которых стихийно определяется механизмом ассоциативной проекции .

Аналогичным образом понятие визуализации понимает Вербицкий А.А.: «Процесс визуализации - это свертывание мыслительных содержаний в наглядный образ; будучи воспринятым, образ может быть развернут и служить опорой адекватных мыслительных и практических действий» . Данное определение позволяет развести понятия «визуальный», «визуальные средства» от понятий «наглядный», «наглядные средства». В педагогическом значении понятия «наглядный» всегда основано на демонстрации конкретных предметов, процессов, явлений, представление готового образа, заданного извне, а не рождаемого и выносимого из внутреннего плана деятельности человека. Процесс разворачивания мыслеобраза и «вынесение» его из внутреннего плана во внешний план представляет собой проекцию психического образа. Проекция встроена в процессы взаимодействия субъекта и объектов материального мира, она опирается на механизмы мышления, охватывает различные уровни отражения и отображения, проявляется в различных формах учебной деятельности .

Если целенаправленно рассматривать продуктивную познавательную деятельность как процесс взаимодействия внешнего и внутреннего планов, как вынесение будущих продуктов деятельности из внутреннего плана во внешний, как корректировку и реализацию во внешнем плане замыслов, то визуализация выступает в качестве главного механизма, обеспечивающего диалог внешнего и внутреннего планов деятельности. Следовательно, в зависимости от свойств дидактических визуальных средств зависит уровень активизации мыслительной и познавательной деятельности обучающихся.

В связи с этим возрастает роль визуальных моделей представления учебной информации, позволяющие преодолеть затруднения, связанные с обучением, опирающимся на абстрактно-логическое мышление. В зависимости от вида и содержания учебной информации используются приемы ее уплотнения или пошагового развертывания с применением разнообразных визуальных средств. В настоящее время в образовании перспективной представляется применение когнитивной визуализации дидактических объектов . Под это определение фактически подпадают все возможные виды визуализации педагогических объектов, функционирующие на принципах концентрации знаний, генерализации знаний, расширения ориентировочно-презентационных функций наглядных дидактических средств, алгоритмизации учебно-познавательных действий, реализуемая в визуальных средств.

На практике, используются более сотни методов визуального структурирования - от традиционных диаграмм и графов до «стратегических» карт (roadmaps), лучевых схем-пауков (spiders) и каузальных цепей (causal chains). Такое многообразие обусловлено существенными различиями в природе, особенностях и свойствах знаний различных предметных областей. Наибольшей информационной емкостью, на наш взгляд, универсальностью и интегративностью обладают структурно-логические схемы. Такой способ систематизации и визуального отображения учебной информации основывается на выявлении существенных связей между элементами знания и аналитико-синтетической деятельности при переводе вербальной информации в невербальную (образную), синтезирование целостной системы элементов знаний. Освоение перечисленных видов по конкретизации смыслов, разворачиванию логической цепочки размышлений, описанию образов и их признаков мыслительной деятельности, а также операций с помощью вербальных средств обмена информацией формирует продуктивные способы мышления, столь необходимые специалистам при современных темпах развития науки, техники и технологий. Согласно достижениям нейропсихологии «обучение эффективно тогда, когда потенциал мозга человека развивается через преодоление интеллектуальных трудностей в условиях поиска смысла через установление закономерностей» .

Структурно-логические схемы создают особую наглядность, располагая элементы содержания в нелинейном виде и выделяя логические и преемственные связи между ними. Такая наглядность опирается на структуру и ассоциативные связи, характерные для долговременной памяти человека. В некотором роде структурно-логические схемы выступают в роли промежуточного звена между внешним линейным содержанием (текст учебника) и внутренним нелинейным содержанием (в сознании). В качестве одного из достоинств структурно-логических схем А.В. Петров выделяет то, что «она выполняет функцию объединения понятий в определенные системы» . Сами по себе понятия ничего не могут сказать о содержании предмета обучения, но будучи связанными определенной системой, они раскрывают структуру предмета, его задачи и пути развития. Понимание и осмысление новой ситуации возникает тогда, когда мозг находит опору в прежних знаниях и представлениях.

Отсюда вытекает важность постоянной актуализации прежнего опыта для овладения новыми знаниями. Процесс изучения нового материала можно представить как восприятие и обработку новой информации путем ее соотнесения с понятиями и способами действий, известными обучающемуся, посредством использования освоенных им интеллектуальных операций. Поступающая в мозг по различным каналам информация концептуализируется и структурируется, образуя в сознании концептуальные сети. Новая информация встраивается в существующие когнитивные схемы, преобразует их и формирует новые когнитивные схемы и интеллектуальные операции. При этом устанавливаются связи между известными понятиями и способами действий и новыми знаниями, возникает структура нового знания .

По данным психологов новая информация усваивается и запоминает лучше тогда, когда знания и умения «запечатлеваются» в системе визуально-пространственной памяти , следовательно представление учебного материала в структурированном виде позволяет быстрее и качественнее усваивать новые системы понятий, способы действий. В качестве примера можно привести визуальную схему: «Цветовая модель RGB» (см. рис. 2).



Рис. 2.

Визуализация учебного материала открывает возможность не только собрать воедино все теоретические выкладки, что позволит быстро воспроизвести материал, но и применять схемы для оценивания степени усвоения изучаемой темы. В практике также широко используется метод анализа конкретной схемы или таблицы, в котором вырабатывают навыки сбора и обработки информации. Метод позволяет включить обучаемых в активную работу по применению теоретической информации в практической работе. Особое место уделяется совместному обсуждению, в процессе которого есть возможность получать оперативную обратную связь, понимать лучше себя и других людей. Обобщая сказанное, заметим, что в зависимости от места и назначения визуальных дидактических материалов в процессе формирования понятия (изучении теории, явления) к выбору определенной структурной модели и наглядному отображению содержания обучения должны быть предъявлены различные психолого-педагогические требования.

При визуализации учебного материала следует учитывать, что наглядные образы сокращают цепи словесных рассуждений и могут синтезировать схематичный образ большей «емкости», уплотняя тем самым информацию. В процессе разработки учебно-методических материалов необходимо контролировать степень обобщения содержания обучения, дублировать вербальную информацию образной и наоборот, чтобы при необходимости звенья логической цепи были полностью восстановлены обучающимися.

Другим важным аспектом использования визуальных учебных материалов является определение оптимального соотношения наглядных образов и словесной, символьной информации. Понятийное и визуальное мышление на практике находятся в постоянном взаимодействии. Они, дополняя друг друга, раскрывают различные стороны изучаемого понятия, процесса или явления. Словесно-логическое мышление дает нам более точное и обобщенное отражение действительности, но это отражение абстрактно. В свою очередь, визуальное мышление помогает организовать образы, делает их целостными, обобщенными, полными.

Визуализация учебной информации позволяет решить целый ряд педагогических задач:

обеспечение интенсификации обучения;

активизации учебной и познавательной деятельности;

формирование и развитие критического и визуального мышления;

зрительного восприятия;

образного представления знаний и учебных действий;

передачи знаний и распознавания образов;

повышения визуальной грамотности и визуальной культуры.

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений DM - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д.

Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

представлять пользователю информацию в наглядном виде;

компактно описывать закономерности, присущие исходному набору данных;

снижать размерность или сжимать информацию;

восстанавливать пробелы в наборе данных;

находить шумы и выбросы в наборе данных.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято

классифицировать на две группы :

представление данных в одном, двух и трех измерениях;

представление данных в четырех и более измерениях.

Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Наиболее известные способы многомерного представления информации:

параллельные координаты;

"лица Чернова";

лепестковые диаграммы.

Представление пространственных характеристик

Отдельным направлением визуализации является наглядное представление

пространственных характеристик объектов. В большинстве случаев такие средства выделяют на карте отдельные регионы и обозначают их различными цветами в зависимости от значения анализируемого показателя.



Карта представлена в видеграфического интерфейса, отображающего данные в виде трехмерного ландшафтапроизвольно определенных и позиционированных форм (столбчатых диаграмм, каждая синдивидуальными высотой и цветом). Такой способ позволяет наглядно показыватьколичественные и реляционные характеристики пространственно-ориентированных

данных и быстро идентифицировать в них тренды.

Процесс Data Mining. Анализ предметной области. Постановка задачи. Подготовка данных.

Процесс Data Mining. Начальные этапы

Процесс DM является своего рода исследованием. Как любое исследование, этот процесс состоит из определенных этапов, включающих элементы сравнения, типизации, классификации, обобщения, абстрагирования, повторения.

Процесс DM неразрывно связан с процессом принятия решений.

Процесс DM строит модель, а в процессе принятия решений эта модель эксплуатируется.

Рассмотрим традиционный процесс DM. Он включает следующие этапы:

анализ предметной области;

постановка задачи;

подготовка данных;

построение моделей;

проверка и оценка моделей;

выбор модели;

применение модели;

коррекция и обновление модели.

В этой лекции мы подробно рассмотрим первые три этапа процесса Data Mining,

остальные этапы будут рассмотрены в следующей лекции.

Этап 1. Анализ предметной области

Исследование - это процесс познания определенной предметной области, объекта или явления с определенной целью.

Процесс исследования заключается в наблюдении свойств объектов с целью выявления и оценки важных, с точки зрения субъекта-исследователя, закономерных отношений между показателями данных свойств.

Решение любой задачи в сфере разработки программного обеспечения должно начинаться с изучения предметной области.

Предметная область - это мысленно ограниченная область реальной действительности, подлежащая описанию или моделированию и исследованию.

Предметная область состоит из объектов, различаемых по свойствам и находящихся в определенных отношениях между собой или взаимодействующих каким-либо образом.

Предметная область - это часть реального мира, она бесконечна и содержит как

существенные, так и не значащие данные, с точки зрения проводимого исследования.

Исследователю необходимо уметь выделить существенную их часть. Например, при решении задачи "Выдавать ли кредит?" важными являются все данные про частную жизнь клиента, вплоть до того, имеет ли работу супруг, есть ли у клиента несовершеннолетние дети, каков уровень его образования и т.д. Для решения другой задачи банковской деятельности эти данные будут абсолютно неважны. Существенность данных, таким образом, зависит от выбора предметной области.

С возрастанием количества накапливаемых данных, даже при использовании сколь угодно мощных и разносторонних алгоритмов Data Mining, становится все сложнее "переваривать" и интерпретировать полученные результаты. А, как известно, одно из положений Data Mining - поиск практически полезных закономерностей. Закономерность может стать практически полезной, только если ее можно осмыслить и понять.

В 1987 году по инициативе ACM SIGGRAPH IEEE Computer Society Technical Committee of Computer Graphics, в связи с необходимостью использования новых методов, средств и технологий данных, были сформулированы соответствующие задачи направления визуализации. К способам визуального или графического представления данных относят графики, диаграммы, таблицы, отчеты, списки, структурные схемы, карты и т.д. Визуализация традиционно рассматривалась как вспомогательное средство при анализе данных, однако сейчас все больше исследований говорит о ее самостоятельной роли.

Традиционные методы визуализации могут находить следующее применение:

Ø представлять пользователю информацию в наглядном виде;

Ø компактно описывать закономерности, присущие исходному набору данных;

Ø снижать размерность или сжимать информацию;

Ø восстанавливать пробелы в наборе данных;

Ø находить шумы и выбросы в наборе данных.

Визуализация инструментов Data Mining

Каждый из алгоритмов Data Mining использует определенный подход к визуализации. В ходе использования каждого из методов, рассмотренных выше, а точнее, их программных реализаций, мы получали некие визуализаторы, при помощи которых удавалось интерпретировать результаты, полученные в результате работы соответствующих методов и алгоритмов.

Ø Для деревьев решений это визуализатор дерева решений, список правил, таблица сопряженности.

Ø Для карт Кохонена: карты входов, выходов, другие специфические карты.

Ø Для линейной регрессии в качестве визуализатора выступает линия регрессии.

Ø Для кластеризации: дендрограммы, диаграммы рассеивания.

Диаграммы и графики рассеивания часто используются для оценки качества работы того или иного метода.

Все эти способы визуального представления или отображения данных могут выполнять одну из функций:

Ø являются иллюстрацией построения модели (например, представление структуры (графа) нейронной сети);

Ø помогают интерпретировать полученный результат;

Ø являются средством оценки качества построенной модели;

Ø сочетают перечисленные выше функции (дерево решений, дендрограмма).

Визуализация Data Mining моделей



Первая функция (иллюстрация построения модели), по сути, является визуализацией Data Mining модели. Существует много различных способов представления моделей, но графическое ее представление дает пользователю максимальную "ценность". Пользователь, в большинстве случаев, не является специалистом в моделировании, чаще всего он эксперт в своей предметной области. Поэтому модель Data Mining должна быть представлена на наиболее естественном для него языке или, хотя бы, содержать минимальное количество различных математических и технических элементов.

Таким образом, доступность является одной из основных характеристик модели Data Mining. Несмотря на это, существует и такой распространенный и наиболее простой способ представления модели, как "черный ящик". В этом случае пользователь не понимает поведения той модели, которой пользуется. Однако, несмотря на непонимание, он получает результат - выявленные закономерности. Классическим примером такой модели является модель нейронной сети.

Другой способ представления модели - представление ее в интуитивном, понятном виде. В этом случае пользователь действительно может понимать то, что происходит "внутри" модели. Таким образом, можно обеспечить его непосредственное участие в процессе. Такие модели обеспечивают пользователю возможность обсуждать ее логику с коллегами, клиентами и другими пользователями, или объяснять ее.

Понимание модели ведет к пониманию ее содержания. В результате понимания возрастает доверие к модели. Классическим примером является дерево решений. Построенное дерево решений действительно улучшает понимание модели, т.е. используемого инструмента Data Mining.

Кроме понимания, такие модели обеспечивают пользователя возможностью взаимодействовать с моделью, задавать ей вопросы и получать ответы. Примером такого взаимодействия является средство "что, если". При помощи диалога "система-пользователь" пользователь может получить понимание модели.

Примерами средств визуализации, при помощи которых можно оценить качество модели, являются диаграмма рассеивания, таблица сопряженности, график изменения величины ошибки:

Ø Диаграмма рассеивания представляет собой график отклонения значений, прогнозируемых при помощи модели, от реальных. Эти диаграммы используют для непрерывных величин. Визуальная оценка качества построенной модели возможна только по окончанию процесса построения модели.

Ø Таблица сопряженности используется для оценки результатов классификации. Такие таблицы применяются для различных методов классификации. Оценка качества построенной модели возможно только по окончанию процесса построения модели.

Ø График изменения величины ошибки. График демонстрирует изменение величины ошибки в процессе работы модели. Например, в процессе работы нейронных сетей пользователь может наблюдать за изменением ошибки на обучающем и тестовом множествах и остановить обучение для недопущения "переобучения" сети. Здесь оценка качества модели и его изменения может оцениваться непосредственно в процессе построения модели.

Примерами средств визуализации, которые помогают интерпретировать результат, являются: линия тренда в линейной регрессии, карты Кохонена, диаграмма рассеивания в кластерном анализе.

Методы визуализации

Методы визуализации, в зависимости от количества используемых измерений, принято классифицировать на две группы:

1. Представление данных в одном, двух и трех измерениях

К этой группе методов относятся хорошо известные способы отображения информации, которые доступны для восприятия человеческим воображением. Практически любой современный инструмент Data Mining включает способы визуального представления из этой группы.

В соответствии с количеством измерений представления это могут быть следующие способы:

Ø одномерное измерение, или 1-D;

Ø двумерное измерение, или 2-D;

Ø трехмерное или проекционное измерение, или 3-D.

Следует заметить, что наиболее естественно человеческий глаз воспринимает двухмерные представления информации.

При использовании двух- и трехмерного представления информации пользователь имеет возможность увидеть закономерности набора данных:

Ø его кластерную структуру и распределение объектов на классы (например, на диаграмме рассеивания);

Ø топологические особенности;

Ø наличие трендов;

Ø информацию о взаимном расположении данных;

Ø существование других зависимостей, присущих исследуемому набору данных.

Если набор данных имеет более трех измерений, то возможны такие варианты:

ü использование многомерных методов представления информации (они рассмотрены ниже);

ü снижение размерности до одно-, двух- или трехмерного представления. Существуют различные способы снижения размерности. Для снижения размерности и одновременного визуального представления информации на двумерной карте используются самоорганизующиеся карты Кохонена.

2. Представление данных в 4 + измерениях

Представления информации в четырехмерном и более измерениях недоступны для человеческого восприятия. Однако разработаны специальные методы для возможности отображения и восприятия человеком такой информации.

Компьютерная графика -- это область информатики, в которой рассматриваются алгоритмы и технологии визуализации данных. Развитие компьютерной графики определяется в основном двумя факторами: реальными потребностями потенциальных пользователей и возможностями аппаратного и программного обеспечения. Потребности потребителей и возможности техники неуклонно растут, и на сегодняшний день компьютерная графика активно используется в самых различных сферах. Можно выделить следующие области применения компьютерной графики:

  1. Визуализация информации.
  2. Моделирование процессов и явлений.
  3. Проектирование технических объектов.
  4. Организация пользовательского интерфеса.

Визуализация информации

В большинстве научных статей и отчетов не обойтись без визуализации данных. Достойная форма представления данных -- это хорошо структурированная таблица с точными значениями функции в зависимости от некоторых переменных. Но часто более наглядной и эффективной формой визуализации данных является графическая, а, например, при моделировании и обработке изображений -- единственно возможная. Некоторые виды отображения информации различного происхождения перечислены в следующей таблице:

Многие программы для финансовых, научных, технических расчётов используют эти и некоторые другие способы визуализации данных. Визуальное представление информации является прекрасным инструментом при проведении научных исследований, наглядным и веским аргументом в научных статьях и дискуссиях.

Моделирование процессов и явлений

Современные графические системы обладают достаточной производительностью для создания сложных анимационных и динамических изображений. В системах моделирования, которые также называются симуляторами, пытаются получить и визуализировать картину процессов и явлений, которые происходят или могли бы происходить в реальности. Самым известным и наиболее сложным примером такой системы является симулятор полётов, который используют для моделирования обстановки и процесса полёта при обучении пилотов. В оптике симуляторы используются для моделирования сложных, дорогостоящих или опасных явлений. Например, моделирование формирования изображения или моделирования процессов в лазерных резонаторах.

Проектирование технических объектов

Проектирование является одной из основных стадий создания изделия в технике. Современные графические системы позволяют наглядно визуализировать проектируемый объект, что способствует скорейшему выявлению и решению многих проблем. Разработчик судит о своей работе не только по цифрам и косвенным параметрам, он видит предмет проектирования на свойм экране. Компьютерные системы позволяют организовать интерактивное взаимодействие с проектируемым объектом и иммитировать изготовление макета из пластичного материала. CAD-системы существенно упрощают и ускоряют работу инженера-конструктора, освобождая его от рутинного процесса черчения.

Организация пользовательского интерфеса

В последние 5-7 лет визуальная парадигма при организации интерфеса между компьютером и конечным пользователем стала доминирующей. Оконный графический интерфейс встроен во многие современные операционные системы. Уже достаточно стандартизован набор элементов управления, которые используются при построении такого интерфейса. Большинство пользователей уже привыкло к такой организации интерфейса, который позволяет пользователям чувствовать себя более комфортно и повышать эффективность взаимодействия.

Всё это, говорит о том, что в самой операционной системе должны быть уже реализованы достаточно большое количество функций для визуализации элементов управления. Например, операционная система Windows предоставляет разработчикам GDI (Graphics Device Interface). Как показывает практика для некоторых приложений возможностей, предоставляемых системной API, вполне достаточно для визуализации обрабатываемых данных (построения простейших графиков, представления моделируемых объектов и явлений). Но такие недостатаки, как низкая скорость отображения, отсутствие поддержки трехмерной графики не способствуют ее использованию для визуализации научных данных и компьютерного моделирования. В некоторых научных и технических программах со сложным графическим выводом требуются функции для более быстрой, мощной и гибкой визуализации вычисленных данных, моделируемых явлений, проектируемых объектов.

Технологии компьютерной графики

В современных научных и технических приложениях сложный графическая вызуализация реализуется с использованием библиотеки OpenGL, которая стала стандартом de facto в области трёхмерной визуализации. Библиотека OpenGL представляет собой высокоэффективный программный интерфейс к графическому аппаратному обеспечению. Наибольшую призводительность эта библиотека позволяет достичь в аппаратных системах работающих на основе современных графических ускорителей (аппаратное обеспечение, освобождающее процессор и выполняющее вычисления, необходимые для визуализации).

Архитектура и алгоритмы были библиотеки разработаны в 1992 году специалистами фирмы Silicon Graphics, Inc. (SGI) для собственного аппаратного обеспечения графических рабочих станций Iris. Через несколько лет библиотека была портирована на многие аппаратно-программные платформы (в том числе Intel+Windows) и сегодня является надёжной многоплатформенной библиотекой.

Библиотека OpenGL является бесплатно распространяемой, что является ее несомненным достоинством и причиной столь широкого использования.

OpenGL является не объектно-ориентированной, а процедурной библиотекой (около сотни комманд и функций), написанная на языке С. С одной стороны - это недостаток (компьютерная графика - благодатная область использования объектно-ориентированного программирования), но зато работать с OpenGL могут программисты работающие на C++, Delphi, Fortran и даже Java и Python.

Совместно с OpenGL обычно используется несколько вспомогательных библиотек, которые помогают наcтроить работу библиотеки в данной среде или выполнить более сложные, комплексные функции визуализации, которые реализуются посредством примитивных функций OpenGL. Кроме того существует большое количество графических библиотек специализированного назначения, которые используют библиотеку OpenGL в качестве низкоуровневого базиса, своеобразного ассемблера, на основе которого строятся сложные функции графического вывода (OpenInventor, vtk, IFL и многие другие). С сообществом пользователей OpenGL можно познакомиться на сайте www.opengl.org

Фирма Microsoft тоже разработала и предлагает использовать для подобных целей мультимедийную библиотеку DirectX. Эта библиотека широко используется в игровых и мультимедийных приложениях, а в научных и технических приложениях распространения не получила. Причина заключатся, скорее всего в том, что DirectX работает только под Windows.

ВИЗУАЛИЗАЦИЯ РЕЗУЛЬТАТОВ ЭКСПЕРИМЕНТАЛЬНЫХ ИССЛЕДОВАНИЙ

(Томск, Томский политехнический университет)

Введение. Область применения и возможности численного экспериментов растут вместе с развитием вычислительной техники. Увеличиваются сложности и многообразие решаемых задач. Огромный объём получаемой в ходе эксперимента информации требует адекватных способов её представления. Вместо массивов числовых данных и простых графиков всё шире используются наглядные визуальные образы, облегчающие полноценное и своевременное осмысление получаемых результатов.

Визуализация данных – задача, с которой сталкивается в своей работе любой исследователь. К задаче визуализации данных сводится проблема представления в наглядной форме данных эксперимента или результатов теоретического исследования. Традиционные инструменты в этой области – графики и диаграммы – плохо справляются с задачей визуализации, когда возникает необходимость изобразить более трех взаимосвязанных величин. С другой стороны, существует мощнейший инструмент изображения информации, привязанной к географической сетке координат. Это очень быстро развивающийся сегодня арсенал ГИС-технологий (ГИС – геоинформационные системы). К сожалению, как только исчезает подложка для изображения информационных слоев – географическая карта – все методы ГИС остаются не у дел.

Основные принципы визуализации информации. Для оптимального отображения информации в приводится ряд рекомендаций, которые могут быть использованы при разработке подсистем визуализации:

1. Состав и форма отображаемой информации, а также задачи и цели подсистемы визуализации определяются целями и задачами системы. В информационные модели должны быть представлены только те свойства отношения, связи управляемых объектов, которые существенны и имеют определенное функциональное значение. Объем, состав, форма предъявленной информации должна соответствовать как решаемым задачам, так и психофизиологическим возможностям человека.

2. Модель должна быть наглядной, т. е. оператор должен иметь возможность воспринимать сведения быстро и без кропотливого анализа. Таким образом, модель может давать наглядное представление о пространственном расположении объектов, что означает быть геометрически подобной их действительному расположению. В этом случае оператор будет иметь наглядное представление о таких свойствах управляемых объектов, как расстояние между ними, их принадлежность к какой-либо территориальной группе и т. п.

Достоинства наглядных моделей заключаются в том, что процесс восприятия такой же, как процесс восприятия реального объекта. Основная задача при разработке наглядных информационных моделей заключается в определении признаков, которые целесообразно отобразить наглядно и в допустимой степени схематизации. Но наглядность информационных моделей не всегда легко достижима, так как нередки случаи, когда объекты управления не обладают наглядными признаками. В этих случаях приходится решать задачи, близкие к тому, что в методологии науки определяется как визуализация понятий. Информационные модели, построенные по данному принципу, называются абстрактными, Достоинства абстрактных моделей заключается в том, что они отображают свойства объекта, которые недоступны непосредственному наблюдателю.

3. Достижением легкой воспринимаемости отображаемой информации обеспечивается правильной организацией ее структуры. Это означает, что в информационной модели должны быть представлены не коллекция или пара сведений, так или иначе упорядоченных, а находящиеся к определенном и очевидном взаимодействии. Одним из средств достижения оптимальной структуры является хорошая компоновка информационной модели. В этом смысле разработка отображения на экране представляет собой задачу в какой-то степени эквивалентную задаче хорошей компоновки картины.

4. Важнейшим психическим процессом при слежении за сложными динамическими образами является антиципация , т. е. возможность прогнозирования развития ситуации оператором, для обеспечения которой следует наглядно графически отображать изменения параметров. Данное положение обеспечивается, если при проектировании информационной модели предусмотрено:

Отображение конкретных изменений свойств элементов ситуации, которые происходят при их взаимодействии. В этих случаях изменения свойств отдельных элементов воспринимаются не изолированно, а в контексте ситуации в целом. Более того, изменение свойств одного элемента воспринимается как симптом изменения ситуации в: целом;

Отображение динамических отношений управляемых объектов. При этом связи и взаимодействия информационной модели должны отображаться в развитии;

Отображение конфликтных отношений, в которые вступают элементы ситуации.

5. Компоновка информации на экране должна учитывать, что горизонтальные движения глаз совершаются наиболее легко и быстро. Скорость движения глаз по кривым зависит от формы, и с помощью выбора формы можно варьировать время фиксации взгляда в той или иной области экрана. В местах расположения наиболее важных данных для процесса управления помещают структурные элементы, при движении по которым снижается скорость движения глаз.

Кодирование информации формой. Наиболее информативным обозначением тождественности информации является кодирование данных формой. Известно, что время декодирования и период латентной реакции на предметное изображение минимально по сравнению с другими методами кодирования (среднее время реакции на предмет – 0,4с, на цветное изображение – 0,9с, время фиксации взгляда па простых геометрических фигурах – 0,18мс, на буквах и цифрах – 0,3мс).

Основное значение при восприятии формы человеком имеет отношение "фигура-фон". Данное отношение имеет несколько видов описания:

Фигура имеет форму, фон относительно бесформен, фигура имеет характер вещи, фон же выглядит как неоформленный материал;

Фигура имеет, тенденцию выступать вперед, фон - отступать назад, фон кажется непрерывно продолжающимся позади фигуры;

Фигура производит большее впечатление, чем фон и легче запоминается.

В психологии эмпирически выявлены некоторые принципы организации поля сигналов, пользуясь которыми можно влиять на отношение "фигура-фон".

1. Чем меньшую замкнутую площадь занимает какая-либо конфигурация, тем больше тенденция именно этому изображению выступать в роли фигуры.

2. В качестве фигуры, прежде всего, выделяются замкнутые конфигурации.

3. Симметричные конфигурации легче воспринимаются как фигуры, чем конфигурации ассиметричные.

4. В том случае, когда поле изображения заполнено однородными элементами, фигуру образуют те из них, которые пространственно расположены ближе друг к другу.

5. Если поле изображения заполнено разнородными элементами, то фигура образуется, прежде всего, теми из них, которые имеют сходство по форме или цвету.

6. Если те или иные элементы перемещаются по полю изображения в одном направлении и с одинаковой скоростью, то именно они выделяются как фигура.

7. Если расположить часть элементов в определенном порядке, то можно создать у наблюдателя установку, которая повлияет на восприятие остальных элементов.

Решающий момент выделения фигуры из фона имеет восприятие контура. Именно восприятие контура обеспечивает возможность дифференцированного восприятия формы, известного единства строения, пропорций и взаимосвязи частей. При восприятии контура наиболее информативными являются точки, в которых происходит резкое изменение направления линий.

Чем сильнее контраст между фоном и фигурой, тем легче и быстрее происходит выделение фигуры. Контур любой фигуры - это комбинации элементарных форм: прямая линия, угол и т. д. Вырез в фигуре или контуре различается лучше, чем выступ. Достаточно хорошо глаз воспринимает также величины углов. Чем сложнее контур фигуры, чем больше информации получает при восприятии человек. Процент ошибки опознания для симметричных фигур меньше, чем для несимметричных. Но при этом необходимо учитывать, что на сложном фоне правильность опознании контуров уменьшается. При кодировании данных формой используются следующие типы или методы: числом точек, линий, величиной площади фигуры, пространственной конфигурации изображения.

Кодирование числом точек используется для обозначения числа объектов в группе или числа групп; при этом можно вместо точек использовать простые геометрические фигуры. Человек без счета может определить количество точек, расположенных в случайном порядке, если их не более пяти. Если же количество точек больше пяти, то число ошибок опознании резко увеличивается. Группировка точек в определенные схемы увеличивает точность оценки их количества. Если точки предъявляются на фоне других групп, сходных по структуре, то опознавание таких конфигураций резко понижается.

Размер или область, занятая какой-то конфигурацией, также может эффективно представлять значение данных, хотя подобно длине это плохая размерность стимула для кодирования тождественности данных. Эффективное разрешение при кодировании размером меньше, чем при кодировании длиной, потому что для кодирования размером требуется большая область отображения в пересчете ни единицу данных. Однако, такое кодирование оказывает большой психологический эффект. Достаточно хорошо идентифицируется 4-5 градаций фигур но площади. Использование изображений объемных тел нецелесообразно, так как при оценке величины человек обычно ориентируется на площадь фигуры, а не на ее объем. При сравнении с некоторыми эталонами, находящимися в информационном поле оператора, точность оценки величины площади фигуры резко возрастает. Кроме всего сказанного можно добавить, что само изменение площади фигуры несет в себе некоторую информацию, а размещение изображения в определенном месте поля зрения оператора может нести определенную смысловую нагрузку.

Представление информации в виде образов. Наиболее эффективным и несущим наибольший объем информации является представление данных в виде образов или картин. Восприятие человека устроено гак, что его мозг, взаимодействуя с внешним миром, воспринимая и осмысливая поступающую информацию, настраивается на определенные образы или эталоны, которые легко, без необходимого приспособления и тренировки, воспринимаются им и требуют дополнительного кодирования.

Основными преимуществами метода образного кодирования являются:

Возможность согласования большого потока информации с пропускной способностью сенсорных анализаторов человека;

Значительное сокращение объема ненужной информации;

Существенное снижение необходимости в априорных сведениях об изучаемом объекте;

Компактность в отношении занимаемой площади; .

Широкие возможности перестройки для обслуживания объектов различного назначения.

Поскольку человек - существо социальное, то наибольшее значение для него приобретают контакты с другими людьми. Это приводит к тому, что человек обучается распознавать огромное количество лиц. По выражению лица, мимике мы мгновенно определяем эмоциональнее состояние человека, но на ряду с основными эмоциональными состояниями мы различаем десятки их оттенков. Причем малейшие изменения. Этим определяется высокая информативность как самого лица, так и его выражения. Эта информативность лица передается в фотографиях, рисунках, карикатурах и т. д.

Анализ графической информации базируется на способности индивида интуитивно находить сходство и различия в объектах, при этом особенно хорошо запоминаются и распознаются черты лица. Указанные особенности человеческого восприятия эффективно используются в диаграммах "лица Чернова". Каждый объект представляет собой схематичное изображение лица, определенным чертам которого (ширине лица, длине носа, изгибу бровей, форме рта и т. д.) соответствуют относительные значения выбранных переменных (рис 1).

Рис.1. Примеры визуализации информации с помощью алгоритма Чернова.

Область применения системы лица разнообразна, но особенно перспективным является применение подобной системы для отображения медицинской информации, поскольку ряд физиологических характеристик человека непосредственно проявляется в чертах лица. Так по лицу можно с большой вероятностью правильно определить возраст человека, наличие избыточного веса, эмоциональное состояние, пол и т. п. Использование таких прямых ассоциаций резко сокращает время декодирования, т. е. перехода от изображения к исходному кодируемому значению параметра. Применение компьютерной графики, для синтеза изображения лиц из физиологических данных позволяет получать физиологический портрет испытуемого в прямом смысле этого слова.

Визуализация экспериментальных данных, представленных в виде числовых таблиц. В медико-психологических исследованиях результаты эксперимента часто представлены в виде числовых таблиц. Методы визуализации такого рода информации основаны, как правило, на переходе от многомерной к двумерной системе координат (метод главных компонент , методы структурного упорядочения, предложенные с соавторами ).

Рассмотрим алгоритм формирования координат объектов в методе начального упорядочения .

Для оценки рассогласования структур в RL и R2 вычисляется матрица взаимных расстояний dnk между элементами Xn и Xk из выборки X:

В n-й строке такой матрицы записаны расстояния от некоторого n-го элемента Xn до всех остальных (N-1) элементов множества https://pandia.ru/text/78/605/images/image004_27.gif" width="48" height="29 src="> до некоторого k-го элемента. Любую n-ю строку матрицы DN(X) можно рассматривать как результат упорядочения элементов относительно n-го элемента Xn путем отображения этого множества на числовую ось действительных чисел . Задавая на оси положение n-го элемента и принимая его за начало отсчета (точку Yn, координата которой на оси равна нулю), можно упорядочить образы выборки X на оси относительно n-го элемента, используя в качестве меры упорядочения расстояние от элемента Xn до всех остальных (N-1) элементов. Из точки Yn https://pandia.ru/text/78/605/images/image005_23.gif" width="23" height="24 src=">) построим перпендикулярно к оси другую числовую ось при этом k-й элемент выборки X расположим в точке пересечения осей https://pandia.ru/text/78/605/images/image008_14.gif" width="23" height="24 src=">.gif" width="48" height="29 src=">, подобно тому как это было осуществлено для оси . Координаты элементов на оси представляют собой расстояния от k-го элемента до всех остальных (N-1) элементов и позволяют судить о группируемости векторов около вектора Xk..gif" width="23" height="24 src="> определят некоторую псевдоплоскость . оценки и мониторинга психофизиологического состояния беременных женщин .

Эффективность данного метода зависит от “хорошего” выбора строк матрицы DN(X), который не должен быть совсем случаен. Выбор близких в RL элементов Xn и Xk в качестве центров упорядочения остальных (N-1) элементов на осях и нерационален, так как не дает существенно новой информации об упорядоченности выборки X, так что необходимо выбирать элементы X, относительно удаленные друг от друга. Поэтому в качестве центров упорядочения нами были выбраны «эталонный» объект и объект, имеющий наихудшие параметры (рис. 2).

Заключение. Суть приведенных методов - пути решения проблемы рационального обобщения и повышения наглядности отображаемой информации с целью создания оптимальных и комфортных условий труда оператора, с целью высвобождения его для решения задач высших уровней управления объектом или общей оценки задачи и условий функционирования на данном этапе принятия решений.

Результаты междисциплинарных исследований позволяют уверенно утверждать, что визуализация является одним из наиболее перспективных направлений повышения эффективности методов анализа и представления информации.

В работе представлены различные подходы к визуализации результатов экспериментальных социальных и медико-психологических исследований.

Работа выполнена при финансовой поддержке РГНФ (проект № в) и РФФИ (проект № а).

ЛИТЕРАТУРА

1. Зиновьев многомерных данных. - Красноярск: Изд. Красноярского государственного технического университета, 2000. - 180 с.

2. Современные методы представления и обработки биомедицинской информации: учебное пособие / Томский политехнический университет; Сибирский государственный медицинский университет; Под ред. ; . - Томск: Изд-во ТПУ, 2004. - 336 с.

3. , . Современные методы когнитивной визуализации многомерных данных - Томск: Некоммерческий фонд развития региональной энергетики, 2007. - 216 с.

4. , Эммануэль В. Информационные технологии в медико-биологических исследованиях. – СПб: Питер, 2003. – 528 с.

5. , . Аналитические исследования в медицине, биологии и экологии: учебное пособие - М. : Высшая школа, 2003. - 279 с.

6. , Шаропин система выявления групп риска среди беременных женщин //Информатика и системы управления, 2008, - № 2(16). - c. 22-23