Курсовая работа по дисциплине «Информатика»


страница1/3
inf.na5bal.ru > Документы > Курсовая
  1   2   3
Белорусский Национальный Технический Университет

Приборостроительный факультет

Кафедра «Инженерная математика»

Курсовая работа по дисциплине «Информатика»

Методы визуального анализа в пакете STATISTICA.



Студент: Микулич Е.С.
Преподаватель: Кондратьева Н.А.


Содержание

1.Введение…………………………………………………………………………………………………………………………………………..…4

2.Теоретическая часть……………………………………………………………………………………………………………………….…..6

2.2 Двухмерные графики……………………………………………………………………………………………………………………..6

2.2.1 Гистограммы……………………………………………………………………………………………………………………………6

2.2.2Диаграммы рассеяния…………………………………………………………………………………………………………….9

2.2.3 Диаграммы Вороного……………………………………………………………………………………………………………12

2.2.4 График квантиль-квантиль……………………………………………………………………………………………………12

2.2.5 График вероятность-вероятность…………………………………………………………………………………………13

2.2.6 Диаграмма диапазонов………………………………………………………………………………………………………..14

2.2.7 Диаграмма размаха………………………………………………………………………………………………………………16

2.2.8 Столбчатые диаграммы ……………………………………………………………………………………………………….17

2.2.9 Линейные графики (для переменных)……………………………………………………………………………....18

2.2.10 Трассировочные XY……………………………………………………………………………………………………………..22

2.2.11 Зонный график…………………………………………………………………………………………………………………….22

2.2.12 Круговые диаграммы………………………………………………………………………………………………………...23

2.3 Трёхмерный визуальный анализ………………………………………………………………………………………………..24

2.3.1 Столбчатые диаграммы………………………………………………………………………………………………………..26

2.3.2 Блоковые диаграммы…………………………………………………………………………………………………………..26

2.3.3 Ленточная диаграмма ………………………………………………………………………………………………………….27

2.3.4 Линейный график………………………………………………………………………………………………………………….27

2.3.5 3М диаграммы размаха……………………………………………………………………………………………………….28

2.4 Пиктографики……………………………………………………………………………………………………………………………….29

2.4.1 Круговые пиктограммы………………………………………………………………………………………………………..29

2.4.2 Последовательные пиктограммы ……………………………………………………………………………………….29

2.4.3 Круговые диараммы…………………………………………………………………………………………………………….30

2.4.3 «Лица Чернова»…………………………………………………………………………………………………………………..30

2.4.4 Звёзды…………………………………………………………………………………………………………………………………..31

2.4.5 Лучи……………………………………………………………………………………………………………………………………….32

2.4.6 Многоугольники……………………………………………………………………………………………………………………33

2.4.7 Профили…………………………………………………………………………………………………………………………………33

3 Постановка задачи……………………………………………………………………………………………………………………………34

4 Описание решения…………………………………………………………………………………………………………………………..34

5 Заключение………………………………………………………………………………………………………………………………………43

6 Список используемой литературы …………………………………………………………………………………………………44



1.Введение

Раньше существовало представление об анализе информации, как о тяжёлом, трудоёмком процессе. Ну это и верно, когда информация избыточна и получена из множества источников то её довольно трудно анализировать, сравнивать и делать какие-либо выводы. Но в наше время анализ информации представляет собой очень захватывающее действие с помощью визуализации.

Визуализация — это процесс представления данных в виде изображения с целью максимального удобства их понимания; придание зримой формы любому мыслимому объекту, субъекту, процессу и т. д. Правда такое понимание визуализации предполагает минимальную мыслительную и познавательную активность обучающихся, а визуальные дидактические средства выполняют лишь иллюстративную функцию. Визуализация учебного материала открывает возможность не только собрать воедино все теоретические выкладки, что позволить быстро воспроизвести материал, но и применять схемы для оценивания степени усвоения изучаемой темы. В практике также широко используется метод анализа конкретной схемы или таблицы, в котором вырабатывают навыки сбора и обработки информации. Метод позволяет включить обучаемых в активную работу по применению теоретической информации в практической работе. Особое место уделяется совместному обсуждению, в процессе которого есть возможность получать оперативную обратную связь, понимать лучше себя и других людей. Другим важным аспектом использования визуализации информации является определение оптимального соотношения наглядных образов и словесной, символьной информации. Понятийное и визуальное мышление на практике находятся в постоянном взаимодействии. Они раскрывают разные стороны изучаемого понятия, процесса или явления. Словесно-логическое мышление дает нам более точное и обобщенное отражение действительности, но это отражение абстрактно. В свою очередь, визуальное мышление помогает организовать образы, делает их целостными, обобщенными, полными.

С помощью новых технологий пользователи способны оценивать: большие объекты и маленькие, далеко они находятся или близко.
Пользователь в реальном времени может двигаться вокруг объектов или кластеров объектов и рассматривать их со всех сторон.
Это позволяет использовать для анализа естественные человеческие перцепционные навыки в обнаружении неопределённых образцов в визуальном трёхмерном представлении данных.
Визуальный анализ данных особенно полезен, когда о самих данных мало что известно и цели исследования до конца не понятны.
За счёт того, что пользователь напрямую работает с данными, представленными в виде визуальных образов, которые он может рассматривать с разных сторон и под любыми углами зрения, в прямом смысле этого слова, он может получить дополнительную информацию, которая поможет ему более чётко сформулировать цели исследования.

Методы визуализации могут быть как самые простые (линейные графики, диаграммы, гистограммы и т.п.), так и более сложные, основанные на сложном математическом аппарате. Кроме того, при визуализации могут использоваться комбинации различных методов. Выделяют следующие типы методов визуализации:

- стандартные 2D/3D-образы - гистограммы, линейные графики и т.п.;

- геометрические преобразования - диаграмма разброса данных, параллельные координаты и т.п.;

- отображение иконок - линейчатые фигуры (needle icons) и звёзды (star icons);

- методы, ориентированные на пикселы - рекурсивные шаблоны, циклические сегменты и т.п.;

- иерархические образы - древовидные карты и наложение измерений.

Статистика позволяет компактно описать данные, понять их структуру, провести классификацию, увидеть закономерности среди случайных явлений. Простейшие методы визуального анализа данных позволяют существенно прояснить сложную ситуацию, которая первоначально состояла из большого нагромождения цифр.

Визуальный анализ данных это наиболее быстрый способ получить представление о характере данных. Современные программные математические пакеты предлагают огромнейшую палитру всевозможных графиков и их комбинаций. Всего в несколько «щелчков мышкой» можно получить практически любой необходимый график. Визуальный анализ данных позволяет получить картину «в целом» и иногда увидеть наличие разнообразных зависимостей и аномалий, которые достаточно тяжело выявить другим способом. Визуальный анализ очень эффективно позволяет обнаруживать группировки данных, выбросы и прочие проблемы в данных. Самое главное преимущество визуального анализа данных – графики, наиболее универсальный способ отображения информации, понятный даже самому неподготовленному в анализе данных

2.2 Двухмерный визуальный анализ

Двухмерный, сокращенно, 2М визуальный анализ, —представляет собой визуальный анализ данных на плоскости. В двухмерном визуальном анализе используются разнообразные гистограммы, диаграммы рассеяния, вероятностные графики, линейные графики, диаграммы диапазонов, размахов, круговые диаграммы, столбчатые диаграммы, последовательные графики (графики последовательных значений) и т. д., позволяющие увидеть специфику данных.

2.2.1 Гистограммы

 Гистогра́мма – это способ графического представления табличных данных. Количественные соотношения некоторого показателя представлены в виде прямоугольников, площади которых пропорциональны. Чаще всего для удобства восприятия ширину прямоугольников берут одинаковую, при этом их высота определяет соотношения отображаемого параметра. Таким образом, гистограмма представляет собой графическое изображение зависимости частоты попадания элементов выборки от соответствующего интервала группировки. Примеры гистограмм приведены на Рис1.

Рис.1

Гистограмма наглядно показывает, какие значения или диапазоны значений исследуемой переменной являются наиболее частыми, насколько сильно они различаются между собой, как сконцентрировано большинство наблюдений вокруг среднего, является распределение симметричным или нет, имеет ли оно одну моду или несколько мод, то есть является мультимодальным.

На простой гистограмме отображаются частоты значений одной переменной, а на составной можно отобразить одновременно частоты нескольких переменных.

Например, показанная на рис.2 составная гистограмма позволяет увидеть, как меняется соотношение между покупками мяса и колбасы в супермаркете. Из нее также видно, что доля колбас и мяса в дорогих покупках (на сумму более 300 рублей) минимальна.



Рис.2

Простые гистограммы является обычными столбчатыми графиками распределений частот выбранной переменной.

Составные гистограммы представляют распределения частот для нескольких переменных на одном графике. Значения переменных откладываются по единой оси X, что облегчает визуальное сравнение распределения переменных. Пример составной диаграммы приведён на Рис.3


Рис.3
На составных гистограммах переменные представлены премыкающими друг к другу столбцами; поэтому для каждой категории строится несколько столбцов. Следовательно, подогнанные кривые либо точно подходить к соответствующим им гистограммам, либо быть сравнимыми друг с другом.

Гистограмму с двойной осью Y можно рассматривать как комбинацию двух составных гистограмм. Можно выбрать два списка переменных. Будет построено распределение частот для каждой выбранной переменной, но частоты переменных, введенных в первый список (Левая ось Y), будут откладываться по левой оси Y, в то время как частоты переменных, введенных во второй список (Правая ось Y), — по правой оси Y. Пример гистограммы с двойной осью Y приведён на Рис.4.

Рис.4

Имена всех переменных из двух списков будут включены в условные обозначения, сопровождаемые буквой Л или П, обозначающей левую или правую ось Y coответственно. Этот график полезен для визуального сравнения распределений переменных с разными частотами.

Гистограмма висячих столбцов является изысканным визуальным способом проверки нормальности распределения переменной, который помогает наглядно определить области, где возникают расхождения между наблюдаемыми и нормальными частотами. Рассмотрим пример гистограммы висячих столбцов на Рис.5.



Рис.5

В отличие от обычного способа наложения на гистограмму нормальной кривой, гистограмма висячих столбцов предлагает альтернативный способ, когда столбцы, представляющие наблюдаемые частоты для последовательных диапазонов значений, «подвешиваются» к нормальной кривой. Если исследуемое распределение приближенно нормальное, то нижние стороны подвешенных прямоугольников ложатся на одну прямую.

Гистограмма или распределение частот значений переменной по интервалам представляет интерес по следующим причинам:

  • По форме распределения можно охарактеризовать природу исследуемой переменной(например, наличие двух мод – наиболее высоких столбцов гистограммы, или, как говорят, бимодальность распределения может означать что выборка неоднородна и состоит из наблюдений, принадлежащим двум различным генеральным совокупностям)

  • Многие критерии статистики основаны на определённых предположениях нормальности, гистограммы помогают визуально проверить выполнение этих предположений.


2.2.2 Диаграммы рассеяния

Двухмерные диаграммы рассеяния используются для визуального исследования зависимости между двумя переменными X и Y (например, весом и ростом человека, рекламой и объемом продаж и т. д.).Пример диаграммы рассеяния приведён на Рис.6



Рис.6

Данные изображаются точками в двухмерном пространстве. Две координаты (X и Y), которые определяют положение каждой точки, соответствуют значениям двух переменных. Если переменные сильно связаны, то множество точек данных принимает определенную форму (например, ложится на прямую линию или кривую, задаваемую определенным уравнением), как показано ниже на Рис.7



Рис.7

Если переменные не связаны, то точки образуют «облако рассеяния», как показано на Рис.8



Рис.8

Простая диаграмма рассеяния визуализирует зависимость между двумя переменными X и Y (например, весом и высотой). Данные изображаются точками в двухмерном пространстве, где оси соответствуют переменным. Две координаты (X и Y), которые определяют положение каждой точки, соответствуют значениям двух переменных. Если переменные сильно связаны, то множество точек данных принимает определенную форму (например, прямой линии или кривой). Если связи нет, то точки образуют «облако». В отличие от простой диаграммы рассеяния, на которой одна переменная представлена по горизонтальной, а вторая — по вертикальной оси, составная диаграмма рассеяния включает несколько зависимостей: значения одной переменной (X) откладываются по горизонтальной оси, а по вертикальной оси откладываются значения нескольких переменных (Y). Для каждой переменной Y используется разный цвет и вид точек. Пример составной диаграммы рассеяния представлен на Рис.9



Рис.9

Диаграмма рассеяния составного типа используется для сравнения структуры нескольких корреляционных зависимостей путем изображения их на одном графике в одном масштабе.

Диаграмму рассеяния с двойной осью Y можно рассматривать как комбинацию двух составных диаграмм рассеяния для одной переменной X и двух различных множеств переменных У. Для независимой переменной Х и каждой из переменных Y строится диаграмма рассеяния, но переменные из первого списка (называемого Левая ось Y) откладываются по левой оси Y, тогда как переменные из второго списка (называемого Правая ось Y) откладываются по правой оси Y. На каждой из осей можно выбрать свой масштаб.



Рис.10

Имена всех переменных Y из двух списков будут включены в условные обозначения, сопровождаемые буквой (Л) или (П), обозначающей левую или правую ось Y соответственно.

Диаграммы рассеяния с двойной осью Y можно использовать для визуального сравнения структуры нескольких корреляционных зависимостей путем изображения их на одном графике. При этом в силу независимости масштабов, используемых для двух списков переменных, этот график облегчает сравнение переменных, значения которых принадлежат разным диапазонам.
  1   2   3

Поделиться в соцсетях



Похожие:

Курсовая работа по дисциплине «Информатика» iconКурсовая работа по дисциплине «Информатика» на тему: «Обзор и сравнительный...
Федеральное государственное бюджетное образовательное учреждение высшего профессионального образования

Курсовая работа по дисциплине «Информатика» iconКурсовая работа самостоятельная разработка конкретной темы по изучаемой...
Курсовая работа – самостоятельная разработка конкретной темы по изучаемой дисциплине с элементами научного анализа, отражающая приобретенные...

Курсовая работа по дисциплине «Информатика» iconПоложение по выполнению курсовой работы по дисциплине «Разработка...
Курсовая работа обязательный вид учебной работы, выполняется студентом в течение учебного семестра

Курсовая работа по дисциплине «Информатика» iconКурсовой проект по направляющим системам электросвязи. У меня вариант...
Курсовая работа должна быть подготовлена в формате редактора word с использованием шрифта размером 14 пунктов и соответствующего...

Курсовая работа по дисциплине «Информатика» iconКурсовая работа по дисциплине «Теория информационных процессов и систем»
Федеральное государственное образовательное бюджетное учреждение высшего образования

Курсовая работа по дисциплине «Информатика» iconКурсовая работа по дисциплине «Теория вычислительных процессов»
Среди столбцов целочисленной матрицы, содержащих только элементы по модулю не большие 10, найти столбец с минимальным произведением...

Курсовая работа по дисциплине «Информатика» iconКурсовая работа является одним из элементов учебного процесса по...
«Бизнес-информатика», «Менеджмент», «Экономика» выполняют курсовую работу, предусматривающую статистический анализ экономической...

Курсовая работа по дисциплине «Информатика» iconКурсовая работа является одним из элементов учебного процесса по...
«Бизнес-информатика», «Менеджмент», «Экономика» выполняют курсовую работу, предусматривающую статистический анализ экономической...

Курсовая работа по дисциплине «Информатика» iconКонтрольная работа по дисциплине: экономическая информатика
Задание II в текстовом процессоре ms word выполните одно из представленных ниже заданий. 6

Курсовая работа по дисциплине «Информатика» iconКонтрольная работа по дисциплине «Информатика и икт»
В колонку «Средний балл» записать нужные расчетные формулы, результат показать преподавателю


Информатика




При копировании материала укажите ссылку © 2000-2017
контакты
inf.na5bal.ru
..На главную