Тема «Проектирование классификаторов»


страница1/4
inf.na5bal.ru > Информатика > Документы
  1   2   3   4



ДОЛГОВА Г.Б.


Проектирование информационных систем
Часть 1.
Лекции

Тема 6. «Проектирование классификаторов»

Н.Новгород

2010


  1. Методы классификации.

  2. Методы кодирования.

  3. Виды классификаторов.

  4. Требования, учитываемые при проектировании.

  5. Последовательность проектирования.

  6. Необходимость классификации и кодирования.




Нормативные документы

  1. ГОСТ 6.10.1 – 87. Единая система классификации и кодирования технико-экономической информации. Основные положения. – М.: «стандарты», 1994.

  2. Постановление Правительства РФ от 10.11.2003 N 677 (ред. от 23.11.2006) "Об общероссийских классификаторах технико-экономической и социальной информации в социально-экономической области" (вместе с "Положением о разработке, принятии, введении в действие, ведении и применении общероссийских классификаторов технико-экономической и социальной информации в социально-экономической области").

  3. Общероссийский Классификатор информации об общероссийских классификаторах. ОК. 026 - 2002.

  4. Порядок разработки общероссийских класификаторов. - ПР 50.1.020 – 2000.

  5. Положение о ведении общероссийских классификаторов на базе информационно-вычислительной сети Госкомстата России. - ПР 50.1.021 – 2000.

  6. Правила по стандартизации. Основные положения Единой ситемы классификации и кодирования технико-экономической и социальной информации и унифицированных систем документации в РФ. - ПР 50.1.019-2000. Утверждены Постановлением Госстандарта России от 25.12.2000 № 409 – ст.


1.1. Методы классификации

Классификация – это разделение множества объектов на подмножества по их сходству или различию в соответствии с принятыми методами. Классификация фиксирует закономерные связи между классами объектов.

Объект классификации – элемент множества, используемый при классификации.

Признак классификации – признак, по которому производится деление заданного множества на подмножества.

Классификационная группировка – подмножества, которые получаются в результате деления заданного множества.

Глубина классификации – число ступеней классификации.

Применяется три метода классификации: элементарный, иерархический и фасетный.

Существуют следующие требования для выбранной системы классификации:

  • достаточная емкость и необходимая полнота, которые гарантируют охват всех объектов классификации в заданных границах;

  • оправданная глубина;

  • обеспечение возможности решения задач управления объектом;

  • возможность расширения множества классифицируемых объектов и внесения необходимых изменений в структуры классификации;

  • обеспечение возможности сопряжения с другими классификациями однородных объектов;

  • обеспечение простоты ведения классификатора.

Каждая система классификации характеризуется следующими свойствами:

  • гибкостью системы;

  • емкостью системы;

  • степенью заполненности системы.

Гибкость системы — это способность допускать включение новых признаков, объектов без разрушения структуры классификатора. Необходимая гибкость определяется временем жизни системы.

Емкость системы — это наибольшее количество классификационных группировок, допускаемое в данной системе классификации.

Степень заполненности системы определяется как частное от деления фактического количества группировок на величину емкости системы.

Элементарный метод

Метод предполагает упорядочивание множества объектов по одному признаку классификации. Наиболее часто используется лексикография (по алфавиту) и хронология.

Пример. Множество районов Н.Новгорода

Алфавит

Хронология

Автозаводский

Нижегородский

Канавинский

Канавинский

Ленинский

Советский

Московский

Сормовский

Нижегородский

Автозаводский

Приокский

Приокский

Советский

Ленинский

Сормовский

Московский

Согласно генеральному плану развития города часть Борского района должна войти в состав Н.Новгорода. Предположим, что будет выделен Борский район города. Тогда классификация нарушится в первом случае. Или ее нужно будет выполнить заново.

Иерархический метод

Под иерархическим методом классификации понимается метод, при котором заданное множество последовательно делится на подчиненные подмножества, постепенно конкретизируя объект классификации. При этом основанием деления служит некоторый выбранный признак. Совокупность получившихся группировок при этом образует иерархическую древовидную структуру в виде ветвящегося графа, узлами которого являются группировки.

Выбор последовательности признаков зависит, прежде всего, от характера информации. При построении классификации выбор последовательности признаков зависит от вероятности обращения к тому или иному признаку. При этом наиболее вероятным обращениям должны соответствовать высшие уровни классификации.

Характерными особенностями иерархической системы являются:

  • возможность использования неограниченного количества признаков классификации;

  • соподчиненность признаков классификации, что выражается разбиением каждой классификационной группировки, образованной по одному признаку, на множество классификационных группировок по нижестоящему (подчиненному) признаку.

Требования к классификатору, построенному на иерархическом методе классификации:

  1. Классификационные группировки, расположенные на одной ступени классификатора, не должны пересекаться, т. е. не должны включать в себя аналогичных понятий.

  2. На каждой ступени классификатора для разделения вышестоящей группировки должен использоваться только один признак.

  3. Сумма подмножества всегда должна давать делимое множество объектов; не должна оставаться часть объектов, не вошедших в состав классификационной группировки.

Основными преимуществами иерархического метода является большая информационная емкость, величина которой зависит от глубины классификации (числа ступеней деления) и количества объектов классификации, которое можно расположить на каждой ступени. Количество же объектов на каждой ступени классификации определяется основанием кода, то есть числом знаков в выбранном алфавите кода. Выбор необходимой глубины классификации и структуры кода зависит от характера объектов классификации и характера задач, для решения которых предназначен классификатор. Преимуществами являются также традиционность, привычность применения, возможность создания для объектов классификации мнемонических кодов, несущих смысловую нагрузку.

Значительным недостатком иерархической классификации является жесткость классификационной схемы. Она обусловлена заранее установленным выбором признаков классификации и порядком их использования по ступеням классификации. Это ведет к тому, что при изменении состава объектов классификации, их характеристик или характера решаемых при помощи классификатора задач требуется коренная переработка классификационной схемы. Гибкость этой системы обеспечивается только за счет ввода большой избыточности в ветвях, что приводит к слабой заполненности структуры классификатора. Поэтому при разработке классификаторов следует учитывать, что иерархический метод классификации более предпочтителен для объектов с относительно стабильными признаками и для решения стабильного комплекса задач.

Обобщенное представление иерархической классификации приведено на рисунке.

Разделение на подмножества по 1 признаку классификации

Разделение подмножеств на 2 уровне, по 3 признаку
Разделение подмножеств, выделенных на 1 уровне, на подмно-жества по 2 признаку

Объекты классификации



Пример. Выполним иерархическую классификацию групп студентов на дневном отделении экономического факультета. В качестве классификационных признаков выберем: специальность, курс, способ финансирования. На рисунке приведен фрагмент классификационного дерева.



Также иерархическую классификацию можно представить в виде вложенного списка. Для нашего примера фрагмент списка выглядит следующим образом:

Группы студентов дневного отделения экономического факультета

Группы специальности экономическая теория

1 курс

Бюджетные



Вне бюджетные



Смешанные

1 группа

2 курс

Бюджетные



Вне бюджетные



Смешанные

1 группа

….

Группы специальности прикладная информатика

1 курс

...

Фасетный (многоаспектный) метод

Аспект — точка зрения на объект классификации, который характеризуется одним или несколькими признаками.

Многоаспектная система — это система классификации, которая использует параллельно несколько независимых признаков (аспектов) в качестве основания классификации. Существуют два типа многоаспектных систем: фасетная и дескрипторная.

Фасет — это аспект классификации, который используется для образования независимых классификационных группировок.

Дескриптор — ключевое слово, определяющее некоторое понятие, которое формирует описание объекта и дает принадлежность этого объекта к классу, группе.

Фасетный (многоаспектный) метод классификации подразумевает параллельное разделение множества объектов на независимые классификационные группировки. При этом не предполагается жёсткой классификационной структуры и заранее построенных конечных группировок. Классификационные группировки образуются путем комбинации значений, взятых из соответствующих фасетов. Последовательность расположения фасетов при образовании классификационной группировки задается фасетной формулой. Количество фасетных формул определяется возможными сочетаниями признаков.

К классификатору, построенному на основе фасетного метода классификации, предъявляются следующие требования:

  1. Должен соблюдаться принцип не пересекаемости фасета, т. е. состав признаков одного фасета не должен повторяться в других фасетах этого же класса;

  2. В состав классификатора должны быть включены только такие фасеты и признаки, которые необходимы для решения конкретных задач.

Общий вид фасетной классификационной схемы:



Внутри фасета значения признаков могут просто перечисляться по некоторому порядку или образовывать сложную иерархическую структуру, если существует соподчиненность выделенных признаков.

ФАСЕТЫ

СПЕЦИАЛЬНОСТЬ

КУРС

СПОСОБ ФИНАНСИРОВАНИЯ

ЭТ

1

БЮДЖЕТ

ГМУ

2

ВНЕ БЮДЖЕТ

ПИ

3

СМЕШАННЫЙ

МЭ

4




МАРКЕТИНГ

5




ЭиУ







МЕНЕДЖМЕНТ







НЭ







Пример. Снова выполним классификацию групп студентов дневного отделения экономического факультета, но с использованием фасетного метода. Выберем в качестве фасетов: специальность, курс, способ финансирования.



В результате классификации мы имеем списки групп. Например, по специальности прикладная информатика или на 3 курсе, или бюджетные. Состав фасетной формулы: специальность, курс, способ финансирования. Каждая группа характеризуется одним из значений в фасете. Так группа 735: прикладная информатика, 3 курс, смешанная.

К преимуществам данной системы следует отнести большую емкость системы и высокую степень гибкости, поскольку при необходимости можно вводить дополнительные фасеты и изменять их место в формуле. При изменении характера задач или характеристик объектов классификации разрабатываются новые фасеты или дополняются новыми признаками уже существующие фасеты без коренной перестройки структуры всего классификатора.

Недостатками фасетного метода классификации являются неполное использование емкости, не традиционность и иногда сложность применения.

В современных классификационных схемах часто одновременно используются оба метода классификации. Это снижает влияние недостатков методов классификации и расширяет возможность использования классификаторов в информационном обеспечении управления.
  1   2   3   4

Поделиться в соцсетях



Похожие:

Тема «Проектирование классификаторов» iconУчебно-методический комплекс по дисциплине «Проектирование информационных систем»
«Проектирование информационных систем» разработан в соответствии с требованиями фгос впо (федеральный или региональный компонент)...

Тема «Проектирование классификаторов» iconУчебно-методический комплекс по дисциплине сд. Ф. 1 "Проектирование...
«Проектирование информационных систем» разработан в соответствии с требованиями фгос впо (федеральный или региональный компонент)...

Тема «Проектирование классификаторов» iconПлан урока по Информатике Тема: Графические методы языка программирования Visual Basic
Умк: «Информатика и икт» 10 класс, Н. Д. Угринович, М.: Бином. Лаборатория знаний, 2012; «Visual Basic творческое проектирование...

Тема «Проектирование классификаторов» iconУчебно-методический комплекс по дисциплине "Проектирование информационных...
«Проектирование информационных систем» разработан в соответствии с требованиями фгос впо (федеральный или региональный компонент)...

Тема «Проектирование классификаторов» iconМетодические указания к выполнению курсовой работы по дисциплине...
Задания и методические указания к выполнению курсовой работы по дисциплине «Проектирование информационных систем». Екатеринбург,...

Тема «Проектирование классификаторов» iconПояснительная записка По дисциплине "Проектирование информационных...
По дисциплине "Проектирование информационных систем" в числе других семестровых контрольных мероприятий студенты должны выполнить...

Тема «Проектирование классификаторов» iconПояснительная записка По дисциплине "Проектирование информационных...
По дисциплине "Проектирование информационных систем" в числе других семестровых контрольных мероприятий студенты должны выполнить...

Тема «Проектирование классификаторов» iconМодульный курс Технология с информатикой 4 класс 2 часа в неделю (68ч) №
Составляем композиции панно (проектирование, конструирование, технологии обработки)

Тема «Проектирование классификаторов» iconКурсы повышения квалификации по иоч вб: 17. 03. 2014г. 21. 03. 2014г
«Проектирование учебного занятия на основе современных информационных технологий»

Тема «Проектирование классификаторов» iconМуниципальное общеобразовательное учреждение гимназия №1
Цель: диссеминация опыта работы педагогов Гимназии№1 в рамках реализации инновационного проекта: «Проектирование информационно-образовательной...


Информатика




При копировании материала укажите ссылку © 2000-2017
контакты
inf.na5bal.ru
..На главную