Тема «Проектирование классификаторов»


страница2/4
inf.na5bal.ru > Информатика > Документы
1   2   3   4

1.2. Методы кодирования


Для полной формализации информации недостаточно простой классификации, поэтому проводят следующую процедуру — кодирование.

Кодирование — это процесс присвоения условных обозначений объектам и классификационным группам по соответствующей системе кодирования. Кодирование реализует перевод информации, выраженной одной системой знаков, в другую систему, то есть перевод записи на естественном языке в запись с помощью кодов.

Система кодирования — это совокупность правил обозначения объектов и группировок с использованием кодов.

Код — это условное обозначение объектов или группировок в виде знака или группы знаков в соответствии с принятой системой. Код базируется на определенном алфавите (некоторое множество знаков). Число знаков этого множества называется основанием кода.

Код характеризуется следующими параметрами:

  • длиной;

  • основанием кодирования;

  • структурой кода, под которой понимают распределение знаков по признакам и объектам классификации;

  • степенью информативности, рассчитываемой как частное от деления общего количества признаков на длину кода;

  • коэффициентом избыточности, который определяется как отношение максимального количества объектов к фактическому количеству объектов.

К методам кодирования предъявляются определенные требования:

  • код должен осуществлять идентификацию объекта в пределах заданного множества объектов классификации;

  • желательно предусматривать использование в качестве алфавита кода десятичных цифр и букв;

  • необходимо обеспечивать по возможности минимальную длину кода и достаточный резерв незанятых позиций для кодирования новых объектов без нарушения структуры классификатора.

Методы кодирования могут носить самостоятельный характер – регистрационные методы кодирования, или быть основанными на предварительной классификации объектов – классификационные методы кодирования.

Регистрационные методы кодирования бывают двух видов: порядковый и серийно-порядковый.

Порядковый метод — каждый из объектов множества кодируется с помощью чисел натурального ряда.

Пример. Числа месяца, годы. Если присвоить коды районам Н.Новгорода при их классификации по алфавиту

Наименование

Код

Автозаводский

1

Канавинский

2

Ленинский

3

Московский

4

Нижегородский

5

Приокский

6

Советский

7

Сормовский

8

Описание классификатора:

Название классификатора

районы Н.Новгорода.

Метод классификации

элементарный, по алфавиту

Метод кодирования

Порядковый

Длина кода

1

Структура кода

Х

район Н.Новгорода

Обеспечивает простоту добавления новых объектов и краткость кода, однако такой код не несёт никакой информации об объекте. Существенным недостатком порядкового метода кодирования является отсутствие в коде какой-либо конкретной информации о свойствах объекта, а также сложность обработки информации при получении итогов по группе объектов классификации с одинаковыми признаками. Для повышения устойчивости классификатора иногда прибегают к пропуску номеров.

Серийно-порядковый метод — кодами служат числа натурального ряда с закрепленной отдельной серией этих чисел (интервалов натурального ряда) за объектами классификации с одинаковыми признаками. В каждой серии, кроме кодов имеющихся объектов классификации, предусматривается определенное количество кодов для резерва.

Пример. Рассмотрим международный классификатор видов транспорта и транспортировки товаров.

Наименование

Код

Водный транспорт

морское судно

железнодорожный вагон (платформа, цистерна), расположенный на морском судне (пароме)

дорожное средство, расположенное на морском судне (суда типа Ро-Ро)

речные суда

суда смешанного "река-море» плавания

Железнодорожный транспорт

железнодорожный вагон, платформа, цистерна

дорожное транспортное средство, расположенное на железнодорожной платформе (в вагоне)

Автомобильный транспорт

транспортное средство

состав транспортных средств (тягач с полуприцепом

и (или) прицепом)

иные дорожные транспортные средства

Воздушный транспорт

воздушное судно

дорожное транспортное средство, расположенное

на воздушном судне

Стационарный транспорт

трубопроводный транспорт

линии электропередачи

иные виды стационарного транспорта

Иные виды транспортировки товара

почтовые отправления

экспресс-доставка

иные виды транспортировки

10

12

16

80
81

20

23

30

31

39

40

43

70

71

79

50

55

59


Посмотрите, выделены серии номеров по видам транспорта.

10 - 19 – морской транспорт.

20 – 29 – железнодорожный транспорт.

30 – 39 – автодорожный транспорт.

40 – 49 – воздушный транспорт.

50 - 59 - почтовые отправления (активный вид транспорта неизвестен).

60 - 69 – смешанные перевозки (активный вид транспорта неизвестен).

70 - 79 – фиксированные транспортные установки (стационарный транспорт)

80 - 89 – внутренний водный транспорт. Этот код используется только в тех случаях, когда этот вид водного транспорта учитывается отдельно.

90 - 99 – вид транспорта неизвестен.

Кодовые обозначения подвидам транспорта присваиваются внутри серии. Оформим таблицу в соответствии с правилами.

Наименование

Код

Водный транспорт

Морской транспорт

морское судно

железнодорожный вагон (платформа, цистерна), расположенный на морском судне (пароме)

дорожное средство, расположенное на морском судне (суда типа Ро-Ро)


Внутренний водный транспорт
речные суда

суда смешанного "река-море» плавания

Железнодорожный транспорт

железнодорожный вагон, платформа, цистерна

дорожное транспортное средство, расположенное на железнодорожной платформе (в вагоне)

Автомобильный транспорт

транспортное средство

состав транспортных средств (тягач с полуприцепом

и (или) прицепом)

иные дорожные транспортные средства
Воздушный транспорт

воздушное судно

дорожное транспортное средство, расположенное

на воздушном судне

Почтовые отправления

почтовые отправления (обычные)

экспресс-доставка

иные виды транспортировки

Стационарный транспорт

трубопроводный транспорт

линии электропередачи

иные виды стационарного транспорта


Серия 10-19

10

12

16

Свободные № 11, 13-15, 17-19

Серия

80-89

80
81

Свободные № 82-89

Серия 20-29

20

23 Свободные № 21, 22, 24-29

Серия 30-39

30

31

39 Свободные № 32-38

Серия 40-49

40

43

Свободные № 41, 42, 44-49 Серия 50-59

50

55

59 Свободные № 51-54, 56-59 Серия 70-79

70

71

79

Свободные № 72-78

При построении классификатора использован прием пропуска номеров внутри серии. Например, 41 и 42.

Описание классификатора:

Название классификатора

Группы студентов

Метод классификации

Иерархический

Метод кодирования

Серийно-порядковый

Длина кода

2

Структура кода

ХХ



Вид транспортировки



Иногда получается успешное решение проблем за счет встречного кодирования в смежных сериях. Рассмотрим применение такого подхода на примере группы водный транспорт.

Наименование

Код

Водный транспорт

Морской транспорт

морское судно

железнодорожный вагон (платформа, цистерна), расположенный на морском судне (пароме)

дорожное средство, расположенное на морском судне (суда типа Ро-Ро)

Внутренний водный транспорт
речные суда

суда смешанного "река-море» плавания


Серия 10-19

Серия 10-15

11

12
13

Свободные № 10, 14-15

Серия

16-19
19

18

Свободные № 17,18

При таком варианте кодирования есть возможность расширения номенклатуры для морского и внутреннего водного транспорта. В случае ошибки в размере серии свободные номера находятся на границе разделения.

Классификационные коды используют для отражения классификационных взаимосвязей объектов и группировок и применяются в основном для сложной логической обработки экономической информации. Группу классификационных систем кодирования можно разделить на две подгруппы: системы последовательного кодирования и параллельного кодирования.

Последовательный метод — в кодовом обозначении знаки на каждой ступени деления зависят от результатов разбиения на предыдущих ступенях. В результате кодовое обозначение группировки дает информацию о последовательности признаков, характеризующих эту группировку. Наиболее подходит иерархическому методу классификации.

Пример. Разработаем классификатор групп студентов, используя ранее выполненную классификацию.

Описание классификатора:

Название классификатора

Группы студентов

Метод классификации

Иерархический

Метод кодирования

Последовательный

Длина кода

4

Структура кода

Х Х Х Х

Группа

Способ финансирования

Курс

Специальность




Присвоим код группе 735 по новой классификации. Прикладная информатика по классификационному дереву – 6. Курс – 3. Способ финансирования смешанный – 3. Группа одна с таким способом финансирования – 1. Получается код – 6331. Если бы отдельно обучались бюджетные студенты, то код их группы – 6311.

Рассмотрим, почему классификатор видов транспорта и транспортировки построен не последовательным методом кодирования. Так, у трубопроводного транспорта должен быть код 71, а у линий электропередач – 72.

Достоинства метода:

  1. высокая информативность;

  2. возможность добавления новых элементов без нарушения систем обозначений;

  3. возможность использования для выполнения автоматизированных процедур (поиск, выборка).

Недостатки метода:

  1. большая длина кода;

  2. возможность нарушения систем обозначений при необходимости включения новых классификационных признаков, при значительном расширении номенклатуры;

  3. относительная сложность построения.

Параллельный метод — признаки классификации кодируются независимо друг от друга определенными разрядами или группой разрядов кодового обозначения. Метод параллельного кодирования чаще всего используется при фасетной классификации, но применяется также и в иерархической классификации. При этом либо соподчиненные признаки, обладая полной однородностью, располагаются параллельно во всех звеньях иерархической цепи, либо не соподчиненные параллельные признаки искусственно устанавливаются в определенной последовательности.

Пример. Присвоим кодовые обозначения группам студентов дневного отделения экономического факультета на основе фасетной классификации. Посмотрите, для групп с одинаковыми признаками получается одинаковый код. Предположим, что на 1 курсе по специальности менеджмент 4 группы, тогда получится: 713, 713, 713, 713. Для того чтобы этого избежать разработан специальный метод раздельной классификации и идентификации. Он используется тогда, когда сочетание признаков в фасетной формуле не позволяет добиться однозначного кодирования объектов классификации. В этом случае, как правило, последним вводят признак - регистрационный номер. Для групп студентов – регистрационный номер группы по мере формирования на дневном отделении экономического факультета. Если учесть, что факультет существует 50 лет, на одном курсе порядка десяти групп, 5 лет обучения, то длина кода регистрационного номера составит (50 *5*10 = 2500) – 4 разряда.

Описание классификатора:

Название классификатора

Группы студентов

Метод классификации

Фасетный

Метод кодирования

Параллельный

Длина кода

7

Структура кода

Х Х Х ХХХХ

Группа

Способ финансирования

Курс

Специальность



Тогда для выделенных групп с учетом их условных регистрационных номеров сформируются коды – 7132116, 7132117, 7132118, 7132119.

Достоинства метода:

  1. высокая информативность;

  2. возможность добавления новых признаков классификации и новых объектов;

  3. возможность использования для автоматизированных логических процедур (выборка, объединение).

Недостатки метода:

  1. сложность построения фасетной формулы, обеспечивающей однозначность идентификации, что приводит к необходимости использования раздельной классификации и идентификации;

  2. большая длина кода;

  3. относительная сложность построения.

Метод повторения – метод кодирования, при котором в кодовом обозначении объекта указываются сложившиеся обозначения полностью или частично. Данный метод иногда позволяет построить код минимальной длины, но в то же время он малоинформативен, возможны нарушения кодовых обозначений при появлении новых элементов, нельзя использовать защиту с помощью контрольных разрядов.

Пример. Рассмотрим фрагмент классификатора видов груза, упаковки и упаковочных материалов.

КЛАССИФИКАТОР

ВИДОВ ГРУЗА, УПАКОВКИ И УПАКОВОЧНЫХ МАТЕРИАЛОВ В НКТС
(Рекомендация ЕЭК ООН N 21/ред. 4 - 04.05.2002)


Код

Наименование на русском языке

Наименование на
английском языке

Ap

Ампула защищенная

Ampoule, protected

An

Ампула незащищенная

Ampoule, non-protected

Ae

Аэрозольная упаковка

Aerosol

Bu

Бадья

Bucket

Va

Бак

Vat

Gi

Балка

Girder

Gb

Балка в пакете/пачке/связке

Girders, in bundle/bunch/truss

Bg

Баллон газовый

Bottle, gas

Bp

Баллон защищенный

Balloon, protected

Bn

Баллон незащищенный

Balloon, non-protected

Первая буква в коде повторяет первую букву в наименовании на английском языке, переставлены слова только в строке «Баллон газовый». А вот для того чтобы определить правило для второго символа потребуется весь объем множества. Посмотрите. Где-то это вторая буква, где-то первая во втором слове. Предположим, что перед нами все множество. Определим структуру кода и присвоим кодовые обозначения.

Код

Наименование на русском языке

Наименование на
английском языке

AP

Ампула защищенная

Ampoule, protected

AM

Ампула незащищенная

Ampoule, non-protected

AE

Аэрозольная упаковка

Aerosol

BJ

Бадья

Bucket

VA

Бак

Vat

GI

Балка

Girder

GZ

Балка в пакете/пачке/связке

Girders, in bundle/bunch/truss

GB

Баллон газовый

Bottle, gas

BP

Баллон защищенный

Balloon, protected

BF

Баллон незащищенный

Balloon, non-protected


Описание классификатора:

Название классификатора

вид груза, упаковки и упаковочных материалов

Метод классификации

элементарный, по алфавиту

Метод кодирования

Повторения

Длина кода

2

Структура кода

В В


Смешанный метод – метод кодирования, при котором для обозначения различных признаков используются различные методы кодирования.

Пример. Общероссийский классификатор основных фондов (ОКОФ). Общая структура девятизначных кодов для образования группировок объектов в ОКОФ представлена в виде следующей схемы:

X0 0000000 - раздел

XX 0000000 - подраздел

XX XXXX000 - класс

XX XXXX0XX - подкласс

XX XXXXXXX - вид

ХХ ХХХХХХХХХ – объект.

Между вторым и третьим знаками кода ставится пробел.

Группировки объектов в ОКОФ до уровня подклассов построены по иерархическому методу классификации, а на уровне видов использованы фасеты (перечни) с привязкой их к нижнему уровню иерархической структуры классификатора - к подклассам в пределах выделенного для данного подкласса интервала кодов.

МАТЕРИАЛЬНЫЕ ФОНДЫ 10 0000000

ЗДАНИЯ (КРОМЕ ЖИЛЫХ) 11 0000000

Гаражи наземные и подземные 11 0001130

Фасеты это списки гаражей на конкретном предприятии:

Гараж № 1 11 000113001

Гараж подземный 11 000113002.

Если использовать смешанный вариант кодирования видов транспорта и способов транспортировки, то описание классификатора выглядит следующим образом:



Название классификатора

Видов транспорта и транспортировки товаров

Метод классификации

Иерархический

Метод кодирования

Смешанный

Длина кода

2

Структура кода

В Х



Трансформируем название вида транспорта для того, чтобы стало возможным использования метода повторения:

Название вида транспорта

Код

Действующее

Синоним

Морской транспорт

Морской транспорт

М

Железнодорожный транспорт

Железнодорожный транспорт

Ж

Автодорожный транспорт

Автодорожный транспорт

А

Воздушный транспорт

Воздушный транспорт

В

Почтовые отправления

Почтовые отправления

П

Смешанные перевозки

Смешанные перевозки

С

Фиксированные транспортные установки (стационарный транспорт)

Фиксированные транспортные установки

Ф

Внутренний водный транспорт

Речной транспорт

Р

Вид транспорта неизвестен

Неизвестный вид транспорта

Н


Результат кодирования:

Наименование

Код

Водный транспорт

Морской транспорт

морское судно

железнодорожный вагон (платформа, цистерна), расположенный на морском судне (пароме)

дорожное средство, расположенное на морском судне (суда типа Ро-Ро)

Речной транспорт
речные суда

суда смешанного "река-море» плавания

Железнодорожный транспорт

железнодорожный вагон, платформа, цистерна

дорожное транспортное средство, расположенное на железнодорожной платформе (в вагоне)

Автомобильный транспорт

транспортное средство

состав транспортных средств (тягач с полуприцепом

и (или) прицепом)
иные дорожные транспортные средства

Воздушный транспорт

воздушное судно

дорожное транспортное средство, расположенное

на воздушном судне

Почтовые отправления

почтовые отправления (обычные)

экспресс-доставка

иные виды транспортировки

Фиксированные транспортные установки

трубопроводный транспорт

линии электропередачи

иные виды стационарного транспорта


М1

М2
М3

Р1

Р2

Ж1

Ж2

А1

А2

А3

В1

В2

П1

П2

П3

Ф1

Ф2

Ф3


Широко распространенные штриховые коды являются также кодом повторения, поскольку определенное сочетание темных и светлых, а также широких и узких полос соответствует десятичной цифре.
1   2   3   4

Похожие:

Тема «Проектирование классификаторов» iconУчебно-методический комплекс по дисциплине «Проектирование информационных систем»
«Проектирование информационных систем» разработан в соответствии с требованиями фгос впо (федеральный или региональный компонент)...

Тема «Проектирование классификаторов» iconУчебно-методический комплекс по дисциплине сд. Ф. 1 "Проектирование...
«Проектирование информационных систем» разработан в соответствии с требованиями фгос впо (федеральный или региональный компонент)...

Тема «Проектирование классификаторов» iconПлан урока по Информатике Тема: Графические методы языка программирования Visual Basic
Умк: «Информатика и икт» 10 класс, Н. Д. Угринович, М.: Бином. Лаборатория знаний, 2012; «Visual Basic творческое проектирование...

Тема «Проектирование классификаторов» iconУчебно-методический комплекс по дисциплине "Проектирование информационных...
«Проектирование информационных систем» разработан в соответствии с требованиями фгос впо (федеральный или региональный компонент)...

Тема «Проектирование классификаторов» iconМетодические указания к выполнению курсовой работы по дисциплине...
Задания и методические указания к выполнению курсовой работы по дисциплине «Проектирование информационных систем». Екатеринбург,...

Тема «Проектирование классификаторов» iconПояснительная записка По дисциплине "Проектирование информационных...
По дисциплине "Проектирование информационных систем" в числе других семестровых контрольных мероприятий студенты должны выполнить...

Тема «Проектирование классификаторов» iconПояснительная записка По дисциплине "Проектирование информационных...
По дисциплине "Проектирование информационных систем" в числе других семестровых контрольных мероприятий студенты должны выполнить...

Тема «Проектирование классификаторов» iconМодульный курс Технология с информатикой 4 класс 2 часа в неделю (68ч) №
Составляем композиции панно (проектирование, конструирование, технологии обработки)

Тема «Проектирование классификаторов» iconКурсы повышения квалификации по иоч вб: 17. 03. 2014г. 21. 03. 2014г
«Проектирование учебного занятия на основе современных информационных технологий»

Тема «Проектирование классификаторов» iconМуниципальное общеобразовательное учреждение гимназия №1
Цель: диссеминация опыта работы педагогов Гимназии№1 в рамках реализации инновационного проекта: «Проектирование информационно-образовательной...


Информатика




При копировании материала укажите ссылку © 2000-2017
контакты
inf.na5bal.ru
..На главную