1.4. Требования, учитываемые при проектировании классификаторов При проектировании классификаторов необходимо учитывать следующие основные требования:
взаимнооднозначное соответствие объектов и их кодовых обозначений;
полнота охвата объектов и признаков классификации;
согласование признаков деления множества с алгоритмами преобразования информации;
минимальная длина кода;
простота кодирования и легкость запоминания;
возможность автоматизации классификации и кодирования;
увязка с другими классификаторами и системами обозначения;
нахождения и исправления ошибок в кодовых обозначениях;
ликвидация синонимов не только в кодовых обозначениях, но и в наименованиях, при необходимости преобразование омонимов;
степень охвата кодируемого множества должна возрастать;
Коэффициент информативности
. Коэффициент избыточности
.
Коэффициент охвата
, если длина кода 2 знака.
1.5. Последовательность проектирования Весь процесс разработки системы классификаторов можно разбить на четыре этапа. 1. Определение состава, назначения и сферы действия классификатора
Этап 1.
2. Определение состава исходных данных и требований к классификатору
Разработка ТЗ на
проектирование
3. Разработка основных принципов построения классификатора Этап 2.
4. Разработка методики построения классификатора
Разработка методических
материалов проектирования
5. Разработка инструктивных материалов по сбору и обработке данных
Этап 3.
6. Сбор и обработка данных
Организация сбора и
обработки исходных данных
7. Построение эталонной и рабочей формы классификатора и системы ведения
8. Экспериментальная проверка и внесение коррективов Этап 4.
Составление классификатора
и системы его ведения
9. Утверждение и издание классификатора
Рис. Процесс разработки классификатора На первом этапе «Разработка ТЗ на проектирование» выполняются две работы. Первая из них связана с определением состава, назначения и сферы действия классификаторов, используемых в системе. Перечень классификаторов определяется на основе анализа реквизитного состава первичных и результатных документов и выделения всей совокупности реквизитов-признаков.
Далее определяют назначение классификаторов. Ранее мы рассмотрели виды классификаторов. Каждый классификатор может быть предназначен для однозначной идентификации объекта, передачи информации на расстояние по каналам связи и для выполнения процедур преобразования информации.
Выполнение работ второго этапа связано с определением состава исходных данных и требований к разрабатываемым классификаторам.
К исходным данным, используемым в процессе проектирования классификаторов, относятся:
- перечень задач, в которых предполагают использовать классификатор;
- состав объектов классификации и мощность исходного множества;
- список признаков классификации и число значений каждого признака;
- наименования отдельных группировок и объектов;
- динамика процесса изменяемости состава задач, объектов и признаков.
Требованиям, которым должны удовлетворять разрабатываемые классификаторы, рассмотрены выше. Требования противоречивы, обязательны для исполнению первые четыре.
Содержанием второго этапа является «Разработки методических материалов проектирования», которая включает, прежде всего, разработку основных критериев и принципов построения каждого классификатора. К критериям построения классификатора относятся:
- отнесения того или иного объекта к конкретному классифицируемому множеству;
- степень охвата кодируемого множества объектов.
Принципы построения классификатора связаны с его структурой классификатора, т.е. количеством ветвей, выходящих из каждой классификационной группировки, количеством ступеней и числом уровней классификации. Классификатор считается однородным, если на каждой ступени из каждой классификационной группировки выходит одинаковое количество ветвей.
Кроме того, на этом этапе разрабатывается система взаимодействия классификаторов разных уровней, предназначенных обеспечивать взаимодействие ЭИС с внешней средой. Эта работа представляет собой разработку некоторого транслятора перехода от одного классификатора к другому. Но чтобы его создать, необходимо провести выбор системы взаимодействия различных классификаторов, ориентированных на некоторую номенклатуру объектов.
При варианте «Равноправные классификаторы» (схема 1, А) в каждой ИС независимо от ее уровня имеются свои собственные локальные классификаторы. ИС могут отличаться набором классификаторов, используемыми в них системами классификации и кодирования, признаками классификации. Обмен информацией при этом ведется на языке классификаторов ИС, передающих или принимающих информацию. В первом случае каждая ИС должна иметь набор классификаторов тех ИС, от которых она получает информацию, во втором — которым она направляет ее.
Достоинства этого варианта - возможность использования локальных классификаторов, хорошо приспособленных к решению внутренних задач, и легкое их ведение. Недостатки — необходимость хранения большого числа классификаторов других систем, организация трансляторов и большие затраты на перекодирование.
При варианте «Приоритетные классификаторы (схема 1, Б) в каждой ИС используются свои локальные классификаторы, а обмен информацией ведется на языке классификаторов вышестоящего уровня. При обмене между ИС одного уровня используются классификаторы ближайшей вышестоящей ИС. При этом варианте каждая ИС должна иметь классификаторы вышестоящего уровня. Он может быть использован, когда преобладает обмен ИС нижестоящего уровня с ИС вышестоящего уровня, а потоки информации между отдельными ИС одного уровня относительно не велики. Достоинства этого варианта — возможность использования локальных классификаторов и меньшие затраты на перекодирование по сравнению с предыдущим вариантом за счет сокращения числа трансляторов. Недостаток — необходимость расширения номенклатуры в классификаторах высшего уровня для обеспечения обмена между всеми ИС.
Достоинства этого варианта — возможность использования локальных классификаторов и меньшие затраты на перекодирование по сравнению с предыдущим вариантом за счет сокращения числа трансляторов. Недостаток — необходимость расширения номенклатуры в классификаторах высшего уровня для обеспечения обмена между всеми ИС.
При варианте «Классификаторы-посредники» (схема 2, В) в каждой ИС применяются свои локальные классификаторы, а при обмене используются специально созданные классификаторы-посредники или в качестве такового берется классификатор какой-либо конкретной ИС. Классификатор-посредник должен включать в себя объекты и признаки, используемые при обмене информацией на всех уровнях.
Достоинства этого варианта — возможность использования локальных классификаторов и меньшие затраты на перекодирование по сравнению с предыдущими вариантами за счет оставления в каждой ИС только одного двустороннего транслятора. Недостаток - трудности ведения классификатора-посредника.
А Б
В Г
Схема 2. Варианты структур взаимодействия классификаторов:
А - равноправные классификаторы; Б - приоритетные классификаторы;
В - классификаторы-посредники; Г - единые классификаторы
При варианте «Единые классификаторы» (схема 2, Г) для обработки информации внутри каждой ИС и для обмена используются единые классификаторы. Достоинство единых классификаторов заключается в отсутствии необходимости перекодирования при обмене. Недостатки — необходимость учета в едином классификаторе большого количества объектов и их признаков, используемых в разных ИС, что приводит к значительному объему классификатора и большой длине кодового обозначения, а также требование организации сложной системы ведения единых классификаторов.
Выбор варианта структуры взаимодействия, кроме структуры и объема информационных потоков, во многом зависит от характера информации. По характеру всю информацию можно разделить на два основных типа: информация, характеризующая номенклатуру объектов, и информация, подробно характеризующая свойства этих объектов. Информация первого типа одинакова для всех трех уровней управления, однако по мере его снижения сокращается в объеме. Информация второго типа, раскрывающая внутреннюю сущность информации первого типа, для различных уровней управления различна по объему и содержанию. Для нее по мере повышения уровня характерно уменьшение набора признаков
На этом же этапе осуществляется разработка методик построения классификаторов, отражающих методы и последовательность выполнения отдельных операций по созданию классификаторов, содержание которых зависит от выбранных критериев и принципов их построения.
Третий этап связан с работами по организации сбора и обработки исходных данных,
необходимых для составления классификаторов. К их числу относится разработка инструктивных материалов по сбору и обработке исходных данных:
- определение перечня решаемых задач, использующих классификаторы;
- выделение классифицируемых объектов;
- определение состава признаков классификации и значений признаков;
- осуществление лингвистической обработки этих данных (удаление синонимов, омонимов, полисемии, антонимов);
- согласование используемой терминологии в исходных данных с нормативными документами.
Другой работой, которую выполняют на этом этапе, являются сбор и обработка данных согласно разработанным инструкциям.
На четвертом этапе «Составление классификаторов и системы их ведения» осуществляется построение эталонной и рабочей формы классификатора и системы ведения классификатора. Выполняются следующие процедуры:
выбор системы классификации;
классификация;
выбор системы кодирования;
кодирование;
определение контрольных разрядов;
согласование с другими классификаторами и системами обозначений.
Эталонный классификатор должен быть утвержден, отпечатан типографским способом и распространен всем пользователям..
Рабочие классификаторы хранятся на машинных носителях и передаются пользователям других ИС. Как правило, классификаторы являются файлами справочниками баз данных. Они используются для выполнения процедур диалогового заполнения экранных форм первичных документов и для декодирования результатной информации, при выводе на печать или экран.
К задачам, решаемым системой ведения классификатора, относятся:
- актуализация классификатора, т.е. постоянное пополнение и изменение объектов классификации и кодирования;
- своевременное оповещение всех пользователей обо всех происходящих изменениях;
- реструктуризация (пересмотр структуры классификатора), при которой осуществляется контроль дублирования объектов классификации, контроль и выявление тупиковых ветвей, не ведущих к объекту, оптимизация резервных ветвей по всем уровням иерархии или по всем аспектам классификации;
К проблемам, связанным с проектированием системы ведения классификаторов, относятся:
- разработка организационной структуры системы ведения, т.е. службы, которая отвечает за пополнение классификаторов;
- разработка юридических основ внесения изменений в классификатор;
- разработка информационного и программного обеспечения системы.
Все работы по проектированию классификаторов заканчиваются экспериментальной проверкой и внесением коррективов, утверждением, изданием и рассылкой классификаторов всем пользователям в функциональные подсистемы.
Для общероссийского классификатора установлены следующие стадии разработки и ведения:
1. Организация разработки.
2. Разработка первой редакции проекта и ее рассылка в заинтересованные организации.
3. Внесение изменений и разработка окончательной редакции проекта, ее обязательное согласование и представление для принятия.
4. Принятие и государственная регистрация.
5. Официальное издание.
6. Ведение.
Порядок разработки, утверждения, введения в действие, издания, ведения и применения отраслевых (ведомственных) классификаторов и классификаторов организаций устанавливают соответственно утвердившие их федеральные органы исполнительной власти, министерства, ведомства и организации. 1.6. Необходимость классификации и кодирования
Классификация способствует упорядочению экономических явлений и этим облегчает процесс их изучения, анализа;
При классификации исключаются синонимы и омонимы;
На основе классификационных деревьев возможно автоматизировать выполнение процедур поиска информации;
Кодовые обозначения позволяют выполнять логические процедуры преобразования информации, если они заложены в кодовом обозначении;
При наличии контрольных разрядов, чисел имеется возможность обнаружение ошибок;
Кодовое обозначение позволяет добиться однозначной идентификации.
|