Эта публикация продолжает обсуждение информационных конструкций систем управления, к которым относятся списки, документы и т.д, а также классификаторы и справочники. Понимание роли классификаторов и справочников в управлении позволит правильно организовывать взаимодействие с ними информационных систем.
Оглавление
- Классификаторы и справочники
- Спонтанная классификация
- Влияние классификаторов на совместимость списков
- Объективность ведения классификаторов
- Лингвистический аспект взаимодействия классификаторов
- Классификаторы в информационном пространстве
- Классификаторы и совместимость управленческих списков
- Подведем итоги
Смотри другие публикации из цикла «По следам забытого РЕГОСС»: Информационные системы, Управленческие списки; Приложение 1. Паутина балансодержателей; Приложение 2. Имущество. Часть 1; Приложение 2. Имущество. Часть 2.
Классификация без стандартизации?
Этот раздел, в первую очередь, посвящен влиянию классификаторов на согласуемость двух и более списков. Т.е., речь не идет о теории классификации в ее широком философском или математическом смысле. Интересующимся именно этой теорией рекомендуем обратиться, например, к труду Омельченко В.В «Общая теория классификации» [34, 35].
Здесь термин «классификация» относится к методам разделения управленческих списков на классы (группы, подмножества), и формирования из кодов и названий этих классов специальных списков – классификаторов.
Дело в том, использование кодов классификатора в качестве значений одного или нескольких атрибутов соответствующего управленческого списка, позволяет решать задачи преодоления неопределенности форматов значений этих атрибутов, и даже уменьшения числа атрибутов [см. Попытки синтеза противоречий].
Не менее важную роль играют классификаторы в «вертикальном» соединении управленческих списков, т.е. при передаче их по управленческой вертикали. Например, для формирования из данных регионов общего списка федерального уровня, используется один из классификаторов регионов. При этом часто к региональному списку просто добавляется атрибут с названием «Код региона», значением которого становится код этого региона, извлеченный из классификатора.
Проблема в том, что классификаторы различных информационных систем с одним и тем же названием могут отличаться составом множества объектов и/или правилами разбиения этого множества на классы, и тем самым создать серьёзные трудности для согласования управленческих списков из этих систем.
Классификаторы и справочники
В Википедии дано неудачное определение классификатора, ‑ классификатор — систематизированный перечень наименованных объектов, каждому из которых в соответствие дан уникальный код. Главный недостаток этого определения в его кажущейся самодостаточности, как будто речь идет о произвольном списке, в котором имеется два атрибута: наименование и код. Можно ли назвать классификатором следующий список: 1 ‑ «первый», 2 ‑ «облако», 3 ‑ «коронавирус», 4 ‑ «сам не знаю, что», 5 ‑ «валенки»? Согласно определению – можно. Но, нужен ли кому-нибудь такой классификатор?
Каждый классификатор, во-первых, неотделим от исходного понятия C с множеством значений из объектов , которое предполагается разделить на классы (группы, подмножества).
Во-вторых, в отличие от управленческого списка, записи которого содержат индивидуальные данные об объектах (предметах), классификатор содержит перечень названий и кодов общих свойств [34 стр.59] для групп объектов из исходного множества.
В-третьих, коды, а иногда названия, классификатора представляют собой предопределенные значения атрибутов соответствующих ему управленческих списков. Условием их соответствия является совпадение родового понятия списка с разделяемым понятием классификатора. Непосредственное соединение классификатора со списком выполняется путем замены характеристик, описывающих общие свойства понятия C кодами (или названиями) классификационных группировок. Таким образом, классификатор содержит набор предопределенных значений одного или более атрибутов для управленческого списка.
В-четвёртых, правила разделения исходного множества объектов на классы, порой неявно, описываются набором характеристик общие свойств и из значений.
Т.е. классификатор, как перечень наименованных объектов в совокупности их уникальными кодами, проще управленческого списка по своей структуре, но более сложен по смыслу.
Отдельно взятый классификатор применим к тем спискам, родовое понятие или контекст [59]. которых совпадает с разделяемым понятием этого классификатора.
Справочник – расширенный классификатор, дополнительными атрибутами которого являются показатели, значения которых зависят от значений уникального кода классификационной группировки.
Справочники широко используются в процессе проектирования зданий, автомобильных и железнодорожных дорог и мостов и т.д. Так, например, классификатор климатических зон превращают в справочник такие показатели, как:
- толщина и материал стен, плотность и разновидность материала крыш у зданий;
- толщина покрытия автомобильных дорог;
- величина надбавки к заработной плате.
Рис. 36. Пример расширения классификатора до справочника
На Рис. 36 показан классификатор Субъектов Федерации России, расширенный до справочника добавлением показателя «Средняя рыночная стоимость одного кв. метра жилого помещения».
Особенность справочников по отношению к управленческим спискам в том, что они путем соединения могут делегировать этим спискам значения своих дополнительных показателей. При этом соединение списка со справочником осуществляется по уникальному коду классификационной группировки.
Спонтанная классификация
Что такое спонтанная классификация попробуем понять из примеров. И начнем с классификации животных из рассказа Борхеса «Аналитический язык Уилкинса».
Этот пример классификации так популярен, потому что демонстрирует почти предел спонтанной классификации. Во-первых, по этой классификации практически невозможно восстановить разделяемое множество животных. Что представляет это множество? Объединение непосредственно животных, мумий животных, нарисованных животных, сказочных и мифических животных? А может и не только животных? Во-вторых, отсутствует единое правило (один набор признаков), на основании которого созданы все классификационные группировки. Каждая группировка в этой классификации создана по своему признаку: «принадлежность кому-то [здесь Императору]», «прирученность кем-то», «количество животных». В-третьих, нарушено требование хотя бы относительного постоянства признаков объектов классификации. Так «бегающее как сумасшедшее» животное, перестав бегать тут же перестанет соответствовать признаку и должно быть отнесено к новой группировке. В-четвертых, классификационная группа быть порождена общим для всех объектов признаком таким как «включенных в эту классификацию».
Этот искусственный пример, поэтому он мало что объясняет и доказывает. Не соглашусь. Поэтому приведу примеры классификаторов из реальных информационных систем.
Таблица 8 содержит классификатор видов населенных пунктов, по крайней мере так следует из ее названия. Но содержание классификатора относится и назначению некоторых строений, и территориальным единицам управления лесами, и даже к органам управления садовыми (огородническими) некоммерческими товариществами (СНТ, ОНТ). Особо следует обратить внимание на группировку «строение», которая объединяет казармы, сторожки.
Ясно, что, если возникнет необходимость соединения списка, значения которого заполнялись с использованием этого справочника и любым другим списком, придется каждое необычное значение обрабатывать индивидуально или говоря на сленге программистов вставлять «костыли» в текст программы. Читатель может сам проанализировать и убедиться в том насколько, например, классификаторы видов (типов) адресных элементов ФИАС (SOCRBASE.DBF) и TADRES.DBF единой системы ведения справочников (ЕСВС), которая применяется в медицинских информационных системах Красноярского края, соответствуют своему содержанию и друг другу.
Спонтанная классификация объектов учета возникает не только в спешке оперативной работы отдельной организации. Однажды приходилось сталкиваться с требованием краевых властей предоставить отчет об объектах недвижимости, в котором предлагалось разбить объекты недвижимости на следующие группы: «здания», «строения», «сооружения». И это несмотря на то, что понятие «Строение» является обобщенным понятием для совокупности зданий и сооружений [45].
Так что классификаторы и справочники, которые используются при информационном взаимодействии должны использовать общий подход к классификации объектов для всех участников взаимодействия. И этот общий подход должен быть изложен и утвержден в общезначимом документе, например, порядке или методике классификации объектов.
Беда в том, что общезначимость документа не гарантия того, что утвержденный им классификатор создан не на спонтанной основе. В качестве примера приведем федеральный нормативный акт ‑ Приказ Минфина России от 05.11.2015 № 171н (ред. от 10.03.2020) «Об утверждении Перечня элементов планировочной структуры, элементов улично-дорожной сети, элементов объектов адресации, типов зданий (сооружений), помещений, используемых в качестве реквизитов адреса, и Правил сокращенного наименования адресообразующих элементов».
Таблица 9 содержит классификатор типов зданий Приказа 171н, используемых при нумерации зданий. Например, корпус — это одно из группы зданий, находящихся под одинаковым номером. Но в этот же классификатор включен группировка «Шахта», которая обозначает один из видов промышленных предприятий.
Своим составом классификационных группировок Таблица 10 отличается от предыдущей таблицы не в лучшую сторону. Если уж в добавок к «дому», «корпусу», «строению» добавлены «котельная», «торговый зал», то почему сюда не включить «стадион», «завод», и т.д.
Невозможно не привести еще один пример спонтанного классификатора— это основные группы Общероссийского классификатора занятий, который содержит Таблица 11. Похоже составляли его большие поклонники «Небесной империи благодетельных знаний».
Таблица 11. Основные группы в классификаторе ОКЗ (Общероссийский классификатор занятий)[1]
Нельзя сказать, что спонтанная классификация не имеет под собой никаких рациональных причин. Часто в процессе использования списка возникает спонтанная задача (например, по требованию руководства) выбора отдельных объектов со сходными свойствами без разделения всей совокупности объектов на подвиды (подгруппы). Так как по обыкновению задача должна быть решена «вчера», то записи списка просматриваются специалистом и подходящие их них отмечаются признаком. А затем из записей, отмеченных этим признаком формируется отчет. Легче всего этот новый признак добавить в существующий классификатор. Так классификатор становится спонтанным.
Выше отмечено, что атрибут списка, значения которого заимствуются из спонтанного классификатора, подвержен частым изменениям, в зависимости от того или иного задачи поиска. Поэтому спонтанные классификаторы непригодны, как поставщики значений идентифицирующих характеристик списков.
Итак, первыми признаками спонтанной классификации, когда классификация выполнена не на множестве объектов с однородными свойствами (далее однородное множество), а также когда правила разделения множества индивидуальны для одного или нескольких классов.
Влияние классификаторов на совместимость списков
Приведем два примера несогласованности классификаторов, которая приводит к невозможности совмещения управленческих списков.
Пример первый
Рассмотрим два классификатора разделяющих одно и тоже множество памятников культурного наследия. Один приведен в федеральном законе от 25.06.2002 № 73-ФЗ (далее ФЗ), а другой в приказе Министерства культура РФ от 03.10.2011 № 954 (далее Приказ).
Рис. 37 показывает, что формально эти два классификатора не согласованы. Т.е. любые два списка с общим атрибутом «Вид объекта культурного наследия» такие, что в одном из них атрибут принимает значения левого списка, а другой — правого, не могут быть соединены по этому атрибуту.
В практической деятельности для согласования эти двух классификаторов обычно создается третий классификатор, который по отдельности согласован с каждым исходным классификатором. И уже через этот третий классификатор соединяются списки.
Согласование классификаторов выполняется путем мысленного «пересечения» классификационных группировок двух классификаторов. Затем новый классификатор дополняется правилами получения группировок исходных классификаторов.
Далее для краткости назовем левый классификатор из Приказа Минкультуры РФ П-Классификатором или П-К, а правый классификатор из Федерального закона — ФЗ-классификатором или ФЗ-К. Таким образом «Памятник Археологии» из П-классификатора, является обобщением двух группировок ФЗ-классификатора: «Мавзолей, отдельное захоронение» и «Объект археологического назначения». Правила приведения группировок нового классификатора могут быть описаны формулами. Например, так: «П-К» -> «Памятник Археологии» = «ФЗ-К» -> «Мавзолей, отдельное захоронение» + ФЗ -> «Объект археологического назначения», где «+» операция «обобщения» [59].
Рис. 38 содержит классификатор, согласующий классификаторы «П-К» и «ФЗ-К», который создан из предположения, что группировки П-классификатора обладают двумя важными свойствами: а) покрывают все множество памятников культурного наследия; б) каждый памятник может быть отнесёт только к одной из этих группировок.
Создать такой согласующий классификатор нельзя без глубокого погружения в предметную, т.е. нет такой универсальной функции, с помощью которой можно было бы установить алгоритмически установить соответствие между двумя таким классификаторами. Более того, в обоих списках, один из которых ссылается на П-классификатор, в другой — на ФЗ-классификатор, значения соответствующих атрибутов должны быть вручную заменены кодами согласующего классификатора.
Итак, использование согласованных классификаторов является достаточным условием совместимости управленческих списков. Обеспечить согласованность классификаторов можно только в случае независимости их разработки и ведения.
Пример второй
Ранее был рассмотрен пример несогласованности классификаторов, разделяющих на классы общее множество. Новый пример демонстрирует проблемы несогласованности классификаторов, основанных на различных, хотя и «родственных» множествах.
В Красноярском крае принята «Стратегия управления рынком труда Красноярского края до 2020 года», утвержденная Распоряжением Правительства Красноярского края от 27 декабря 2013 года № 992-р. Этот документ содержит меры для расширения возможностей управления рынком труда.
Основная идея предложенных мер в развитии рынка труда при условии поддержания баланса кадровой потребностью края и заполнением кадровой потребности, не допуская при этом ни трудоизбыточности и трудонедостаточности. Уж извините, это термины из «Стратегии». Простыми словами, «трудоизбыточность» — это характеристика территории края(района), на которой количество жителей, имеющих профессию, больше, чем требуется рабочих этой профессии на предприятиях этой территории. И наоборот, «трудонедостаточность» — это характеристика территории, которая означает, что предприятиям территории требуется больше рабочих определенной профессии, чем жителей территории, обладающих этой профессией.
Рис. 39. Схема вычисления проблемы на рынке труда
Задача, казалось бы, простая – вычислить разницу между потребностью предприятий в рабочих заданной профессии и числом неработающих жителей, имеющих возможность работать по этой профессии. Но это только на первый взгляд.
Начнём с того, что при расчёте числа людей способных работать по заданной профессии необходимо учитывать выпускников учебных заведений, а не только тех специалистов, которые по какой-то причине лишились работы. А для этого необходимо множеству профессий сопоставить множество учебных специальностей. При этом, список профессий представлен классификатором ОКПДТР[2], а список специальностей выпускников учебных заведений — классификатором ОКСО[3].
Формально говоря, эти классификаторы несовместимы, т.к. опираются на разные множества. Что ж попробуем выяснить можно ли установить соответствие между всеми профессиями и учебными специальностями.
Во-первых, классификаторы ОКПДТР и ОКСО различаются видами классов, на которые эти классификаторы разделяют исходное множество. ОКПДТР ограничивается одним видом классов — профессиями. ОКСО содержит 3 вида классов: профессии, специальности, направления [Рис. 40 слева]. И если профессии, специальности ОКСО оставляют надежду установить соответствие между ними и профессиями ОКПДТР, то задача установления соответствия между направлениями полученных выпускником знаний и профессиями представляется алгоритмически (математически) неразрешимой.
Во-вторых, ОКПДТР и ОКСО используют разные основания для правил образования классификационных группировок. В ОКПДТР профессия определяется как набор умений или навыков, а в ОКСО профессия (специальность, направление) это набор научных фундаментальных и прикладных знаний [Рис. 40 слева]. В этом случае даже одно и то же наименование профессии в ОКПДТР и профессии или специальности в ОКСО не гарантирует их одинакового смыслового содержания. [Смотри, например, Кто в лес, кто по дрова].
В-третьих, базовый набор областей знаний, которым в процессе обучения овладевают представители различных профессий, может оказаться одинаковым. Отличаются профессионалы глубиной знаний в области необходимых в его работе. Рис. 40 справа показывает, что круг знаний, который используют в своей работе системный аналитик, прикладной программист, администратор баз данных, системный администратор, находится в рамках одних и тех же областей знаний. Поэтому, их образование по ОКСО относится к одной и той же группировке «Информатика и вычислительная техника». Но, например, системный аналитик лучше знаком с теорией систем и предметной областью автоматизируемой отрасли (организации, подразделения) чем это необходимо прикладному программисту.
Как показывает пример Рис. 40 справа, классификатор ОКПДТР содержит профессии неразличимые в классификаторе ОКСО. А значит установить соответствие между позициями этих классификаторов можно только в принудительном порядке. Такие попытки сейчас предпринимаются в Министерстве труда и социальной защиты Российской Федерации.
Возвращаясь к задачам «Стратегии управления рынком труда Красноярского края до 2020 года», можно сказать, что эти задачи неразрешимы путем соединения списков и причиной этому несовместимость классификаторов ОКПДТР и ОКСО [см. Рис. 41].
Объективность ведения классификаторов
Очень трудно подобрать термин, характеризующий проблему использования общедоступного классификатора, которая будет описана здесь. Речь идет о тех случаях, когда результат обращения пользователя к классификатору не соответствует ожиданиям большого числа пользователей классификатора. Такая ситуация возникает, когда оператор ведения классификатора в свою пользу толкует правила составления и назначения классификатора.
Судите сами. Федеральный закон от 28.12.2013 N 443-ФЗ «О федеральной информационной адресной системе и о внесении изменений в Федеральный закон «Об общих принципах организации местного самоуправления в Российской Федерации» содержит следующие положения:
Адрес — описание места нахождения объекта адресации, структурированное в соответствии с принципами организации местного самоуправления в Российской Федерации и включающее в себя в том числе наименование элемента улично-дорожной сети и (или) наименование элемента планировочной структуры (при необходимости), а также цифровое и (или) буквенно-цифровое обозначение объекта адресации, позволяющее его идентифицировать (статья 2);
В государственный адресный реестр вносятся сведения об адресах и о реквизитах документов о присвоении, об изменении, аннулировании адресов (статья 4).
Т.е., естественно ожидать, что отдельный адрес должен присутствовать в классификаторе только один раз.
Но, не тут-то было. Этот классификатор в некоторых случаях содержит записи с повторяющимися адресами (Таблица 12).
В том, что разные объекты имеют одинаковый адрес нет ничего удивительного. Здание и земельный участок под ним; дом, гараж, баня у одного хозяина. Все они имеют один и тот же адрес. Но ФИАС – это адресный реестр, т.е. список адресов.
Т.е. оператор ФИАС, федеральная налоговая служба, подстраиваясь под свои нужды, преобразует список адресов в перечень наземных строений.
Далее под объективностью ведения классификатора будем понимать отсутствие разницы в правилах между описанием классификатора и практикой его ведения.
Лингвистический аспект взаимодействия классификаторов
Проблемой соединения списков может стать не только различие в наборе справочных элементов классификаторов, но и различие смысла одинаково названных элементов классификаторов.
Рассмотрим пример, который приводит Джон Лайонз в «Введение в теоретическую лингвистику» [[23] стр.74].
Рис. 42 содержит пример классификации цветов: красный (red), оранжевый (orange), желтый (yellow), зеленый (green), синий (blue). При этом горизонтальный размер каждой клетки условно соответствует диапазону цветов, который обозначен соответствующим словом. Рисунок показывает, что классификация цветов языка А соответствует по составу и смыслу (семантически изоморфны) классификации цветов в английском языке, а классификация цветов в языках B и C – нет.
Проблема, описанная Лайонзом, возникает не только при сравнительном анализе слов, употребляемых в разных языках. Она отображает разницу в подходе образования каждого понятия, лежащего в основе слова. Так, например, смысл понятий может изменяться со временем, тогда решение задачи сравнения данных за разные календарные периоды, может привести к необходимости согласования понятий, использующихся в анализе.
Подобные же различия наблюдаются в классификаторах, созданных различными ведомствами.
Так вся территория России с одной стороны может быть разделена на части по административному принципу, т.е. на регионы или субъекты Российской Федерации. С другой стороны, в кадастровом учете земель территория России разделена на кадастровые округа, территории которых не везде совпадают с территорией региона (Таблица 13).
Аналогично, административные границы района или крупного населенного пункта не всегда совпадают территорией кадастрового района с тем же названием (Таблица 14).
Другими словами, один и тот же земельный участок с позиции административного деления территории может относиться к территории Красноярска, а в кадастровом учете к Емельяновскому или Березовскому кадастровому району.
Далее покажем, что в некоторых случаях классификаторы, содержащие группировки на основе различающихся «объёмом» понятий, можно согласовать через введение общего базового классификатора.
В [59] предложен подход аппарат согласования понятий, для чего была введена операция «синтеза» понятий «+». Продемонстрируем этот метод на примере Лайонза (Рис. 42).
Первым шагом создадим новый термин, каждая позиция которого «пересекается» только с одним элементом каждого языка. Так, например, термин «f» языка B пересекается с терминами «a» и «b» языка A, а термин «g» языка B пересекается с терминами «b» и «c» языка A. Поэтому они требуют разбиения на менее объёмные по смыслу термины.
В результате, как показывает Рис. 43, получится новый условный язык, который будет называться базовым языком.
Вторым шагом преобразуем сравниваемые языки A, B, C в производные от базового языка. Для этого каждому термину этих языков поставим в соответствие формулу его образования из терминов базового языка. Таким образом, например, язык будет представлен следующим набором:
В результате исходные языки описываются в форме своеобразных толковых словарей таких, как это представляет Таблица 15.
Этот метод предполагает «измеримость» объема каждой классификационной группировки. Так Лайонз создал свою таблицу в предположении, что каждому цвету сравниваемых языков сопоставлен некий диапазон электромагнитного излучения. Поэтому появилась возможность сравнения их объема, и поэтому можно выполнить операцию пересечения сравниваемых цветов.
Административные и кадастровые территории измеряются своим местоположением на карте, а в базе данных координатами и величиной своих полигональных геометрий. Поэтому эти классификаторы могут быть преобразованы указанным методом. В результате для каждой точки на карте за одно обращение к базе данных можно определить ее принадлежность как административной, так и к кадастровой территориям.
Классификаторы в информационном пространстве
Как следует из предыдущего обсуждения, каждый классификатор, участвующий в соединении двух или более списков должен быть «известен» каждому из участников такого соединения. В этом смысле, классификаторы считаются частью информационного пространства – некой комфортной среды для взаимодействия информационных систем, в том числе соединения управленческих списков («Семантика информационного пространства»).
В пределах информационного пространства каждый классификатор является общим ресурсом для управленческих списков в рамках своей области видимости.
Направленность Классификаторов
Одной из характеристик каждого классификатора является множество, которое разделяется им на классы (группы). При этом таким множеством может быть подмножество значений управленческого списка — предметов или объектов. С другой стороны, классификатор может быть определён на множестве самих списков или понятий, лежащих в их основе.
Поэтому классификатор, определенный на множестве значений списков, будем называть классификатором, направленным на значения списка или просто классификатором значений. Классификатор же, определенный на множестве списков(понятий), будем назвать классификатором, направленным на списки (понятия), или просто классификатором списков (понятий).
Классификаторы списков являются классификаторами более высокого порядка по отношению классификаторов значений.
Рис. 44 содержит пример классификатора понятий в информационной системе АИС «РЕГОСС».
Области видимости Классификаторов
Областью видимости классификатора называется один или несколько управленческих списков в информационном пространстве.
В дальнейшем классификатор будут называться внутренним если его область видимости ограничена набором списков одной информационной системы.
Классификатором взаимодействия называется классификатор, область видимости которого включает управленческие списки из двух и более информационных систем.
Рис. 45 показывает классификаторы 1, 2, …, n, как классификаторы взаимодействия. В тоже время, оси информационного пространства могут быть включены в один или несколько классификаторов понятий.
Область видимости тесно связана с понятием уровня использования классификатора. Уровень классификатора определяет рамки использования в пределах системы управления. Например, классификатор организации, органа власти, отрасли, региона, Российской Федерации, международный.
«Родственные» группы Классификаторов
Основная польза взаимодействия классификаторов со списками заключена в возможности замены неформатированных значений идентифицирующих характеристик списков кодами классификаторов. Действительно, два управленческих списка легко соединяются при помощи одних и тех же кодов общего классификатора.
К сожалению, неумолимое время лишь редким классификаторам позволяет остаться постоянными. В результате классификаторы дополняются новыми группировками, у отдельных классификационных группировок изменяются коды. А порой старые классификаторы заменяют их «потомками» с новыми правилами разделения множества, на которое они направлены. (Подробнее смотри Попытки синтеза противоречий).
Нужны примеры? Пожалуйста. Классификатор советского времени СОАТО заменен классификатором ОКАТО Классификатор ОКОНХ[4] — ОКВЭД[5]. А В 2014 году введен классификатор ОКВЭД2 (вторая редакция ОКВЭД). ОКВЭД2 отличался от ОКВЭД настолько, что для перехода потребовалась специальная таблица соответствия кодов.
Все вышесказанное наводит на мысль, что классификаторы следует представлять участниками некой «родственной» группы. Т.е. над списком классификаторов информационного пространства следует определить метаклассификатор, разделяющий их по «родственным» группам. Классификаторы в составе «родственной» группы могут быть упорядочены по времени их актуальности. Дополнительно каждому следующему классификатору в группе следует поставить в соответствие функцию преобразования предыдущего классификатора в следующий.
Упорядоченность классификаторов в «родственной» группе позволяет выделить классификатор с самым поздним периодом актуальности, тем самым, задать отношение «быть эталоном». Далее, каждый классификатор «родственной» группы будем считать перенумерованным, начиная с 1 (классификатор с самым ранним периодом актуальности) и называть его n-ой редакцией классификатора или просто n-ой редакцией (смотри Рис. 46).
Окна несогласованности классификаторов
Со временем разделяемое классификатором множество предметов (объектов) подвержено изменениям — добавляется новые, исчезают устаревшие объекты или изменяются взаимосвязи между объектами. Такие изменения множества приводят к смысловой несогласованности с разделяющим его классификатором, продолжительность которой в дальнейшем будет именоваться «окном несогласованности» (смотри (inconsistency window) [02 стр.70].
Размеры окон несогласованности общероссийских классификаторов могут измеряться месяцами и даже годами. Например, несмотря на то, что ФИАС обновляется 2 раза в неделю, но это не означает, что столь же часто обновляются редакции классификатора в информационных системах.
Наличие окон несогласованности классификаторов, порождает несогласованность списков, атрибуты которых содержат его уникальные коды в качестве значений. Одной из причин увеличения окон несогласованности списков может быть сложность обнаружения новой редакции классификатора в том случае, когда изменяются только отдельные коды группировок. Например, коды ОКАТО[6], ОКТМО[7] изменяются по мере изменения структуры подчиненно административной подчиненности территорий. Смотри пример на Рис. 26.
Необходимость управления окнами несогласованности как классификаторов, так и использующих их списков привела к концепции «Родственных» групп классификаторов. В том числе потому, что функции преобразования редакций классификатора могут быть применены к обновлению значений соответствующих атрибутов в списках.
Назначения и роли Классификаторов
В этом разделе только для наглядности изложение будет вестись в предположении, что соединение управленческих списков выполняется только по одному атрибуту. В тоже время все последующие замечания с небольшими дополнениями справедливы и для соединения списков с произвольным набором атрибутов.
Механизм соединения списков непосредственно можно представить в виде прямого или функционального соединения списков.
Два совместимых списка могут быть соединены непосредственно по значениям соответствующих идентифицирующих атрибутов. Такое соединение будем называть прямым соединением списков. Для реализации простого соединении особенно полезны классификаторы взаимодействия. При этом должно выполняться условие, что классификатор, делегирующий атрибуту списка свои коды, единственный в «родственной» группе, или соединяемые списки используют одну и туже редакцию классификатора. Последнее условие кажется почти невероятным, если соединяются списки двух различных ведомств, т.к. операторы управленческих списков не слишком любят выполнять частый переход на новую редакцию классификатора из-за того, что этот процесс может оказаться слишком затратным.
На практике множества значений общего атрибута двух формально совместимых списков могут не совпадать, и тем не менее соединить списки необходимо. В этом случае может помочь функция преобразования значений общего атрибута одного списка в значения другого списка. Соединение списков при помощи функций преобразования значений будем называть функциональным соединением списков. Особенно часто функциональное соединение применяется, в случаях, когда классификаторы соединяемых списков принадлежат к одной «родственной» группе, но разным редакциям.
Для использования функционального соединения значениями общего атрибута соединяемых списков должны быть не совпадающие коды из разных редакций одной группы. При этом у этих классификаторов должно быть одно общее разделяемое множество и общие правила разделения этого множества на классификационные группировки.
В случае, когда не совпадают и правила разделения общего множества на классификационные группировки приходится создавать третий классификатор, из группировок которого можно создать группировки каждого из классификаторов, которые участвуют в соединении списков. Пример метода создания такого промежуточного классификатора приведен в разделе «Лингвистический аспект взаимодействия классификаторов».
Описанные здесь функции и вспомогательные классификаторы, используемые для соединения списков, совместно с другими средствами трансформации записей исходных списков к формату списка назначения составляют обменный формат. А версия исходных списков, полученная в результате трансформации при помощи обменного формата, сохраняется в обменном файле.
Многие классификаторы информационного пространства можно расширить путем добавления атрибутов, содержащих дополнительные показатели. Расширенные таким образом классификаторы мы ранее договорились называть справочниками. Таким образом справочники на основе классификаторов позволяют включать в списки показатели, которые напрямую не зависят от информационных характеристик самих списков. Так значения районных коэффициентов для начисления заработной платы могут быть соединены с управляющим списком, как это показывает Рис. 47 через расширение классификатора районов.
Ну и наконец. На основе классификатора списков информационного пространства может быть построен очень полезный справочник, содержащий для каждого эталонного названия набор фактических названий этого списка, встречающихся в информационном пространстве. Такие справочники будем называть справочниками синонимов списков. Следует подчеркнуть, что несмотря на некоторую схожесть этого справочника с классификатором классификаторов, синонимы внутри групп не удастся упорядочить. Да этого и не нужно назначение этого справочника в том, чтобы каждому синониму сопоставить правильное имя.
Замечание
На Рис. 45 показано, что множество понятий, лежащих в основании списков, может быть представлено в виде осей информационного пространства. Т.е. классификатор списков можно интерпретировать как классификатор осей в пространстве списков.
С другой стороны, каждый классификатор группирующий множество предметов (объектов) экспортирует в атрибут списка набор уникальных кодов классификаторов. Таким образом классификатор по отношению к списку представляет собой особую форму атрибута со множеством возможных значений. Из этого следует, что классификатор классификаторов можно интерпретировать как классификатор осей в пространстве универсальных атрибутов.
Классификаторы и совместимость управленческих списков
Подведем итоги
Дать краткую характеристику хорошего классификатора не получилось. Поэтому обратимся к плохому классификатору, который демонстрирует Таблица 16.
Что в этом классификаторе плохого? Давайте попробуем выделить множество, которое должен разделять классификатор. Так группировки «Удаленная запись», «Исправления», «Архив» относятся к записям списка, «Не определен Б/Д[8]» — к объектам имущества, остальные, скорее всего, к организациям.
В классификации организаций тоже какая-то путаница. «Банкрот», «Внешнее управление», «Заявление о несостоятельности», «Конкурсное производство», «Мировое соглашение», «Процедура наблюдения» — стадии банкротства организации. «Академия Наук» указание на определенный вид деятельности организации. «ЮЛ, имеющие только земельные участки (ОПФ-прочие)», «Имущество, недвижимость» характеризуют организации по признаку наличия того или иного вида собственности.
Организация в стадии, например, конкурсного наблюдения может одновременно быть юридическим лицом, имеющим только земельные участки. Какое значение должно быть выбрано для соответствующей записи списка, атомарный атрибут которого использует этот классификатор как источник значений? Или еще, запись списка об организации может быть перемещена в архив. Тогда прежнее значение атрибута, связанное с классификатором, должно быть утеряно?
Итак, рассматриваемый классификатор плох тем, что каждую запись списка нельзя соотнести с единственной классификационной группировкой.
Причина этого в том, что группировки классификатора разделяют разные множества, а значит обладают различными условиями такого разделения, например, «какова стадия банкротства», «какими видами объектов недвижимости пользуются», «Находится ли запись в архиве» и т.д. Т.е. записи классификатора обладают не одинаковыми наборами признаков или несовпадающим предикатом.
Так что же такое хороший классификатор?
Классификатор – результат классификации, т.е. разделения, множества объектов на группы, так что каждая группа получает название и в большинстве случаев код. То есть для того, чтобы классификация оказалась хорошей, должно быть точно определено множество объектов, к которому она применяется. Такое множество, которое ранее было названо базовым множеством классификатора, должно удовлетворять требованиям:
- единственности основания определения множества;
- правильного выбора основания определения множества;
- полноты множества.
Кроме того, хороший классификатор:
- Должен быть полным. Т.е. не должно быть ни одного объекта базового множества, который бы не мог быть отнесен к той или иной группе.
- Обладать понятным и общим для всех пользователей смыслом каждой классификационной группировки.
- Обладать максимально возможной областью видимости.
- Обладать предсказуемым и управляемым окном несогласованности.
Дополнительно, будем называть полный классификатор еще и строгим, если каждый объект его базового множества может быть отнесен только к одной классификационной группировке. По этой причине, в качестве источником значений атомарных атрибутов списков используются только строгие классификаторы. Нестрогие классификаторы являются поставщиками значений неатомарных атрибутов списков. В качестве примера достаточно вспомнить ОКВЭД. Каждый список, ссылающийся на этот классификатор, обладает неатомарным атрибутом, содержащим в качестве значений набор кодов классификатора.
Смотри другие публикации из цикла «По следам забытого РЕГОСС»:
- Информационные системы
- Приложение. Паутина балансодержателей
- Управленческие списки
- Имущество. Часть 1
- Имущество. Часть 2
Сноски
[1] «ОК 010-2014 (МСКЗ-08). Общероссийский классификатор занятий» (принят и введен в действие Приказом Росстандарта от 12.12.2014 N 2020-ст). Разработан Министерством труда и социальной защиты Российской Федерации. Представлен Министерством труда и социальной защиты Российской Федерации
[2] ОКПДТР — Общероссийский классификатор профессий рабочих, должностей служащих и тарифных разрядов. Объем классификатора 8215 записей
[3] ОКСО -Общероссийский классификатор специальностей по образованию. Объем классификатора 1590 записей.
[4]ОКОНХ — Общесоюзный классификатор отраслей народного хозяйства.
[5]ОКВЭД — Общероссийский классификатор видов экономической деятельности.
[6] ОКАТО — Общероссийский классификатор объектов административно-территориального деления.
[7] ОКТМО — Общероссийский классификатор территорий муниципальных образований.
[8] Б/Д — сокращение от слова балансодержатель. В данном случае, балансодержатель— это организация, использующая государственное имущество.
Литература
- Эрик Эванс. Предметно-ориентированное проектирование (DDD): структуризация сложных программных систем. Пер. с англ. — М.: 000 «И.Д. Вильямс», — 448 с. : ил.
- Мартин Фаулер, Прамодкумар Дж Садаладж. NoSQL: новая методология разработки нереляционных баз данных. Пер. с англ. — М.: ООО «И.Д. Вильяме», 2013. — 192 с.: ил.
- Нонако Икуджиро, Такеучи Хиротака. Компания — создатель знания. Зарождение и развитие инноваций в японских фирмах. Пер. с англ. А. Трактинского. — М.: ЗАО «Олимп-Бизнес», 2011. — 384 С.: ил.
- Иванов М.А., Шустерман Д.М. Организация как ваш инструмент: Российский менталитет и практика бизнеса. ‑3-е изд. – М: Альпина Бизнес Букс, 2006‑ 392 С.
- Саймон Герберт, Науки об искусственном: Пер с англ. Изд. 2-е. — М.: Едиториал УРСС, 2004. — 144 с.
- Бир Стаффорд, Кибернетика и управление производством. Мифология систем под сводом сумерек. /Под ред. А.Б. Челюсткина. Пер. с англ. Изд. 2-е. М: Издательство «НАУКА», 1965. – 392 с.
- Бир Стаффорд, Кибернетика и управление производством.Пер. с англ. Изд. 2-е. М: Издательство «НАУКА», 1965. – 392 с.
- Сенге Питер, Танец перемен: новые проблемы самообучающихся организаций/ Питер М. Сенге, Арт Клейнер, Шарлота Робертс, Ричард Б. Росс, Джорж Рот, Брайан Дж. Смит// Пер. с англ. Борис Пинскер М: Издательство «Олимп-Бизнес», 2017. – 624 с.: ил
- Сенге Питер, Пятая дисциплина. Искусство и практика обучающейся организации/ Пер. с англ. Константинова Юлия М: Издательство «Манн, Иванов и Фербер», 2018. – 496 с.: ил
- Карр Николас Дж. Блеск и нищета информационных технологий: почему ИТ не являются конкурентным преимуществом. /Пер. с англ. М: Издательский дом «Секрет фирмы», 2005– 176 с.
- Гамма Э., Хелм Р., Джонсон Р., Влиссидес Дж , Приемы объектно-ориентированного проектирования. Паттерны проектирования. — СПб: Питер, 2001. — 368 с.: ил. (Серия ≪Библиотека программиста≫)
- Аристотель, Метафизика. Сочинения в четырех томах. Т. 1. Ред. В. Ф. Асмус. М., «Мысль», 1976.550 с.; (АН СССР. Ин-т философии. Филос. наследие). Стр. 63.
- 13. Аристотель, Категории. Сочинения в четырех томах. Т. 2. Ред. 3. Н. Микеладзе М., «Мысль», 1978. 687 с.; (АН СССР. Ин-т философии. Филос. наследие). Стр. 52.
- Когаловский М. Р., Перспективные технологии информационных систем. — М.: ДМК Пресс, 2003, — 288 с.
- Глушков В.М. Основы безбумажной информатики. Изд. 2-е, испр.‑ М.: Наука. Гл. ред. физ.-мат. лит., 1987. ‑ 552 с.
- Джордж Л. Майкл «Бережливое производство + шесть сигм» в сфере услуг: Как скорость бережливого производства и качество шести сигм помогают совершенствованию бизнеса / Майкл Л. Джордж; [пер. с англ.] — М.: Альпина Бизнес Букс, 2005. — 402 с. — (Серия «Модели менеджмента ведущих корпораций»).
- Пихорович В.Д. «Очерки истории кибернетики в СССР». Изд. Стереотип. М.: ЛЕНАРД, 2016. – 264 с. (Наука в СССР: Через тернии к звездам. № 31.)
- Фреге Готлоб, О Смысле и Значении, стр. 230-246. Логика и логическая семантика: Сборник трудов/Пер. с нем. Б.В. Бирюкова под ред. З.А. Кузичевой: Учебное пособие для студентов вузов. М.: Аспект Пресс. 2000 – 512с.
- Фреге Готлоб, Размышления о Смысле и Значении, стр. 247-252. Логика и логическая семантика: Сборник трудов/Пер. с нем. Б.В. Бирюкова под ред. З.А. Кузичевой: Учебное пособие для студентов вузов. М.: Аспект Пресс. 2000 – 512с.
- Фреге Готлоб, О Функции и Понятии, стр. 215-228. Логика и логическая семантика: Сборник трудов/Пер. с нем. Б.В. Бирюкова под ред. З.А. Кузичевой: Учебное пособие для студентов вузов. М.: Аспект Пресс. 2000 – 512с.
- Фреге Готлоб, О Понятии и Предмете, стр. 253-262. Логика и логическая семантика: Сборник трудов/Пер. с нем. Б.В. Бирюкова под ред. З.А. Кузичевой: Учебное пособие для студентов вузов. М.: Аспект Пресс. 2000 – 512с.
- Акаткин Ю.М., Ясиновская Е.Д. Цифровая трансформация государственного управления: Датацентричность и семантическая интероперабельность / Под науч. Ред. И предисл. В.А. Конявского. – М.: ЛЕНАНД, 2019 – 724 с.
- Лайонз Дж. Введение в теоретическую лингвистику. — М.: Прогресс, 1978. — 544 с.
- Потапов А.С., Распознавание образов и машинное восприятие: Общий подход на основе принципа минимальной длины описания. – СПб.: Политехника, 2011. – 548 с.: ил.
- Ансофф И. Стратегическое управление. М Экономика. Пер. с англ. – М.: Экономика, 1989. –520 с.
- Родионов В.И. Регулирование динамики социально-экономических систем в условиях роста нестабильности внешней и внутренней среды. М Спб «Нестор-История», 2012. –394 с.
- Паттон Джефф, Пользовательские истории. Искусство гибкой разработки ПО. — СПб.: Питер, 2017. — 288 с.: ил. — (Серия «Бестселлеры O’Reilly»).
- Лосев Алексей Федорович, Философия имени. Бытие. Имя. Космос / Сост. и ред. А.А.Тахо-Годи — М: Мысль,1993.958 с. Стр.613.
- Борхес Хорхе Луис, Аналитический язык Джона Уилкинса, Сочиненя в трех томах. Т.2/Пер. с исп.; Составл., предисл., коммент. Б. Дубина. – Рига: Полярис, 1994. ‑511с. Стр. 85.
- Гегель Георг Вильгельм Фридрих, Наука Логики, В 3-х томах. Т.1/ Пер. с нем. Б. Г. Столпнера. – М: «Мысль», 1970. ‑501с. (АН СССР. Ин-т философии. Философское наследие).
- Гегель Георг Вильгельм Фридрих, Феноменология духа/ Пер. с нем. Г. Шпета. – М: Наука, 2000. -495 с. (Российская АН. Ин-т философии. Серия «Памятники философской мысли»).
- Эшби У. Росс, Введение в кибернетику, М:«Иностранная литература», 1959 — 432 с.
- Ингрсолл Грант С., Мортон Томас С., Фэррис Эндрю Л., Обработка неструктурированных текстов. Поиск, организация и манипулирование. / Пер. с англ. Слинкин А.А. – М.: ДМК Пресс, 2015. – 414 с.: ил.
- Омельченко В.В. Общая теория классификации. Часть I. Основы системологии познания действительности. М.: ООО «ИПЦ „Маска»», 2008 — 436 с.
- Омельченко В.В. Общая теория классификации. Часть 2. Общая теория классификации. Ч. 2: Теоретико-множественные основания /Предисл. Д. А. Ловцова. — М.: Книжный дом «ЛИБРОКОМ», 2010. — 296 с.
- Дейт К. Дж. Введение в системы баз данных = Introduction to Database Systems. — 8-е изд. — М.: Вильямс, 2005. — 1328 с.
- Кузнецов С. Д. Основы баз данных. — 2-е изд. — М.: Интернет-университет информационных технологий; БИНОМ. Лаборатория знаний, 2007. — 484 с.
- Войшвилло Е. К. Понятие как форма мышления: логико-гносеологический анализ. — М.: Изд-во МГУ, 1989. — 239 с.
- Заде Л.А. Понятие лингвистической переменной и его применение к принятию приближенных решений /Пер. с англ. Н.И. Ринго ; Под ред. Н.Н. Моисеева и С.А. Орловского — М.: Мир, — 1976.-165 с.
- Кодд Е.Ф., Реляционная модель данных для больших совместно используемых банков данных/стр. 145—150/ журнал Системы Управления Базами Данных № 1/1995 Пер. с англ. М.Р. Когаловского. М.: издательский дом «Открытые системы».
- Гладков Сергей, Разработка программ: проблемы и иллюзии. Открытые системы. СУБД 2010 № 01 c. 54. Дополнительно: Почему ИТ оказываются невостребованными и как этому способствуют программисты.
- Гладков Сергей, «О стратегическом подходе к развитию ИТ-отрасли Красноярского края»
- Гладков Сергей, «Оправдание технического задания»
- Гладков Сергей, Игра на третьей волне с благодарностью к «Красноярск.Биз»
- Нагаев Р.Т. Недвижимость: Энциклопедический словарь. – Казань: Издательство ГУП «Идел- Пресс», 2003. 1088-1.
- Федеральный закон от 25.06.2002 N 73-ФЗ (ред. от 21.02.2019) «Об объектах культурного наследия (памятниках истории и культуры) народов Российской Федерации»./
- Закон Красноярского края от 17 января 1996 г. № 8-220 «Об управлении государственной собственностью Красноярского края» (действующая версия: Закон Красноярского края от 03 марта 2011г. № 12-5650 «Об управлении государственной собственностью Красноярского края»)
- Постановление администрации Красноярского края от 16 февраля 2000 г. N 101-П «Об утверждении Положения об учете государственного имущества Красноярского края и ведении Реестра государственной собственности Красноярского края» (действующая версия: Постановление Правительства Красноярского края от 15 декабря 2014 № 594-п «Об утверждении Правил ведения Реестра государственной собственности Красноярского края»)
- Постановление Правительства Российский Федерации от 3 июля 1998 г. № 696 «Об организации учета федерального имущества и ведения реестра федерального имущества» (действующая версия: Постановление Правительства Российский Федерации от 16 июля 2007 г. № 447 «О совершенствовании учета федерального имущества»
- Приказ Министерства экономического развития РФ от 30 августа 2011 г. N 424 «Об утверждении Порядка ведения органами местного самоуправления реестров муниципального имущества»
- Распоряжение Минэкономразвития России от 14.04.2014 N 26Р-АУ «Об утверждении Методических рекомендаций по внедрению проектного управления в органах исполнительной власти»
- Приказ Министерства финансов РФ от 1 декабря 2010 г. N 157н » Единого плана счетов бухгалтерского учета для органов государственной власти (государственных органов), органов местного самоуправления, органов управления государственными внебюджетными фондами, государственных академий наук, государственных (муниципальных) учреждений и Инструкции по его применению (с изменениями на 28 декабря 2018 года)»
- Закон Красноярского края от 30 июня 2003 года N 7-1195 О краевой целевой программе «Создание автоматизированной системы ведения государственного земельного кадастра и государственного учета объектов недвижимости в Красноярском крае на 2003-2007 годы»
- Приказ Красноярского краевого комитета по управлению государственным имуществом от 7 мая 2003 года N 09-288п «Об утверждении правил учета государственного имущества на территории Красноярского края».
- Инструкция Госкомстата России 22.12.1999 N АС-1-24/6483 «о порядке учета юридических лиц, их обособленных подразделений в Едином государственном регистре предприятий и организаций. Часть I».
- Счетная палата Красноярского края. АКТ проверки эффективности управления и законности использования в 2009 году и I полугодии 2010 года объектов недвижимости, находящихся в оперативном управлении краевых государственных учреждений Красноярского края, от 11 октября 2010 г.
- Постановление Правительства Российский Федерации от 8 сентября 2010 г. N 697 «О единой системе межведомственного электронного взаимодействия».
- Мазур М., «Качественная теория информации» 1974, М.: Мир.
- Гладков С.Л.О требованиях к интеллектуальной модели данных. ВЕСТНИК Московского Университета имени С.Ю.Витте, 2015’2(10). — С. 63-70, http://www.muiv.ru/vestnik/pdf/pp/ot_2015_2_63-70.pdf
- Джон М. Смит, Диана К. Смит. Абстракция баз данных: Агрегацияи обобщение// СУБД. 1996. No 2. С. 141–160 (Постоянное место хранения на сайте Центра Информационных Технологий («ЦИТ», «ЦИТ Форум») URL: http://citforum.ru/database/classics/abstraction_generalization/)
Оригинал: John Miles Smith and Diana C.P. Smith. Database Abstractions: Aggregation and Generalization. ACM Transactions on Database Systems, Vol. 2, No. 2, June 1977. - Рудольф Карнап, Значение и необходимость. Исследование по семантике и модальной логике, М.: Изд. иностр. литературы,1959. 384
Оригинал: Rudolf Carnap. Meaning and necessity. A study in semantics and modal logic. Chicago, 1956
Рудольф Карнап, Значение и необходимость. Исследование по семантике и модальной логике. Пер. с англ. /Общ. ред. Д.А. Бочвара. Предисл. С.А. Яновской. Изд.2-е. М.: Издательство ЛКИ, 2007. 384с. - Наом .Хомский, Формальные свойства грамматик // Кибернетический сборник Новая серия. Выпуск 2. Сб. переводов. /Под ред. А.А. Ляпунова и О.Б. Лупанова. М.: Мир, М.: Иностранная Литература,– С. 121-230.
Оригинал: Chomsky N., Formal properties of grammars. Handbook of Mathematical Psychology, vol. 2, ch. 12, Wiley, 1963, 328-418. - Фу Кинг-Сун, Структурные методы в распознавании образов / К. Фу ; Перевод с англ. Н.В. Завалишина [и др.] ; Под ред. М.А. Айзермана. — М.: Мир, 1977. — 319 с. : ил.
Оригинал: K. S. Fu. Syntactic Methods in Pattern Recognition (Mathematics in Science and Engineering, Vol. 112) (Mathematics in Science and Engineering, Volume 112) 1st Edition/ Academic Press, New York and London, 1974 - Шрейдер Ю.А. Равенство, сходство, порядок: Популярное введение в теорию бинарных отношений. С примерами из математической лингвистики. М.: «Наука», 1971, 256 стр. с ил.
Смотри другие публикации из цикла «По следам забытого РЕГОСС»:
- Информационные системы
- Управленческие списки
- Приложение 1. Паутина балансодержателей
- Приложение 2. Имущество. Часть 1
- Приложение 2. Имущество. Часть 2
Спасибо за статью! Мне очень нравится этот сайт.
Спасибо и Вам на добром слове