Цифровая модель рынка труда: ключевые аспекты работы программного комплекса
Смирнов А.Ю.1
1 Центр научных исследований в сфере профориентации и психологии труда
Скачать PDF | Загрузок: 8
Статья в журнале
Экономика труда (РИНЦ, ВАК)
опубликовать статью | оформить подписку
Том 10, Номер 10 (Октябрь 2023)
Цитировать:
Смирнов А.Ю. Цифровая модель рынка труда: ключевые аспекты работы программного комплекса // Экономика труда. – 2023. – Том 10. – № 10. – С. 1535-1552. – doi: 10.18334/et.10.10.119514.
Эта статья проиндексирована РИНЦ, см. https://elibrary.ru/item.asp?id=55824066
Аннотация:
Статья посвящена описанию работы программного комплекса «Цифровая модель рынка труда», связанного с анализом вакансий и резюме, представленных на цифровых биржах российского рынка труда. Исследование представляет проект, разработанный и реализуемый в рамках деятельности Автономной некоммерческой организации «Центр научных исследований в сфере профориентации и психологии труда» в настоящее время. Приводятся данные о причинах деформации структуры профессий, представленных на отечественных цифровых биржах, предлагается построение объективной системы индикаторов рынка труда, позволяющих провести наиболее объективную оценку состояния рынка труда по имеющимся вакансиям и резюме применительно к локальным местностям и регионам.
Сделан вывод о необходимости внедрения более высокоточной идентификации профессий в вакансиях и резюме, распределения профессий, анализа структуры рынка соискателей, имеющиеся кадровые перекосы по отраслям, предприятиям и населенным пунктам. Представленная цифровая программа позволит внедрять новые механизмы регулирования рынка труда в современной России.
Ключевые слова: рынок труда, цифровая модель, вакансии, профессии, резюме
JEL-классификация: J21, J23, J24
ВВЕДЕНИЕ
Процесс цифровизации основных процессов жизни современного общества внедряется и в сферу экономики труда. Все участники рынка – как со стороны работодателей, так и соискателей, заинтересованы в быстром и качественном решении вопросов трудоустройства, а государство призвано создавать условия для решения проблемы трудовой занятости населения в условиях развития рыночной экономики, возрастания конкурентности и противоречий в меняющемся мире.
Актуальность статьи обусловлена необходимостью определения условий и факторов воздействия на процессы развития отечественного рынка труда, связанных с внедрением цифровых программ. Крайне важно в нынешних условиях не только мониторить ситуацию на рынке труда, но и формировать механизм его регулирования при помощи современных технологий.
Современные исследователи рынка труда подчеркивают, что происходит довольно заметная динамика в изменении структуры рабочей силы (Гимпельсон В.Е. и др.) [1]. Применяются различные подходы к исследованию рынка труда, как, например, заметила Горина Е.Е., что вызывает, по мнению автора, полемику в научной среде [2]. Предпринимаются попытки более тщательного анализа ситуации на региональных рынках страны, как например, сделано в специальной монографии Комлева А.Р. [3]. Российский экономист Горелов Н.А. посвятил вопросам развития экономики труда целую серию работ, указывающих на такие особенности развития современной экономики как высокая технологичность отраслей и повышение информационной составляющей рынка труда [4, с. 21 и др.].
Наряду с высоким уровнем научного интереса к проблеме экономики труда в целом, следует отметить появление в последние годы работ, посвященных вопросам влияния цифровизации на современную экономику труда. В специально проведенном социологическом исследовании на Урале в 2019 году были проанализированы мнения студентов, показавшие большую роль цифровизации в решении вопросов безработицы и повышении качества жизни [5, с.58-59 и др.].
Цель данной работы заключается в том, чтобы представить программный комплекс «Цифровая модель рынка труда» как самостоятельный действенный проект, обеспечивающий не только анализ, но и решение вопросов трансформации современного отечественного рынка труда. Проект разработан и реализуется в настоящее время как направление деятельности АНО «Центр научных исследований в сфере профориентации и психологии труда».
Новизна данной работы заключается в том, что впервые научной общественности представлены технологические и методические аспекты реализации цифровой программы, специально разработанной для анализа текущей ситуации на рынке труда. Впервые приводится анализ возможностей применения данного цифрового комплекса для решения вопросов развития структуры профессий, развития профессиональных компетенций, совершенствования механизма регулирования отечественного рынка труда.
Описание и цели проекта.
«Цифровая модель рынка труда» — это комплекс программного обеспечения, в непрерывном режиме функционирования анализирующий пул вакансий и резюме российского рынка труда. Он реализуется в качестве работающего проекта.
Целями проекта является:
· оценка и анализ ситуации с дефицитами и переизбытками рабочей силы в разрезе страны в целом и любого населенного пункта в частности;
· учет и осмысление происходящих изменений (трендов) на рынке труда;
· упорядочивание представлений о существующих профессиях и должностях через анализ требуемых ими компетенций и предлагаемых условий труда;
· формирование реалистичных представлений о структуре, составе и компетентностном содержании рабочей силы (соискателей);
· реализация эффективных предиктивных (предсказательных) инструментов на основе динамики ключевых индикаторов рынка труда.
Проект представляет собой пул взаимосвязанных цифровых программ, выполняющих разные функции. В эти программы входят сетевые парсеры, осуществляющие общий сбор информации, динамические базы данных, программы анализа, контроля и другие. Взаимодействие оператора (эксперта-аналитика, проводящего исследования) и Цифровой модели происходит через текстовые и web-ориентированные программные интерфейсы.
Алгоритм работы.
«Цифровая модель рынка труда» функционирует в любом заданном режиме работы (непрерывном/ ежедневном/ еженедельном/ ежемесячном/ ежегодном) по следующему алгоритму:
А. Сбор данных.
С различных job-площадок собираются находящиеся в открытом доступе в статусе «опубликованные» вакансии и резюме. Количество job-площадок, обрабатываемых программным комплексом, регулярно обновляется и пересматривается. На сегодняшний момент наиболее крупными площадками являются коммерческий портал «Head Hunter» (hh.ru), государственный портал «Работа России» (trudvsem.ru), далее со значительным отрывом идут такие проекты как «Авито-работа», «Superjob» и другие.
Большая часть вакансий и резюме дублируются по всем job-площадкам. По состоянию на середину 2023 года по нашим данным практически 90% всех публикуемых вакансий и резюме приходились всего на два портала - «Head Hunter» и «Работа России». Однако в рамках проекта обрабатываются и другие источники. Не обрабатываются закрытые job-площадки с ограниченным доступом, где выкладываются «штучные» вакансии (как правило, топ-менеджеров) или резюме высококлассных специалистов. Также не обрабатываются малочисленные каналы в программах обмена сообщениями (каналы в Telegram, WhatsApp, Discord и других), если эксперту, работающему с нашей «Цифровой моделью», не требуется по специальному запросу детальный анализ по какой-либо конкретной профессии (пулу профессий) или населенному пункту.
Б. Первичная обработка данных.
Первичная обработка данных осуществляется на уровне серверной инфраструктуры с двумя целями:
· выделить уникальные объекты (вакансии, резюме), убрав дублирующие объекты.
· привести к единой разметке данных, так как базы данных job-порталов отличаются друг от друга.
На этом этапе возникают непростые задачи как методического, так и технического характера. К методическим задачам относятся вопросы склонность работодателей изменять не только текст выставляемой вакансии, но и условия работы внутри одной и той же вакансии, размещенной на разных job-сайтах. Так, более 15% работодателей указывают размер заработной платы на портале «Head Hunter» выше, чем в аналогичной вакансии, размещенной в этот же период времени на сайте «Работа России». Наши специальные ранее проведенные исследования показывают, что это вынужденная мера для сохранения конкурентоспособности на данной job-площадке среди других аналогичных вакансий [6].
В связи с этим в ходе реализации данного проекта необходимо решить вопрос: какую заработную плату считать реалистичной? В рамках программных возможностей Цифровой модели экспертам предлагается самостоятельно определить выбор методики, например: а) использовать или максимальную, или минимальную, или среднюю между заявленными; б) ввести собственный коэффициент с учетом таблицы коэффициентов, отражающий средние значения соотношения зарплат на разных job-площадках; в) другие варианты.
Еще один методический аспект связан с ситуацией изменения названия должности (вакансии) на разных площадках. Для работодателей характерна такая модель поведения при поиске сотрудников, которая может быть охарактеризована как эпатаж, привлечение внимания к вакантным должностям. Так уже становятся популярными названия: «акула продаж», «пар-мастер» и других им подобных, наиболее распространенных на площадке «Head Hunter». Это приводит к ограничениям в выборе названия вакансии при размещении на других job-порталах. Решение этой проблемы осуществляется на последующих этапах обработки вакансии программным комплексом.
Следующая методическая задача - множественные публикации одной и той же вакансии на одном и том же job-портале с небольшой разницей в наименовании. Такую стратегию часто используют компании с массовым набором соискателей (строительные, аграрные и другие). Возможно, они считают, что чем чаще их предложение встретится пользователю площадки, тем в большем выигрыше они окажутся по сравнению с вакансиями конкурентов. Это неизбежно приводит к искажению реальной структуры рынка вакансий. Так по нашим данным, представленным на открытой площадке Rutrud в 2022 и 2023 гг. лидерами массового набора кандидатов становятся всего несколько организаций, занимающихся торговлей, банкингом, доставкой, связью и набором кадров [7]. При этом число рабочих мест, как на отдельных предприятиях, так и в стране в целом, точно определить не представляется возможным в силу сложившейся ситуации на цифровых биржах, где происходит неконтролируемый выброс сведений о «вакансиях» и «рабочих местах» с множественными названиями и неопределяемым функционалом [8].
В свою очередь наблюдается склонность соискателей размещать множественные резюме, в которых могут быть указаны: различные суммы ожидаемой заработной платы (при прочих одинаковых полях резюме); различные профессии (должности) или перечисление в одном ряду (в наименовании резюме) большого ряда профессий, в том числе существенно отличающихся друг от друга (Например: «учитель, библиотекарь, контент-менеджер» или «водитель, экспедитор, грузчик склада, разнорабочий»).
Встречаются резюме одного и того же соискателя, в котором указывается разное образование и разный опыт работы, кроме одного основного резюме соискатель размещает еще несколько «дополнительных» на этом же сайте или разных сайтах. Даже если соискатель уже нашел работу, или уехал, или отошел в мир иной, его резюме продолжает «работать» на цифровых биржах, обеспечивая коммерческую прибыль заинтересованному бизнесу. С каждым годом число подобных «двойственных» резюме растет. В результате появляются так называемые «миражные резюме», при этом количество соискателей не совпадает с количеством резюме, и, соответственно, происходит еще одно искажение на рынке труда.
В зависимости от задач эксперта, работающего с программным комплексом «Цифровая модель рынка труда», выбираются соответствующие методики учета соискателей. На данном этапе программа группирует множественный профиль соискателя, учитывающий наличие нескольких разных резюме.
При этом следует учитывать, что программный комплекс «Цифровая модель рынка труда» осознанно не собирает контактные данные и другие данные, позволяющие пофамильно идентифицировать соискателей. Это создает определенные технические моменты, связанные с процессом идентификации, которые учитываются в нашем проекте.
Например, для формирования базы уникальных вакансий создается сложная модель, сравнивающая в определенной последовательности различные поля вакансий, размещенных в разных источниках.
Первая обработка происходит по идентификации самой компании: по названию, по ИНН, по ОГРН, по контактным данным. Однако на разных job-порталах осуществляется различная запись-дентификация компаний-работодателей. Так, на «Работа России» указывается полное наименование юридического лица, а на «Head Hunter» чаще указывается бренд компании. Например, «Пятерочка» вместо ООО «Агроторг». Более того, в базе данных «Head Hunter» отдельно есть вакансии «Пятерочки» и «Пятёрочки». Всё это требует нелинейного подхода к идентификации работодателей.
Кроме того, hr-менеджеры крупных сетевых компаний, размещающих объявления о найме, не всегда корректно (одинаково и уникально) указывают наименования своих организаций, особенно это характерно для государственных компаний. Тогда идентификация вакансии только через наименование работодателя не дает валидного результата. Поэтому во внимание принимается пул полей, включая:
· Описание трудовых действий
· Требования к соискателю
· Условия найма (тип занятости, график работы)
· Дата публикации / модернизации
· Наименование вакансии
· Заработная плата
Как мы уже упомянули выше, два последних поля могут отличаться на разных job-сайтах, хотя сама по себе это может быть одной и той же вакансией. Поэтому в программах, определяющих уникальность вакансий, эти поля имеют наименьший вес, а наибольший получает описание трудовых действий и требования к соискателю (в совокупности с остальными данными).
В итоге процесс унификации вакансий происходит через алгоритм сравнения и «взвешивания» соответствия полей похожих вакансий, и выносится автоматизированный вердикт. В режиме «контроля» эксперт может посмотреть, насколько верными являются решения программы, в особенности с наиболее «пограничными» результатами взвешивания. При необходимости можно повысить / понизить коэффициент соответствия весов.
Следует отметить, что сравнение между собой нескольких миллионов вакансий – процесс затратный по времени и стоимости вычислительных услуг. Сейчас эту часть программного обеспечения «Цифровой модели рынка труда» мы тестируем на обученной нейросети. Это менее ресурсоемко и быстрее происходит сверка данных похожих вакансий из разных источников, чтобы определить, тождественные они или уникальные.
В. Основная обработка данных
Цели основной обработки данных:
· Финальная идентификация вакансий и резюме с помощью машинного чтения и распознавания.
· Построение системы индикаторов рынка труда, позволяющих провести оценку рынка труда в любом населенном пункте и выявить проблемные точки (отклонения, аномалии и др.).
· Решение специфических исследовательских задач конкретного эксперта, работающего в проекте.
Практически для любого эксперта, работающего с «Цифровой моделью рынка труда», одной из базовых задач является сравнение предлагаемых рабочих мест и имеющихся соискателей по одной и той же профессии в одном и том же населенном пункте.
Именно эта задача оказывается наиболее сложной, если задаться целью получить максимально точные данные. Основная её сложность заключается в том, что в нашей стране нет универсального и общепринятого перечня профессий, которыми бы пользовались и работодатель, и соискатель. А для исследователей оставалось бы только посчитать количество тех и других в нужном городе в случае наличия такого официально принятого реестра.
На сегодня ситуация выглядит так: существует более 240 000 уникальных наименований профессий, специальностей и должностей — и это без учета квалификационных требований, которые становятся частью наименования должности (названия вакансии или резюме). По нашим статистическим данным, полученным при помощи «Цифрового модели рынка труда» за последние три года - с 2020 по 2023 гг. в два раза выросло число уникальных наименований профессий от 150 тысяч соответственно до 301 тысячи наименований. Среди «новых» названий появились «авитолог», «озонолог» и пр. Хотя в имеющемся «справочнике профессий» от государственного сайта «Работа России» (trudvsem) за этот период остаются прежние и неизменные 8038 наименований. Детали полученной статистики можно посмотреть на нашем официальном телеграмм-канале «Рынок труда в России» [9]. Число этих уникальных наименований продолжает расти.
Природу и причины появления прироста новых наименований профессий и должностей мы описывали в специальном исследовании, где обосновании попыткой работодателей создать некоторую привлекательность своих предложений, выделяющих их на фоне других вакансий, и определенная мода (тренд) за новые слова или профессиональный слэнг, и также общий понижающийся уровень культуры работодателей [10].
Приведем ряд типичных примеров, связанных с терминологической и семантической путаницей, что затрудняет быструю идентификацию профессии:
1. Существует большое количество синонимов одной и той же профессии. Например, «буровик» и «машинист буровой машины», которого также могут называть «машинист буровой установки» или «оператор буровой машины» или «мастер буровой». Но это еще легкая задача, так как имеется однокоренное слово в названии, а сама профессия старая и хорошо изучена. Гораздо хуже, когда профессия только появилась, и используются ее множественные еще неустоявшиеся названия. Или когда используются англицизмы, в том числе и для давно известных профессий. Так, возник острый дефицит «карщиков» (от англ. car) при переизбытке на рынке «водителей и машинистов автопогрузчиков», хотя это всё одна и та же профессия.
Наибольшее количество «условных» синонимичных терминов существует у профессии «менеджера по продажам»: их свыше тысячи. Почему условное? Потому что в название профессии включается определенная специфика его функционала, которая существенно отличает продавцов: по категориям продаж, по рынку сбыта, по специфике продаваемого товара, по специфики самой сделки. Есть большая разница между продавцом, ежедневно отгружающим сотни, тысячи наименований товаров широкому кругу физических лиц, и продавцом, который полгода и более ведет одну многомиллионную сделку с юрлицом или госпокупателем.
В этом случае эксперт определяет синонимическое поле профессий. Можно выборочно или по конкретным профессиям, группам профессий, или задать общие параметры для всего словаря профессий.
2. Наблюдая за опытом коллег из Росстата, мы видим, как часто ошибочно объединяют и сравнивают между собой профессии, имеющие одинаковые или однокоренные слова в названии, но совершенно разные по своей сути.
Типичный пример: профессия, в наименовании которой есть слово «оператор». В итоге получается, что в один ряд операторов попали и «операторы заправочных станций» (фактически – продавцы), и «операторы машинного доения» (дояры в на ферме), и «операторы линий производства» (которые между собой существенно отличаются по типу деятельности и уровню требований к профессиональным качествам и компетенциям), и операторы буровых установок, и операторы нефти и газа, и операторы станков с ЧПУ, и операторы ЭВМ. Всё это принципиально разные операторы — и, соответственно, разные профессии.
3. Не меньшая проблема идентификации возникает с простыми и понятными на первый взгляд профессиями, от которых никто не ждет подвоха. Например, водитель. В наименовании вакансии часто указано только «Водитель», но вот в требованиях может стоять различная категория – «B», «C», «D», «E». А ведь какая большая разница между водителем легковой машины, водителем автобуса на регулярных городских маршрутах и водителем-дальнобойщиком на еврофуре! Это абсолютно отличающие профессии и по образу жизни, и по условиям труда, и по заработной оплате, и, что важнее всего для исследователей, по уровню спроса и предложения.
4. Примерно похожая проблема возникает с омонимичными профессиями — пишущимися одинаково, но разными по смыслу. Например, в вакансии требуется «инспектор». А вот какой именно инспектор – инспектор ГИБДД, инспектор по кадрам, инспектор по технике безопасности, инспектор ФСИН и так далее, — в наименовании вакансии не указано. Более того, этого может быть не указано даже в описании вакансии. Вместо информации о требованиях красуется фраза, любимая тысячами государственных предприятий-работодателей, — «согласно должностной инструкции». Разобраться, кто же реально нужен по данной вакансии можно только после установления соответствия названия с наименованием работодателя и его формой собственности, а порой и с множеством других данных: уровнем заработной платы, графиком работы и т.п.
Есть и другие примеры, которые показывают, что по одному названию, указанному в «шапке» вакансии, невозможно точно идентифицировать, о какой именно профессии идет речь. А значит и нельзя сравнивать, например, кадровый дефицит по этой профессии: соотношение рабочих мест и имеющихся соискателей.
На некоторых job-сайтах предлагается так называемый «умный поиск», который также ищет название запрашиваемой профессии внутри всего текста вакансии или резюме. Но практика показывает, что более чем для 30% «офисных» профессий «умный поиск» ошибается. Так как очень часто другие профессии могут быть указаны в вакансии как примеры, с кем предстоит взаимодействовать в процессе работы. Например, профессия дизайнер может встретиться в описании профессии менеджера по рекламе или копирайтера, которые взаимодействуют с дизайнерами в процессе работы, но «умный поиск» при запросе дизайнеров может показать менеджеров по рекламе и копирайтеров, и наоборот. А внутри вакансий «индустриальных» профессий, как мы уже упоминали, может не быть никаких описаний, и тогда «умный поиск» не находит все имеющиеся вакансии по непрямому запросу через синоним.
Г. Решение проблемы идентификации и «самообучения».
Для решения проблемы высокоточной идентификации профессий в вакансиях и резюме мы разработали специальную программную надстройку «Магуча», которая на машинном уровне позволяет идентифицировать профессию по чтению всех полей вакансий и резюме, а также обращению к дополнительным источникам (каталогу работодателей, форм собственности, к другим вакансиям работодателя и др.).
Основная задача «Магучи» в рамках одной из выбранных экспертом методик обработки данных сравнивать количество предлагаемых вакансий и количество имеющихся соискателей по каждому населенному пункту Российской Федерации [11].
«Магуча» читает весь текст вакансии, включая требования, условия труда, наименования работодателя, а в особо сложных моментах идентификации программа обращается к просмотру других вакансий этого работодателя (а для резюме – это «анализ» предыдущих мест работы соискателя по наименованию работодателя и его формы собственности), и с помощью особых алгоритмов взвешивания «Магуча» идентифицирует профессию [12].
Основным ядром «Магучи» является новая таксономия профессий, которая имеет два разреза: 1 - статичный разрез, который описывает общую структуру профессий, специальностей и должностей, а также квалификационных разрядов. Это теоретическая опорная модель, позволяющая перейти ко второй практической части; и 2 - динамическая модель таксономии профессий.
В динамической модели профессии рассматриваются как некоторые множества, которые могут объединяться при совпадении определенных свойств, к которым мы относим:
ü в первую очередь, набор требуемых в профессии профессионально важных качеств и компетенций (с учетом требуемого уровня выраженности эти качеств и компетенций), а также объема и сложности требуемого уровня профессиональных знаний;
ü во вторую очередь – характер, ритм, темп работы;
ü в третью — условия труда (методика оценки двенадцати параметров условий труда) и требования к медицинским показаниям.
Такая модель позволяет объединять в одно множество взаимозаменяемые профессии, отличающиеся друг от друга только спецификой производственных задач, но не их объемом, сложностью, последовательностью, требуемым компетенциям и т.д. Например, по этому принципу объединяются в одну групп все профессии, чья работа связана с написанием рекламных текстов. В этой группе представлены несколько десятков известных специальностей и более сотни уникальных названий от «креативных» работодателей. При изменении настроек для данного множества, определяемых экспертом, эту группу можно расширить для всех «пишущих» профессий или, напротив, сузить до конкретных тем, упоминаемых в вакансии.
Существует большое количество как производственных, так и офисных профессий, в том числе и их синонимов на рынке вакансий, которые по существу требуемых знаний и компетенций взаимозаменяемы. Так, в некоторых производствах монтажник заменяем техником, копирайтер — SMM-менеджером и так далее. В более сложных комбинациях происходит оценка профессии с учетом уровня квалификации. Например, плотник 5-6 разряда взаимозаменяем со столяром 2-3 разрядов.
По ряду профессий требуется учитывать специфику производств на более глубоком уровне. Так, в ряде предприятий химической отрасли есть «аппаратчики», обладающие уникальным наименованием по названию производственного процесса. Например, «аппаратчик смешивания», «аппаратчик дозирования», «аппаратчик обессоливания воды» и так далее. Они полностью взаимозаменяемы, требования к их качествам и компетенциям идентичны, а дифференциация названий больше необходима для внутренних регламентов работодателя. Но есть технологические процессы, которые требуют дополнительных компетенций в рамках таких же действий аппаратчика. Например, к «аппаратчику окисления» предъявляются более высокие требования как со стороны техники безопасности, так и к его моторике, объему и продолжительности внимательности, быстроте реакции; к личным качествам, относящимся к компетенциям проактивности и вытекающей из нее ответственности, и так далее.
Всего в модели задействовано несколько сотен оцениваемых качеств и компетенций, и их комбинаций, когда наличие двух или более определенных качеств формируют новые системные (эмерджентные) качества. Похожая методика применяется в другом нашем смежном проекте профессиональных проб по качествам и компетенциям «Навигатум: профпробы360» [13]. «Читая» текст вакансии, программа выделяет лингвистические конструкции, содержащие либо описание трудовых действий (глагольные формы), либо прямое указание на требуемое качество (выносливость, коммуникабельность), либо определяемый конечный результат (для дизайнера: эскиз, дизайн-концепт, 3D-модель, проект и пр.).
Выделенные наборы трудовых действий, готовых результатов труда, помогают сузить размер множества соответствующим этим параметрам профессий. Чем четче соответствие — тем выше присваиваемый балл параметру. Дополнительные факторы, такие как условия труда, требуемые компетенции, понижают балл соответствия у заведомо нерелевантных факторов. В конце происходит итоговое взвешивание по сбалансированной динамичной, перестраиваемой в зависимости от различных условий модели, и происходит итоговая идентификация.
Бывают ситуации, когда программа встречает несогласуемые факторы, например, противоречивые компетенции, несочетаемые трудовые действия и так далее. Такие вакансии или резюме выделяются в отдельную группу, которую в ручном режиме может просмотреть эксперт. В процессе такого разбора экспертом пополняется «база знаний» и вводятся новые правила в программы-обработчики. Эксперт может также изменять уровень «проходного» балла: чем он выше — тем точнее идентификация, чем ниже – тем грубее, и, соответственно, быстрее.
К сожалению, этот фрагмент программного обеспечения, осуществляющий чтение и идентификацию, пока нельзя передать нейросети, потому что требуется сохранить методическое разнообразие, возможность внесения сверхтонких настроек через регулирование более тысячи параметров, и сохранить полную прозрачность и проверяемость в ручном режиме выборки. Возможно, в дальнейшем мы обучим необходимое количество веток нейросети для решения задачи в соответствии со всеми имеющимися методиками.
Кроме программ идентификации, есть у нас работают и программы «самообучения» — они делают выборку по всем точно идентифицированным через прямое соответствием вакансиям, и вычленяют повторяющиеся лингвистические конструкции в описаниях этих вакансий. Фактически они формируют «цифровой портрет профессии», который уже в удобочитаемом виде представляется для эксперта, «одобряется» или корректируется в ручном режиме для каталога компетенций и каталога профессий. Есть версии программ, где эти процессы полностью автоматизированы и жизнеспособны, но их результаты не являются высокоточными, хотя и существенно выше других известных нам моделей. Мы продолжаем множественные эксперименты с настройкой программного обеспечения.
Д. Профессиональная структура, дополнительный анализ соискателей и учет рабочих мест.
Следует отметить, что в этом проекте используется большой объем знаний в формате цифровой разметки по кластерам - профессиям с их трудовыми действиями, условиями труда, требуемыми компетенциями и т.д. Каждый параметр представляет собой отдельную библиотеку, формируемую в течение шести лет нашими специалистами, работающими в рассматриваемом проекте «Цифровая модель рынка труда». Это позволило получить еще один интересный программный информационный продукт – проект «Атлас современных профессий, специальностей и должностей» [14]. Атлас содержит актуальное описание всех современных профессий и должностей, и особый акцент делается на подробном описании профессионально важных качеств, условий труда, медицинских противопоказаний и т.д., то есть всей существенно важной информации, позволяющей структурировать профессии на рынке труда России.
Еще одной методической задачей, связанной с подсчетом вакансий, является учет рабочих мест в рамках одной вакансии. Рабочие места указываются на одних job-площадках (например, «Работа России») и не указываются на других. После тщательного ручного анализа четырехлетней выборки вакансий, где работодатели отмечали количество рабочих мест в вакансии, нами была выведена система коэффициентов, позволяющая оценить среднее значение распределений, опираясь на данные по работодателю: отрасль, вид деятельности, локализация, общее количество сотрудников* и оборот*, и наименование профессии. Параметры, отмеченные звездочкой, получались путем автоматизированных запросов из открытых данных налоговой инспекции. Использовать в работе «Цифровой модели» коэффициенты или точные данные по источнику, или учитывать только вакансии без количества рабочих мест принимает решение эксперт, проводящий исследование со своими задачами.
Аналогично вакансиям происходит обработка резюме, но несколько проще: соискатели, в отличии от работодателей, реже прибегают к эзопову языку в названиях профессий, а также более формализировано описывают свой предыдущий опыт. Кроме этого, структуры баз данных позволяют легко определять дубликаты резюме. Существующие настройки позволяют кластеризовать соискателей нужным эксперту методом.
Из значимых настроек целесообразно отметить несколько моментов, связанных с анализом соискателей. Кроме упомянутой выше уникальности резюме, следует разобраться с его актуальностью. Так как соискатели часто «бросают» резюме, не закрывая его, оно может годами хранится в статусе «опубликованное» (открытое), но это вовсе не означает, что соискатель доступен и ищет работу. Какие резюме считать актуальными? Простым методом является определение некого срока в виде количества дней, ранее которого актуальными считаются все созданные или модифицированные резюме в статусе «опубликовано». Так, на «Head Hunter» таким сроком считают 30 дней, а большая часть экспертов «Rutrud» считает 100 дней. Более высокоточным, хотя и сложным вариантом является выведение «индекса закрытия резюме». Это динамическая модель, в которой ретроспективно анализируются даты появления и закрытия миллионов резюме по разным профессиям, и на основании предыдущего опыта формируется индекс с учетом опыта соискателя, самой профессии, индекса востребованности и индекса конкурентности профессии в конкретном населенном пункте, и других параметров.
Настройки сравнения резюме соискателей и предлагаемых вакансий должны совпадать по предлагаемому графику работы, чтобы не сравнивать вакансии с полной занятостью с резюме, предполагающими неполный рабочий день, формату работы (в офисе / удаленная), квалификационным требованиям, чтобы не сравнивать вакансии, где требуется опытный специалист с резюме новичков, и так далее. Подсчет соотношения резюме и вакансий позволил нам составить индекс конкурентности профессий, который показывает насколько сложно или легко найти искомую профессию.
«Цифировая модель рынка труда» позволят работать с более точным индексом Фраучи, когда число вакансий делится на число резюме, и затем умножается на 10 для удобства читаемости. Индекс Фраучи используется не только для конкретной профессии, а для групп профессий или вообще для всего рынка, и нужен как индикатор, по которому отслеживается общая динамика: направленность изменений, скорость и сила их выраженности [15].
Оценка данных и исследовательские задачи.
Результатом работы программы на этапе сравнения вакансий и резюме является формирование базы данных, в которую включены результаты сравнения по каждой профессии, специальности, должности и с учетом квалификационного уровня, упомянутой в вакансиях и резюме, в разрезе каждого населенного пункта, где были размещены эти вакансии и резюме. Эта база показывает структуру и распределение профессий, структуру рынка соискателя, имеющиеся кадровые перекосы, расхождения в зарплатных предложениях/ожиданиях и другие параметры.
До начала 2022 года мы подключали дополнительные модули из открытых данных по численности и половозрастному составу населения, данные налоговых инспекций по юридическим лицам, данные справочников по предприятиям (ДубльГис, Яндекс и другие). А самым полезным с точки зрения оценки кадрового потенциала рынка труда были данные по выпускникам системы среднего и высшего профессионального образования, включая дополнительное образование, курсы повышения квалификации и т.п. Эти дополнительные данные существенно расширяли представления о прогнозируемых ситуациях на рынке труда конкретного города. В связи с геополитической обстановкой и тенденцией к закрытию статистических данных в настоящее время мы приостановили обслуживание данных программных модулей.
Сейчас в рамках «Цифровой модели рынка труда» мы отслеживаем в соответствии с исследовательскими задачами:
· кадровое соотношение,
· уровень активности работодателей и соискателей (ориентируясь относительно численности населенного пункта и среднего значения по стране),
· заработные платы (предлагаемые и ожидаемые по каждой профессии), средние показатели по городу и стране, данные в разрезе источника и др.
· портрет профессий в разрезе требуемых компетенций, условий труда и т.п. (в разных городах они могут отличаться в рамках одной профессии),
· портрет соискателя, как в рамках конкретной профессии, так и общий (средний) по группам и кластерам профессий,
и другие параметры.
Основные аналитические изыскания проходят по двум основным направлениям:
1 - отслеживание изменения индексов по временным срезам (динамика изменений: сила выраженности, направленность);
2 - сравнение однотипных городов/областей или профессий друг с другом в масштабах страны в поисках отклонений, индивидуальных особенностей, вычисления определенных «трудовых сигнатур» городов и др.
Оценка по временным срезам с короткими интервалами за несколько лет позволяет отличить сезонные колебания от масштабных изменений в рамках какой-либо профессии (отраслевой группы профессий) в конкретном городе, регионе или стране в целом.
В процессе формируется свыше тысячи индексов по каждому населенному пункту, отдельно формируются индексы по конкретным профессиям. По населенным пунктам сравниваются относительно самих себя в разрезе времени и между собой (так называемые корреляционные индексы), что позволяет понимать природу некоторых изменений. Например, программа отличает всплеск трудовой активности, и с высокой долей истины может соотнести: или это заслуга местного центра занятости, или это эффект от рекламы коммерческого job-портала, или это закрытие / открытие какого-то крупного предприятия с большим количеством нанимаемых / увольняемых сотрудников.
Данные вычисления тоже относятся к категории ресурсоемких и имеют большое количество настраиваемых параметров, методику исчисления и настройки которых определяет эксперт, проводящий исследование.
Отдельный блок программ посвящён предиктивной или предсказательной аналитике. Возможности ретроспективно использовать алгоритмы на данных за предыдущие годы и сравнивать «предсказания» программы с реальными событиями позволило оптимизировать и усовершенствовать модель. Но стоит заметить, что программа лишь замечает аномалии (отклонения, динамику и отклонения в ее силе, направленности и т.п.), но конечная интерпретация остается за экспертом. И мы многократно были свидетелями, как одинаковые данные по-разному интерпретировались различными экспертами.
В качестве дополнения к описанию работы «Цифровой модели» хочется отметить необходимость в разработке специальных программных модулях, отслеживающих работу других модулей (подпрограмм). Так как в процессе полномасштабного функционирования всего программного комплекса (обычно в режиме глубокого исследования или предсказательной аналитики) одновременно обрабатывается свыше четырех терабайт данных, состоящих из тысяч баз данных различных разметок и форматов, то иногда возникают программные сбои, которые могут быть незаметны для эксперта, но при этом повлиять на выдаваемый результат.
Для решения задачи были разработаны «программы-надзиратели», отслеживающие активность других программ или процессов, и сверяющие их показатели с выведенными таблицами допустимых норм. Однако, с усложнением программного обеспечения, которое за год обычно увеличивается вдвое, потребовалось вводить новое поколение программ, которые «надзирают» за надзирателями. Предполагается, что такая система войдет в тупик через 1-1,5 года. За это время мы предполагаем полностью переписать архитектуру имеющихся программ.
В настоящее время проект «Цифровая модель рынка труда» закрыл все задачи в рамках исследовательской и профориентационной деятельности, реализуемой нашим исследовательским центром. Большая часть времени использования проекта уходит на работу сторонних экспертов, с которыми мы сотрудничаем на условиях научного обмена. Запросы приходят от самых разных организаций: научных институтов, образовательных учреждений, частных исследователей, коммерческих и некоммерческих предприятий. Планируется установление сотрудничества с заинтересованными государственными структурами. Анализ рынка труда на основе совместных исследований специалистов разного уровня позволяет получать более качественные результаты.
Итоги исследования.
«Цифровая модель рынка труда» как самостоятельный проект полностью доказала свою эффективность в использовании для анализа ситуации на рынке труда, в том числе в меняющейся структуре и таксономии профессий в России. Проект позволяет на совершенно новом уровне развивать профориентационную работу с разными категориями граждан, составлять «цифровой портрет» профессий, отслеживать и регулировать уровень трудовой активности работодателей и соискателей, определять «трудовые сигнатуры» разных населенных пунктов в регионах.
Цифровая программа способна «предсказывать» динамику развития основных элементов рынка труда: спрос на рабочую силу (вакансии), предложения рабочей силы (резюме), цену рабочей силы (заработная плата), анализировать «трудовую историю» кандидата на должность, и многое другое. Несомненно, что процессы цифровизации рынка труда имеют тренд на возрастание и внедрение во все стороны жизни населения.
Источники:
2. Горина Е.Е. Исследование рынка труда: междисциплинарный подход // Современная экономика: проблемы, тенденции, перспективы. – 2011. – № 5. – c. 3.
3. Комлев А.Л. Региональный рынок труда (проблемы и перспективы). / Монография. - Волгоград: Издательство Волгоградского института экономики, социологии и права, 2006. – 131 c.
4. Горелов Н.А. Экономика труда в контексте вызовов времени // Экономика труда. – 2014. – № 1(1). – c. 7-28.
5. Ермолаева С.Г. Влияние цифровизации на рынок труда: мнение студентов // Вестник Сургутского государственного педагогического университета. – 2020. – № 2(65). – c. 56-64. – doi: 10.26105/SSPU.2020.65.2.007.
6. Ягафарова И.М., Смирнов А.Ю. Цифровые биржи как фактор влияния на профессиональную структуру рынка труда // Экономика труда. – 2023. – № 7. – c. 979-998. – doi: 10.18334/et.10.7.118626.
7. Структура рынка вакансий. Рынок труда в России онлайн. [Электронный ресурс]. URL: https://rutrud.com/vacancy-structure-2023/ (дата обращения: 17.10.2023).
8. Что такое «число рабочих мест», или липовые вакансии. Rutrud.com. [Электронный ресурс]. URL: https://rutrud.com/number-of-jobs-2022/ (дата обращения: 17.10.2023).
9. Рынок труда в России. Откуда берутся названия профессий на рынке труда?. T.me. [Электронный ресурс]. URL: https://t.me/rutrud/31 (дата обращения: 17.10.2023).
10. Ягафарова И.М., Смирнов А.Ю. Цифровые биржи как фактор влияния на профессиональную структуру рынка труда // Экономика труда. – 10. – № 7. – c. 979-998. – doi: 10.18334/et.10.7.118626.
11. Ягафарова И.М. «Цифровая модель рынка труда» как инновационный метод анализа данных о состоянии российского рынка труда // Fundamental Science and Technology: Сборник научных статей по материалам X Международной научно-практической конференции. Уфа, 2022. – c. 82-85.
12. Магуча: лингвистическая онтология для чтения вакансий и резюме. Магуча - программа глубокого анализа рынка труда. [Электронный ресурс]. URL: https://crcg.ru/magucha/?ysclid=lnx2yqqpnz254156730 (дата обращения: 17.10.2023).
13. Методика диагностики Профпробы-360. Навигатум: профпробы-360. [Электронный ресурс]. URL: https://profproba360.ru/metodika/ (дата обращения: 17.10.2023).
14. Атлас современных профессий, специальностей и должностей. Центр научных исследований в сфере профориентации и психологии труда. [Электронный ресурс]. URL: https://crcg.ru/atlas-professions/ (дата обращения: 17.10.2023).
15. Индекс конкурентности профессий и подводные камни. Рынок труда в России онлайн. [Электронный ресурс]. URL: https://rutrud.com/indeks-konkurentnosti-professii/?ysclid=lnx1stm8q5525882048 (дата обращения: 17.10.2023).
Страница обновлена: 15.07.2024 в 03:21:13