{IF(user_region="ru/495"){ }} {IF(user_region="ru/499"){ }}


Ирина Голощапова Руководитель проекта «Big Data Indicators». Аспирант экономического факультета МГУ им. М.В. Ломоносова 23 марта 2018г.
Макроэкономические индикаторы и Big Data
Как комментарии интернет-пользователей в СМИ становятся индикаторами экономических ожиданий населения, рыночной конъюнктуры и потребительской активности

Альбина Пылаева:

Добрый вечер, «Интернет-экономика» с Альбиной Пылаевой по пятницам на канале Mediametrics. Гость сегодняшней программы Ирина Голощапова, руководитель и соавтор исследовательского проекта «Big Data Indicators», правильно?

Ирина Голощапова:

Верно. 

Альбина Пылаева:

Вот по-русски если это перевести, это гораздо состоит из больших слов. Интерес к Ирине и к её проекту связан вот с чем. Именно сегодня были обозначены закончившиеся итоги выборов в цифрах, и Президент обратился к своему народу. Естественно, он поблагодарил избирателей и сказал, над какими проблемами работать нам вместе в последующие шесть лет. Как я это поняла, экономическая политика, она сфокусирована на человека. И вот Ирину я пригласила, как макроэкономиста, который в этой своей деятельности и в отдельном, в частности, проекте экономику изучают через призму человеческого поведения. Правильно я представила Ваш проект? Но в целом интерес к её проекту состоит в том, что Ирина придумала, у неё была идея и у её соавтора, Марка Андреева, у них появилась идея использовать СМИ, как источник, по которому можно делать оценки экономического поведения, экономических ожиданий населения или ожидания от экономических изменений. То есть то, что мы оставляем какие-то комментарии к статьям, вот из всего этого путём приложения технологии Big Data и получается макроэкономическая картина не только поведенческих настроений, но в целом это и конъюнктура рынка и, отчасти, и в дальнейшем я так вижу развитие этого проекта, это и потребительское поведение. Очень интересный проект. Он интересен и тем, кто делает эту политику, и властям, государственным управленцам. Он интересен бизнесу, он интересен даже и читателям, по сути, этих СМИ, которые комментируют. Они понимают, что это всё считается, и из этого может получиться замечательная картина экономическая. По этим их оценкам можно диагностировать в целом экономическую картину. Вот правильно ли я поняла, Ирина, что Вы делаете?

Ирина Голощапова:

Да, в целом очень корректно, правильно описали. Действительно, идеей проекта является попытка найти, понять, есть ли какое-то зерно смысла в том, что люди обсуждают экономические новости. Потому что, казалось бы, когда мы читаем какую-то статью экономическую, кажется, она понятная, интересная, потом заглядываем в комментарии, и нам становится плохо, странно и думаем, что совершенно странные вещи люди пишут. А вот если рассмотреть все комментарии людей, все обсуждения экономических событий в совокупности и попытаться задать этим текстам, мыслям людей какие-то вопросы, выясняется, что в действительности мы можем выявить определённый ряд индикаторов, которые будут действительно соответствовать макроэкономической динамике. И мы можем пытаться понять, как люди воспринимают вообще экономические события, какие выводы они из них делают, как меняют свои ожидания, и почему они их меняют. 

Альбина Пылаева:

По сути дела, у Вас есть оптика, оптика экономиста, и это Big Data. То есть это аналитика больших данных. Вот через эту оптику мы смотрим, что в сути проекта лежит. 

Ирина Голощапова:

Большими данными в данном случае являются статьи, новостные статьи СМИ и комментарии. То есть понятно, что новостей очень много, особенно если мы будем прослеживать индикаторы в динамике. На настоящий момент мы с 2014г. строим индикаторы, это четыре источника СМИ: Ведомости, РБК, Коммерсант и Эксперт. Выборку мы определили на основе обсуждения с экспертами в области экономического анализа, а также на основе рейтингов Медиалогии, рейтингов СМИ. Понятно, что выборка пока маленькая, нужно понимать, что это достаточно сложно, это уже большие данные, собрать выборку статей СМИ с 14-го года. То есть сейчас это порядка 280 тысяч статей всего, к ним порядка 1,5 млн. комментариев от 140 тысяч пользователей. И вот здесь мы уже пытаемся понять, построить индикаторы ожиданий. То есть основным, первым вопросом, который был в нашем проекте, когда мы вообще хотели понять, а можно ли такие данные использовать для построения индикаторов, это была оценка инфляционных ожиданий населения. 

Альбина Пылаева:

Давайте так, немножко обозначим координаты этого проекта. Он, смысл проекта, цели, задачи поняли, о чем он тоже. В чем он реализуется, в каких-то графиках, в отчётах, что по итогам и вообще, как наглядно увидеть эти индикаторы. А потом о самих индикаторах. 

Ирина Голощапова:

Хорошо. Наглядно вообще, основные результаты проекта, они размещены на отдельном сайте bigdata-indicators.com. 

Альбина Пылаева:

Вы сами сделали этот сайт?

Ирина Голощапова:

Да, сами написали, регулярно обновляем, то есть стараемся в первые пять рабочих дней каждого месяца обновить результаты индикаторов. Там у нас сейчас индикатор инфляционных ожиданий, даже два индикатора, направленные на разные аспекты этого вопроса. Индикаторы, которые пытаются объяснить причины изменения инфляционных ожиданий, о чём люди говорили, когда упоминали то, что ждут роста цен, о чем ещё они говорили, с чем они связывали изменения своих ожиданий, там разными способами. То есть мы здесь и содержание комментариев рассматриваем с помощью алгоритмов машинного обучения, и с помощью построения индикаторов уже просто на основе экспертного мнения. 

Альбина Пылаева:

Но этот подсчёт, он ведётся, Вы какую-то программу заказывали какому-то?

Ирина Голощапова:

Нет, мы пишем на языках программирования Python, R.

Альбина Пылаева:

То есть сами. То есть Вас два человека в этом проекте. Смотрите, я нашла информацию о Вас на сайте центра макроэкономического анализа и краткосрочного прогнозирования. Этот центр поддерживает проект. И тот, кто знаком с аналитикой и с уважаемыми аналитиками, тот знает, что это за центр. Действительно, очень серьёзное аналитическое такое, этот аналитический исследовательский центр, где нет шуточных экономистов, а именно макроэкономисты. И то, что они поддерживают Ваш проект, говорит о том, что значимость этого проекта, глубина и серьёзность, она, ее невозможно уместить в рамки авторского проекта Ирины Голощаповой и Марка Андреева. Это шире. Сам центр пользуется тем, что Вы делаете, поскольку они всё-таки выкладывают информацию, то есть есть сайт ЦМАКП, можно зайти к Вам на страничку. 

Ирина Голощапова:

Да, мы очень благодарны ЦМАКП за поддержку, в первую очередь. В частности, благодарны Олегу Солнцеву, руководителю направлению денежно-кредитной политики и анализа финансового сектора за обсуждение с нами идеи проекта, новые какие-то мысли и за такую активную поддержку. И Дмитрию Рэмовичу Белоусову, руководителю направления макроэкономического анализа и моделирования. Да, я надеюсь, что ЦМАКП использует результаты проекта, поскольку выпускаются различные аналитические материалы, в том числе, недавние 13 тезисов об экономике, новая серия. Это, в том числе, наши индикаторы, они могут помочь составить целостную картину, происходящую в экономике и главное, как люди ее воспринимают. 

Альбина Пылаева:

Что происходит и как воспринимают. Что такое индикаторы, вот что заложено в этом смысле в проекте, чем Вы пользуетесь. Индикатор - это. 

Ирина Голощапова:

Давайте, например, на примере инфляционных ожиданий разберём, что за индикатор. 

Альбина Пылаева:

Смотрите, может быть, даже я неправильно поставила вопрос. Вы уже публикуете, я видела несколько таких словосочетаний: индикатор инфляционных ожиданий, индикатор кризисных ожиданий. Вот что ещё, вот этот список продолжите, что ещё анализируется. 

Ирина Голощапова:

Пока индикатора всего 2, и мы стараемся, в том числе, максимально глубоко понимать их динамику, смотреть, насколько вообще люди формируют эти ожидания, как устроены механизмы, как эти механизмы формирования ожидания меняются с течением времени. А так вообще алгоритм построения индикатора, он предполагает возможность оценки фактически любых ожиданий, которые мы можем предположить, что люди обсуждают в контексте различных экономических новостей, которыми мы располагаем. То есть мы точно так же, пользуясь методикой, которую мы применяем в рамках построения индикатора инфляционных ожиданий, мы точно так же можем построить индикатор ожидания ослабления курса рубля, ожидания ухудшения ситуации на рынке труда. Если мы хотим какие-то более детальные вещи посмотреть, например, индикатор ожидания роста цен на бензин, ещё чего-то. 

Альбина Пылаева:

Эта информация от кого-то для кого-то, да? А Вы посредники, которые её собирают и анализируют. Вот информация идёт, Вы её находите в СМИ, самый последний участок, самый последний элемент Вашей системы, это интернет-пользователь, правильно?

Ирина Голощапова:

Да. 

Альбина Пылаева:

Интернет-пользователь, за ним стоит кто, автор статьи? 

Ирина Голощапова:

Базой, основной базой для оценки индикаторов являются комментарии пользователей. То есть фактически, сначала мы должны сформулировать вопрос, на который мы хотим ответить. В случае инфляционных ожиданий мы хотим понять, насколько интенсивно люди обеспокоены ростом цен, насколько сильно люди в будущем ждут роста цен больше, чем вчера или меньше, чем вчера. 

Альбина Пылаева:

Вот вопрос задаёте Вы, не ищите вопросы из СМИ. 

Ирина Голощапова:

Да, мы сами формулируем вопросы. Соответственно, первым вопросом, которым мы заинтересовались, это были инфляционные ожидания, вопрос, который стал актуальным с момента введения режима инфляционного таргетирования у нас в стране, центральный банк ещё с сентября 2013г. начал внедрение режима инфляционного таргетирования. И сам этот режим, он предполагает, что он будет успешным, если мы будем правильно управлять инфляционными ожиданиями населения. Если население будет доверять действиям Центрального банка, в соответствии с ним выстраивать инфляционные ожидания. 

Альбина Пылаева:

Ну, вот смотрите, простой пример из жизни. Я тоже читала статьи, естественно, вот буквально последние несколько дней, если промониторить одну из ведущих экономических газет. Речь шла о том, что россияне не заметили, что инфляция как-то уменьшилась, её практически, она не такая серьёзная, как были в предыдущие годы. Они этого не заметили. А у Вас есть индикатор инфляционных ожиданий. 

Ирина Голощапова:

Да, в действительности, обсуждения. 

Альбина Пылаева:

Вот что, совпадает вот это общее распространённое мнение, совпадает ли заголовок, что россияне не заметили этот подарок, и совпадают ли индикаторы, по которым Вы судите, да, ожидают, да, не ожидают. 

Ирина Голощапова:

Да, в действительности наши индикаторы показывают, наш индикатор основной интенсивности ожидания инфляции, он показывает повышенные ожидания в данном случае, то есть относительно других измерений, которые существуют, относительно, например, индикаторов на основе опросов, которые делаются по официальному заказу Банка России. Как раз наш индикатор показывает, что люди, в общем-то, не доверяют официальной статистике, тому, что цены низкие. И, самое интересное, наверное, понять, почему они этому не доверяют. То есть экономическая теория нам, например, предполагает, что в случае, если у нас какая-то взаимосвязь есть, если у нас низкие реальные доходы, то есть мы сами ощущаем, что маленькие у нас доходы, то мы меньше тратим, инфляция будет низкой. Соответственно, люди тоже должны это понимать, что сейчас у них доходы не сильно растут или, как у нас сейчас происходит, они четвёртый год подряд падают, значит и инфляция будет низкая. Однако, что получается на практике, и что показывают наши индикаторы, в частности, когда мы глубже начинаем это смотреть, то, что в случае падение реальных доходов люди, наоборот, намного острее воспринимают инфляционные процессы. Им кажется, что я сейчас купить могу меньше, значит, цены растут. Не значит, что-то с моими доходами, а значит, цены выросли, инфляция больше, чем её называют. 

Альбина Пылаева:

А вот кому мы должны сказать: почувствуйте, поймите истину, что нет, ни цены не растут, ни инфляция, а просто Вы меньше получаете денег, зарплаты у Вас низкие, вот этот месседж кому? Или нет этого месседжа? 

Ирина Голощапова:

Мы это пытаемся говорить общественности, наверное, в принципе, наши такие результаты, они в определённой степени подтверждаются теми же исследованиями на основе опросов, когда люди упоминают в качестве причин, формулировок своих ожиданий инфляции упоминают как раз состояние своих доходов. То есть в выступлениях представителей ФОМ звучали фразы о таком восприятии. 

Альбина Пылаева:

А вот два индикатора, один инфляционный, а второй кризисных настроений. А что происходит с настроениями? Я, единственное, перед этим вопросом ещё, наверное, для наших слушателей важно было бы понять, что эти индикаторы и Ваши исследования, они проходят в реальном времени. Что это ежедневный подсчёт, ежемесячный отчёт, что есть какие-то временные границы, за которые вы подсчитываете и выдаёте результат. Вот сейчас будем говорить про индикатор кризисных настроений, мы какой период возьмём, какие самые свежие данные у Вас? 

Ирина Голощапова:

В действительности мы все пересчитаем в начале апреля, всё опубликуем. То есть то, что последнее, это то, что мы опубликовали. Но в действительности программа написана так, алгоритм устроен так, что мы можем фактически в ежесекундном формате обновлять наши индикаторы. То есть это возможно, у нас это предусмотрено, но, чтобы это вывести на сайт, в реальном времени, чтобы индикаторы менялись, пока это не реализовано, сами мы не обладаем пока достаточным временем, чтобы это сделать. Но в целом возможность высокочастотного анализа, как минимум, ежедневного. То есть произошло какое-то событие, допустим, выборы Президента в США, волновались из-за этого люди, изменили ли они свои ожидания кризиса в российской экономике, являются ли для них какие-то события в США индикатором того, что у нас что-то будет с инфляцией. 

Альбина Пылаева:

А вот, кстати, Вы можете посчитать интенсивность этих упоминаний кризисных каких-то явлений?

Ирина Голощапова:

Конечно, это и есть наш индикатор. То есть, как он вообще устроен. Допустим, индикатор кризиса, в первую очередь, мы сформулировали цель, что мы хотим оценить индикатор кризисных настроений. Мы, в первую очередь, берём всю нашу выборку новостных статей и определяем из них те статьи, где хоть что-то говорится про экономический рост, про экономику, рост, кризис, всё вместе, чтобы сузить немного тематику. И дальше смотрим все комментарии, которые оставили интернет пользователи, которые читали эту статью, что-то хотели на эту тему сказать. И уже в этих комментариях мы подсчитываем, действительно, сколько было комментариев, упоминающих кризис. 

Альбина Пылаева:

Но вот вернёмся к тому, что Вы хотите пересчитать, уточнить и опубликовать в апреле. Вот за март что мы увидели, и по каким, может быть, основным факторам изменений. Как считали кризисные настроения, по динамике цен на нефть, по курсу доллара и так далее. Вот что в качестве основных факторов резких изменений были, и какие выводы за март, например. Март - серьёзный месяц. 

Ирина Голощапова:

За март я всё-таки пока не могу. 

Альбина Пылаева:

Давайте за февраль возьмём готовые данные. 

Ирина Голощапова:

Вот за февраль, да, можно про кризисное настроение, в первую очередь. Наверное, самое интересное в феврале что происходило, это то, что все ждали публикации доклада Минфина США о санкциях, и вокруг этого процесса было непонятно, насколько, во-первых, что это будет, насколько это будет серьёзно, вокруг этого было много переживаний. И, в принципе, статей было соответствующих тоже много. Но вот что мы отметили в своих индикаторах и инфляционных ожиданиях, и в кризисных, что действительности люди как-то не особо заметили этого процесса, и свои ожидания, обеспокоенность не усилилась. И другой интересный момент, это то, что когда мы смотрим динамику индикатора инфляционных ожиданий в высокочастотном разрезе, в каждодневном, то интересно, можно заметить, что после очередного решения Центрального банка о снижении процентной ставки, в действительности, инфляционные ожидания пошли на спад. То есть практически сразу после объявления о решении вот это сработало, прямо правильный теоретический механизм. 

Альбина Пылаева:

Так много хочется спросить, закончили мы эту мысль, потому что я спрашивала, что есть, по каким факторам, что беспокоит людей чаще всего, когда они делают какие-то комментарии к статьям в СМИ. 

Ирина Голощапова:

Да, что беспокоит. В данном случае мы, чтобы понять, что беспокоит людей, в первую очередь, мы пользуемся тем, что мы анализируем в общем-то содержание комментариев, которые люди написали, что я думаю, что цены вырастут, потому что цены на хлеб выросли на 20 %, я вчера ходил в магазин и это видел. Такого рода комментарии. И мы пытаемся сделать категории факторов, с которыми люди связывают изменения своих ожиданий. И на основе экспертного анализа мы выявили 8 категорий. То есть это цены на сырьё, всё, что определяет нашу экономику во многом, курс национальной валюты, доходы, состояние мировой конъюнктуры, некоторые процессы во внутренней политике. Но эта категория достаточно широкая, потому что, к сожалению, достаточно много комментариев, которые люди не пытаются объяснить свои ожидания, а просто говорят: потому что всё плохо, коррупция. 

Альбина Пылаева:

А вот такая категория, как неопределённость экономической ситуации. 

Ирина Голощапова:

Неопределённость, и этот фактор, он поддержан ещё и с точки зрения международной практики таких исследований, есть очень известная работа Baker, Bloom & Davis 2016г., где автор на основе новостных статей СМИ построили, просто подсчитывая количество упоминаний слова «неопределённость» в статьях. Построили индикатор, который оказался очень высоко скоррелирован с кризисными процессами. Соответственно, для нас это тоже важно понять, в какие моменты растёт неопределённость, упоминается неопределённость в рамках изменения инфляционных ожиданий, изменения кризисных настроений. В том числе, вообще, применение индикаторов этих очень интересно отслеживать на высокочастотном уровне, как люди воспринимали развитие кризисных процессов. Вот как мы входили в кризис 14-го года, с конца 14-го года. 

Альбина Пылаева:

То есть Вы сравниваете по годам, у Вас за сколько лет есть сейчас картина?

Ирина Голощапова:

С 14-го года, и мы на ежедневном уровне также публикуем на сайте данные. 

Альбина Пылаева:

Ну, и что изменилось за три года, за четыре, практически, за три и вот четвёртый год 18-й ещё не закончился. 

Ирина Голощапова:

Как минимум, мы подошли к некоторой надежде выхода из кризиса, надеемся, что мы в посткризисного периоде, инфляционные ожидания всё-таки гораздо ниже, чем в пиковое время. 

Альбина Пылаева:

Этот кризис 14-го года нужно объяснить, с чем он связан, это же не мировой кризис, который 2008-й, отголоски дошли до России, но несколько кризисов мы переживали. Вот этот кризис связан с санкциями и т.д. С чем связан вот этот кризис 14-го года, как его воспринимают. 

Ирина Голощапова:

Вы знаете, развитие наших индикаторов, оно показывало, что первый всплеск вообще обеспокоенности инфляцией и процессами в экономике, он возник ещё в июле 14-го года, то есть когда ещё не было бешеного всплеска и ставки, и цены на нефть ещё упали не сильно. Но у нас было обострение действительно отношений международных, были санкции. Что очень интересно, был всплеск ожиданий повышения инфляции после очередного, третьего подряд повышения ключевой ставки Банком России. Когда люди поняли, что появляется тенденция к увеличению этой ставки и, опять же, супротив экономической теории нет, чтобы подумать, что Центральный банк поднимает ставку, значит, инфляция будет ниже, Центральный банк справится. Люди запереживали, Центральный банк поднимает ставку, значит, всё будет плохо, инфляция будет выше, что-то не так. И дальше уже обеспокоенность фактором монетарной политики, как фактором инфляционных ожиданий, она снизилась, и дальше самыми главными факторами стала обеспокоенность ценами на нефть, обеспокоенность происходящим с курсом национальной валюты. То есть когда уже процессы получили своё развитие. А в начале люди запереживали ещё в самом начале. 

Альбина Пылаева:

Но прежде, чем расспросить Вас, а как Вы это делаете, у меня ещё один вопрос про содержание проекта. Это может быть про результаты тематического моделирования. Это предмет, статья, даже перейдём, как это делаете. Нет, вот какой у меня вопрос, забегая вперёд, потому что хочется успеть спросить обо всём. Адресат этих исследований. Вот когда Вы говорите, нет, чтобы подумать, а кто должен думать. 

Ирина Голощапова:

Нет, нет, чтобы подумать, в смысле нет, чтобы подумать в рамках экономической теории. 

Альбина Пылаева:

Но в рамках комической теории рассуждают экономисты и те, кто так или иначе понимает в ней. 

Ирина Голощапова:

Конечно, но когда... 

Альбина Пылаева:

Адресат исследований или заказчик его, как вот это устроено у Вас? С аудиторией, целевая аудитория кто?

Ирина Голощапова:

Целевая аудитория, в первую очередь, это всё-таки правительственные организации, Центральный банк, мы надеемся, что понимание, что наши индикаторы, они позволят углубить понимание психологии людей, психологии восприятия экономических событий, взаимосвязей между ними. Также Министерству экономического развития определённые вещи могут быть полезны. Кроме того, алгоритм, мы стараемся сделать его универсальным, поскольку мы можем задать имеющимся данным любой вопрос. Это может быть полезно и какому-то крупному бизнесу. Например, отслеживание, допустим, восприятие людей, тонкое отслеживание восприятия цен на бензин. Когда мы обеспокоены, нет, возможно, это определённой отрасли будет интересно. Ещё какие-то вопросы могут быть. 

Альбина Пылаева:

У нас, у нашей передачи, безусловно, есть определённая аудитория, это и бизнес аудитория, и люди, которые в инновационных секторах экономики работают и так далее. Что для них было бы важно понять, для руководителей этих компаний. Вы даёте им какой-то практический материал в руки или это только. Что Вы можете им сказать, что услышит от Вас бизнес. И как ему пользоваться тем, что Вы делаете. 

Ирина Голощапова:

Пользоваться очень просто. Есть сайт, на нём единственное, что только раз в месяц обновляются данные, в случае каких-то других вопросов к нам можно обращаться, конечно же. Все данные, которые мы рассчитываем по тем индикаторам, которые мы рассчитываем, всё это можно скачать с сайта, доступно скачивание данных. В принципе, крупный бизнес, он тоже интересуется происходящим в экономике. Потому что бизнес-план нужно выстраивать и особенно тот бизнес, который работает с конечным потребителем. Ему важно понимать не только, что происходит в экономике, но и как люди это воспринимают, как они будут менять свои финансовые решения в зависимости от того, что они думают о происходящем в стране. 

Альбина Пылаева:

Вы начинали свой проект, как всё-таки научный проект в рамках того же центра. Вы работали там с 2008-го по...

Ирина Голощапова:

С 2009 по 17-й. 

Альбина Пылаева:

С 2009 по 17-й год. Сейчас то, что Вы делаете, то есть Вы не связаны сейчас напрямую с наукой, это часть Вашей жизни, этот проект. Есть ещё какая-то работа, она с чем связана, тоже с исследованиями?

Ирина Голощапова:

Да, я работаю в X5 Retail Group, занимаюсь макроэкономическим анализом. Но данный проект по оценке экономических ожиданий, это всё-таки отдельный исследовательский проект, мы его реализуем совместно с Марком Андреевым, это скорее, в рамках нашей научной деятельности в Московском Государственном университете. 

Альбина Пылаева:

Вы аспирантка МГУ. 

Ирина Голощапова:

Да, это поддерживается ЦМАКП, чему мы очень рады. 

Альбина Пылаева:

Я для чего задала этот вопрос, для того, чтобы понять вот такую вещь. Мы в самом начале говорили, что не только ожидания населения от экономических каких-то изменений или процессов, но возможно, и рыночную конъюнктуру можно проследить по тем индикаторам, можно ли проследить какую-то рыночную конъюнктуру, сделать выводы о потребительском поведении россиян. Вот эти индикаторы, они могут использоваться вот так прикладно, в прикладном значении?

Ирина Голощапова:

Конечно, могут, мы можем смотреть исторические ряды обеспокоенности населения различными явлениями, такими, как, например, кризис. Но это самый явный способ, что если мы, конечно, больше ждём кризиса и больше о нём беспокоимся, наверное, мы сейчас не побежим покупать много товаров и не будем сильно улучшать своё потребительское поведение. Но хотя, если мы хотим говорить о том, что конкретно совсем макроэкономикой отвязываться уже от психологии потребителя, то скорее, наверное, нужно больше концентрироваться на данных статей. Потому что это более чувствительный в данном случае индикатор. То есть насколько СМИ часто или много пишут про кризис, тоже про различные события. 

Альбина Пылаева:

Слушайте, а есть разнонаправленные индикаторы, или движения их разнонаправленные. Потому что споры о перспективах экономического роста в последнее время, это не то, что споры о прогнозах каких-то. Нет ясности вообще в трактовке происходящего в экономике. Вот Вы убедились ли на своих исследованиях, которые такие постоянные, о том, что есть разнонаправленные индикаторы. 

Ирина Голощапова:

Мы в этом убеждаемся каждый день, смотря на статистику Росстата. 

Альбина Пылаева:

Приведите пример.

Ирина Голощапова:

Но здесь, наверное, в первую очередь. 

Альбина Пылаева:

Например, движение зарплаты и доходов населения, есть такие разночтения. 

Ирина Голощапова:

Это у нас в макроэкономике есть, этого нам хватает. Поскольку у нас всего два индикатора, которые мы публикуем, здесь у нас противоречий меньше. Но первое противоречие, это то, что у нас инфляции идёт вниз, а люди всё-таки на рекордно низких уровнях находятся уже какое, достаточно долгое время. При этом люди обеспокоены, люди всё-таки ждут в дальнейшем некоторого ускорения, хотя, конечно, не кризисного, скажем так. И другой момент, что, несмотря на то, что, в принципе, в 17-м году по оценкам экспертов мы считаем, что экономика переходит к восстановлению, всё постепенно выходит из кризиса, всё становится лучше. При этом наш индикатор кризисных настроений в конце 17-го года, он даже немного выше аналогичных значений 16-го года. То есть мы можем сказать, что есть определённые, есть неопределённость. То есть у нас всё-таки, если в целом смотреть на макроэкономику, то мы можем видеть неустойчивость производственной активности, неустойчивость восстановления, неустойчивость инвестиционной активности, стагнацию корпоративного кредитования продолжающуюся. То есть мы не можем сказать, что мы сейчас находимся на этапе сбалансированного восстановления экономического. И люди это чувствуют. Люди чувствуют, что ещё не всё в порядке. Поэтому так замерли в ожидании, сильного улучшения, сильного снижения кризисной обеспокоенности мы не видим. Она, конечно, не такая, не на уровне действительно, когда у нас наблюдался кризис, но она не снизилась. 

Альбина Пылаева:

Вот как долго этот процесс идёт, такая неуспокоенность. 

Ирина Голощапова:

Неуспокоенность, скорее мы увидели в конце, в четвёртом квартале 17-го года и, в принципе, это сопровождалось достаточно грустной статистикой по промышленности в четвёртом квартале от Росстата. Сейчас мы видим, что относительно значений конца 17-го года индикатор пошёл вниз, то есть люди более спокойны. Но при этом, если сравнивать с индикатором год назад, всё-таки обеспокоенность на несколько повышенном уровне. 

Альбина Пылаева:

И самое интересное тоже, как Вы это делает? Это очень любопытно, потому что источник у Вас классический, социальные медиа и просто медиа, скажем так. Как это практически осуществляется? Вы рассказали нам о четырёх ведущих экономических СМИ, как Вы мониторите их? Какие статьи выбираете, забиваете, грубо говоря, в поисковике, как получается вот эта картинка, вот реально, как это происходит, механизм работы. 

Ирина Голощапова:

Давайте, расскажем. В первую очередь, мы усилиями Марка в основном написали программу, которая загружает все статьи указанных четырёх источников, публикуемых в открытом доступе. Всё, что можно найти в открытом доступе, и сопоставляет также с новостями об этих статьях, публикации этих статей в социальных сетях, Facebook и ВКонтакте, сейчас у нас охвачены. И дальше мы уже думаем, какой вопрос мы хотим задать этим данным. Мы хотим найти инфляционные ожидания. Соответственно мы пытаемся сузить выборку новостных статей, в первую очередь. Мы ищем статьи, которые так или иначе... 

Альбина Пылаева:

По заголовкам ищите или просто по контенту? 

Ирина Голощапова:

По тексту, по доступному тексту статьи. 

Альбина Пылаева:

По всему тексту. 

Ирина Голощапова:

Да, там есть ограничения в том, что, например, на сайте Ведомостей не все статьи они полностью показывается, там что-то по подписке. Мы этого не преодолеваем, то есть если в доступном тексте статьи есть упоминание инфляции, то мы считаем, что это статья об инфляции, что нам интересно посмотреть, что люди говорили в комментариях к ней. И дальше уже мы загружаем, выбрали все статьи, которые об инфляции, для инфляционных ожиданий порядка 80.000 статей, по-моему, сейчас на всём периоде там. Дальше загружаем все доступные комментарии к этим статьям. 

Альбина Пылаева:

За месяц? 

Ирина Голощапова:

Нет, за весь период, с 14-го года. 

Альбина Пылаева:

То есть каждый раз Вы начинаете с 14-го. 

Ирина Голощапова:

Почему каждый раз, мы один раз загрузили и дальше подгружаем уже только что новое поступает. 

Альбина Пылаева:

То есть Вы подгружаете статьи, все, поняла. 

Ирина Голощапова:

Конечно, мы дополняем выборку. Но поскольку мы эти данные храним, они у нас есть, мы в любой момент можем ещё какой-то вопрос задать нашим данным и получить ещё один индикатор, который будет начинаться 1 января 14 два года. 

Альбина Пылаева:

А потом он по релевантности сортирует, получается, по времени, как они отсортировываются. 

Ирина Голощапова:

Конечно, у нас есть дата загрузки, вплоть до секунды публикации каждого комментария, статьи. То есть мы это всё можем изобразить на временном периоде, интенсивность этого обсуждения. И что важно, мы к этому не сразу пришли, когда мы подсчитываем интенсивность уже обсуждений, именно интенсивность упоминаний ожиданий инфляции или ожиданий роста цен в комментариях, мы корректируем эти ожидания на количество статей об инфляции в СМИ. То есть всё-таки есть те моменты, когда пытаемся выловить моменты, когда искусственно, может быть, СМИ может влиять, о какой-то теме говорить больше, люди просто идут за этим. Вводим эту коррекцию. 

Альбина Пылаева:

В том-то и интерес потому что есть же редакционные коллегии, редакционная политика, и есть темы, инициированные журналистами. Есть просто задачи СМИ, привлекать внимание читателей и так далее. То есть да, тем более, Вы работаете не с новостными агентствами, где не важно мнение автора статьи, есть факты, но нет отношенческих вещей, который чаще всего в новостях просто нет. Там что, где, когда, зачем и почему. Как Вы преодолеваете вот этот барьер? Вернее, в чем точность этого подхода, если есть инициация самих СМИ. Они же не зеркало, которое всё отражает, они же и креативят некоторые темы. 

Ирина Голощапова:

Да, мы пытаемся, они всё-таки основные события, основную статистику об инфляции, как только она выходит, указанный источник, который мы обрабатываем, они тут же это публикуют с указанием собственного мнения. Но статистика эта вся доступна и многие именно своё восприятие экономических процессов связывают с этими источниками, читают их, на основе них получают информацию об экономических событиях. 

Альбина Пылаева:

А Вы первые додумались анализировать именно статьи, что-то предшествовало Вашему проекту, может быть, не в России, что было до того?

Ирина Голощапова:

Конечно, в области именно того, что в области экономических исследований влияние новостей, оно исследуется уже достаточно давно. Ещё в 2003-м году в исследовании Кэрол была построена теоретическая модель того, что именно новости, они очень сильно должны учитываться людьми при построении инфляционных именно ожиданий. Потом ещё через несколько лет, сейчас я уже не помню конкретную дату, было исследование, где на основе вот этой теоретической модели она была проверена на основе практических данных. Где просто взяли Washington Post и New York Times, и просто в заголовках искали упоминание слова «инфляция» и подсчитывали. И получилось, что тоже вполне жизнеспособный индикатор, который оказался важным в рамках построенной модели для формирования ожидания населения. Мы преемственно взяли, решили её расширить тем, что есть ли смысл смотреть в совокупности на комментарии населения, есть или в этом что-то полезное. И оказывается, что, да, оказывается, что мы можем действительно понимать, что люди, во-первых, интуитивно следуют действительно экономическим событиям. То есть если мы просто построим динамику нашего индикатора на ежедневном уровне, курс рубля, цена на нефть и ключевую ставку, мы увидим, что индикатор прекрасно встраивается. То есть люди просто, вроде бы хаотично обсуждая экономические новости, они в действительности очень чётко интуитивно следуют экономическим событиям и формируют свои ожидания. 

Альбина Пылаева:

Смотрите, изучаем интернет-пользователей, это живые люди, они разные. А Вы можете, есть ли у Вас какая-то выборка или какой-то подход, через который можно увидеть лицо этого пользователя, его профиль. 

Ирина Голощапова:

Да, мы стараемся работать в этом направлении, здесь есть ряд сложностей, конечно, но мы стараемся. То есть если мы ограничим выборку комментариев только социальными сетями, мы проверяли, перестраивали индикатор, в принципе, это возможно, ключевые выводы и его динамики не меняется. И ограничивались пользователями ВКонтакте и профиль авторов комментариев загружали, пытались посмотреть, какие мы агрегированные характеристики нашей выборки исследуемой можем понять, построили в целом возрастное распределение, то есть наиболее активная часть обсуждающих, это люди от 25 до 35 лет. Но при этом, если построить индикаторы по сегментам, как строились инфляционные ожидания различных возрастных категорий. Поскольку, во-первых, ограничен всё-таки вывод, далеко не все указывают свой возраст в профиле ВКонтакте. Но на основе того, что мы построили, в принципе, видно, что наиболее логично, чётко и быстро свои инфляционные ожидания формируют люди от 35 до 45 лет. И, как правило, систематически позже, когда уже кризис начался, возникает ожидание, обеспокоенность у более старшей категории, старше 55. А наиболее распространённой категории, от 25 до 35 лет, как-то в соответствии с экономическими событиями. То есть предсказать событие ещё пока нет возможности, это уже чуть надо подрасти. Строили также разрез женщины – мужчины, ожидания. Там, наверное, тот вывод, который мы единственный можем сделать с учётом того, какой у нас охват небольшой всех пользователей. Это то, что мужчины гораздо более интенсивно обсуждают новости, для них каждая новость, событие, что-то случилось в США, что-то у нас вышло, все сразу обеспокоились, возникли ожидания, потом утихли. А женщины более спокойно, что-то произошло, мы немного повысили инфляционные ожидания, потом подумали, посмотрели, что происходит, как-то всё более плавно и спокойно происходит. 

Альбина Пылаева:

Ещё бы уточнить, в какое время дня делают комментарии. Было бы существенно. 

Ирина Голощапова:

В какое время дня, это возможно вполне. 

Альбина Пылаева:

Да, когда наибольшая активность. 

Ирина Голощапова:

Это очень несложно посчитать, все данные для этого есть. Также строили Москва-Питер, это и выборки, достаточно много людей из столицы, из культурной столицы и, в общем, эти люди чаще указывают свои локацию, то есть тоже проще построить. Здесь мы выявили, что Москва, что-то случилось, сразу Москва среагировала, чуть-чуть позже Питер. То есть культурная столица, она немножко с лагом следит за экономическими событиями. Хотя в момент того, когда цены на нефть совсем стали сильно падать в четвёртом квартале 2014г., когда у нас потом произошло очень сильное повышение ставки Центральным банком, здесь одновременно произошёл всплеск, то есть все уже следили. 

Альбина Пылаева:

Ирина, осталось немного времени, я хочу успеть спросить, что дальше, как Вы видите перспективы развития своего проекта, что Вы задумали еще?

Ирина Голощапова:

Ещё мы задумали, конечно же, расширение экстенсивное, то есть мы задумываем расширение количества источников, на которых мы базируемся и собираем информацию, что очень важно. Мы планируем новые индикаторы, в частности, индикатор ослабления курса рубля, индикатор ситуации на рынке труда. И также очень важное направление, это интенсивное развитие, мы хотим больше погрузиться в понимание цепочек взаимосвязей, как люди формируют внутри себя цепочку взаимосвязей. Снизились цены на нефть, значит сейчас там что-то случится с курсом, значит, вырастет инфляция. И как вот это всё взаимосвязано, и как сюда встроилась денежно-кредитная политика, в том числе. Встроилась ли она. 

Альбина Пылаева:

Огромное спасибо, слушайте, очень интересно, и моя мысль, что популяризация экономики, это, в том числе, и дело макроэкономистов, которые занимаются этим и как наукой, и делают серьезные комментарии, это гораздо интереснее и серьёзнее, чем попсовая экономика, когда ведущие экономисты, упрощённо апеллируя не датами. У Вас же даты, то есть, простите, цифры и выводы на основе Big Data. Это очень хороший инструмент, хотя ему вообще, в принципе, 10 лет. Но в сочетании с макроэкономикой оказался, очень интересные вещи происходят, в том числе, и рождение Вашего проекта. Спасибо большое, мы будем следить, ещё раз скажите, как называется Ваш сайт, чтобы те, кто принимает решения относительно коллектива своих людей, относительно своего бизнеса, относительно вообще экономической политики страны и каждый из нас, чтобы мы опирались, в том числе, на выводы на основе Big Data. 

Ирина Голощапова:

bigdata-indicators.com. Заходите.

Альбина Пылаева:

Спасибо большое, Ирина. Новых встреч.