Анализ новостей и пресс-релизов компаний-эмитентов с целью принятия инвестиционных решений на фондовом рынке

Юдаков С.Г.

Статья в журнале

Российское предпринимательство *
№ 2-2 (106), Февраль 2008
* Этот журнал не выпускается в Первом экономическом издательстве

Цитировать эту статью:

Аннотация:
В последние годы в России заметно вырос интерес к использованию финансовых инструментов. Долгое время ценные бумаги, фондовый рынок представлялись для большинства населения чем-то далеким и непонятным, считались уделом банков и малого числа профессионалов. С повышением благосостояния населения возникает вопрос инвестирования свободных денежных средств, сохранения их от потерь в виде инфляции и получении дополнительного дохода.

Ключевые слова: инвестиции, фондовый рынок, принятие решений, инвестиционные решения



В последние годы в России заметно вырос интерес к использованию финансовых инструментов. Долгое время ценные бумаги, фондовый рынок представлялись для большинства населения чем-то далеким и непонятным, считались уделом банком и малого числа профессионалов. С повышением благосостояния населения возникает вопрос инвестирования свободных денежных средств, сохранения их от потерь в виде инфляции и получении дополнительного дохода.

По данным Московской межбанковской валютной биржи на конец 2006 года было открыто 230 тысяч частных брокерских счетов. За 2006 год количество счетов увеличилось более чем вдвое [6]. По прогнозам аналитиков темпы роста открытия счетов будут расти и к 2009 году число счетов может превысить 1,2 млн. Поэтому вопрос анализа текущей рыночной ситуации и прогнозирования поведения цены очень актуален.

Современные способы принятия участия в торгах, как правило, связаны с торговлей через телекоммуникационные сети (в частности, через Интернет). В своем распоряжении инвестор имеет терминал, предоставляющий ему текущие цены, объемы сделок, и дающий возможность в любое время совершить сделку с интересующим его инструментом, а также предлагающий ему ленту новостей и событий.

Многочисленные способы принятия решений о покупке или продаже акций связаны с анализом цен, объема и направления движения рынка. К сожалению, новости и прочие события рассматриваются, но никак не учитываются в принятии решений либо решения по ним принимаются стихийно, без какого-либо обоснования.

Учитывая значимость информации, поступающей в виде новостей, заметок в прессе, отчетов компаний, можно сделать акцент на информации такого рода, нежели на изменениях цен. Для этого необходимо разработать систему, которая сможет сделать прогноз изменения цены на основании поступивших в нее текстовых данных. Условно данный процесс можно разделить на три этапа:

‑ изучение и анализ текста – исходного материала;

‑ категорирование полученного материала;

‑ получение торговых идей на основании значений, обретенных ранее [5].

Получаемую информацию можно разделить на информацию от компании-эмитента, а также на различного рода заметки, исследования, статьи в прочих источниках. Информация эмитента содержит весьма значимую для анализа информацию – значения выручки компании, назначения и увольнения в руководящих органах, о новых приобретениях или продажах направлений бизнеса. Подобные пресс-релизы важны для инвестора, так как раскрывают информацию, касающуюся эмитента и влияющую на цену акций. Изменение цены бывает очень значительным – от 2 и более процентов в течение короткого периода времени [4].

Влияние информации на цены очевидно: хорошие новости ведут к росту цен, плохие – к их снижению. Помимо этого степень влияния новости на цену сильно зависит от имеющихся ожиданий – прогнозов, консенсусов по ожидаемым новостям. Однако не всегда стратегии торговли, учитывающие разницу между фактом и прогнозом, дают положительный результат. Часто в аналогичных ситуациях рынок ведет себя по-разному. Поэтому анализ и применение его результатов исключительно самого события может дать более вероятный прогноз [4].

Для построения системы и применения ее алгоритмов необходимо перевести текст в цифровое представление. Для этого проводится анализ текста по его составляющим – словам и формируется словарь наиболее часто используемых слов, из которого исключаются предлоги, цифры и т.д. Слова, совпадающие по своей сути (имеющие один корень), считаются как за одно слово.

Полученный словарь анализируется с целью выявления наиболее часто повторяемых слов в пределах одного документа (предполагается, что важные слова повторяются в документе часто) – частота слова TF (term frequency); а также числа документов, содержащих определенное слово среди всей коллекции (предполагается, что это наиболее важные с точки зрения описания события слова; таким образом, снижается значимость слов, которые часто повторяются в пределах одного документа) – обратная частота документа IDF (inverse document frequency). Сортировка произведений TF-IDF выявит наиболее важные слова во всем словаре, на основании которых будет делаться прогноз [3].

Такой метод прогнозирования допустим при соблюдении некоторых условий: прогноз делается для ценных бумаг компаний, ежедневный оборот по которым больше некоторого порогового значения (следует из того, что ценами акций с малым внутридневным объемом торгов возможно манипулирование), а также устанавливаются ограничения по времени появления новости. При этом не используются новости, опубликованные за несколько часов до начала и после окончания торгов. Кроме того, не рассматриваются новости без указания компании, с указанием 2 и более компаний.

С целью исключения влияния краткосрочной волатильности [1] цен на прогноз. Изменение цены в 1-1,5% часто может укладываться в ситуацию на рынке, когда некоторые крупные игроки открывают или закрывают позиции, и может быть не связано с какими-то причинами, касающимися эмитента.

Для этого определим «хорошую» новость, как новость, после публикации которой в течение 60 минут цена вырастает на 3%, а среднее значение цены за этот же период выше на 1%, чем цена в момент публикации новости. Соответственно, «плохую» новость определим как новость, после публикации которой в течение 60 минут цена снижается на 3%, а среднее значение цены за этот же период становится ниже на 1%. Остальные новости будем считать «нейтральными» (их последствия характерны большим количеством сделок (частым изменением цены) при малом абсолютном изменении цены.

Для выполнения системой своих функций ее необходимо «обучить». Некоторое количество новостных событий, а также данные об изменении цен после пресс-релизов, вносятся в систему. Таким образом, в дальнейшем система на основе предыдущих новостей, а также архива значений цен в аналогичный период времени, поступающие новости сможет самостоятельно характеризовать как «хорошие», «плохие», «нейтральные».

Таким образом, система при получении новости, отвечающей заданным параметрам, без анализа текущих ценовых значений, сможет сама поместить новость в одну из категорий и, следовательно, дать торговую идею (покупать, продавать, вне позиции).

Так при эмпирическом исследовании в 43% случаев представления пресс-релиза (длинные и короткие позиции в совокупности) система сама рекомендовала совершить те или иные операции. Данное значение достаточно велико, учитывая, что количество новостей, которые однозначно были отнесены к «хорошим» или «плохим» намного меньше (приблизительно в 10 раз). Данный факт можно объяснить тем, что изначально некоторые «нейтральные» новости были отнесены к двум другим категориям. Формально новость, повлекшая изменение цены, чуть меньше чем на 3% (2,7-2,9%) не относится ни к «хорошей», ни к «плохой», но не по своей экономической сути.

При проведении сделок статистические исследования показывают, что доходность по сделкам, совершенным по сигналам такой системы, составляет в среднем 0,11%. Данные сделки проводились следующим образом: позиция открывается через 2 минуты после появления новости, закрывается через 58 минут от открытия, т.е. сделка проводится в течение 60 минут от появления новости.

Возможно увеличение доходности по сделкам в случае установления пределов, т.е. позиция закрывается при достижении определенного порогового значения, а не по истечении 60 минут.

Наибольшая доходность по сделкам (0,17-0,21%) была достигнута при установлении пороговых значений сверху в промежутке от 0,5% до 2,0% и без установления порога снизу. Такая ситуация объяснима тем, что в случае «хорошей» новости рост цен меньше (в %), нежели падение цены в случае «плохой» новости.

На основании вышесказанного можно сказать, что данный подход, заключающийся в анализе текста новости, может эффективно использоваться на практике. При этом есть свободные области для дальнейшей оптимизации рассмотренного подхода с целью повышения точности прогнозов: анализ не только слов, но и словосочетаний, гибкое изменение временных границ закрытия сделки, распространение метода на акции, имеющие малый ежедневный объем торгов.


Источники:

1. Ageev M.S., Dobrov B.V. Support Vector Machine Parameter Optimization for Text Categorization Problems. Proceedings of 2nd International Conference ISTA'2003 "Information Systems Technology and its Applications", LNI 2 GI 2003, pp. 165-176.
2. Back, B., Toivonen, J., Vanharanta, H., and Visa, A. Comparing numerical data and text information from annual reports using self-orginizing maps, International Journal of Accounting Information Systems (2), 2001, pp. 249-269.
3. Joachims T. Text Categorization with Support Vector Machines: Learning with Many Relevant Features. Proceedings of ECML-98, 10th European Conference on Machine Learning, pp. 137--142, 1998.
4. Robert Schumaker, Hsinchun Chen. Textual Analysis of Stock Market Prediction Using Financial News.
5. Thomas, James., Sycara, Katia. Integrating genetic algorithms and text learning for financial prediction.
6. www.micex.ru

Страница обновлена: 21.09.2024 в 22:22:51