Прогнозирование цены криптовалюты с использованием технологий искусственного интеллекта
Статья в журнале
Теневая экономика (РИНЦ, ВАК)
опубликовать статью | оформить подписку
Том 8, Номер 4 (Октябрь-декабрь 2024)
Введение
В связи с тем, что рынок криптовалют продолжает активно развиваться и привлекать внимание как частных инвесторов, так и крупных финансовых организаций, данная тема является актуальной. Благодаря высокой степени волатильности в таких криптовалютах как Bitcoin, Ethereum и других создаются огромные возможности для получения прибыли, а также серьезные риски для участников рынка. Именно в этой связи становится актуальной задача, направленная на прогнозирование курсов криптовалют, позволяющая минимизировать риски и принимать более обоснованные инвестиционные решения.
Методы технического и фундаментального анализа не всегда могут быть эффективными в прогнозировании курсов криптовалют из-за их уникальной природы. Влияние на курс криптовалюты оказывают не только экономические и политические факторы, но и инновационные разработки, регуляторные изменения и даже социальные тенденции. Данное обстоятельство делает задачу прогнозирования достаточно сложной и требует использования современных технологий искусственного интеллекта. Глубокое обучение и нейронные сети показывают высокую эффективность при обработке больших объемов информации и поиске сложных нелинейных зависимостей. В случае использования нейронных сетей для анализа временных рядов и прогнозирования, появляется возможность учитывать множество факторов одновременно и адаптироваться к меняющимся условиям рынка.
Степень проработанности темы.
Научные работы, посвященные прогнозированию цен на ценные бумаги, эволюционировали от использования традиционных авторегрессионных моделей до нейронных сетей. Технические индикаторы и модели типа ARIMA и SARIMA рассмотрены в работах Добрина М.В., Стрекалова Д.С. [5], Karthikeyan C. [17] и других. Исследованием применения технологии нейросетевого моделирования в рамках прогнозирования цен на акции публичных эмитентов занимались Low P.R., Sakk E. [21], Gülmez B. [14], Li Q., Kamaruddin N., Al-Jaifi H.A. [19], Hang L., Liu D., Xie F.A. [15], Ali A.I., Bilal N.S., Marwa A.F. [10], Chen C., Xue L., Xing W. [13], Shet A., Ashika S, Hanumanth D.N, Shetty S. [24], Jeevan В., Naresh E., Kumar B.P., Kambli P. [16] и другие.
Криптовалюты не являются исключением в плане научных интересов. В публикации Sarkar M. and et. [23] предлагается улучшенная модель временных рядов с использованием более эффективных алгоритмов и экспертной системы для прогнозирования рыночной неопределенности и обеспечения доходности.
Также встречаются исследования, в ходе которых изучались способы использования нейронных сетей для прогнозирования обменных курсов криптовалют. Нейронные сети, использующие долговременную память (LSTM), показали более высокую эффективность по сравнению с традиционными временными рядами, такими как ARIMA [18]. Модель нейронной сети, которую разрабатывали авторы [18], имеет горизонт прогноза в 1 день, а коэффициент детерминации на тестовых данных составляет 0,54, что очень мало.
В отдельных научных исследованиях для определения цены биткоина на следующий день были использованы нейронные сети обратного распространения ошибки (BPNN), которые продемонстрировали высокую степень точности [22]. В высокочастотной торговле (торговля внутри одного дня – на минуты, секунды) также применяются свёрточные нейронные сети (CNN) и гибридные модели CNN-LSTM [12]. Кроме того, можно отметить работы, посвященные разработке нейронных сетей с несколькими входами для обработки данных разных криптовалют, которые дают возможность повысить эффективность прогнозирования цен и их колебаний [20]. В работе Almasri E. [11] также используется нейронная сеть для прогнозирования дневных цен криптовалют.
В рассмотренных исследованиях продемонстрирован потенциал технологий нейронных сетей в предоставлении прогнозов обменного курса криптовалют, однако они ориентированы на прогнозирование в течение одного дня или же на минуты. Однако другие краткосрочные периоды прогнозирования (неделя-месяц) не рассматриваются. Также все представленные работы не содержат открытого кода разрабатываемой нейронной сети, что не позволяет ее протестировать.
Цель исследования заключается в совершенствовании методов прогнозирования цены криптовалюты на примере биткоина в целях улучшения эффективности краткосрочной торговой стратегии.
Основная часть
Следует отметить, что криптовалюта - цифровой финансовый актив, который создается и учитывается в распределенной базе данных цифровых транзакций. «Криптовалюта позволяет легко и быстро перемещать большие суммы, и к ней можно получить доступ из любой точки мира» [6].
Крипто-индустрия характеризуется своей дуалистической природой. С одной стороны, криптовалюта является средством для отмывания денежных средств, полученных преступным путем, провоцирует дополнительную нагрузку на энергетическую инфраструктуру регионов. С другой стороны, позволяет обеспечить прозрачность операций. «Массовое подключение к блокчейн-архитектуре экономических агентов может помочь в борьбе с теневым сектором экономики, при этом гарантируя прозрачность транзакций, которые проходят между ними» [1].
«Криптовалюты могут быть объектами инвестирования, а не только средством платежа» [8].
Настоящий анализ посвящен оценке стоимости биткоина в долларах, которая формируется в процессе торгов на бирже. График роста цены биткоина с 2014 по 2024 гг. представлен на рис. 1.
Рис. 1 Цена биткоина с 2014 по 2024 гг. (долларов)
Источник: составлено автором в Python по данным yahoo.finance [2]
Рост цены биткоина обусловлен большим вниманием со стороны институциональных и розничных инвесторов. Развитие технологий, таких как Lightning Network, улучшило возможности использования биткоина. Рост экономической неопределенности, такой как инфляция и политическая нестабильность, увеличил привлекательность биткоина как "безопасной гавани". Росту также способствует медийный интерес и поддержка со стороны знаменитостей и публичных личностей.
Все озвученные факторы привели к росту интереса к биткоину как альтернативному активу. При этом фундаментальных факторов роста цены не прослеживается.
При этом стоит отметить высокую степень волатильности курса. Среднее значение цены с 2014 года составляет 19057.97 долларов, стандартное отклонение - 21233.418 долларов. Коэффициент вариации составляет 111.41% ((21233.417872 / 19057.967240) × 100).
После выборов в США в 2024 году и победы Д. Трампа на ожиданиях, что правительство займет более мягкую позицию по отношению к криптовалютам, сложилась ситуация особой степени перекупленности биткоина. На рис. 2 представлен график индекса относительной силы (RSI, Relative Strength Index) — технический индикатор, который используется для оценки силы тренда и определения состояний перекупленности или перепроданности финансовых инструментов на рынке. Индекс разработан Дж. Уэллсом Уайлдером в 1978 году и описан в его книге «Новые концепции технических торговых систем» [9].
Рис. 2 показывает динамику цены биткоина за последний месяц и индекс относительной силы (RSI). С 1 ноября до 21 ноября наблюдается значительный рост цены с 70,000 до 95,000 долларов. Индекс относительной силы (RSI) поднялся выше уровня 70 примерно к середине графика, что свидетельствует о зоне перекупленности. Затем он снижается к отметке около 50, показывая ослабление покупательского давления.
Рис. 2 График цены биткоина за последний месяц (долларов) и индекс относительной силы (RSI)
Источник: рассчитано автором в Python по данным yahoo.finance [2]
Поскольку RSI вошел в зону перекупленности и начал снижаться, возможно, есть потенциал к коррекции цены. Однако неизвестно конечное значение данной коррекции для принятия инвестиционных решений.
Для решения данной проблемы воспользуемся рекуррентной нейронной сетью архитектуры долговременной краткосрочной памяти (LSTM), т.к. в рассмотренных исследованиях она демонстрировала хорошее качество. Данный тип нейронной сети специально разработан для обработки последовательных данных и временных зависимостей. В отличие от стандартных RNN, LSTM способна эффективно запоминать долгосрочные зависимости в данных, что делает её особенно подходящей для задач прогнозирования временных рядов.
LSTM-модель обучается на последовательностях данных, используя обратное распространение ошибки через время. Это позволяет ей корректировать веса переменных таким образом, чтобы лучше учитывать как краткосрочные, так и долгосрочные зависимости.
Разработка модели LSTM для прогнозирования цены биткоина на горизонте 10 дней.
После загрузки данных (всего 3734 значений) о котировках биткоина осуществлена их нормализация для улучшения сходимости модели. С использованием MinMaxScaler масштабируются значения так, чтобы минимальное значение стало 0, а максимальное — 1. Это помогает модели лучше обучаться, так как уменьшается влияние больших значений (рис. 3).
Следующим этапом осуществлялось разделение данных на обучающую и тестовую выборки. Размер тестовой выборки рассчитывался как 20% от общего количества данных. Обучающие данные (train_data) берутся до последних test_size элементов. Тестовые данные (test_data) из последних test_size элементов.
Рис. 3. Подготовка данных к обучению
Источник: составлено автором в Python по данным открытой библиотеки [4]
Далее создано временное окно для обучения (рис. 3). На вход подаются данные (data), длина временного окна (time_step) и горизонт прогноза (forecast_horizon). X содержит последовательность из значений цены за последние 60 дней. Y содержит значения для прогноза на следующие 10 дней. На выходе возвращаются два массива — входные данные X и целевые значения y. Затем созданы обучающие и тестовые выборки с изменением формы данных для LSTM. Данные преобразуются так, чтобы каждая последовательность имела форму [time_steps, features], где features=1 (только одно измерение — цена).
Важным этапом является создание архитектуры и обучение модели (рис. 4).
Рис. 4. Создание обучающей и тестовой выборки, архитектура модели
Источник: составлено автором в Python по данным открытой библиотеки [3; 7]
Сформирована последовательная модель (Sequential), к которой добавлялись слои:
- первый слой LSTM с 50 нейронами и параметром return_sequences=True, что позволяет возвращать последовательности (требуется для следующего слоя LSTM);
- слой Dropout с коэффициентом 0.2 для регуляризации (в целях предотвращения переобучения);
- второй слой LSTM с 50 нейронами (без возвращения последовательностей);
- один слой Dropout с коэффициентом 0.2;
- полносвязный слой (Dense) с числом выходов, равным горизонту прогноза (forecast_horizon=10), что соответствует прогнозу на 10 дней вперед.
Модель компилировалась с оптимизатором Adam и функцией потерь mean_squared_error (MSE), которая минимизирует среднеквадратичную ошибку (рис. 4).
Модель обучалась в течение 10 эпох (epochs=10) с размером батча 32 (batch_size=32) (рис. 5).
После обучения модель проверяется на тестовых данных. Прогнозируемые значения масштабируются обратно к исходному диапазону цен с помощью scaler.inverse_transform (рис. 5).
Рис. 5. Обучение и тестирование LSTM модели
Источник: составлено автором в Python по данным открытой библиотеки [3]
По рис. 6 истинных цен (y_test_original) и прогнозируемых цен (predictions) можно сделать вывод о достаточно хорошей способности модели к аппроксимации.
Рис. 6. Истинные (голубая линия) и предсказанные значения (красная линия)
Источник: разработано автором в Python
На тестовых данных средняя абсолютная ошибка (MAE) составила 2993.9 долларов, а коэффициент детерминации (R²) определен на уровне 0.940. Данные метрики свидетельствуют о высоком качестве полученной модели.
Подавая на вход модели значения цены биткоина за последние 60 дней, на выходе получаем прогноз цены на 10 дней вперед (рис. 7).
Ключевые преимущества полученной модели:
1. позволяет эффективно моделировать временные зависимости и паттерны в данных, что особенно важно для анализа временных рядов, таких как цены криптовалют;
2. может быть адаптирована для различных горизонтов прогнозирования (например, прогноз на 1 день, 10 дней и т.д.), что делает её универсальной для различных целей;
3. способна выявлять сложные нелинейные зависимости в данных, которые могут быть неочевидны для традиционных статистических методов;
4. процесс прогнозирования становится полностью автоматическим, что сокращает необходимость ручного анализа данных;
5. может быть масштабирована для работы с большими данными и различными активами;
6. использование «прореживания» способствует снижению риска переобучения.
Рис. 7. Использование модели для прогнозирования цены биткоина на 10 дней вперед
Источник: составлено автором в Python
Ограничения модели:
1. чувствительность к качеству входных данных. Шум в данных, пропуски или ошибки могут существенно ухудшить качество прогнозов;
2. криптовалютный рынок характеризуется высокой волатильностью и непредсказуемостью, что усложняет задачу долгосрочного прогнозирования. Модель может плохо справляться с внезапными рыночными изменениями;
3. несмотря на использование регуляризации (Dropout), модель может переобучаться на исторических данных и плохо обобщать новые рыночные условия;
4. модель учитывает только исторические данные о ценах и не принимает во внимание макроэкономические факторы, новости, настроения рынка или другие переменные, которые могут существенно влиять на цену криптовалюты;
5. обучение LSTM-модели требует значительных вычислительных ресурсов, особенно при увеличении объема данных или сложности модели.
Заключение
Предложенный подход имеет значительный потенциал для автоматизации торговых стратегий и управления рисками на криптовалютном рынке благодаря способности LSTM-моделей учитывать временные зависимости в данных и выявлять сложные паттерны.
Полученная модель может быть интегрирована в алгоритмические торговые стратегии для автоматического открытия и закрытия позиций на основе прогнозов цен. Прогнозы могут использоваться для определения точек входа и выхода из сделок, а также для адаптации стратегии к текущим рыночным условиям. Появляется возможность определить потенциальные зоны риска (например, ожидаемые снижения цен), что позволяет заранее принимать меры по хеджированию или ограничению убытков.
Однако для успешного применения необходимо учитывать ограничения модели, такие как зависимость от качества данных и высокая волатильность рынка. В перспективе возможна интеграция дополнительных переменных (макроэкономических и новостных) и улучшение архитектуры модели для повышения ее точности и адаптивности к быстро меняющимся рыночным условиям.
Страница обновлена: 06.01.2025 в 12:34:00