Экономика облачных вычислений

Макаров С.В.

Статья в журнале

Креативная экономика (РИНЦ, ВАК)
опубликовать статью | оформить подписку

№ 9 (45), Сентябрь 2010

Цитировать:
Макаров С.В. Экономика облачных вычислений // Креативная экономика. – 2010. – Том 4. – № 9. – С. 121-130.

Эта статья проиндексирована РИНЦ, см. https://elibrary.ru/item.asp?id=15186485
Цитирований: 5 по состоянию на 07.12.2023

Аннотация:
В статье раскрывается авторский подход к более глубокой экономической сущности модели Облачных Вычислений «pay-as-you-go», которую можно перевести как принцип потребления услуги в следующей форме – «плата исключительно за использование». При этом учитывается, что в модели Облачных Вычислений пользователь платит за фактическое использование Полезности, а в модели традиционного датацентра – за использование ресурсов оборудования.

Ключевые слова: облачные вычисления, модель облачных вычислений, эластичность облачных вычислений, традиционные дата-центры, эффективность облачных вычислений



Известно, что модель Облачных Вычислений существенно более гибкая, чем любая другая модель потребления компьютерных услуг, что означает возможность применения адаптивной стратегии. А именно, для Облачных вычислений возникают довольно широкие возможности исправления ситуации, когда нам нужно оценить риски принятия решений на основе ошибочных прогнозов. Широкие возможности возникают за счёт эластичности модели Облачных вычислений.

Стоимость аппаратных решений постоянно снижается. Однако неравномерно по типам оборудования (например, стоимость центральных процессорных устройств – ЦПУ и устройств хранения снижается быстрее, чем стоимость использования глобальной вычислительной сети – WAN). В модели Облачных Вычислений пользователь платит за фактическое использование Полезности, в модели традиционного датацентра – за использование ресурсов оборудования.

Облачные Вычисления являются своего рода буфером, для пользователей, при изменениях в стоимости оборудования, поэтому можно ожидать, что использование Облака может быть более эффективным, нежели строительство собственного дата-центра.

В процессе принятия решения необходимо тщательно оценить ожидаемый уровень средней и пиковой загрузки оборудования. Рассчитать варианты стоимости решений, которые будут использоваться при пиковой нагрузке и какова стоимость эксплуатации этих решений при низкой нагрузке. Рассчитать операционную стоимость, для аналогичных сценариев, для различных технологий Облач ных Вычислений.

Эластичность и управление рисками

Экономическая эффективность Облачных Вычислений, которая «лежит на поверхности» – это ≪конверсия капитальных затрат в операционные расходы≫ (CapEx to OpEx). Но более глубокая экономическая сущность модели Облачных вычислений выражается фразой ≪pay-as-you-go≫. По-видимому, можно предложить перевод этой фразы, как принципа потребления услуги, в следующей форме ≪плата исключительно за использование≫.

Время использования, купленное в модели Облачных Вычислений, может быть распределено неравномерно (покупка 100 серверо-часов сегодня и ноль завтра – при этом плата за сервер-час не меняется; 100Mb трафика сегодня и ноль завтра – при этом плата за использование пересылки единицы информации не меняется)1. (1 См. например: Usage based pricing: Washington Post Case Study: AmazonWebServices. Available from: http://aws.amazon.com/solutions/case-studies/washington-post/.)

И уже к этому принципу – принципу pay-as-you-go добавим ≪CapEx to OpEx≫, когда отсутствие необходимости первоначальных вложений на ИТ позволит пропорционально увеличить размеры средств, направляемые на другие нужды.

Таким образом, несмотря на то, что например, цена покупки полезности одного сервера, в течение его жизненного цикла, в модели ≪pay-as-you-go≫ может оказаться выше, чем стоимость эксплуатации аналогичного сервера в собственном датацентре, мы утверждаем, что экономические преимущества от применения модели Облачных Вычислений существенно выше, за счёт эластичности и возможности управления рисками, в особенности рисками необеспеченных пиковых загрузок и недозагрузки оборудования.

Начнём с эластичности

Ключевой фактор Облачных Вычислений – возможность добавлять или удалять ресурс небольшими «порциями». Например:

а) для низкоуровневой Облачной платформы;

б) для AWS EC2 – один сервер за час (сравните с неделями на покупку и установку нового сервера в датацентре);

в) для высокоуровневых Облачных платформ – один пользователь (плюс один гигабайт для хранения данных) за месяц (сравните с «пожизненной» схемой лицензирования коробочного ПО).

Таким образом, обеспечивается существенно более точное соответствие между нагрузкой (количеством функций за единицу времени) и ИТ-ресурсом, выделяемым для исполнения необходимого количества функций. Для традиционных датацентров утилизация серверов находится в диапазоне от 5% до 20%. Это удивительно мало. Но вполне соответствуют другому статистическому наблюдению, а именно, что пиковая нагрузка превышает среднюю в 2-5 раз.

Средняя нагрузка существенно ниже пиковой, но необходимость обработки ситуации пиковой нагрузки требует наличия соответствующих ресурсов, которые по необходимости будут простаивать в обычные часы. Чем больше разница между пиковой и средней нагрузкой, тем больше бесполезное простаивание ресурсов. Поясним на простом примере, как эластичность Облачных Вычислений позволяет уменьшить бесполезное простаивание, и, таким образом, может компенсировать потенциально большую стоимость часа аренды сервера в сравнении с часом работы собственного сервера (рис. 1).

Рис. 1. Пиковая загрузка обрабатывается. Но при отсутствии эластичности, мы имеем простаивающие ресурсы (заштриховано),во время непиковой нагрузки2

Пример 1

Предположим, наш сервис имеет вполне предсказуемую дневную нагрузку: 500 серверов для обработки пиковой нагрузки в полдень, и 100 серверов для обработки запросов в полночь (рис. 1) Средняя нагрузка, за день, составит 300 серверов. Утилизация оборудования составит 300×24=7200 серверо-часов. Однако мы должны обрабатывать пиковую нагрузку, поэтому используемые ресурсы, за которые мы должны заплатить, составят 500×24=12000 серверо-часов. Разница составит фактор 1,7.

Таким образом, если почасовая аренда сервера за три года (по принципу «pay-as-you-go») будет в 1,7 раза меньше стоимости покупки нового сервера, мы достигнем уровня экономии в модели Облачных Вычислений, в сравнении с традиционной моделью покупки сервера3. (2 Иллюстрация http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.html3 Пример расчётов смотри «Amazon.com CEO Jeff Bezos on Animoto» http://blog.animoto.com/2008/04/21/amazon-ceojeff-bezos-on-animoto/.)

Пример весьма прост, а потому не учитывает все преимущества эластичности для реальной жизни. Колебания спроса на достаточно сложные сервисы в реальной жизни могут быть как краткосрочными(как в примере) или долгосрочными (месячными, сезонными, годовыми), так и непредсказуемыми (реакция пользователей на внешние, «новостные» факторы).

Рис. 2. Пиковая загрузка не обрабатывается, случай 1. Необработанные запросы (клиенты) приводят к недополученной прибыли4 (4 Иллюстрация http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.html)

В традиционной модели приобретение и наладка сервера для обработки нового уровня загрузки занимает недели, поэтому единственный способ – это планировать ввод оборудования в эксплуатацию заранее. Даже при правильном прогнозировании и планировании, как в приведенном примере, это может привести к существенной недозагрузке оборудования в обычные часы (дни, месяцы). При неправильном прогнозировании, при недооценке загрузки, ситуация становится ещё хуже (рис. 2).

При недооценке загрузки мы попросту не обслуживаем поступающие запросы возможных клиентов нашего сервиса. В случае переоценки количества запросов пиковой загрузки, достаточно легко посчитать потери от простоя оборудования. В случае недооценки загрузки, посчитать потери несколько сложнее. Кроме эффекта недополученной прибыли от неоказания сервиса потенциальным клиентам, возникает долговременный эффект от невозврата потенциального клиента, который был неудовлетворён низким качеством сервиса (или вообще, его неоказанием).

Эта ситуация проиллюстрирована на рис. 3, когда количество запросов (клиентов) уменьшается, пока не достигнет уровня, когда мы не начнём удовлетворять запросы всех пользователей. Однако наблюдается тенденция уменьшения количества клиентов, что в долгосрочном масштабе может принести большие неприятности.

Рис. 3. Пиковая загрузка не обрабатывается, случай 2. Неудовлетворённые клиенты уходят из сервиса5

(5 Иллюстрация http://www.eecs.berkeley.edu/Pubs/TechRpts/2009/EECS-2009-28.html)

Пример 2

Используем, в качестве примера, тот же случай с компанией Animoto, который мы уже рассмотрели. Animoto запустил свой сервис в Facebook . Спрос на сервис вырос за три дня в размерах, потребовавших увеличить количество серверов с 50 до 3500. Предсказать удвоение требуемых ресурсов каждые 12 часов в течение трёх дней было практически невозможно. Через некоторое количество времени спрос упал существенно ниже уровня пиковой нагрузки.

В данном случае, вопрос эластичности – масштабируемости вверх – не лежал в сфере оптимизации стоимости использования оборудования, он лежал в области обеспечения функционирования сервиса вообще. А масштабируемость вниз позволила эффективно управлять затратами на операционную деятельность при снижении уровня спроса на некий стабильный уровень.

Качество эластичности весьма ценно не только для стартапов, но и для крупных компаний. Target, второй по величине ритейлер США, использует AWS для размещения своего сайта Target.com. 28 ноября 2008 г. (день «Чёрной пятницы») сайты других крупных ритейлеров демонстрировали крайне низкую производительность или вообще были не способны функционировать в приемлемом режиме. Сайт target.com был на 50% медленнее, но обслуживал покупателей.

Другой пример: среди клиентов SalesForce.com встречаются компании с двумя пользователями, и компании с более чем 40,000 пользователями. Однако даже и не столь драматические ситуации колебаний спроса показывают одно из ключевых преимуществ Облачных Вычислений – риск ошибочного прогноза загрузки компьютерных ресурсов переносится от провайдера ПО-как-услуга на провайдера Облака. Провайдер Облака по разному может обрабатывать ситуацию риска. Например, при продаже почасовых порций ресурсов взимать большую удельную плату, нежели при продаже крупного пакета порций, например годовых контрактов.

Расчёт экономической Эффективности

Предположим, что провайдер Облачных Вычислений использует модель оплаты pay-as-you-go (по факту-использования), когда потребитель платит пропорционально количеству времени и количеству использованных ресурсов. Вторым предположением является то обстоятельство, что величина прибыли потребителя прямо пропорциональна общему числу потреблённых человеко-часов.

Существует несколько подходов к исчислению ценовых моделей для низкоуровневых, инфраструктурных сервисов. Анализ показывает, что модель исчисления по факту использования выглядит наиболее привлекательной из-за своей простоты и прозрачности для пользователей, как это и происходит в мире материальных полезностей, таких, как газ и электричество.

В своём простом виде, расчёт общей экономической оценки эффективности выглядит следующим образом:

В левой части неравенства чистая прибыль умножается на число человеко-часов, что даёт оценку получаемой прибыли за указанное количество часов. В правой части производятся аналогичные вычисления для датацентра с фиксированной мощностью, с учётом значения средней утилизации использования оборудования в условиях пиковой и обычной загрузки. Большее значение левой или правой части неравенства соответствует возможности получения большей прибыли от использования Облачных вычислений или традиционного датацентра.

Очевидно, что если Утилизация = 1 (оборудование датацентра утилизируется на 100%), правая и левая часть неравенства выглядят идентичными. Однако теория очередей гласит, что при утилизации, стремящейся к единице, время ответа системы на запросы стремится к бесконечности. На практике, максимальная утилизация оборудования датацентра, без видимого снижения времени ответа на запросы пользовательским сервисом, составляет 0,6-0,8.

В условиях датацентра мы должны заложить этот резерв (0,4-0,2) на функционирование собственно самого датацентра. Учёт этого резерва – причина использования термина «pay-as-you-go», а не термина «аренда», в модели Облачных вычислений. Аренда включает резерв, в то время как «pay-as-yougo » – не включает. Аренда 100 мегабитного канала Интернет означает, что практическая пропускная способность составит порядка 60-80 мбит/сек. Аренда канала означает одну плату, плата за переданные мегабайты – другую.

Уравнение формализует и показывает один из основных общих элементов во всех наших примерах – возможность контролировать стоимость использования сервиса с детализацией до пользователя и до часа.

Выводы

В Примере 1 стоимость пользователя-часа, без эластичности, достаточно высока из-за высокого уровня

простоя ресурсов – и не меняется от уровня загрузки. Точно также при переоценке спроса на сервис, когда наше оборудование опять простаивает, стоимость пользователя-часа остаётся высокой.

В Примере 2, стоимость пользователя-часа увеличивается в результате недооценки спроса, что ведёт низкому уровню обслуживания, следовательно, к оттоку пользователей с сайта. В этом случае количество часов остаётся тем же, но количество пользователей уменьшается на количество ушедших, и не вернувшихся пользователей.

Эти соображения в случае нетривиальных случаев колебания спроса, и соответственно, нагрузки иллюстрируют фундаментальные ограничения предыдущей до Облачной модели покупки сервисов.


Страница обновлена: 15.07.2024 в 01:33:19