Перейти к основному контенту
Microsoft 365
Подписаться

Облачные службы, которым можно доверять: доступность Office 365

Если бы у Microsoft Office 365 был девиз, наверное, он бы звучал так: «Все, что нужно для работы, — в облаке». Мы гордимся тем, что уже миллиард человек используют Office, но хорошо понимаем, что наши решения должны не только соответствовать требованиям клиентов, но и превосходить их. Мы знаем, что без офисных приложений работа невозможна, поэтому считаем своей важнейшей задачей обеспечение надежности своих служб при расширении возможностей Office 365. Для этого мы ввели такой показатель, как доступность службы.

Доступность Office 365

После того как мы запустили Office 365 два года назад, мы вложили немалые средства в свою инфраструктуру, чтобы обеспечить высокую доступность службы.  Раньше мы предоставляли отчеты об этом своим клиентам, а сегодня мы делаем эту информацию доступной всем, кто интересуется Office 365.   Мы измеряем доступность как процентное отношение числа минут, в течение которых служба Office 365 была доступна в определенный календарный месяц, к общему количеству минут в этом месяце.  Этот показатель называется коэффициентом доступности. При расчете учитываются службы для бизнеса, государственных организаций и образовательных учреждений. Мировой коэффициент доступности Office 365 за последние четыре квартала (с июля 2012 г. по июнь 2013 г.) равнялся 99,98 %, 99,97 %, 99,94 % и 99,97 % соответственно.  Теперь мы будем ежеквартально публиковать коэффициенты доступности в центре управления безопасностью Office 365.

Вот что еще следует знать о коэффициенте доступности:

  1. Коэффициент измеряет доступность Exchange, SharePoint, Lync и веб-приложений Office с учетом количества людей, использующих каждую из этих служб. Клиенты используют эти службы вместе, поэтому все они учитываются при расчете времени доступности.
  2. Коэффициент доступности относится к Office 365 для бизнеса, образовательных и государственных учреждений. Службы, предоставляемые отдельным потребителям, не учитываются.
  3. Office 365 профессиональный плюс является неотъемлемой частью пакета служб, но не учитывается при расчете, так как по большей частью работает на устройствах пользователей.
  4. Процент доступности для отдельных клиентов может быть выше или ниже мирового коэффициента. Это зависит от того, где находится клиент и как он использует службы.

В соглашении об уровне обслуживания мы гарантируем доступность службы в течение 99,9 % времени и обязуемся возместить ущерб в случае, если доступность будет ниже.

Принципы обеспечения доступности

Мы десятилетиями разрабатывали решения корпоративного класса и запустили несколько облачных служб, например Office 365, Windows Azure, CRM Online, Outlook.com, SkyDrive, Bing, Skype и Xbox Live. Применение лучших методик, используемых в каждом из таких разнообразных решений, к другим службам позволяет нам совершенствовать как программное обеспечение, так и операционные процессы.

Вот лишь несколько примеров:

Избыточность. Избыточность на все уровнях — физическом, функциональном и уровне данных:

  • для защиты от сбоев мы обеспечиваем физическую избыточность на уровне дисков и карт серверов, на уровне серверов в центрах обработки данных и на уровне службы в центрах, расположенных в разных регионах. Кроме того, у каждого центра обработки данных есть резервное оборудование и источники питания. Каждый регион обслуживают несколько центров обработки данных.
  • Чтобы обеспечить избыточность на уровне данных, мы постоянно реплицируем их между центрами, находящимися в разных регионах. Мы обеспечиваем наличие нескольких копий данных при их передаче и хранении, а также возможности отработки отказа, обеспечивающие быстрое восстановление.
  • Кроме того, клиенты Office поддерживают избыточность на функциональном уровне, позволяя полноценно работать в автономном режиме, когда вы не подключены к сети.

Устойчивость. Активная балансировка нагрузки и постоянное тестирование восстановления в доменах сбоя:

  • мы активно балансируем нагрузку, чтобы работа конечных пользователей протекала без проблем. Эти механизмы также динамически определяют приоритеты задач, выполняя задачи с низким приоритетом в периоды низкой активности и откладывая их во время загруженных периодов.
  • Мы поддерживаем автоматическую и ручную отработку отказа для оборудования и программного обеспечения, а также отслеживание оповещений.
  • Кроме того, мы регулярно выполняем восстановление в доменах сбоя, чтобы обеспечить готовность к отработке отказа.

Распределенные службы. Функционально распределенные службы компонентов:

  • Службы компонентов в Office 365, такие как Exchange, SharePoint, Lync и Office Web Apps, функционально распределены, чтобы сбой в одной области не повлиял на другие.
  • Мы реплицируем данные каталогов по этим службам компонентов, поэтому если в одной из них возникнет проблема, это не помешает войти в другие службы и использовать их.
  • Кроме того, такая схема упрощает обслуживание, развертывание, диагностику, исправление и восстановление служб для наших специалистов.

Монитиронг. Разнообразные средства мониторинга, диагностики и восстановления:

  • наши внутренние системы мониторинга постоянно отслеживают работу служб и способны инициировать их автоматическое восстановление.
  • В случае отклонений от ожидаемого поведения нашим инженерам отправляется уведомление, что позволяет быстро принимать нужные меры.
  • Мы также постоянно осуществляем внешний мониторинг из надежных сторонних служб в разных странах (для независимой проверки соглашения об уровне обслуживания), а также из наших собственных центров обработки данных по всему миру.
  • Для диагностики мы используем различные средства ведения журналов, аудита и отслеживания. Подробное отслеживание и мониторинг позволяют выявлять причины проблем.

Упрощение. Понижение сложности обеспечивает предсказуемость:

  • мы используем стандартизированные компоненты, где только возможно. Это упрощает развертывание и выявление проблем, а также делает восстановление после сбоя предсказуемым.
  • Мы также по возможности применяем стандартизированные процессы. При этом целью является не только автоматизация, но и возможность воспроизведения важнейших процессов.
  • Компоненты программного обеспечения не требуют тесной связи друг с другом, поэтому для развертывания и поддержания работоспособности не нужна сложная оркестрация.
  • Наконец, наша система управления изменениями обеспечивает последовательную, поэтапную и инструментированную проверку служб на различных уровнях перед их развертыванием по всему миру.

Техническая поддержка живыми людьми. Круглосуточная поддержка по телефону:

  • хотя мы выполняем автоматическое восстановление, где возможно, вы также можете рассчитывать на круглосуточную поддержку профессионалами. В команду технической поддержки входят инженеры, разработчики продуктов, руководители программ и менеджеры по продуктам, а также представители высшего руководства.
  • Благодаря этому мы можем быстро отвечать на ваши вопросы и собирать информацию, необходимую для решения проблемы.
  • Кроме того, ваши звонки помогают специалистам совершенствовать автоматические системы.

Непрерывное обучение

Перерывы в обслуживании все же иногда случаются. В случае такого инцидента мы каждый раз проводим тщательную проверку, даже если он повлиял на работу незначительно. Проверка включает анализ того, что произошло, как мы на это отреагировали и как предотвратить подобные инциденты в будущем. Для прозрачности и подотчетности мы предоставляем результаты таких проверок для всех существенных инцидентов организациям, которых они коснулись. Кроме того, мы используем предварительные версии служб для своей повседневной работы, чтобы первыми узнавать о проблемах. Постоянное совершенствование — ключевой компонент для предоставления службы мирового класса с высочайшей доступностью.

Непротиворечивая информация

Для обеспечения прозрачности важна непротиворечивая и полная информация, особенно если вы используете веб-службы для ведения бизнеса. Мы предоставляем клиентам сведения через несколько каналов, включая электронную почту, веб-каналы RSS и панель мониторинга работоспособности служб. Клиенты Office 365 получают подробные сведения о доступности служб, необходимых для их организации. Узнать текущее состояние служб и лицензий можно на панели мониторинга работоспособности служб Office 365. Среди последних функций, которые появились в ней, — отслеживание времени установки обновлений, которое позволяет получать актуальные сведения о работоспособности служб.

Мы также предлагаем несколько новых способов получения информации о службе.  На прошлой неделе в Центре администрирования появился так называемый Центр сообщений, где выводятся новости о службах, отчеты по клиентам и инструкции для администраторов.  Кроме того, к концу этого года будет выпущено мобильное приложение, предоставляющее сведения о работоспособности службы и другую информацию о ней.

Поддержка комплексной и постоянно развивающейся службы с растущим количеством клиентов — сложная задача, и, несмотря на наши усилия, сбои неизбежны. Хотелось бы уверить вас, что мы постоянно развиваемся и делаем все для того, чтобы предоставлять вам высокодоступные службы, отвечающие вашим требованиям.  Непрерывная работа служб — это не просто принцип их предоставления. Это обязательство, которое мы даем своим клиентам в соглашении об уровне обслуживания, и одна из ключевых задач центра управления безопасностью Office 365 (наряду с обеспечением конфиденциальности, безопасности, соответствия требованиям и прозрачности). Это публичное уведомление о времени доступности Office 365 является свидетельством того, как для нас важны непрерывная работа служб и прозрачность.