Ежики на колесах: как мы поддерживаем качество связи в Москве. Мегафон хабрахабр


О карте МегаФона — технические подробности / Блог компании «МегаФон» / Хабр

В предыдущих постах мы уже обсуждали банковскую карту МегаФона как финансовый продукт и рассказывали о ее возможностях для конечного потребителя. Но, безусловно, за таким проектом стоит огромная работа, которую проделала команда профессионалов. В этот раз мы подробнее расскажем именно о технических особенностях реализации этого проекта и об устройстве программного обеспечения.

Учитывая масштаб проекта, описать все тонкости в рамках одного поста не получится, поэтому начнем мы с рассказа о бэкенде системы ДБО (дистанционного банковского обслуживания). Задача бэкенда — обеспечить рабочую связку всех специализированных систем в рамках единой логики, а также функционирование множества фоновых процессов. А самое главное — удобный и функциональный личный кабинет для пользователей. Техническим партнером проекта карты Мегафон выбрал компанию TYME. Все время работы специалисты двух компаний работали в тесной связке с поставщиками банковского ПО, биллинга, платежными системами и другими поставщиками, собирая разрозненные функциональные кусочки мозаики будущего проекта в единое целое.

«У нас были сжатые сроки и большой объем работы. Не было лишних дней на долгие обсуждения и права на ошибку при выборе технологии и подходов. Здорово, что нам вместе с компанией TYME удалось реализовать сложный и инновационный проект.» Ян Кухальский, Генеральный директор МегаЛабс В 2013 стартовал проект «Терминалы», и с этого времени мы постоянно совершенствовали решение, интегрируя его со своими сервисами и новыми провайдерами услуг и добавляя новые функции для клиентов.

У TYME довольно большой опыт работы в финтех-отрасли, они успешно преодолели все трудности и мы вместе с технологическими партнёрами успешно запустили карту МегаФона. Далее на страницах блога МегаФона даём слово команде TYME, пусть ребята сами расскажут о деталях своей части проекта.

Детали большого проекта

После реализации каждого масштабного проекта мы оглядываемся назад, чтобы оценить проделанную работу. В весьма сжатые сроки нам удалось запустить крайне сложную систему, которая находится в самом сердце финансового продукта федерального масштаба.

Немного цифр для примера:

  • 18 внешних систем для интеграции
  • 600 бизнес-процессов были реализованы в рамка проекта
  • 770 страниц технической документации
  • 2500 сценариев для автотестов
  • 15000 человеко-часов разработки
Оценить истинный объем задач можно только тогда, когда разработка по проекту заканчивается. Объем задач в ходе работы постоянно увеличивался. Если смотреть на это сейчас, то становится даже немного страшно — как мы в принципе могли подписаться на такой объем в такие сроки.

Ноябрь 2015-го. Проект — на стадии концепции. В переводе на человеческий — у нас есть лишь четко оговоренная дата запуска и приблизительное ТЗ от бизнеса.

Отсекаем мрамор

Возможность изучить заказчика и не доставать его постоянными вопросами у нас появилась благодаря правильно выстроенным отношениям и нескольким годам совместной работы.

Вот некоторые принципы, следование которым нам очень помогло:

  • Работать, исходя из текущего состояния требований. Нужно искать конкретные задачи, за которые уже можно взяться прямо сейчас, вместо того, чтобы заниматься скрупулезной детализацией.
  • Применять декомпозицию. Нужно распределять работы и вести проектирование и разработку независимо.
  • Использовать готовые источники. Одна из наших задач – интеграция с уже готовыми системами, которые на момент начала работ уже были частично запущены. Это прозвучит банально, но то, что позволило нам упростить интеграцию — это вдумчивое изучение документации по функционирующим системам и совместная фиксация принципов работы на ранних этапах проекта.
  • Выполнять лидирующую роль в управлении. Залог успех проекта — это инициатива разработчика в процессе формализации требований. То есть работать надо всегда на опережение, искать возможность продвинуться вперед по другим частям плана, если какие-то другие провисают.
Само собой, при таком подходе неизбежно возникает риск для разработчика — ведь ресурсы на аналитику приходится тратить весьма существенные, и по собственной инициативе. Подходит этот путь в тех проектах, в которых вы полностью уверены в своих взаимоотношениях с заказчиком, и если вы хорошо ориентируетесь в самой отрасли.

Agile и долгосрочное планирование

О достоинствах Agile-методологии сказано уже много. Не будем повторяться и сконцентрируемся на тех моментах, которые обычно заказчику тяжелее всего принять.
  • Нет жестких сроков окончания большого проекта
  • Затраты на большой проект могут вырасти при его проработке
  • Непредсказуемые границы проекта, то есть скоуп работ всегда будет относительным, а  попытка его финализировать лишь приведет к сильно отложенному старту.
Так как мы работали по SCRUM, то проблема была стандартной – заказчику нужен был «водопадный» план проекта на ближайший год. А детализация проекта была готова только на несколько ближайших спринтов, за которые команда взяла на себя обязательства выполнить описанные задачи.

Часто можно увидеть следующую рекомендацию: если вы хотите получить долгосрочный план, работая по Agile, заведите в Project каждый спринт или итерацию как задачу. В результате на выходе будет примерно следующая картина:

Рекомендация настолько общая, что у нас не прижилась. Этот вариант плана не показывает вехи продукта, значимые для заказчика, и не может быть полноценно использован для обсуждения долгосрочного графика проекта.

Серебряную пулю в 1986-м придумал Барри Боэм, американский военный. Его идея — спиральная модель разработки. Многие айтишники уже знают, что это, но на практике все равно очень часто наблюдаются крайности — или Agile без долговременных планов, или водопад со сроками и бюджетами, которые постоянно изменяются.

Артемий Лебедев в «Ководстве» неплохо высказался на этот счет.

Благодаря спиральной модели мы решили две задачи сразу:

  • поддерживали актуальный долгосрочный план, понятный заказчику
  • выдавали в разработку задачи итеративно, не превращая при этом SCRUM в водопад.
Проектная же работа строилась так:
  • Итеративная детализация требований. Документ, который описывал требования по каждому из модулей системы, имел свою внутреннюю структуру, когда составляющие ее компоненты могут находиться в разной степени готовности. На каждой из итераций детализация требований увеличивалась, давая возможность взять в разработку очередной объем задач.
  • Эволюция рабочих продуктов. На каждой итерации разработки мы пересматривали весь стек рабочих продуктов на полную глубину в соответствии с новыми реалиями требований и фидбеком на прототипы. Это заставляло нас иногда переделывать архитектуру продукта.  К примеру, на старте проекта планировалось, что все процессы будут обеспечиваться в рамках 40 микросервисов, и в ходе детализации архитектуры их количество было сокращено до 20.Так эволюционировали представления о том, каким образом необходимо декомпозировать бизнес-логику по сервисам. В итоге это дало очень большое преимущество — мы постоянно имели возможность получать фидбек о текущей реализации архитектуры, и практически не накапливали технический долг.
  • Регулярное перестроение плана. Долгосрочный план проекта также был «живым», исходя из актуальных требований, информации о графике разработки внешних систем и других вводных. Мы не относились к плану как к константе, закрепленной на старте проекта, для нас это был «маршрут», который должен привести из той точки, где мы находимся, к итоговой цели. Соответственно, если ситуация вокруг меняется (а происходит это регулярно),  уточняется и план.
  • Ориентированность на ранний результат. Мы постоянно работали над тем, чтобы максимально рано взять задачу в разработку, и как можно быстрее выдать результат для приемки и тестирования. При этом мы старались разбивать зависимости, мешавшие нам это сделать — если не готов внешний сервис, мы не ждем его реализации, а пишем «заглушку»; если существует неопределенность по какой-то части задачи, стараемся декомпозировать ее еще сильнее и выполнить работы по тем составляющим, где определенность есть. Часто команды разработки не идут на подобные затраты, опасаясь сделать лишнюю работу, и зачастую эти опасения обоснованы. В этот раз мы сделали ставку на скорость.
  • Разработка по SCRUM. Мы прикладывали максимальные усилия для того, чтобы изолировать разработчиков от неопределенностей в проекте, не нарушая привычный ритм SCRUM. Управление проектом было построено таким образом, что в каждый момент времени был «буфер» понятных команде задач как минимум на один спринт вперед. Это позволило не терять темп на протяжении всего периода активной разработки.
В итоге мы пришли к такому маппингу задач между планом в MS Project для заказчика и Jira для команды разработки

За само управление потоком работ отвечала Jira (но это мог бы быть любой удобный для Agile продукт), а план в MS Project был нужен для контроля глобального статуса работ и его визуализации для заказчика.

Макроэффект от микросервисов

Проект превратился в кучу подпроектов, которые были весьма связаны между собой. Так как мы еще вначале выбрали подход, обеспечивающий такое дробление — мы могли это себе позволить.

Тренд микросервисов существует в мире разработки уже довольно давно. Огромное количество обсуждений на эту тему происходят на профильных конференциях. Кто-то принципиально отрицает пользу от такого построения систем, есть и те кто занял прямо противоположную позицию и переводит все свои сложные системы на микросервисную архитектуру.

Микросервисная архитектура — это подход к разработке, при котором вместо создания одного большого приложения, может быть, разделенного на слои (GUI, Бизнес-логика, БД), создается множество небольших, изолированных друг от друга компонент, которые называются микросервисами. Не вдаваясь в теоретические детали, которые можно достаточно легко найти на Хабре, хотелось бы остановиться на том, как оказался данный подход полезен в нашем проекте.

Вот главные плюсы такого подхода (на наш взгляд):

  1. Каждый сервис решает конкретный набор задач, у него определен API, по которому можно обращаться к сервису. Мы отлично изолируем ответственность внутри одного сервиса.
  2. Один микросервис, при желании, можно легко заменить новой версией или быстро провести безопасный рефакторинг.
  3. Горизонтальное масштабирование микросервиса при наличии сложностей с быстродействием. Это killer-feature для систем, которые должны работать в режиме 24*7. Масштабирование всегда идет вместе с мониторингом быстродействия каждого сервиса, мы собираем эту статистику и  принимаем решение о запуске дополнительных инстансов.
  4. Особенности корпоративных сетей таковы, что по ИБ мы обязаны работать в закрытом контуре, но при этом часть нашей платформы имеет доступ в интернет, другие сервисы изолированы и работают с десятком внешних систем в рамках отдельных подсетей. Мы выделили сегменты, которые работают в публичном интернете, внутренние сервисы и интеграционные сервисы, которые находятся в специальной зоне с максимально закрытым доступом. В случае монолита, пришлось бы совмещать на одном сервере несколько сетей, что не всегда  нравится сотрудникам обеспечивающим ИБ.
Само собой, не удалось избежать и некоторых сложностей:
  1. Самое сложное решение — о границах микросервиса. Нужно ответить безошибочно на вопрос — какой из существующих микросервисов должен выполнять эту задачу? На старте нам приходилось дублировать некоторые решения в нескольких микросервисах, чтобы сохранить их изолированность. Да, для разработчика это немного непривычная ситуация, так как переиспользование кода — основная задача.
  2. Кардинально иной подход к обновлению нашего приложения. Без автоматизации этого процесса для администратора усложняется многократно, так как ему пришлось бы в окно обслуживания выполнить в несколько раз большее количество операций, чтобы доставить обновление в промышленную среду.
Разделение системы на набор микросервисов + небольшая команда + разработка по SCRUM: вот рецепт, который помог нам снизить уровень зависимостей и максимально эффективно использовать все наши возможности и компетенции, вести разработку одновременно по нескольким направлениям одновременно, минимизируя влияние каждого сервиса на остальные части системы.

Быть в центре событий

Наша система не только обеспечивает бизнес-логику представления данных банка для клиента, это еще и интеграционная шина, объединяющая front-end и все участвующие внешние системы.

Когда отказывает наш бэкенд  - это автоматически означает, что пользователь видит сбой. Когда отказывает любая другая система — у нас есть возможность смягчить проблему и сохранить работоспособность большей части функций.

Это значит, что наша система должна обладать эксплуатационными характеристиками, превышающими эти показатели любой смежной с нами платформы:

  • Лучший uptime
  • Самый большой запас по производительности
  • Лучшая устойчивость по отношению к отказам и сбоям
Мы изначально понимали, что наша система станет главным узлом, с которого будет начинаться диагностика инцидентов, и мы должны обладать исчерпывающей информацией для любых технических расследований.

Эти вводные данные предопределили дополнительные условия для разработки:

  • Быстрая доставка обновлений
  • Максимальное качество работы каждого сервиса
  • Исчерпывающее сквозное лигирование

Обновить за 90 секунд

Когда работаешь с платформой, построенной на микросервисах, важно понимать:
  • Обновление нужно максимально автоматизировать. Пора забыть про ручное обновление и максимально устранить человеческий фактор.
  • Огромный плюс микросервисов — децентрализованность. Мы сразу запланировали, что наши системы не должны иметь единой точки сбоя, чтобы обеспечить максимальный аптайм.
При этом мы не могли позволить себе вводить какие-то технологические окна на обновления — любые, даже небольшие простои системы в нашем случае крайне нежелательны.

Объединив усилия службы эксплуатации и разработчиков, мы получили решение, которое обладает всеми нужными свойствами:

  • Быстрое обновление, которое не требует «ручного» вмешательства разработчиков или администраторов. Мы настроили авто-deploy, который обеспечил выкатывание «одной кнопкой» с учетом всей нашей специфики. Подготовка сборки происходит на ресурсах поставщика, а фактическое развертывание – в защищенном контуре заказчика.
  • Во время обновления сервис не останавливается. Так как каждый сервис развернут и работает минимум на двух параллельных серверах, во время обновления мы отключаем от траффика группу обновляемых в текущий момент серверов и распределяем нагрузку по другим экземплярам микросервисов. После обновления — проверяем smoke-тестом работу новой версии сервиса и, если все прошло успешно, обновляем следующую группу сервисов, переводя трафик на уже обновленные сервисы. Так, постепенно поднимая версии, мы получаем работающую систему, без полной остановки платформы.
  • Непрерывный контроль деградации функционала. Благодаря покрытию автотестами всех процедур, нам удалось обеспечить возможность очень быстро диагностировать отклонения перед деплоем на бой и осознанно принять решение о проведении обновления.
  • Быстрая доставка функционала на бой. Благодаря всем ранее изложенным моментам, мы можем очень быстро выкатывать в промышленную эксплуатацию исправления и новый функционал без ущерба для непрерывности работы.
Есть ряд моментов, которые можно улучшить в процедуре обновления — например, обновление БД каждого из сервисов и обеспечение обратной совместимости для работы старой и новой версий сервиса одновременно.

Если это будет интересно, мы с удовольствием выпустим отдельную статью о тех подходах, которые мы применяем у себя.

Философия качества

Сервис, который не должен останавливаться, и при этом динамично развивается, всегда находится между двух огней. В случае простоя финансовые и репутационные потери будут колоссальными. А если вспомнить про чрезвычайно сжатые сроки и меняющиеся требования в процессе разработки, то степень сложности продолжала повышаться. Поэтому перед отделом качества встала амбициозная задача выстроить тестирование продукта таким образом, чтобы оно было:
  • Быстрым. У нас сжатые сроки, короткие спринты и мы не хотим ждать по нескольку дней, пока тестеры проведут регрессионное тестирование по чек-листам. В идеале – нужно получать ответ, какой регресс понесла система после каждого изменения кода.
  • Полным. Быстрое осуществление тестов – не самоцель. Настоящая цель – быть уверенными, что если тесты прошли успешно, то наша система готова к обновлению. А значит тесты должны быть не только быстрыми, но и полностью охватывать функционал продукта.
  • Гибким. Быстрые и полные тесты это прекрасно. Но если у заказчика есть новые требования, и изменения требуют полного переписывания тестов – это никуда не годится, потому что мы опять теряем скорость. Соответственно, тесты должны быть гибкими к изменениям.
  • Дешевым. Ресурс тестировщика при большой скорости разработки всегда будет выходить на первый план, если нам нужно получить высокое качество. Поэтому всё, что описано выше, должно выполняться существующим количеством специалистов по тестированию. Мы здесь лишь подтвердили общее соотношение, когда на 3 разработчиков приходится 1 тестировщик.
В качестве основы автотестов был выбран Python вкупе с фреймворком py.test. Python — это быстрый (в плане разработки) и мощный язык, а py.test с его замечательной подсистемой фикстур и параметризации – гибкий инструмент, позволяющий широко переиспользовать код тестов.

В качестве агрегатора результатов: билд-сервер TeamCity с установленными плагинами для интерпретации итогов проверки от py.test.

Сами тесты пишутся максимально изолированно, выполнение каждого теста никак не зависит от результата выполнения остальных тестов. Если тесту нужно подключаться к БД системы и получать данные, значит, фикстура теста должна эти данные там обеспечить до выполнения теста. Если на тест может повлиять значение, лежащее в кэше, значит другая фикстура должна обнулить кэш до выполнения этого теста. Да, это привело к тому, что много времени потребовалось для разработки систематизированной сетки фикстур, но очень быстро эти инвестиции стали окупаться скоростью добавления новых тестов и, самое главное, стабильностью их результатов. Полный контроль над тестируемой системой означает минимум ложных срабатываний тестов.

Интеграция с  сервером сборки TeamCity дала возможность просто нажать одну кнопку, чтобы тесты проверили все процессы платформы. При этом никаких приготовлений делать не нужно, а значит, это может сделать любой член команды. Отчет о тестировании в подробном и наглядном виде отображается на веб-интерфейсе build-сервера.

Не пожалели мы и о полном отказе от автоматизации тестов API через специализированные решения. Да, такие инструменты дают набор функциональности прямо из коробки. Но, во-первых, это недешево, во-вторых, нам всё равно нужно больше возможностей.

К примеру, в определенных тест-кейсах нашего API было нужно получать СМС-код подтверждения на операцию, пробрасывать его в тесты и наблюдать за поведением системы. Вот здесь и выходит на первый план мощь coded тестов, пусть их разрабатывать и дороже, чем, к примеру, собрать  test-step’ы в SoapUI.

В итоге, сейчас процесс построен таким образом, что Postman или тот же SoapUI используется тестировщиками только на этапе первичной проверки. В конечном итоге процесс всё равно должен быть покрыт автотестами на Python и внедрен в общий репозиторий. Это закон.

Ни одно изменение функционала системы не обходится у нас без тестирования вообще и без автотестов в частности. Story просто не считается выполненной, пока она не покрыта автотестами. Такой подход требует высокой самодисциплины от команды и производительности от тестировщиков, но результат того стоит: если на билд-машине тесты зеленые, мы уверены в качестве своей системы.

Сейчас количество функциональных тестов перевалило за 2500 и продолжает расти. Выполнение занимает 25 минут.

Правильный выбор инструментов и полное покрытие автотестами с ранних этапов разработки позволило нам поддерживать высокую скорость внедрения новых функций на всем протяжении проекта, оставаться гибкими к изменениям требований, и при этом не жертвовать качеством продукта.

One more thing

Документация — это аспект ИТ-проектов, который часто остается в тени историй про архитектуру, проектирование и общение с заказчиком. Но это очень важная деталь, невнимание к которой может усложнить эксплуатацию и развитие даже самой замечательной, с точки зрения внутренней организации, системы.

Нами был выбран подход, при котором документация эволюционирует по ходу прохождения цикла разработки:

  • Начальные требования от заказчика сразу же образуют первые страницы будущей документации
  • На этапе проектирования она дополняется техническим описанием планируемого варианта реализации
  • Во время оценки и планирования она дополняется ответами на вопрос разработчиков, если они не были учтены во время проектирования
  • После того как требования попадают в разработку, они декомпозируются по задачам, каждая задача получает ссылку на раздел документации, в соответствии с которой она должна делаться
  • При приемочном тестировании реализованной функции проверяется не только её правильная работа, но и актуальность документации — часто при реализации делаются уточнения и «всплывают» моменты, которые не были очевидны при проектировании, все несоответствия возвращаются аналитику в работу
  • По завершении приемки и тестирования разработанная функция имеет набор тестов и итоговую проверенную документацию.
Подобный подход дал сразу несколько преимуществ:
  • Работа над документацией оказалась распределена по процессу разработки, мы избежали ситуации, когда по завершении нужно выделить большой ресурс на документирование
  • Документация по каждому модулю правилась в тот момент, когда все участники максимально погружены в тему, и это позволило сделать ее максимально точной и не тратить время на попытки вспомнить «а как же оно сделано», которые неизбежны, если бы мы вынесли этот этап за рамки разработки
  • В случае каких-то споров и сомнений у нас всегда есть возможность провести трассировку, включающую исходные требования, задачи на разработку и документацию
Самое главное — мы в любое время можем предоставить заказчику документацию как по текущей версии платформы, так и по планируемым изменениям, чтобы обеспечить готовность с их стороны к обновлениям.

Благодаря паре дней, которые ушли на общую редактуру и настройку выгрузки из Confluence, выгрузка итогового документа сейчас может быть выполнена в течение часа по всем компонентам системы.

Вместо заключения

Мы постарались описать общий принцип работы двух компаний и раскрыть внутреннюю кухню разработки.

Было бы здорово услышать от вас сложные вопросы, которые бы мы могли использовать как основу для новых статей!

Спасибо ребятам за такой подробный рассказ! Это только первая часть технической составляющей карты Мегафона, будут ещё истории. Оставайтесь на связи.

Смежные темы

Ссылки

habrahabr.ru

как мы поддерживаем качество связи в Москве / Блог компании «МегаФон» / Хабр

Весной-летом 2017 года Роскомнадзор протестировал мобильных операторов и опубликовал результаты на качествосвязи.рф. В итоге по успешным голосовым соединениям и скорости мобильного интернета лучшим оказался МегаФон. При этом тестирование интернета проводилось терминалами Cat.4 (до 150 Мбит/с), а в начале августа мы первыми в России запустили Gigabit LTE (до 1 Гбит/с). Так что при тестировании устройствами Cat.6 и быстрее разрыв с конкурентами мог бы быть еще больше. В этом посте мы расскажем, как добиваемся таких результатов.

Хорошие показатели МегаФона — результат комплексной работы всех подразделений технического блока. Свой вклад вносят инженеры, отвечающие за строительство, планирование и оптимизацию сети, системы эксплуатации, мониторинга аварийности и контроля качества работы сети.

Основа грамотной системы эксплуатации и контроля качества — это мониторинг сети. Первый центр управления и мониторинга (ЦУМ) сети МегаФон был развернут в 2006 году на Вятской улице в Москве.

В мае 2015 года МегаФон, следуя мировым трендам, вывел мониторинг в единый центр управления сетью (ЕЦУС, он же GNOC — Global Network Operational Center), расположенный на двух площадках — в Самаре и Петербурге. Преимущество двух площадок в том, что при возникновении каких-то проблем в одном из ЦУС второй может оперативно подхватить его задачи.

Инженеры центра круглосуточно мониторят сетевые элементы всех подсистем и при необходимости инициируют оперативное устранение проблем, задействуя нужные профильные подразделения. К примеру, если выходит из строя базовая станция (БС), инженеры ЕЦУС оповещают об этом локальную команду инженеров, которые выезжают на БС и устраняют проблему. Про ЕЦУС и его особенности можно рассказывать интересно и много — это предмет для отдельного поста. Здесь мы сосредоточимся на описании принципов и подходов работы с качеством сети МегаФон.

«Вкалывают роботы, а не человек», или автоматическая система Self-Optimization Network (SON)

Для мониторинга бесчисленных элементов и параметров современной мобильной сети мы используем систему SON (Self-Optimization Network). В режиме 24/7 она автоматически собирает параметры оборудования, использует сетевую статистику и трейсы, поступающие от каждого элемента сети. На основе этих данных SON выполняет три основные функции:
  1. Оперативно реагирует на происходящие в сети изменения, например, на резкие всплески нагрузки. К примеру, если на БС внезапно возрастает количество абонентов, SON может изменить параметры соты либо углы наклона антенн, чтобы оптимизировать зону покрытия этой БС, перераспределив тем самым нагрузку на соседние БС.
  2. Поддерживает корректность настроек и взаимосвязей между БС. SON постоянно сверяет настройки сети, а также оптимизирует соседства (взаимосвязи) между БС. Это необходимо чтобы абоненты могли делать «хендовер» — без прерывания сервиса переходить между сотами на одной БС или соседними БС. SON добавляет потенциально полезные (по своей оценке) соседства, проверяет, как работают существующие и удаляет неиспользуемые.
  3. Автоматизирует рутинные задачи оптимизации сети. Поскольку мобильные сети сейчас имеют очень сложную структуру – три технологии (2G/3G/4G) на одной БС с несколькими диапазонами в каждой технологии (LTE-800/1800/2600 и т.д) – количество соседств только на одной БС составляет около тысячи. Чтобы охватить этот объем, не хватит штата инженеров ни одной компании. SON снимает эту нагрузку с инженеров, которым остается только контролировать работу системы. Таким образом человеческих ресурсы освобождаются для более сложных и творческих задач, например, внедрения новых технологий.
В среднем, система выполняет от 200 до 400 тысяч корректирующих операций в день. По нашим оценкам, это снижает нагрузку на инженеров на 40-60%. Система SON имеет модульную структуру, в которой каждый модуль отвечает за выполнение определенного набора функций. Примеры базовых модулей:
  • ANR (Automatic Neighbour Relations) – отвечает за правильную работу «хендовера». ANR анализирует статистику работы сети, добавляет новые либо изменяет существующие «соседства» между БС на наиболее оптимальные в каждой конкретной ситуации, поддерживает корректность их настроек
  • SH (Self-Healing) – вступает в работу в случае аварийных ситуаций в сети. Например, если вышла из строя БС, модуль распознает проблему и закрывает «дырку» в покрытии, расширяя зону покрытия соседних БС за счет изменения электронных углов наклона антенн или увеличения их мощности.
  • DLB (Dinamic Load Balancing) – реагирует на всплески нагрузки сети, перераспределяя ее между соседними базовыми станциями, оптимизируя зону покрытия с помощью изменения параметров соты или углов наклона ее антенн.
Чтобы механизмы SON работали эффективно, их логику необходимо регулярно адаптировать под изменчивые условия работы сети. В МегаФоне поддержкой данного направления занимается специальная команда инженеров. Их задача — постоянно расширять функциональные возможности SON за счет разработки и ввода в действие новых модулей и автоматических алгоритмов управления софтверными параметрами радиоподсистемы.

Отдел технического контроля

Возможности SON не безграничны, и в сложных ситуациях для устранения проблем требуется вмешательство человека. Для этого в МегаФоне существует отдел технического контроля (ОТК), который подключается, когда ЕЦУС не может определить причину деградации качества на оборудовании. Сюда стекается вся статистика, накапливаемая по работе сети. Используя широкий набор сетевых KPI собственной разработки и накопленный опыт, мы выявляем закономерности в ухудшениях на различных узлах, находим их причину и устраняем проблему.

В этом нам помогает ряд инструментов:

  1. Дэшборды по различным подсистемам с кастомизированными KPI.
  2. Абонентские трассировки. По ним можно детально проанализировать сигнальный обмен телефона с сетью и выявить причину проблемы абонента.
  3. Измерения штатных и crowd-source систем.
  4. Бенчмаркинг для сравнения с другими операторами — сервисы Speedtеst для скорости передачи данных и Vigo для качества видео.
  5. Система SQM, позволяющая использовать новейший подход к Е2Е анализу — не только на базе несетевых метрик, а на уровне конкретного сервиса целиком. Предположим, Вас устраивает общее качество сети, но плохо работает конкретно приложение Facebook. В этом случае система позволит детально посмотреть, на каком этапе возникают проблемы.
Останавливаться на дэшбордах и абонентских трассировках мы не будем, так как в том или ином виде это давно есть практически у каждого оператора сотовой связи. Различия проявляются только в нюансах анализа и отработки проблем. А вот об остальном расскажем подробнее.

Crowd-source данные: приложение «Моя сеть»

Приложение «Моя сеть», разработанное компанией Metricell и кастомизированное специально для МегаФона, позволяет собирать информацию о качестве связи у абонента и передавать ее техническим специалистам МегаФона для анализа. Приложение доступно для всех в Play Market.  «Моя сеть» может работать в двух режимах – в пассивном и активном.

В пассивном режиме основная информация о покрытии сети (уровень сигнала, качество соединения и т.п.) и сбоях автоматически собирается и отправляется на сервера МегаФон. Там она аккумулируется и в дальнейшем используется во многих активностях: от планирования сети до маркетинговых акций. В активном режиме пользователь самостоятельно проверяет качество связи и в случае проблем через простую форму сообщает о них.

«Моя сеть» помогает выявить проблемы с сетью в сложных городских застройках или сельской местности, куда не добрались инженеры с переносными измерительными комплексами и не доехали автомобильные системы для радиоизмерений.

Полевые радиоизмерения

В одной популярной песне есть такие слова: «Потому что на десять девчонок по статистике девять ребят». В ней приводится информация о численном соотношении, но ничего не говорится о том, какие это девчонки и ребята, сколько им лет и где они проживают. Так и в мониторинге: «большие данные» сетевой статистики могут дать много пищи для размышлений, но за глобальными трендами можно легко пропустить частные проблемы. Большинство инструментов контроля качества опираются на сетевую статистику, которая, по сути, является огромным массивом информации по состоянию сети и работе сервисов. Как любая Big Data, сетевая статистика хорошо показывает тренды и не всегда позволяет выявить частные случаи проблем на сети. Кроме того, если в какой-то зоне совсем нет покрытия мобильной сети, в сетевой статистике также не будет информации об этой проблеме.

В таких случаях для выявления и устранения проблем, а также для реальных замеров сети мы используем полевые радиоизмерения: локальные драйв-тесты с участием инженера и контрольные автоматические с помощью машины с измерительным оборудованием.

Локальные измерения проводятся для конкретных мест, часто на основании жалобы абонента или же когда невозможно использовать автоматические комплексы (проехать на машине). Например, в закрытых дворах, торговых центрах, метро и т.п. А также для тестирования новых сервисов и технологий, их обкатки вживую.

Носимый измерительный комплекс помещается в обычном рюкзаке. Он состоит из сканирующего приемника, нескольких измерительных смартфонов, установленных на специальном шасси, и управляющего устройства. С помощью сканирующего приемника инженер оценивает покрытие сотовой сети, а также просматривает эфир на всех рабочих частотах в конкретном месте. Так, например, можно засечь слабый сигнал от удаленной базовой станции, создающей помеху, или оценить покрытие всех четырех операторов в этой зоне.

Специальная прошивка измерительных смартфонов позволяет управлять их функциями на самом глубоком уровне, вплоть до подключения только к определенному диапазону или базовой станции. В максимальном варианте допускается установка до 8 смартфонов, но, как правило, используется 4-5 устройств – по числу основных тестов. С помощью смартфонов инженер оценивает качество голосовых вызовов (в том числе так называемый MOS (Mean Opinion Score) или, по-простому, разборчивость речи), скорость передачи данных, качество просмотра видео, работу мессенджеров и другие параметры стандартных сервисов.

Полное управление смартфонами осуществляется по Bluetooth, не нужно каждый раз лезть в рюкзак. В качестве контроллера может быть использован смартфон, планшет или ноутбук. Через него инженер запускает прогон того или иного теста на одном или всех смартфонах одновременно, однократно или в циклическом режиме.

Логи всех тестов записываются в память смартфонов для последующего анализа в офисе. При необходимости тесты можно провести и через само управляющее устройство. В процессе радиоизмерений инженер может сам оценить выявленную проблему и попытаться в режиме онлайн устранить ее совместно со специалистами, находящимися в офисе.

Для масштабных контрольных измерений мы используем не инженеров с рюкзаками, а специальные автоматические радиоизмерительные комплексы, установленные на автомобилях.

Водитель такого автомобиля не принимает участия в управлении измерительными комплексами, а отвечает за перемещение по заданному маршруту. Впрочем, наши нынешние водители настолько опытны, что могут при необходимости и сами провернуть простые операции вроде проверки состояния комплекса или перезагрузки системы.

Наличие «ежика» на крыше автомобиля обусловлено большим количеством диапазонов, задействованных в сотовой сети МегаФона.

Как только поворачивается ключ в замке зажигания, комплекс запускается в работу. Он представляет собой стойку с 3-4 блоками, каждый из которых состоит из 4 устройств, эмулирующих смартфоны. Как и при ручном тестировании, количество устройств определяется числом проводимых тестов. На блоках имеются разъемы для подключения внешних антенн.

Все управление комплексом осуществляется удаленно. Инженер прямо из офиса может задать алгоритм его работы или поменять конфигурацию. По своим возможностям такой комплекс мало отличаются от варианта в рюкзаке, однако обладает повышенной надежностью, что позволяет выполнять тестирование хоть круглые сутки, собирая огромный объем данных. Здесь мы также можем проводить измерения покрытия сети, осуществлять голосовые вызовы и тестировать мобильные сервисы передачи данных. Все результаты измерений накапливаются в логи и в режиме онлайн передаются в офис по каналам сотовой связи.

С помощью контрольных радиоизмерений мы регулярно оцениваем и сети других сотовых операторов, сравнивая с нашей. А еще собираем и анализируем специфические настройки, используемые на их оборудовании. Такие бенчмарки позволяют оценить свое качество на фоне других операторов и перенять что-то полезное у конкурентов.

Система SQM (System Quality Management) для контроля качества сети

Развернутая в МегаФоне новейшая система SQM содержит несколько модулей:
  • Модуль, используемый на первой линии траблшутинга. Он показывает агрегированную статистику по абоненту и проблемы, которые он испытывал.
  • Модуль контроля качества сети на массовых мероприятиях, при скоплениях пользователей.
Ни одно массовое мероприятие в Москве и области не проходит незамеченным для МегаФона. В соответствии с территорией проведения каждого мероприятия в системе создается локация (группировка сот, обслуживающих мероприятие).

В соответствии с локацией система каждые пять минут выдает инженерам характеристики качества работы сети на мероприятии, влияющие на клиентский опыт. В случае резкого изменения показателей мы тут же локализуем проблемные элементы сети и привлекаем профильные подразделения для оперативного устранения. Этот подход широко использовался во время проведения Кубка Конфедераций.

На массовых мероприятиях инженеры ОТК МегаФона применяют и нестандартные решения. Например, за концертом группы Ленинград сотрудники наблюдали через открытые публичные трансляции в Periscope и Instagram. Это позволяет в режиме онлайн определять качество конечного сервиса в конкретных точках на территории мероприятий и оперативно принимать меры в случае ухудшений.

  • Модуль мониторинга и контроля качества по всей сети

Москва и Московская область разбиты на 470 кластеров, по которым осуществляется мониторинг KQI (Key Quality Indicator). При резких ухудшениях качества без видимых аварий на оборудовании настроена автоматическая генерация алармов. Чтобы ничего не пропустить. В случае проблемы список сот с деградацией конкретных KPI и основной ClearCode (причину проблемы) система выдает за 5 минут.

  • Модуль анализа проблемных терминалов, некорректно работающих в сети. Благодаря ему специалисты видят, какие модели телефонов используются наиболее активно.

И могут оценить качество их работы.

МегаФон активно использует эти метрики, ведь клиент оценивает качество сети, исходя не только из объективных показателей, но также из показателей работы конкретно его терминала (смартфона). С помощью этих данных мы определяем проблемные устройства и проводим большую работу с их производителями, содействуем им в разработке новых прошивок для телефонов и оборудования. Эта информация также помогает понять, насколько абоненты используют возможности своей сети и оборудования — с учетом ее мы формируем новые предложения. Например, велика доля абонентов, которые могли бы пользоваться технологией VoLTE, но не делают это, потому что их терминал не обновлен до нужной версии прошивки.

Service Quality Management умеет собирать статистику по роумингу в зарубежных сотовых сетях и выстраивать их рейтинг по качественным показателям с выдачей рекомендаций по ручному подключению. Инженер видит данные по терминалам роуминговых абонентов, зарегистрированных в сети МегаФона, и отслеживает основные параметры их работы.

В качестве примера комплексного подхода МегаФона к качеству сети можно привести скоростной поезд «Сапсан», ежедневно курсирующий между двумя столицами. Мы обеспечиваем покрытие LTE по маршруту и при этом изучаем пользовательский опыт в каждом вагоне в любой момент времени. Для этих целей мы установили измерительные устройства Metricell Automobile в каждом вагоне «Сапсана». Они ежесекундно собирают статистику по важным для абонента сервисам и передают данные на сервер для последующего анализа.

Это позволяет находить проблемы в работе оборудования «Сапсана», которые невозможно локализовать из любой другой статистики или данных по авариям.

Инструменты для контроля качества популярных сервисов

По прогнозам, до 75% всего мобильного трафика в перспективе 5 лет будет составлять видеоконтент. Поэтому нам важно оценивать, насколько хорошо сеть позволяет просматривать видеоролики. В этом МегаФону помогает инструментарий Vigo.

Это российский SDK, который встраивается во многие популярные сервисы просмотра видео — Вконтакте, Ivi.ru, Megogo, STS, Дождь и т.п. — и собирает в них основные качественные метрики, такие как задержки, обрывы просмотра, время буферизации, скорость, разрешения видео и др. Кроме того, с помощью Vigo мы можем сравнивать себя с другими операторами по качеству этой услуги.

Ниже на карте показаны примеры данных из Vigo. В зеленых областях наилучшие показатели у МегаФона, в желтых — паритет с другими операторами.

  • Показатель обрывов видео:
  • Данные по скоростям при просмотре:
Вот так с помощью многочисленных онлайн- и оффлайн-инструментов МегаФон оценивает качество сети. Если по нашему рассказу у вас остались вопросы, оставляйте комментарии, и мы вам ответим.

habrahabr.ru

Как мы строили базовую станцию / Блог компании «МегаФон» / Хабр

Термины «базовая станция» и «вышка сотовой связи» давно и прочно вошли в наш лексикон. И если средний пользователь вспоминает об этих вещах не так часто, то уж «сотовый телефон» по привычности явно входит в десятку лидеров. Сотовой связью ежедневно пользуются сотни миллионов людей, но очень мало кто из них задумывается о том, как обеспечивается эта самая связь. И из этого меньшинства очень немногие действительно представляют всю сложность и тонкость этого инструмента связи.

С точки зрения большинства людей, установка базовой станции сотовой связи является весьма несложным делом. Достаточно повесить несколько антенн, подключить их к сети — и готово. Но такое представление в корне неверно. И поэтому мы решили рассказать о том, сколько тонкостей и нюансов возникает при монтаже базовой станции в условиях мегаполиса.

Осторожно, трафик! Чтобы наглядно проиллюстрировать свой рассказ, мы подробно задокументировали процесс установки вышки сотовой связи на крыше здания в Москве, по адресу ул. Краснодонская, д.19, корп.2. Это двухэтажное отдельно стоящее административное здание. Мы выбрали именно этот пример потому, что на этой базовой станции не просто смонтирована маленький кронштейн для подвески антенн, а установлена 5-секционная вышка высотой 15 м. Но начнём по порядку.

Подготовка и проектирование
Работа по установке базовой станции начинается с поиска подходящего объекта. Когда он найден, с его владельцем заключается договор аренды. Определяется необходимое расположение антенн будущей станции, масса полезной нагрузки, и исходя из этого проектируются металлоконструкции. При этом учитывается несущая способность элементов конструкции самого здания.

На каждую установленную базовую станцию оформляется комплект документации (толщиной почти 5 см). Помимо прочего, здесь указано множество параметров будущей конструкции: её расположение на объекте, габаритные размеры, общий вес, расположение точек опоры, потребляемые напряжение и мощность, и так далее.

В этой папке собрана исчерпывающая информация:

• Проектная документация, • Копии ведомостей, лицензий, сертификатов и заключений соответствия на все элементы, вплоть до гаек и краски, • Рабочая документация на оборудование, металлические конструкции, архитектурно-строительное решение, молниезащиту. • Санитарно-эпидемиологическое заключение о безопасности станции для жителей окружающих домов.

Вернёмся к нашей вышке. После согласования и утверждения проекта, на заводе были изготовлены отдельно платформа и пять сегментов вышки. Поскольку в данном случае речь шла о довольно тяжёлой конструкции, то её необходимо было установить на несущие стены здания. Для этого в кровле были прорезаны отверстия и проведена установка опорных балок. Они играют роль свайного фундамента для платформы, на которую в дальнейшем было смонтировано оборудование станции и вышка с антеннами. Общий вес платформы составил 3857 кг.

Профиль, размеры и количество балок, из которых собирается платформа, толщина стенок, протяжённость сварных швов, используемые метизы — все эти параметры рассчитываются исходя из массы полезной нагрузки, несущей способности стен здания, а также возможных ветровых нагрузок в данном регионе. Конечно, это далеко не единственные критерии, в первую очередь вышка должна обеспечить возможность установки приёмо-передающих антенн на необходимой высоте в зоне видимости соседних базовых станций. Кроме того, конструкция должна быть достаточно жёсткой, чтобы не сбивался луч релейной связи.

Монтаж металлоконструкций
Здание небольшое, отдельного выхода на крышу у него нет, поэтому бригаде монтажников приходится залезать по пожарной лестнице. Её нижняя часть отрезана, чтобы на крышу не лазили жители окружающих домов. К сожалению, это их не слишком останавливает, поэтому с крыш часто что-нибудь пропадает — запчасти, кабели, фидеры и т.д.

Несмотря на то, что каждая станция оснащается сигнализацией, служба безопасности не всегда успевает приехать вовремя.

На крыше уже установлена базовая станция другого сотового оператора, но её размеры не идут ни в какое сравнение с нашей.

После монтажа платформы, подготавливаются площадки для установки первой секции вышки:

После установки секции, начинается «закручивание гаек»:

Установка вышки на шпильки делается для того, чтобы можно было компенсировать отклонения от вертикали в ходе монтажа и дальнейшей эксплуатации.

Вертикальность конструкции постоянно контролируется с двух точек с помощью теодолитов. Причём измерения проводятся отдельно для каждой секции вышки, и потом журнал измерений будет включён в комплект документов. Впоследствии проводится периодические измерения положения вышки, поскольку под собственным весом и весом оборудования может происходить небольшое спиралеобразное скручивание конструкции (до 50 мм на 72 м высоты).

Аппаратный шкаф, подготовленный к установке на платформу:

Итак, первая секция установлена и выровнена. Монтажники готовятся к приёму второй секции:

Безопасности и комфортности работ уделяется очень большое внимание не только при монтаже, но и при дальнейшем обслуживании. Размер рабочих площадок подобран таким образом, чтобы у инженеров было достаточно места для работы. Установлены ограждения лестниц, проёмы в площадках на вышке закрываются люками, чтобы предотвратить случайное падение. Платформа поднята над плоскостью крыши, чтобы в зимнее время аппаратуру не заметало снегом и не блокировало льдом.

Монтаж остальных секций вышки:

Очередь аппаратного шкафа:

Вышка смонтирована, произведены последние измерения с помощью теодолитов. Отклонения минимальны и строго в пределах допусков. Масса вышки составила 2827 кг, а общая масса всех металлоконструкций — 6684 кг.

Цвета секций стандартные: нижняя и верхняя всегда красные, промежуточные чередуются с белым. На вершине вы можете видеть 4 штыря, являющихся продолжением рёбер вышки — это элементы молниезащиты.

Аппаратура
Следующим этапом стал монтаж всей необходимой аппаратуры и прокладка кабелей. Полный список установленного оборудования:

В результате станция приобрела довольно величественный вид, особенно в сравнении с самим зданием:

На станцию подаётся питание напряжением 380 В (3 фазы), которое потом преобразовывается в 48 В. Мощность взята с запасом — до 10 кВт. Питание подводится в отдельный шкафчик.

Откроем дверцу аппаратного шкафа. В неё встроен кондиционер (сверху) и обогреватель (снизу).

В шкафу в течение всего года поддерживается температура 18…20 градусов Цельсия. Это необходимо для бесперебойной работы оборудования и длительной службы аккумуляторов (они расположены внизу).

Аккумуляторы предназначены для обеспечения работы станции в течение примерно суток в случае отключения внешнего питания.

Сверху находится коммутационный блок и преобразователь напряжения.

Передача информации между системными модулями и приёмо-передатчиками (о них ниже) осуществляется через оптоволоконные кабели. Вот так выглядит разъём в коммутационном блоке. Его ни в коем случае нельзя трогать руками, волокно очень чувствительно к повреждениям и загрязнению.

Все базовые станции сотовой связи подключены к единой информационно оптоволоконной сети, протянутой по всей Москве. Белая бухта под аппаратным шкафом — это как раз кабель, через который подключена данная станция.

Справа от шкафа расположены системные модули GSM, CDMA и LTE:

Эти модули являются сердцем базовой станции, они принимают сигнал с антенн и осуществляют его преобразование и сжатие с дальнейшей пересылкой. Им не страшны осадки, все разъёмы герметизированы, а рабочий диапазон температур от +60 до -50.

Под системными модулями расположены грозоразрядники, которые предотвращают выгорание аппаратуры в случае удара молнии:

Справа над модулями расположены бухты оптоволоконного кабеля, с помощью которого они соединяются с приёмо-передатчиками на вышке.

Перейдём к вышке. На ней установлены приёмо-передатчики отдельно для каждого диапазона (GSM, CDMA и LTE). Они усиливают сигнал от крайне малых значений до 115-120 дБ. Из аппаратного шкафа к ним подводится питание:

Продолговатые вертикальные «ящики» — это и есть антенны. Сзади они экранированы, чтобы защитить обслуживающий персонал от электромагнитного излучения. Поднимемся на площадку.

Приёмо-передатчик GSM:

Приёмо-передатчик CDMA:

Приёмо-передатчик LTE:

По краям к приёмо-передатчику подключены оптоволоконные кабели, в центре — электропитание:

Заземление выведено на вышку:

Кабельные разъёмы и их заглушки на антенне:

Принципиальная схема коммутации оборудования базовой станции:

Мы уже упоминали о том, что проектирование и постройка базовой станции сотовой связи является совсем не таким простым делом, как кажется непосвящённым. Здесь множество нюансов, которые связаны и с конкретным местоположением станции. Например, передача радиосигнала над большой водной поверхностью ухудшается, хотя должно быть наоборот, ведь никаких препятствий нет. Но дело в том, что над поверхностью земли распространяется электромагнитное поле, а большой объём воды работает своеобразным конденсатором, над которым усиливаются помехи радиосигналу. И таких тонкостей множество, поэтому от профессионализма проектировщиков и монтажников напрямую зависит эффективность работы базовой станции. Например, от таких людей, как этот бригадир монтажников, высококлассный специалист-радиоинженер, и просто замечательный человек:

habrahabr.ru

МегаФон в труднодоступных местах / Блог компании «МегаФон» / Хабр

В стремлении развивать мобильную связь компания «Мегафон» не останавливается на городах. Мы участвуем в государственной программе по интернетизации малых населенных пунктов, устанавливаем базовые станции в тундре, горах и даже шахтах.

На днях мы объявили об установке базовой станции в деревне Половинка Чебаркульского района Челябинской области области, где проживает всего 351 человек. До этого в этом районе был очень слабый сигнал голосовой мобильной связи, люди даже порой не могли дозвониться до врачей и спасателей.  Что уж говорить о мобильном интернете, его не было совсем. Основной проблемой для прохождения сигнала и установки базовых станций был прежде всего сложный рельеф местности и густой лесной массив. Теперь же местным жителям доступен 3G интернет и скорости до 10 Мбит/с. Улучшения связи почувствуют и жители соседней деревни Крыжановка.

Подобное стало возможным благодаря участию компании «Мегафон» в государственной программе по интернетизации малых населенных пунктов численностью от 250 до 500 человек, а также при поддержке правительства Челябинской области. Оптико-волоконный канал передачи данных до базовой станции обеспечила компания «Ростелеком», которая также является участником программы.

«Жители Половинки получили отличный подарок к Новому году. Теперь в праздничную ночь быстрый интернет от «Мегафона» сделает их по-настоящему рядом со своими близкими и друзьями, как бы далеко от них они не находились. Улучшая связь, улучшаем качество жизни простых людей – это и есть в нашем понимании ответственный подход в бизнесе», — отметил директор Челябинского отделения компании «Мегафон» Игорь Остатюк.

За Полярным кругом на Кольском полуострове находится одна из самых необычных базовых станций «Мегафона». Она расположена в тундре и покрывает участок, где сходятся дороги трёх направлений: Мурманск — Териберка — Туманный. Населенных пунктов в этом районе нет, но связь нужна. В тундре не редки случаи полного заметания дороги зимой. Застряв в снежных заносах и оставшись без возможности дозвониться до службы спасения, человек может легко погибнуть. Поэтому было принято решение установить в этом районе базовую станцию второго поколения с планируемой установкой на ней 3G-оборудование. Охват такой станции составляет около 30 км.

При установке базовой станции у нас возникла проблема. Совсем рядом проходит линия электропередач, но для подключения пришлось бы построить понижающую подстанцию. Напряжение в линии составляет более 100 тысяч вольт. Постройка подстанции — дорогой и технологически сложный проект. Но тут на помощь пришли природные условия Кольского полуострова с его вечными ветрами. Для электроснабжения станции было решено использовать ветряной генератор.

В ветрогенераторе используется турбина мощностью 5 кВт. Для выработки энергии, достаточной для работы базовой станции, хватает скорости ветра от 10 метров в секунду. В этом районе это совершенно обычная погода. Если случается штиль, то станция дополнительно оснащена дизельным генератором, который запускается автоматически. За всеми технологическими процессами как внутри станции и ветряного генератора, так и снаружи специалисты компании «Мегафон» следят удаленно. Всего в Мурманской области четыре базовых станций «Мегафона» используют ветрогенераторы для своей работы.

На побережье Баренцева моря скорости мобильного доступа достигают в среднем 10-12 Мбит/с. Этого достаточно для комфортной работы и использования большинства интернет-сервисов.

«Предмет особой гордости «МегаФона» — объекты связи, расположенные повсеместно по побережью Баренцева моря. Нашими услугами пользуется Северный флот РФ. Мы предоставляем не только связь в общепринятом понимании, но и защищенные каналы связи. Широкая зона покрытия «МегаФона», особенно в прибрежных районах, уже по достоинству оценена армией, рыбаками и всеми теми, кто связан с морем», — директор Мурманского отделения компании «МегаФон» Владимир Чуйко.

Там же, на Кольском полуострове, расположены Хибины — старейший горный массив. Хибины известны своей флорой, большая часть которой занесена в Красные книги, и крупнейшими месторождениями апатит-нефелиновых руд и, конечно, рудниками по их добыче. А ещё здесь работают самая «глубокая» и самая «высокая» базовые станции «Мегафона» на Северо-Западе России.

«́Глубокая» станция расположена внутри Расвумчоррского рудника на глубине 500 метров. Точнее, по бумагам она находится на отметке 440 метров над уровнем моря, но если отсчитывать глубину от вершины горы, то она составит как раз 500 метров. Всего Расвумчоррском руднике для нужд АО «Апатит» размещены две базовые станции 2G. Они обеспечивают «сигнальную связь», давая работникам возможность поддерживать коммуникацию друг с другом и с диспетчером. Связь с поверхностью происходит по медному кабелю.

Самая «высокая» базовая станция «Мегафона» на Северо-Западе находится на плато Расвумчорр в семи километрах к юго-востоку от города Кировска. Она установлена на высоте 980 метров над уровнем моря по заказу АО «Апатит». Такое местоположение помогает увеличить зону покрытия и обеспечить надежной связью удаленные площадки нашего корпоративного клиента.

Так как предприятие находится за 200 км от полярного круга в горной местности, а её работа всегда осложняется климатическими условиями и буранами, которые зачастую делают труднодоступными удаленные объекты предприятия, надежная связь является крайне важной для нормального функционирования объекта. В том числе мониторинга движения транспортных средств.

Для того, чтобы можно было оперативно развернуть временную мобильную связь в горных районах Хибин, «МегаФон» предоставил шахтёрам «передвижную базовую станцию». С её помощью можно обеспечить весь спектр услуг мобильной связи стандарта 2G, 3G, 4G в любом месте, в том числе в труднодоступных районах.

Весь комплекс станции, включающий в себя оборудование 2G, 3G, 4G, радиорелейную и спутниковую связь, размещается на базе транспортного средства и приспособлен к автономной работе в полевых условиях без подключения к внешним источникам энергопитания. Станция способна работать до 7 суток без подзарядки и обеспечивать радиус действия сигнала до 30 км. Её мощности хватит, чтобы обслуживать до 6 тысяч абонентов, а мобильный интернет легко держит скорость до 300 Мбит/с.  

«МегаФон» каждый год работает над расширением и улучшением покрытия своей сети, инвестируя в инфраструктуру и развитие. Мы строим мобильные станции даже в таких местах, где живет три-четыре человека. Но и им нужна связь – это требование времени. И мы даем им эту связь.

habrahabr.ru

как сотовый оператор тестирует технику / Блог компании «МегаФон» / Хабр

Оказывается, у МегаФона в Питере есть Лаборатория, которая занимается разными интересными вещами — от тестирования новых моделей телефонов еще перед их официальным выходом на рынок до составления требований по скорости отклика сенсорного экрана. Сегодня мы пройдемся по этой Лаборатории, познакомимся с ее обитателями и узнаем много страшных слов:

Ничего не понимаете? Ничего, после прочтения статьи будете!

Если заинтересовались — прошу под кат! Вообще, зачем сотовому оператору нужна Лаборатория? В первую очередь, такая Лаборатория позволяет снижать затраты на обслуживание, не ухудшая его качество. Каким образом это достигается? Несколькими путями:

1) Тестирование большинства новинок мобильной техники, прежде чем она попадает на полки магазинов. По результатам этого тестирования, во-первых, начинается диалог с производителем, результатом которого является тонкий тюнинг(как правило, программный) радио-части устройства для улучшения его работы в сети. Во-вторых, принимается решение о допуске устройств в собственную розницу Megafon (все эти фирменные магазины).

Тестовая мира для проверки качества камер телефона, входящая в список 250 тестов для любого устройства, продающегося в салунахсалонах Megafon

2) Изучением поддержки устройствами новых функций передачи данных. Дело в том, что производители устройств (аппаратной части) и программ (так называемых прошивок устройств) продают свои решения операторам связи в очень разных конфигурациях: от самых дешевых с минимумом функций, до навороченных, с полной поддержкой всех возможных стандартов связи.

Таким образом, маленький оператор связи где-нибудь в Индонезии покупает недорогое решение, которого ему хватит надолго — потому как большинство его абонентов ходят еще с кнопочными звонилками, а крупный оператор в городе-миллионнике берет решение с поддержкой современных стандартов, иначе не сможет угнаться за гонкой скоростей и обеспечить своим абонентам вменяемое качество работы.

Кроме того, постоянное увеличение скорости — это жизненно необходимый путь в условиях роста количества устройств и увеличения трафика. Дело в том, что полоса пропускания делится на всех абонентов, находящихся в зоне действия. И чем быстрее абонент скачает нужный ему файл, тем быстрее освободит канал, и увеличит скорость для других абонентов.

Панель управления БС(базовой станции). В панели управления можно настроить работу БС с поддерживаемыми протоколами и режимами

Кстати, эту же цель преследует и первое направление работы Лаборатории — чем лучше будет настроено клиентское устройство, тем меньше оно будет мешать соседним устройствам, тем меньше оно будет потреблять емкость сети, и быстрее будет передавать данные, а значит, улучшит качество связи для всех остальных абонентов.

Таким образом, Лаборатория экономит деньги оператора связи, позволяя ему вместо строительства дополнительных базовых станций улучшать устройства и протоколы связи. А экономия денег оператора — это уменьшение скорости роста тарифов для его пользователей.

Что же представляет собой Лаборатория?

Во-первых, это инфраструктура.

Например, три экранированных комнаты для тестирования, в которых можно создать любые условия и комбинации существующих сетей.

Дверь в экранированное помещение. Сами вы капитан.

Много шилд-боксов (это такие же штуки, как комнаты, только маленькие и ставятся на стол).

Шилд-бокс, внутрь помещается тестируемое устройство

Несколько базовых станций: LTE, 3G, 2G.

Радиоголовы БС производства Huawei

Во-вторых, это понимание того, как надо тестировать устройства.

Например, при опросах абонентов в салонах по всей стране выяснилось, что важнее всего для среднего покупателя не объем памяти, и не скорость процессора, и не качество камеры. В те полчаса, которые обычно проходят от входа в магазин до покупки телефона, важнее всего то, насколько плавно работает интерфейс и насколько хорошо сенсор воспринимает нажатия.

Узнать-то это узнали, а как это измерить, непонятно, ведь оценку «ну, норм вроде» производителям не передашь.

Поэтому Лаборатории пришлось разработать с нуля процедуру тестирования сенсора телефона, которая позволила превратить субъективную оценку в количественную — баллы. В процедуре тестируется и маркость поверхности, и отсутствие мертвых зон, быстрота отклика, точность позиционирования и так далее.

Малая часть устройств, побывавших на тестировании

В дальнейшем, эта процедура войдет в глобальный документ по Требованиям оператора к девайсам, посвященный протоколам тестирования и результатам теста, который будет доступен вендорам мобильных устройств — они смогут заранее проводить тесты на своем оборудовании, экономя время. Цикл прохождения всех тестов в Лаборатории составляет от двух недель до месяца, после каждого цикла производителю направляет документ о тестировании, он исправляет недостатки, и вновь отправляет на тестирование. Обычно, таких итераций требуется от 3 до 10, в Лаборатории надеются, что документ сократит это число как минимум в пару раз.

В-третьих, это люди. В процессе работы тут сотрудники приобретают уникальный опыт работы со специфичным железом, который очень ценится — один человек уже ушел работать в Apple, двух других взяли на работу производители оборудования — Nokia и Huawei, еще один сейчас работает в Квалкомм. Компетенция сотрудников позволяет им создавать такие протоколы и документы для тестирования, как был описан выше, которые в итоге помогает всей отрасли мобильной связи. Кроме того, тут работают милашки:

Мария — инженер по тестированию абонентского оборудования

Нас поводили по Лаборатории и рассказали подробнее о том, что в ней есть.

Вот так выглядит одна из экранированных комнат(всего их три).

Комнаты отличаются цветом стен — это «желтая комната»

Не стоит обманываться вполне обычным внешним видом — под слоем чистовой отделки скрывается экранирующая металлическая сетка и специальная штукатурка, которые обеспечивают почти полное экранирование внутреннего пространства комнаты от любых излучений снаружи. В ней не принимается WiFi здания, нельзя поговорить по рации, не работают радио-приемники, не ловятся сотовые сети. Идеальное место для людей, «страдающих» аллергией на радио-излучения. Одна только проблема — сооружение такой комнаты обойдется примерно в $100 000.

Для того чтобы находясь в этой комнате, можно было поговорить по телефону, здесь установлена фемтосота:

Черный блок — фемтосота. Такое устройство при наличии интернета создать сеть оператора где угодно. Для того, чтобы их не увозили на курорты Турции, их снабжают защитой и GPS-трекерами.

Однако, сама по себе, экранированная комната бесполезна — если связи нет, то и тестировать нечего. Для того чтобы в ней можно было создать тестовые условия, в нее вводятся радио-тракты от базовых станций:

В каждой комнате есть 4 ввода, которые можно коммутировать на на любые БС и их комбинации при помощи кросс-панели

Эти выводы подключаются к антеннам, создавая в комнате интимную атмосферу сеть оператора в миниатюре:

Антенны — серые четвертинки цилиндров

Внутри комнаты обычно на доске написана текущая конфигурация, что и куда подключено:

Green lab configuration, inter freq, intra freq, конфеты за апрель… ЧТО?

Спрашиваем, куда делись конфеты за апрель.

Говорят, были в марте. Ок. Вернемся к нашим баранам БС.

Выводы от БС можно подключать не только к комнатам, но и к шилдбоксам:

На шилдбоксе написано, к какой БС он подключен

Шилдбокс — это такая же комната, только в миниатюре. У него также есть несколько вводов для антенн и сами антенны внутри:

В этом боксе три ввода для антенн, а также ввод питания, Ethernet, USB, COM-порта и PS/2

Сами антенны шилдбокса выглядит вот так:

Сетка на антенне нужна для точного расположения ее на тестируемом устройстве, например, когда измеряется диаграмма направленности

Некоторые шилдбоксы совсем маленькие:

Правда, стоят все равно дорого

Если комнаты используются для множественного тестирования(когда на БС вешают сразу десяток-другой устройств, и смотрят, как они переваривают друг друга), тестирования на людях(поговорить, подержать в руках, потестировать скорость интернета при серфинге), и комбинации нескольких разных сетей, то шилд-боксы в основном используют для тестирования и настройки единичных устройств. Вот, например, нагрузочное тестирование CPE Zyxel с LTE-Advanced:

На фото: Александр Джакония (руководитель Лаборатории), Zyxel(роутер). Zyxel слева.

Скачано уже 466 гбит:

Обычно для тестирования просто скачивается какой-нибудь большой файл

А вот выглядит отладка китайскими производителями своего нового WiFi-модема:

На роутер, помещенный в шилд-бокс, залита тестовая прошивка, а сам роутер подключен к компьютеру на котором китайцы колдуют с параметрами через TeamViewer

Из шилдбоксов мы возвращаемся к экранированным комнатам. Сегодня там тестируют iPhone 7 — первый из iPhone на российском рынке, который поддерживает агрегацию трёх несущих. 6S поддерживал только двух.

Почему агрегация?Смысл всей этой агрегации несущих в том, что на фиксированной полосе частот нельзя наращивать скорость до бесконечности — всякие MIMO позволяют засунуть в диапазон больше данных, но ценой траты дополнительных процессорных ресурсов на обработку сигналов, как на БС, так и на телефоне, причем эти затраты возрастают в геометрической прогрессии. В итоге, для увеличения скорости остается только расширять доступную полосу частот.

Правда, просто растянуть ее в несколько раз, сделав из 20МГц 60МГц не получится — во-первых, широкополосные приемники будут стоить дороже(или будут требовать больше ресурсов для обработки), а во-вторых, этому препятствует то, что частоты, купленные операторами, как правило, распределяются по всему диапазону — 20МГц там, 10МГц там. Поэтому, единственный доступный путь — агрегация нескольких несущих(Carrier Aggregation — CA), когда БС отправляет данные на телефон сразу в нескольких диапазонах параллельно, суммируя пропускную способность каналов. Кстати, БС может и не размазывать все данные на несколько каналов, а дублировать данные, улучшая тем самым прием в сложных условиях — там где не пройдет 2.6ГГц, 1800МГц хоть как-то, но примет. Все зависит от настроек БС.

Для чего это надо? Для увеличения скорости, конечно. Все предыдущие устройства поддерживали агрегацию максимум двух каналов по 20 МГц, что давало теоретический потолок максимальной скорости в 300мбит. В реальности было меньше — около 280. Полоса в 10МГц это примерно 70мбит скорости. Две несущих по 20МГц, плюс третья шириной 10Мгц, получается (70+70)*2+70 = 350мбит. Вот, например, получилось 330мбит:

Если скорость выше 300 мбит — то это уже выше теоретического предела для двух несущих

В общем, как я уже говорил, такая скорость нужна не столько пользователям, сколько оператору — человеку нет особой разницы, скачается фильм за полчаса или за 10 минут, подождать нетрудно, а вот оператору — есть, увеличении скорости позволяет обеспечить связью большее количество абонентов.

Панель управления БС подтверждает рекорд

Выйдем из экранированных комнат и пойдет вдоль толстых коаксиальных кабелей, который выходят из каждой комнаты. Они ведут в отдельное помещение, в котором находится святая святых Лаборатории — базовые станции и радиоголовы. Вот, например, сами БС:

В стойках находятся БС для 3G и LTE

Толстые синие кабели — это тракты от приемников GPS на крыше:

Казалось бы, зачем знать координаты стоящего на месте здания?

GPS используется для точной синхронизации времени на соседних базовых станциях — для синхронизаций ими между собой времени начала приема и передачи. Отсутствие этой синхронизации создает интерференцию и помехи, вплоть до отсутствия связи вообще.

Желтые провода это оптоволокно, CPRI — интерфейс для связи БС и радио-головы(передатчика). А вот и сами передатчики:

Передатчики нового типа, которые могут устанавливаться рядом с антеннами

Система обычно разделена на управляющий модуль БС(на фото выше), передатчик и антенну. В старых системах управляющий модуль и передатчик обычно были в одной стойке, а антенна соединялась с передатчиком длинным-длинным фидерным трактом. В новых системах передатчик, если получается, устанавливается рядом с антенной, а соединяется с антенной коротким трактом. За счет этого экономится длина фидерного тракта, упрощается прокладка, уменьшаются потери, а значит, растет дальность приема/передачи.

Еще бывают микросоты — это когда в одном корпусе и управление, и передатчик, и антенна:

Антенна, правда, отключена, чтобы ее можно было вывести в шилд-бокс

Остается подключить питание, связь, и полноценная сеть готова. Конечно, производительность такой микросоты меньше, чем у обычной, но иногда хватает и ее.

На выходе из радио-голов стоят черные штуки — это аттенюаторы, снижающие мощность сигнала.

Такой аттенюатор снижает мощность сигнала на 10db — в 10 раз.

Комнаты маленькие, а БС мощные, и чтобы не облысеть раньше времени и не перегрузить входные тракты тестируемых устройств, сразу на выходе мощность передатчика снижают.

Аттенюаторы бывают не только маленькими:

Такой аттенюатор снижает мощность сигнала на 30db — в 1000 раз.

Разница в входной и выходной мощности выделяется на нем в виде тепла, поэтому, чем больше номинал, тем больше радиатор. Эти аттенюаторы в первом приближении можно рассматривать как резисторы для электроники.

После аттенюаторов сигнал идет в кросс-панель, на которой можно соединить выходы передатчиков со входами в комнатах или в шилд-боксах:

Кросс-панель, по сути, всего лишь набор разъёмов, соединенных между собой кабелями

Панель позволяет быстро переключать устройства между разными приемниками, не ползая между базовых станций и не трогая их разъёмы лишний раз.

Но кросс-панель, позволяет не только соединить выбранную радио-голову и комнату. Она позволяет включить между ними… еще один аттенюатор. Только не простой:

Это настраиваемый программируемый аттенюатор с управлением

У него есть Ethernet-порт, через который ему можно командовать, на сколько надо снизить уровень сигнала. Это позволяет делать очень сложные схемы тестирования, вроде плавного переключения с одной БС на другую в условиях плохого приема.

Например, это использовалось при отладке технологии переключения абонентского устройства на более свободную соту, пусть даже с худшим сигналом — если текущая сота не справляется с таким количеством абонентов. Звучит довольно просто, но на самом деле — там тысяча и одна тонкость, начиная от настройки порогов этого самого переключения, и алгоритмами расчета загрузок сот(чтобы понять, какой процент абонентов при необходимости надо перебрасывать), заканчивая объяснением телефону, почему ему нельзя вернуться обратно на эту привлекательную близкую соту с сильным сигналом. Такие вещи очень тяжело отладить в реальной сети, а с таким инструментарием — запросто.

Теперь вам понятен смысл объявления на заглавной картинке?

А вот и тот файл с портала в распечатанном виде:

Кстати, полноразмер доступен по клику

В завершении рассказа покажу несколько железных артефактов, что встретились нам в Лаборатории.

Целые коллекции сим-карт:

А вот так выглядит ранний-ранний прототип 3G-модема:

Это только платформа, на которой разные производители могут разрабатывать свои устройства.

В отличие от них, она имеет отладочные интерфейсы:

Правда, иногда такие интерфейсы приходится подключать и к релизным устройствам:

Но чаще всего они тестируются просто так, а потом складываются на полочку:

На этом экскурсию по Лаборатории можно считать законченной. Ирина Крылова, инженер по тестированию абонентского оборудования хихикает и прощается с вами:

habrahabr.ru

как мы поддерживаем качество связи в Москве / Блог компании «МегаФон» / Хабр

Весной-летом 2017 года Роскомнадзор протестировал мобильных операторов и опубликовал результаты на качествосвязи.рф. В итоге по успешным голосовым соединениям и скорости мобильного интернета лучшим оказался МегаФон. При этом тестирование интернета проводилось терминалами Cat.4 (до 150 Мбит/с), а в начале августа мы первыми в России запустили Gigabit LTE (до 1 Гбит/с). Так что при тестировании устройствами Cat.6 и быстрее разрыв с конкурентами мог бы быть еще больше. В этом посте мы расскажем, как добиваемся таких результатов.

Хорошие показатели МегаФона — результат комплексной работы всех подразделений технического блока. Свой вклад вносят инженеры, отвечающие за строительство, планирование и оптимизацию сети, системы эксплуатации, мониторинга аварийности и контроля качества работы сети.

Основа грамотной системы эксплуатации и контроля качества — это мониторинг сети. Первый центр управления и мониторинга (ЦУМ) сети МегаФон был развернут в 2006 году на Вятской улице в Москве.

В мае 2015 года МегаФон, следуя мировым трендам, вывел мониторинг в единый центр управления сетью (ЕЦУС, он же GNOC — Global Network Operational Center), расположенный на двух площадках — в Самаре и Петербурге. Преимущество двух площадок в том, что при возникновении каких-то проблем в одном из ЦУС второй может оперативно подхватить его задачи.

Инженеры центра круглосуточно мониторят сетевые элементы всех подсистем и при необходимости инициируют оперативное устранение проблем, задействуя нужные профильные подразделения. К примеру, если выходит из строя базовая станция (БС), инженеры ЕЦУС оповещают об этом локальную команду инженеров, которые выезжают на БС и устраняют проблему. Про ЕЦУС и его особенности можно рассказывать интересно и много — это предмет для отдельного поста. Здесь мы сосредоточимся на описании принципов и подходов работы с качеством сети МегаФон.

«Вкалывают роботы, а не человек», или автоматическая система Self-Optimization Network (SON)

Для мониторинга бесчисленных элементов и параметров современной мобильной сети мы используем систему SON (Self-Optimization Network). В режиме 24/7 она автоматически собирает параметры оборудования, использует сетевую статистику и трейсы, поступающие от каждого элемента сети. На основе этих данных SON выполняет три основные функции:
  1. Оперативно реагирует на происходящие в сети изменения, например, на резкие всплески нагрузки. К примеру, если на БС внезапно возрастает количество абонентов, SON может изменить параметры соты либо углы наклона антенн, чтобы оптимизировать зону покрытия этой БС, перераспределив тем самым нагрузку на соседние БС.
  2. Поддерживает корректность настроек и взаимосвязей между БС. SON постоянно сверяет настройки сети, а также оптимизирует соседства (взаимосвязи) между БС. Это необходимо чтобы абоненты могли делать «хендовер» — без прерывания сервиса переходить между сотами на одной БС или соседними БС. SON добавляет потенциально полезные (по своей оценке) соседства, проверяет, как работают существующие и удаляет неиспользуемые.
  3. Автоматизирует рутинные задачи оптимизации сети. Поскольку мобильные сети сейчас имеют очень сложную структуру – три технологии (2G/3G/4G) на одной БС с несколькими диапазонами в каждой технологии (LTE-800/1800/2600 и т.д) – количество соседств только на одной БС составляет около тысячи. Чтобы охватить этот объем, не хватит штата инженеров ни одной компании. SON снимает эту нагрузку с инженеров, которым остается только контролировать работу системы. Таким образом человеческих ресурсы освобождаются для более сложных и творческих задач, например, внедрения новых технологий.
В среднем, система выполняет от 200 до 400 тысяч корректирующих операций в день. По нашим оценкам, это снижает нагрузку на инженеров на 40-60%. Система SON имеет модульную структуру, в которой каждый модуль отвечает за выполнение определенного набора функций. Примеры базовых модулей:
  • ANR (Automatic Neighbour Relations) – отвечает за правильную работу «хендовера». ANR анализирует статистику работы сети, добавляет новые либо изменяет существующие «соседства» между БС на наиболее оптимальные в каждой конкретной ситуации, поддерживает корректность их настроек
  • SH (Self-Healing) – вступает в работу в случае аварийных ситуаций в сети. Например, если вышла из строя БС, модуль распознает проблему и закрывает «дырку» в покрытии, расширяя зону покрытия соседних БС за счет изменения электронных углов наклона антенн или увеличения их мощности.
  • DLB (Dinamic Load Balancing) – реагирует на всплески нагрузки сети, перераспределяя ее между соседними базовыми станциями, оптимизируя зону покрытия с помощью изменения параметров соты или углов наклона ее антенн.
Чтобы механизмы SON работали эффективно, их логику необходимо регулярно адаптировать под изменчивые условия работы сети. В МегаФоне поддержкой данного направления занимается специальная команда инженеров. Их задача — постоянно расширять функциональные возможности SON за счет разработки и ввода в действие новых модулей и автоматических алгоритмов управления софтверными параметрами радиоподсистемы.

Отдел технического контроля

Возможности SON не безграничны, и в сложных ситуациях для устранения проблем требуется вмешательство человека. Для этого в МегаФоне существует отдел технического контроля (ОТК), который подключается, когда ЕЦУС не может определить причину деградации качества на оборудовании. Сюда стекается вся статистика, накапливаемая по работе сети. Используя широкий набор сетевых KPI собственной разработки и накопленный опыт, мы выявляем закономерности в ухудшениях на различных узлах, находим их причину и устраняем проблему.

В этом нам помогает ряд инструментов:

  1. Дэшборды по различным подсистемам с кастомизированными KPI.
  2. Абонентские трассировки. По ним можно детально проанализировать сигнальный обмен телефона с сетью и выявить причину проблемы абонента.
  3. Измерения штатных и crowd-source систем.
  4. Бенчмаркинг для сравнения с другими операторами — сервисы Speedtеst для скорости передачи данных и Vigo для качества видео.
  5. Система SQM, позволяющая использовать новейший подход к Е2Е анализу — не только на базе несетевых метрик, а на уровне конкретного сервиса целиком. Предположим, Вас устраивает общее качество сети, но плохо работает конкретно приложение Facebook. В этом случае система позволит детально посмотреть, на каком этапе возникают проблемы.
Останавливаться на дэшбордах и абонентских трассировках мы не будем, так как в том или ином виде это давно есть практически у каждого оператора сотовой связи. Различия проявляются только в нюансах анализа и отработки проблем. А вот об остальном расскажем подробнее.

Crowd-source данные: приложение «Моя сеть»

Приложение «Моя сеть», разработанное компанией Metricell и кастомизированное специально для МегаФона, позволяет собирать информацию о качестве связи у абонента и передавать ее техническим специалистам МегаФона для анализа. Приложение доступно для всех в Play Market.  «Моя сеть» может работать в двух режимах – в пассивном и активном.

В пассивном режиме основная информация о покрытии сети (уровень сигнала, качество соединения и т.п.) и сбоях автоматически собирается и отправляется на сервера МегаФон. Там она аккумулируется и в дальнейшем используется во многих активностях: от планирования сети до маркетинговых акций. В активном режиме пользователь самостоятельно проверяет качество связи и в случае проблем через простую форму сообщает о них.

«Моя сеть» помогает выявить проблемы с сетью в сложных городских застройках или сельской местности, куда не добрались инженеры с переносными измерительными комплексами и не доехали автомобильные системы для радиоизмерений.

Полевые радиоизмерения

В одной популярной песне есть такие слова: «Потому что на десять девчонок по статистике девять ребят». В ней приводится информация о численном соотношении, но ничего не говорится о том, какие это девчонки и ребята, сколько им лет и где они проживают. Так и в мониторинге: «большие данные» сетевой статистики могут дать много пищи для размышлений, но за глобальными трендами можно легко пропустить частные проблемы. Большинство инструментов контроля качества опираются на сетевую статистику, которая, по сути, является огромным массивом информации по состоянию сети и работе сервисов. Как любая Big Data, сетевая статистика хорошо показывает тренды и не всегда позволяет выявить частные случаи проблем на сети. Кроме того, если в какой-то зоне совсем нет покрытия мобильной сети, в сетевой статистике также не будет информации об этой проблеме.

В таких случаях для выявления и устранения проблем, а также для реальных замеров сети мы используем полевые радиоизмерения: локальные драйв-тесты с участием инженера и контрольные автоматические с помощью машины с измерительным оборудованием.

Локальные измерения проводятся для конкретных мест, часто на основании жалобы абонента или же когда невозможно использовать автоматические комплексы (проехать на машине). Например, в закрытых дворах, торговых центрах, метро и т.п. А также для тестирования новых сервисов и технологий, их обкатки вживую.

Носимый измерительный комплекс помещается в обычном рюкзаке. Он состоит из сканирующего приемника, нескольких измерительных смартфонов, установленных на специальном шасси, и управляющего устройства. С помощью сканирующего приемника инженер оценивает покрытие сотовой сети, а также просматривает эфир на всех рабочих частотах в конкретном месте. Так, например, можно засечь слабый сигнал от удаленной базовой станции, создающей помеху, или оценить покрытие всех четырех операторов в этой зоне.

Специальная прошивка измерительных смартфонов позволяет управлять их функциями на самом глубоком уровне, вплоть до подключения только к определенному диапазону или базовой станции. В максимальном варианте допускается установка до 8 смартфонов, но, как правило, используется 4-5 устройств – по числу основных тестов. С помощью смартфонов инженер оценивает качество голосовых вызовов (в том числе так называемый MOS (Mean Opinion Score) или, по-простому, разборчивость речи), скорость передачи данных, качество просмотра видео, работу мессенджеров и другие параметры стандартных сервисов.

Полное управление смартфонами осуществляется по Bluetooth, не нужно каждый раз лезть в рюкзак. В качестве контроллера может быть использован смартфон, планшет или ноутбук. Через него инженер запускает прогон того или иного теста на одном или всех смартфонах одновременно, однократно или в циклическом режиме.

Логи всех тестов записываются в память смартфонов для последующего анализа в офисе. При необходимости тесты можно провести и через само управляющее устройство. В процессе радиоизмерений инженер может сам оценить выявленную проблему и попытаться в режиме онлайн устранить ее совместно со специалистами, находящимися в офисе.

Для масштабных контрольных измерений мы используем не инженеров с рюкзаками, а специальные автоматические радиоизмерительные комплексы, установленные на автомобилях.

Водитель такого автомобиля не принимает участия в управлении измерительными комплексами, а отвечает за перемещение по заданному маршруту. Впрочем, наши нынешние водители настолько опытны, что могут при необходимости и сами провернуть простые операции вроде проверки состояния комплекса или перезагрузки системы.

Наличие «ежика» на крыше автомобиля обусловлено большим количеством диапазонов, задействованных в сотовой сети МегаФона.

Как только поворачивается ключ в замке зажигания, комплекс запускается в работу. Он представляет собой стойку с 3-4 блоками, каждый из которых состоит из 4 устройств, эмулирующих смартфоны. Как и при ручном тестировании, количество устройств определяется числом проводимых тестов. На блоках имеются разъемы для подключения внешних антенн.

Все управление комплексом осуществляется удаленно. Инженер прямо из офиса может задать алгоритм его работы или поменять конфигурацию. По своим возможностям такой комплекс мало отличаются от варианта в рюкзаке, однако обладает повышенной надежностью, что позволяет выполнять тестирование хоть круглые сутки, собирая огромный объем данных. Здесь мы также можем проводить измерения покрытия сети, осуществлять голосовые вызовы и тестировать мобильные сервисы передачи данных. Все результаты измерений накапливаются в логи и в режиме онлайн передаются в офис по каналам сотовой связи.

С помощью контрольных радиоизмерений мы регулярно оцениваем и сети других сотовых операторов, сравнивая с нашей. А еще собираем и анализируем специфические настройки, используемые на их оборудовании. Такие бенчмарки позволяют оценить свое качество на фоне других операторов и перенять что-то полезное у конкурентов.

Система SQM (System Quality Management) для контроля качества сети

Развернутая в МегаФоне новейшая система SQM содержит несколько модулей:
  • Модуль, используемый на первой линии траблшутинга. Он показывает агрегированную статистику по абоненту и проблемы, которые он испытывал.
  • Модуль контроля качества сети на массовых мероприятиях, при скоплениях пользователей.
Ни одно массовое мероприятие в Москве и области не проходит незамеченным для МегаФона. В соответствии с территорией проведения каждого мероприятия в системе создается локация (группировка сот, обслуживающих мероприятие).

В соответствии с локацией система каждые пять минут выдает инженерам характеристики качества работы сети на мероприятии, влияющие на клиентский опыт. В случае резкого изменения показателей мы тут же локализуем проблемные элементы сети и привлекаем профильные подразделения для оперативного устранения. Этот подход широко использовался во время проведения Кубка Конфедераций.

На массовых мероприятиях инженеры ОТК МегаФона применяют и нестандартные решения. Например, за концертом группы Ленинград сотрудники наблюдали через открытые публичные трансляции в Periscope и Instagram. Это позволяет в режиме онлайн определять качество конечного сервиса в конкретных точках на территории мероприятий и оперативно принимать меры в случае ухудшений.

  • Модуль мониторинга и контроля качества по всей сети

Москва и Московская область разбиты на 470 кластеров, по которым осуществляется мониторинг KQI (Key Quality Indicator). При резких ухудшениях качества без видимых аварий на оборудовании настроена автоматическая генерация алармов. Чтобы ничего не пропустить. В случае проблемы список сот с деградацией конкретных KPI и основной ClearCode (причину проблемы) система выдает за 5 минут.

  • Модуль анализа проблемных терминалов, некорректно работающих в сети. Благодаря ему специалисты видят, какие модели телефонов используются наиболее активно.

И могут оценить качество их работы.

МегаФон активно использует эти метрики, ведь клиент оценивает качество сети, исходя не только из объективных показателей, но также из показателей работы конкретно его терминала (смартфона). С помощью этих данных мы определяем проблемные устройства и проводим большую работу с их производителями, содействуем им в разработке новых прошивок для телефонов и оборудования. Эта информация также помогает понять, насколько абоненты используют возможности своей сети и оборудования — с учетом ее мы формируем новые предложения. Например, велика доля абонентов, которые могли бы пользоваться технологией VoLTE, но не делают это, потому что их терминал не обновлен до нужной версии прошивки.

Service Quality Management умеет собирать статистику по роумингу в зарубежных сотовых сетях и выстраивать их рейтинг по качественным показателям с выдачей рекомендаций по ручному подключению. Инженер видит данные по терминалам роуминговых абонентов, зарегистрированных в сети МегаФона, и отслеживает основные параметры их работы.

В качестве примера комплексного подхода МегаФона к качеству сети можно привести скоростной поезд «Сапсан», ежедневно курсирующий между двумя столицами. Мы обеспечиваем покрытие LTE по маршруту и при этом изучаем пользовательский опыт в каждом вагоне в любой момент времени. Для этих целей мы установили измерительные устройства Metricell Automobile в каждом вагоне «Сапсана». Они ежесекундно собирают статистику по важным для абонента сервисам и передают данные на сервер для последующего анализа.

Это позволяет находить проблемы в работе оборудования «Сапсана», которые невозможно локализовать из любой другой статистики или данных по авариям.

Инструменты для контроля качества популярных сервисов

По прогнозам, до 75% всего мобильного трафика в перспективе 5 лет будет составлять видеоконтент. Поэтому нам важно оценивать, насколько хорошо сеть позволяет просматривать видеоролики. В этом МегаФону помогает инструментарий Vigo.

Это российский SDK, который встраивается во многие популярные сервисы просмотра видео — Вконтакте, Ivi.ru, Megogo, STS, Дождь и т.п. — и собирает в них основные качественные метрики, такие как задержки, обрывы просмотра, время буферизации, скорость, разрешения видео и др. Кроме того, с помощью Vigo мы можем сравнивать себя с другими операторами по качеству этой услуги.

Ниже на карте показаны примеры данных из Vigo. В зеленых областях наилучшие показатели у МегаФона, в желтых — паритет с другими операторами.

  • Показатель обрывов видео:
  • Данные по скоростям при просмотре:
Вот так с помощью многочисленных онлайн- и оффлайн-инструментов МегаФон оценивает качество сети. Если по нашему рассказу у вас остались вопросы, оставляйте комментарии, и мы вам ответим.

habr.com

Зеленоглазый интернет / Блог компании «МегаФон» / Хабр

Выражение «зеленоглазое такси» появилось из-за того, что свободные машины часто обозначаются включённым зелёным фонариком. В новом LTE/Wi-Fi-мобильном роутере МегаФон MR100-2 зелёный огонёк означает работающий интернет и идущую передачу данных. О возможностях этого роутера и в очередной раз об LTE сети «МегаФона» я и расскажу.

Интернета хватит на всех

Применение
Новые возможности порождают новые потребности — это движущий механизм прогресса. Распространение мобильного интернета ведёт к тому, что он требуется всё большему числу людей — и устройств. В принципе, функция точки доступа есть и в смартфонах, но вопрос расхода батарейки никто не отменял. Так что для обеспечения интернетом небольшого парка устройств где-нибудь вдали от провода мобильный роутер остаётся востребованным решением.

МегаФон MR100-2 может работать как:

  • LTE-модем для ноутбука, компьютера и любого другого устройства с USB-портом
  • Wi-Fi-роутер для частной сети
  • Wi-Fi-роутер для открытой сети
— в сети «МегаФона», раздавая Wi-Fi на 10 устройств. Встроенная батарейка роутера объёмом 2100 мАч (побольше, чем у некоторых смартфонов) делает его вполне автономным устройством. Лежит MR100-2 в кармане, в рюкзаке, на подоконнике, в бардачке автомобиля или в ящике стола, мигает зелёным глазом — и делает свою работу.
Дизайн

Помимо роутера в небольшой коробочке только руководство пользователя — довольно компактное, полностью на русском и, что важно — полезное. Впрочем, прочитавшим этот пост туда заглядывать уже не понадобится ;)

Сам гаджет — невелик и изящен; его размеры — 97x66x13 мм — очень близки к габаритам среднего 2,5-дюймового HDD. Весит он при этом всего 99 г.

Корпус выполнен из гладкого пластика. Верхний торец гаджета отдан под e-ink дисплей, показывающий режим сети и заряд батареи, и кнопку переключения режимов работы. Красная точка под кнопкой — резет.

MR100-2 поддерживает два режима Wi-Fi — частная сеть и частная сеть + открытая сеть, переключаемые кнопкой вверху. Положение по центру — выключено, влево — частная сеть, вправо — открытая. Во втором случае Wi-Fi устройства вокруг будут видеть две сети: частную, как вы её назовёте при создании пароля, и MegaFon Free.

В нижней части корпуса — выдвижной разъём USB. Точнее, это не просто разъём, а 3-в-1: это слот для SIM-карты, ещё он совмещён с microUSB-портом с обратной стороны, а также скрывает доступ к разъему для microSIM.

Спереди — подсвечиваемая надпись 4G MegaFon:

Cзади — ничего, кроме наклейки с информацией, которую стоит запомнить и отклеить:

Начало работы
Роутер уже продается с microSIM и 2 неделями бесплатного 4G-интернета. Затем нужно будет выбрать пакет с нужным количеством трафика.

— Вставляем SIM-карту до характерного щелчка фиксатора. Чтобы извлечь её — нужно вдавить её ногтём до срабатывания выталкивающей пружинки. Впрочем, вытащить её голыми руками может оказаться затруднительно, но спасет любой подручный предмет. — Батарейка должна быть заряжена. — Нажимаем кнопку включения, выбирая один из двух режимов раздачи Wi-Fi: в закрытой или открытой сети — и вы в интернете.

Как любое новое устройство, роутер после включения желательно настроить под себя. Со смартфона/планшета, поймавшего Wi-Fi от роутера, или ноутбука нужно зайти на status.megafon.ru. Wi-Fi мобильным устройством ловится сразу, т.к. по умолчанию оба режима Wi-Fi незапаролены. Логично, что для режима частной сети лучше побыстрее поставить пароль:

Там же решаем, нужен ли нам зарубежный роуминг через этот роутер, какой режим сети предпочитаем, нужна ли подсветка лого и возможность увидеть текущий уровень заряда батареи — что особенно удобно, когда роутер лежит где-нибудь далеко.

Затем стоит зайти на megafon.ru — в верхней части страницы будет указан телефонный номер и баланс счёта:

Здесь же через 2 недели бесплатного интернета можно будет выбрать подходящий объем интернета на месяц и пополнять баланс:

Работа в сети
LTE «МегаФона» в Москве я уже тестировал недавно на новом iPad Air. МегаФон MR100-2 просто подтвердил качество сети: в разгар рабочего дня на Тульской 42 мегабита — это очень прилично.

Забавно, что роутер и айпад видят LTE «МегаФона» у меня лучше, чем моя Xperia — обычную мобильную сеть. Впрочем, тут возможно, дело уже в гаджете, а не в качестве сети.

Батарейка — тоже важное преимущество отдельного роутера перед смартфоном, раздающим сеть. В «МегаФоне» говорят, что одной из задач при разработке нового роутера был поиск решения, позволяющего обеспечить наибольшее время работу от батареи. По сравнению с предыдущей моделью MR100-1 ёмкость аккумулятора возросла на 50%, составив 2100 мАч. Расход батареи происходит только в режиме передачи данных (когда мигает зелёная лампочка), поэтому в целом время работы гаджета получается весьма высоким: в режиме рабочего использования (больше чтение Хабра и дургих сайтов, работа с почтой без загрузки тяжёлых файлов) роутера хватает на 12 часов и выше, минимальное же время работы устройства — 5 часов в режиме непрерывной закачки. В среднем, получается, при равном режиме использования роутер работает в 2-3 раза дольше смартфона, раздающего интернет. Этого достаточно, чтобы обеспечить целый рабочий день небольшой компании на пленэре.

Дополнительные возможности
Помимо управления функциями роутера, страница status.megafon.ru позволяет использовать его в квазителефонном режиме — например, отправлять USSD-запросы (баланс, управление опциями), отправлять/получать SMS, определяет номер телефона используемой SIM.

Все эти функции доступны только в режиме подключения по USB или по частной сети Wi-Fi. Те, кто подключены к открытой сети (режим Wi-Fi free) попасть на страницу status.megafon.ru, разумеется, не смогут.

Приобрести роутер можно в интернете-магазине «МегаФона» в чёрном (как наш тестовый аппарат) и белом цветах по цене 4900 р.

habrahabr.ru


Смотрите также