Skype подробно объяснил причины крупного сбоя

Skype подробно объяснил причины крупного сбоя
Причиной сбоя в работе популярного VoIP-сервиса Skype, произошедшего на прошлой неделе по всему миру, стала ошибка в версии приложения для Windows. Об этом в блоге компании рассказал директор по информационным технологиям Skype Ларс Раббе (Lars Rabbe).
Интернет сфера 108902 января, 2011

По его словам, в среду 22 декабря несколько вспомогательных серверов сети подверглись перегрузке и отключились. В результате время доставки сообщений на компьютеры пользователей увеличилось. И версия приложения 5.0.0.152 для Windows неправильно обработала это событие, в результате чего в приложении произошел сбой.

В последней версии Skype для Windows - 5.0.0.156, - а также в более ранних версиях приложения для Windows (4.x), Mac OS и iOS обработка события прошла нормально, поэтому в них сбоя не произошло.

Тем не менее, версия 5.0.0.152 для Windows была установлена на компьютерах примерно 50% всех пользователей Skype в мире, из которых примерно на 40% произошел сбой. А так как сервис Skype базируется на технологии P2P, то проблемы на компьютерах одних пользователей привели к эффекте лавины - отключаться начали и их «соседи».

Многие клиенты, использовавшие проблемную версию, пытались несколько раз перезагружать софт Skype на своем компьютере, что еще больше увеличило нагрузку на серверы. Следствием этого стало то, что оставшиеся узловые серверы были загружены примерно в 100 раз больше обычного.

Сбой в программе Skype


Крупнейший сервис интернет-телефонии Skype вчера вечером, 22 декабря, перестал отвечать на запросы части пользователей по всему миру. По неофициальной информации, проблемы испытала как минимум половина владельцев аккаунтов.

Администрация сервиса в официальном блоге признала проблему и заявила, что на восстановление работоспособности потребуется как минимум несколько часов. «Некоторые из вас могут испытать проблемы при входе в Skype. Мы проводим расследование и приносим свои извинения за сбои в работе. Наши инженеры работают в режиме нон-стоп, чтобы исправить ситуацию. Спасибо вам за терпение», - заявили в компании.

В Skype достаточно поверхностно объяснили причины сбоя. У сервиса есть три уровня в сети: рядовой пользователь, пользователь, через которого перенаправляются звонки в случае, если программа не может соединиться напрямую, и суперноды – мощные узловые серверы, которые призваны «подстраховывать» пользователей не имеющих «соседей», чтобы перенаправить их трафик.

В официальном сообщении говорится о том, что вышли из строя именно суперноды. «Сегодня многие из них перестали работать. Проблема затронула несколько версий Skype. Именно поэтому некоторые из вас оказались отключены от сети». В компании добавили, что они создают «мегасуперноды» для того, чтобы возобновить работу сети в полном объеме.

Представитель Skype в России Арсений Расторгуев подтвердил CNews, что причиной неполадок в сети Skype стало отключение большого количества узловых серверов. По его словам, сигналом о неполадках для команды Skype стало падение числа онлайн-ользователей. Расторгуев отметил, что на момент написания этого материала в сети Skype находится примерно 4,5 млн пользователей, в то время, как обычно, когда в Москве утро, их бывает около 10 млн.

Эксперты считают, что полностью восстановить работу Skype будет нелегко. «Похоже что что-то сломалось в протоколе Skype, причем именно на уровне перенаправления звонков. Сложность в том, что сеть не управляется централизовано. И, судя по описанному Skype пути решения, возможность централизованного решения проблемы в протокол изначально не заложена, - говорит Вячеслав Борилин, генеральный директор компании "Видеомост". - Теперь для того, чтобы «научить» компьютеры пользователей снова ходить и соединяться, надо сделать что-то, чтобы алгоритм, заложенный в каждый Skype, установленный на каждом компьютере, сам «смог догадаться» куда ему теперь ходить».

Представители Skype стараются держать пользователей в курсе событий через Twitter. Опубликованное ночью сообщение говорит о том, что «Работа Skype начала нормализовываться». Однако по истечении десяти часов, согласно сообщению, опубликованному несколько минут назад, в мире по-прежнему остаются пользователи, у которых доступ к сети отсутствует.


Читайте также


Комментарии от Disqus