АНАЛИЗ ИНТЕРНЕТ ТРАФИКА НА ОСНОВЕ ПОТОКОВЫХ ТЕХНОЛОГИЙ Ф. Афанасьев, А. Петров ЗАО «СамараТелеком», Аэродромная 45, Самара s: W. Daly, HEAnet ltd., Dublin4, Ireland А. Сухов Лаборатория сетевых технологий, Самарская государственная академия путей сообщения, 1ый Безымянный пер., 18, Самара,
Величины, применяемые для оценки качества сети: уровень загрузки канала время прохождения пакета между двумя удаленными точками. RTT = 2 * OWD потери пакетов при передаче изменения во времени доставки пакетов (IP packet delay variation – ipdv) Последние три величины используются для описания качества соединения между двумя удаленными точками (end-to-end connection). В этой работе мы исследуем качество связи на Интернет магистрали, одного участка между двумя маршрутизаторами (hop).
Обычно, сервис-провайдеры, например Sprint, применяют правило 50%: C. Fraleigh, S. Moon, C. Diot, B. Lyles and F. Tobagi, Packet-level Traffic Measurements from a Tier-1 Backbone, Sprint ATL Technical Report, TR01-ATL , November 2001 Если среднесуточная загрузка каналов на магистрали не превышает 50%, то считается, что не возникает никаких проблем с качеством связи. Однако в России внутри российские магистральные каналы перегружены из-за их дороговизны и просто недостатка. Проследить региональным операторам связи, как у того или иного общероссийского провайдера (РТК-Интернет (Ростелеком), ТрансТелеКом, Глобал один и ГолденТелеком) загружена магистраль невозможно. Правило 50% при присоединении регионального оператора к магистральному узлу соблюдается, а качество связи низкое из-за перегрузки магистрали.
Магист- ральный маршру- тизатор в регионе CmCm Магистральный канал C1C1 к ISP1 C2C2 к ISP2 CnCn к ISPn
Для мониторинга качества сетевых соединений мы разработали свой метод, основанный на потоковых технологиях (flow). Под потоком (flow, 5-tuple) понимают процесс передачи пакетов между двумя удаленными точками, характеризующийся одинаковыми IP адресами источника и места назначения, портами и одним и тем же номером протокола. Другими словами – это обычные TCP или UDP сессии, например, перекачка по ftp файла и т.д. Имеется еще одна разновидность flow, by prefix. Его определение – поток пакетов направленных на /24 адресное пространство (на класс С адресов).
Cisco NetFlow, IETF RTFM – Real-Time Flow Measurement Поддержку NetFlow включили все ведущие производители оборудования. Часто используется для построения биллинговых систем, в частности, в «СамараТелеком» В научно-образовательных сетях соответствующее ПО часто не настроено, так как нет задачи детального представления о трафике для нужд биллинга. Мы использовали две экспериментальные площадки – ЗАО «СамараТелеком» HEAnet ltd – Ирландскую научно-образовательную сеть
Модель трафика, базирующаяся на основе потоков: C. Barakat, P. Thiran, G. Iannaccone, C. Diot, P. Owezarski, A Flow- based Model of Internet backbone Traffic, IEEE Transactions on Signal Processing – SI on SP in Networking, 51(8), pp , 2003 В этой работе доказано, что все важнейшие характеристики трафика можно описать при помощи трех переменных: - величина, обратная интервалу между появлением новых потоков [1/s] - средний размер потока [Kb] - средняя величина отношения квадрата размера потока к его длительности [Kb 2 /s]
Важнейшие характеристики трафика: Процесс описания трафика с помощью потоков можно рассматривать как однородный Пуассоновский процесс: можно рассматривать как постоянную для 30 мин. интервалов. Однако, все основные выражения не изменятся, если процесс появления новых потоков считать Марковским или неоднородным Пуассоновским. - распределение потоков по размеру - распределение длительности потоков - время появления n-го потока - iid последовательности
M. Crovella and A. Bestavos, Self-similarity in world wide web traffic: Evidence and possible cause. In Proceedings of ACM SIGMETRICS96, 1996 V. Paxson and S. Floyd, Wide-area traffic: The failure of Poisson, IEEE/ACM Trans. Networking, 3(3), 1995, pp
Для описания каждого потока вводится специальная функция (shot): Поток называется активным в момент времени t, если Обозначим скорость потока (bit/s) как = 0, при и - суммарная скорость передачи данных на исследуемом участке Последнее уравнение может описывать число активных потоков, если при Процесс
Модель Barakat et al позволяет вычислить для слабо загруженных участков сети следующие величины: среднюю скорость передачи данных отклонение от средней скорости В то же время справедлив закон Литтла, показывающий число активных потоков в канале, независимо от загрузки сети
загрузка сети Число активных потоков 100% Конец рабочего участка Точка перегрузки идеальное состояние реальное состояние Сетевые состояния на уровне потоков:
Доверительный интервал для рабочего участка сети: Гауссово распределение для - средняя скорость потока - выражение для скорости ПД на исследуемом участке сети. N – число активных потоков
Методика тестирования: «СамараТелеком», Cisco 7206 sh ip cache flow sh int [название интерфейса] HEAnet, GSR router, Cisco enable attach slot-number show ip cache flow В «СамараТелеком» данные снимались раз в полчаса, В HEAnet каждые 5 минут в течение 72 часов
Полученные результаты (СамараТелеком): 4 E1 потока (по Mbps) к разным провайдерам (ТрансТелеком, Спринт, ГолденТелеком) Средняя скорость на поток – 1400 bit/s При загрузке > 45% начинаются потери качества Правило 50% не действует
Полученные результаты (HEAnet): Исследуемый поток – STM1 до GEANT Средняя скорость на поток bit/s Малые загрузки сети А(0.01)=10
Доверительные интервалы:
Планируемые исследования: Тестирование высокоскоростных сетей STM4, STM16, STM64 Оценка качества end-to-end соединений