M5 · Serviços de Rede

QoS — Qualidade de Serviço em Redes Cisco

O que é

QoS (Quality of Service) é um conjunto de mecanismos que permitem a um dispositivo de rede tratar pacotes de forma diferenciada. Em vez de encaminhar tudo na mesma fila sem distinção, o roteador ou switch identifica o tipo de tráfego, classifica sua importância e decide quem passa primeiro, quem espera e quem pode ser descartado em caso de congestionamento.

O conceito surgiu da necessidade de compartilhar a mesma infraestrutura IP entre aplicações com requisitos radicalmente diferentes: uma ligação VoIP exige que cada pacote de áudio chegue em tempo real, enquanto um backup noturno pode esperar vários segundos sem problema. Sem QoS, ambos competem igualmente pela banda — e a ligação de voz paga o preço.


Como funciona

Por que QoS existe: os quatro inimigos do tráfego sensível

Característica Definição Limite recomendado (voz interativa)
Banda (bandwidth) Capacidade total do enlace (Mbps) Reservar mínimo por classe
Delay (latência) Tempo de ponta a ponta ≤ 150 ms (one-way)
Jitter Variação no delay entre pacotes ≤ 30 ms
Perda (loss) % de pacotes que não chegam ≤ 1%

Quando a rede está congestionada e as filas enchem, pacotes excedentes são descartados — fenômeno chamado tail drop. O pior efeito do tail drop é a sincronização TCP global: todos os fluxos TCP reduzem a janela ao mesmo tempo, subcarregam a rede, depois aumentam juntos, congestionam novamente — um ciclo de ondas de subutilização e congestionamento.

Para evitar isso, usa-se RED (Random Early Detection): pacotes são descartados aleatoriamente antes de a fila encher, de forma que apenas alguns fluxos reduzam a taxa, sem sincronismo global. A versão aprimorada, WRED (Weighted RED), permite configurar qual classe de tráfego começa a ser descartada primeiro — tráfego de menor prioridade é eliminado mais cedo.


Classificação e Marcação

Para diferenciar o tratamento, o dispositivo precisa primeiro identificar o tipo de tráfego. Isso é feito por meio de:

  • ACL — identifica tráfego por IP/porta de origem/destino
  • NBAR — inspeção profunda de pacotes (DPI) até camada 7, útil para identificar aplicações que usam portas dinâmicas

Após classificar, o dispositivo marca o pacote inserindo um valor em campos específicos do cabeçalho:

CoS / PCP (Camada 2 — tag 802.1Q)

O campo PCP (Priority Code Point), também chamado CoS (Class of Service), tem 3 bits na tag 802.1Q. Funciona apenas em enlaces trunk ou em portas com Voice VLAN configurada.

Valor PCP Tipo de tráfego
0 Best effort (padrão)
3 Sinalização de voz (call setup)
4 Vídeo
5 Voz (áudio RTP)

Limitação importante: como depende da tag 802.1Q, o CoS não existe em enlaces WAN ou entre roteadores sem VLAN — nesses casos, usa-se marcação de camada 3.

IP Precedence (legado — 3 bits no byte TOS)

Predecessor do DSCP, com apenas 8 valores (0–7). IPP 5 = voz, IPP 4 = vídeo, IPP 0 = best effort. Presente em equipamentos mais antigos.

DSCP (Camada 3 — 6 bits no byte TOS)

O DSCP (Differentiated Services Code Point) usa 6 bits, dando 64 valores possíveis. É o padrão atual. Existem três conjuntos de marcações:

DF — Default Forwarding

  • DSCP 0 (000000) — tráfego sem requisito especial

EF — Expedited Forwarding

  • DSCP 46 (101110) — tráfego com baixíssimo delay, jitter e perda; tipicamente voz RTP

AF — Assured Forwarding

  • 4 classes de prioridade (1–4, sendo 4 a mais alta) × 3 níveis de descarte (1–3, sendo 3 o maior risco de descarte)
  • Notação: AFXY — X = classe, Y = descarte
  • Fórmula de cálculo do valor decimal: 8X + 2Y
AF DSCP decimal Uso recomendado
AF41 34 Vídeo interativo (melhor)
AF43 38 Vídeo interativo (pior)
AF31 26 Streaming de vídeo
AF21 18 Dados de alta prioridade
AF11 10 Dados de baixa prioridade

CS — Class Selector

  • Compatibilidade retroativa com IPP: CSn = DSCP 8×n
  • CS0=0, CS1=8, CS2=16, CS3=24, CS4=32, CS5=40, CS6=48, CS7=56

Resumo de marcações recomendadas (RFC 4954)

Tipo de tráfego Marcação recomendada DSCP decimal
Voz (áudio RTP) EF 46
Vídeo interativo AF4x 34–38
Streaming de vídeo AF3x 26–30
Dados importantes AF2x 18–22
Best effort DF 0

Trust Boundary (Fronteira de Confiança)

Define onde os roteadores e switches confiam nas marcações dos pacotes recebidos. Se o tráfego vem de fora da fronteira, o dispositivo ignora (ou sobrescreve) as marcações originais.

Prática recomendada para redes com IP phones:

  • Confiar nas marcações do telefone IP — ele marca corretamente a voz como EF/CoS5
  • Não confiar nas marcações do PC — usuários avançados poderiam marcar tráfego comum como EF para furar a fila

A fronteira de confiança é configurada na porta do switch onde o telefone está conectado.


Filas de Saída e Escalonamento

Quando o roteador recebe mais pacotes do que consegue encaminhar por uma interface, os pacotes vão para a fila daquela interface.

FIFO — Padrão; primeiro que entra, primeiro que sai. Sem diferenciação de prioridade.

CBWFQ (Class-Based Weighted Fair Queuing) — Múltiplas filas por classe de tráfego. Um escalonador round-robin ponderado garante a cada fila um percentual mínimo de banda mesmo durante congestionamento.

LLQ (Low Latency Queuing) — Acrescenta ao CBWFQ uma fila de prioridade estrita: enquanto houver pacotes nessa fila, o escalonador sempre a esgota antes de servir as demais. Ideal para voz e vídeo. Risco: pode "matar de fome" outras filas se houver excesso de tráfego prioritário — por isso é comum usar policing junto com LLQ.


Policing vs Shaping

Ambos limitam a taxa de tráfego, mas de maneiras diferentes:

Característica Policing Shaping
O que faz com o excesso Descarta (ou remarca) Enfileira (bufferiza)
Efeito no delay Nenhum (descarte imediato) Aumenta delay (fila extra)
Onde é mais usado Borda de operadora (ISP) Borda do cliente (CPE)
Suavidade do tráfego Tráfego "picotado" Tráfego suavizado

Exemplo prático: Uma empresa de SP contrata 300 Mbps de um ISP, mas a interface física é de 1 Gbps. O ISP faz policing na entrada — todo tráfego acima de 300 Mbps é descartado. O roteador do cliente faz shaping na saída — bufferiza os pacotes que passariam de 300 Mbps para enviá-los de forma ordenada, evitando descarte no ISP.


PHB — Per-Hop Behavior

O QoS é configurado salto a salto (per-hop). Marcar um pacote com EF no roteador de borda de SP não garante que o próximo hop (roteador de outro ISP ou do cliente) vai tratá-lo com prioridade — cada dispositivo precisa ter sua própria política configurada. Por isso, acordos de nível de serviço (SLAs) entre ISPs incluem compromissos de PHB para que a marcação seja respeitada em todo o caminho.


Na prática

Cenário real: imagine o link WAN de uma filial em Campinas conectada à matriz em São Paulo via link de 50 Mbps contratado. Durante o horário de pico, colaboradores fazem backup de arquivos grandes via FTP ao mesmo tempo em que equipes de vendas realizam reuniões pelo Webex.

Sem QoS, o backup pode consumir 40 Mbps e deixar apenas 10 Mbps para as chamadas de vídeo — resultado: travamentos, áudio cortado e reuniões improdutivas.

Com QoS configurado no roteador da filial:

  1. Tráfego Webex é identificado pelo NBAR e marcado como EF (voz) e AF41 (vídeo)
  2. FTP é marcado como AF11 (baixa prioridade)
  3. LLQ garante que EF saia imediatamente
  4. CBWFQ reserva 20% da banda para AF41
  5. FTP usa apenas o que sobrar

Comandos IOS (estrutura MQC — Modular QoS CLI):

! Passo 1: identificar o tráfego
class-map match-any VOZ_MAP
 match protocol rtp
class-map match-any VIDEO_MAP
 match protocol webex
class-map match-any FTP_MAP
 match protocol ftp

! Passo 2: definir ações
policy-map WAN_SAIDA
 class VOZ_MAP
  set ip dscp ef
  priority percent 20
 class VIDEO_MAP
  set ip dscp af41
  bandwidth percent 20
 class FTP_MAP
  set ip dscp af11
  bandwidth percent 5

! Passo 3: aplicar na interface
interface GigabitEthernet0/0
 service-policy output WAN_SAIDA

Por que cai no exame

O CCNA 200-301 cobra QoS no exam topic 4.7. Os pontos mais frequentes nas provas são:

  1. Valores DSCP: EF = 46, DF = 0, fórmula AF (8X+2Y), CS = 8×n
  2. Diferença policing × shaping — policing descarta, shaping bufferiza
  3. LLQ × CBWFQ — LLQ tem fila de prioridade estrita, CBWFQ usa round-robin ponderado
  4. WRED × RED — WRED descarta por classe (ponderado), RED descarta aleatoriamente sem distinção
  5. Trust boundary — confiar em IP phone, não confiar em PC
  6. Padrões de delay/jitter/loss para voz: 150 ms / 30 ms / 1%
  7. TCP global synchronization — causada por tail drop, evitada por RED/WRED
  8. PHB — QoS funciona hop a hop, não de ponta a ponta automaticamente

A prova não exige configuração, mas exige entendimento de conceitos, valores e comparações entre as técnicas.


Resumo em uma linha

QoS é o conjunto de ferramentas que garante que voz e vídeo não percam para o download do estagiário numa rede congestionada — usando classificação, marcação DSCP, filas priorizadas (LLQ/CBWFQ) e controle de taxa (policing/shaping) salto a salto.