QoS — Qualidade de Serviço em Redes Cisco
O que é
QoS (Quality of Service) é um conjunto de mecanismos que permitem a um dispositivo de rede tratar pacotes de forma diferenciada. Em vez de encaminhar tudo na mesma fila sem distinção, o roteador ou switch identifica o tipo de tráfego, classifica sua importância e decide quem passa primeiro, quem espera e quem pode ser descartado em caso de congestionamento.
O conceito surgiu da necessidade de compartilhar a mesma infraestrutura IP entre aplicações com requisitos radicalmente diferentes: uma ligação VoIP exige que cada pacote de áudio chegue em tempo real, enquanto um backup noturno pode esperar vários segundos sem problema. Sem QoS, ambos competem igualmente pela banda — e a ligação de voz paga o preço.
Como funciona
Por que QoS existe: os quatro inimigos do tráfego sensível
| Característica | Definição | Limite recomendado (voz interativa) |
|---|---|---|
| Banda (bandwidth) | Capacidade total do enlace (Mbps) | Reservar mínimo por classe |
| Delay (latência) | Tempo de ponta a ponta | ≤ 150 ms (one-way) |
| Jitter | Variação no delay entre pacotes | ≤ 30 ms |
| Perda (loss) | % de pacotes que não chegam | ≤ 1% |
Quando a rede está congestionada e as filas enchem, pacotes excedentes são descartados — fenômeno chamado tail drop. O pior efeito do tail drop é a sincronização TCP global: todos os fluxos TCP reduzem a janela ao mesmo tempo, subcarregam a rede, depois aumentam juntos, congestionam novamente — um ciclo de ondas de subutilização e congestionamento.
Para evitar isso, usa-se RED (Random Early Detection): pacotes são descartados aleatoriamente antes de a fila encher, de forma que apenas alguns fluxos reduzam a taxa, sem sincronismo global. A versão aprimorada, WRED (Weighted RED), permite configurar qual classe de tráfego começa a ser descartada primeiro — tráfego de menor prioridade é eliminado mais cedo.
Classificação e Marcação
Para diferenciar o tratamento, o dispositivo precisa primeiro identificar o tipo de tráfego. Isso é feito por meio de:
- ACL — identifica tráfego por IP/porta de origem/destino
- NBAR — inspeção profunda de pacotes (DPI) até camada 7, útil para identificar aplicações que usam portas dinâmicas
Após classificar, o dispositivo marca o pacote inserindo um valor em campos específicos do cabeçalho:
CoS / PCP (Camada 2 — tag 802.1Q)
O campo PCP (Priority Code Point), também chamado CoS (Class of Service), tem 3 bits na tag 802.1Q. Funciona apenas em enlaces trunk ou em portas com Voice VLAN configurada.
| Valor PCP | Tipo de tráfego |
|---|---|
| 0 | Best effort (padrão) |
| 3 | Sinalização de voz (call setup) |
| 4 | Vídeo |
| 5 | Voz (áudio RTP) |
Limitação importante: como depende da tag 802.1Q, o CoS não existe em enlaces WAN ou entre roteadores sem VLAN — nesses casos, usa-se marcação de camada 3.
IP Precedence (legado — 3 bits no byte TOS)
Predecessor do DSCP, com apenas 8 valores (0–7). IPP 5 = voz, IPP 4 = vídeo, IPP 0 = best effort. Presente em equipamentos mais antigos.
DSCP (Camada 3 — 6 bits no byte TOS)
O DSCP (Differentiated Services Code Point) usa 6 bits, dando 64 valores possíveis. É o padrão atual. Existem três conjuntos de marcações:
DF — Default Forwarding
- DSCP 0 (000000) — tráfego sem requisito especial
EF — Expedited Forwarding
- DSCP 46 (101110) — tráfego com baixíssimo delay, jitter e perda; tipicamente voz RTP
AF — Assured Forwarding
- 4 classes de prioridade (1–4, sendo 4 a mais alta) × 3 níveis de descarte (1–3, sendo 3 o maior risco de descarte)
- Notação: AFXY — X = classe, Y = descarte
- Fórmula de cálculo do valor decimal: 8X + 2Y
| AF | DSCP decimal | Uso recomendado |
|---|---|---|
| AF41 | 34 | Vídeo interativo (melhor) |
| AF43 | 38 | Vídeo interativo (pior) |
| AF31 | 26 | Streaming de vídeo |
| AF21 | 18 | Dados de alta prioridade |
| AF11 | 10 | Dados de baixa prioridade |
CS — Class Selector
- Compatibilidade retroativa com IPP: CSn = DSCP 8×n
- CS0=0, CS1=8, CS2=16, CS3=24, CS4=32, CS5=40, CS6=48, CS7=56
Resumo de marcações recomendadas (RFC 4954)
| Tipo de tráfego | Marcação recomendada | DSCP decimal |
|---|---|---|
| Voz (áudio RTP) | EF | 46 |
| Vídeo interativo | AF4x | 34–38 |
| Streaming de vídeo | AF3x | 26–30 |
| Dados importantes | AF2x | 18–22 |
| Best effort | DF | 0 |
Trust Boundary (Fronteira de Confiança)
Define onde os roteadores e switches confiam nas marcações dos pacotes recebidos. Se o tráfego vem de fora da fronteira, o dispositivo ignora (ou sobrescreve) as marcações originais.
Prática recomendada para redes com IP phones:
- Confiar nas marcações do telefone IP — ele marca corretamente a voz como EF/CoS5
- Não confiar nas marcações do PC — usuários avançados poderiam marcar tráfego comum como EF para furar a fila
A fronteira de confiança é configurada na porta do switch onde o telefone está conectado.
Filas de Saída e Escalonamento
Quando o roteador recebe mais pacotes do que consegue encaminhar por uma interface, os pacotes vão para a fila daquela interface.
FIFO — Padrão; primeiro que entra, primeiro que sai. Sem diferenciação de prioridade.
CBWFQ (Class-Based Weighted Fair Queuing) — Múltiplas filas por classe de tráfego. Um escalonador round-robin ponderado garante a cada fila um percentual mínimo de banda mesmo durante congestionamento.
LLQ (Low Latency Queuing) — Acrescenta ao CBWFQ uma fila de prioridade estrita: enquanto houver pacotes nessa fila, o escalonador sempre a esgota antes de servir as demais. Ideal para voz e vídeo. Risco: pode "matar de fome" outras filas se houver excesso de tráfego prioritário — por isso é comum usar policing junto com LLQ.
Policing vs Shaping
Ambos limitam a taxa de tráfego, mas de maneiras diferentes:
| Característica | Policing | Shaping |
|---|---|---|
| O que faz com o excesso | Descarta (ou remarca) | Enfileira (bufferiza) |
| Efeito no delay | Nenhum (descarte imediato) | Aumenta delay (fila extra) |
| Onde é mais usado | Borda de operadora (ISP) | Borda do cliente (CPE) |
| Suavidade do tráfego | Tráfego "picotado" | Tráfego suavizado |
Exemplo prático: Uma empresa de SP contrata 300 Mbps de um ISP, mas a interface física é de 1 Gbps. O ISP faz policing na entrada — todo tráfego acima de 300 Mbps é descartado. O roteador do cliente faz shaping na saída — bufferiza os pacotes que passariam de 300 Mbps para enviá-los de forma ordenada, evitando descarte no ISP.
PHB — Per-Hop Behavior
O QoS é configurado salto a salto (per-hop). Marcar um pacote com EF no roteador de borda de SP não garante que o próximo hop (roteador de outro ISP ou do cliente) vai tratá-lo com prioridade — cada dispositivo precisa ter sua própria política configurada. Por isso, acordos de nível de serviço (SLAs) entre ISPs incluem compromissos de PHB para que a marcação seja respeitada em todo o caminho.
Na prática
Cenário real: imagine o link WAN de uma filial em Campinas conectada à matriz em São Paulo via link de 50 Mbps contratado. Durante o horário de pico, colaboradores fazem backup de arquivos grandes via FTP ao mesmo tempo em que equipes de vendas realizam reuniões pelo Webex.
Sem QoS, o backup pode consumir 40 Mbps e deixar apenas 10 Mbps para as chamadas de vídeo — resultado: travamentos, áudio cortado e reuniões improdutivas.
Com QoS configurado no roteador da filial:
- Tráfego Webex é identificado pelo NBAR e marcado como EF (voz) e AF41 (vídeo)
- FTP é marcado como AF11 (baixa prioridade)
- LLQ garante que EF saia imediatamente
- CBWFQ reserva 20% da banda para AF41
- FTP usa apenas o que sobrar
Comandos IOS (estrutura MQC — Modular QoS CLI):
! Passo 1: identificar o tráfego
class-map match-any VOZ_MAP
match protocol rtp
class-map match-any VIDEO_MAP
match protocol webex
class-map match-any FTP_MAP
match protocol ftp
! Passo 2: definir ações
policy-map WAN_SAIDA
class VOZ_MAP
set ip dscp ef
priority percent 20
class VIDEO_MAP
set ip dscp af41
bandwidth percent 20
class FTP_MAP
set ip dscp af11
bandwidth percent 5
! Passo 3: aplicar na interface
interface GigabitEthernet0/0
service-policy output WAN_SAIDA Por que cai no exame
O CCNA 200-301 cobra QoS no exam topic 4.7. Os pontos mais frequentes nas provas são:
- Valores DSCP: EF = 46, DF = 0, fórmula AF (8X+2Y), CS = 8×n
- Diferença policing × shaping — policing descarta, shaping bufferiza
- LLQ × CBWFQ — LLQ tem fila de prioridade estrita, CBWFQ usa round-robin ponderado
- WRED × RED — WRED descarta por classe (ponderado), RED descarta aleatoriamente sem distinção
- Trust boundary — confiar em IP phone, não confiar em PC
- Padrões de delay/jitter/loss para voz: 150 ms / 30 ms / 1%
- TCP global synchronization — causada por tail drop, evitada por RED/WRED
- PHB — QoS funciona hop a hop, não de ponta a ponta automaticamente
A prova não exige configuração, mas exige entendimento de conceitos, valores e comparações entre as técnicas.
Resumo em uma linha
QoS é o conjunto de ferramentas que garante que voz e vídeo não percam para o download do estagiário numa rede congestionada — usando classificação, marcação DSCP, filas priorizadas (LLQ/CBWFQ) e controle de taxa (policing/shaping) salto a salto.