video digital 3 teórico

33
Instituto de Cências Sociais 1. TÉCNICAS DE COMPRESSÃO DE VÍDEO DIGITAL 2. INTEGRIDADE DOS DADOS E ÂMBITO DA COMPRESSÃO 3. CODECS E FORMATOS A consultar: Wooton, C. (2005). “Choosing The Right CODEC”, in A Practical Guide to Video and Audio Compression. Focal Press, p. 171-185. Wooton, C. (2005). “How Encoders Work”, in A Practical Guide to Video and Audio Compression. Focal Press, p. 187-193. Wikipedia (2015). Video Compression. Online [24.11.2015]. <URL = http://en.wikipedia.org/wiki/Video_compression> Wikipedia (2015). Motion JPEG. Online [24.11.2015]. <URL = http://en.wikipedia.org/wiki/Motion_JPEG> Wikipedia (2015). MPEG-1. Online [24.11.2015]. <URL = http://en.wikipedia.org/wiki/MPEG-1> 09

Upload: gisa-coimbra

Post on 29-Jan-2016

4 views

Category:

Documents


0 download

DESCRIPTION

video digital

TRANSCRIPT

Page 1: video digital 3 teórico

Instituto de Cências Sociais

1. TÉCNICAS DE COMPRESSÃO DE VÍDEO DIGITAL 2. INTEGRIDADE DOS DADOS E ÂMBITO DA COMPRESSÃO 3. CODECS E FORMATOS A consultar: Wooton, C. (2005). “Choosing The Right CODEC”, in A Practical Guide to Video and Audio Compression. Focal Press, p. 171-185.

Wooton, C. (2005). “How Encoders Work”, in A Practical Guide to Video and Audio Compression. Focal Press, p. 187-193.

Wikipedia (2015). Video Compression. Online [24.11.2015]. <URL = http://en.wikipedia.org/wiki/Video_compression>

Wikipedia (2015). Motion JPEG. Online [24.11.2015]. <URL = http://en.wikipedia.org/wiki/Motion_JPEG>

Wikipedia (2015). MPEG-1. Online [24.11.2015]. <URL = http://en.wikipedia.org/wiki/MPEG-1>

09

Page 2: video digital 3 teórico

Instituto de Cências Sociais

1. Técnicas de Compressão de Vídeo Digital

Page 3: video digital 3 teórico

Instituto de Cências Sociais

a compressão

vídeo

Tal como no áudio, a escolha do formato de compressão vídeo é a busca do melhor compromisso possível entre:

Qualidade (de imagem/som)

Fluidez de dados do videostream (optimização do data-rate)

Tamanho de ficheiro

A compressão faz-se através da aplicação de CODECs de vídeo, que são técnicas (ou um conjunto de técnicas combinadas) que visam a compressão e descompressão de informação vídeo.

Normalmente também está associado a um CODEC áudio

Como no áudio, há CODECS que actuam ao nível de hardware e outros ao nível do software, sendo os primeiros, por regra, os mais eficazes, mas mais caros

Page 4: video digital 3 teórico

Instituto de Cências Sociais

2. Integridade dos Dados e Âmbito da Compressão

Page 5: video digital 3 teórico

Instituto de Cências Sociais

técnicas de compressão

vídeo

Há dois aspectos essenciais para analisar as técnicas de compressão de vídeo digital:

• A integridade dos dados; e

• O âmbito da compressão.

Page 6: video digital 3 teórico

Instituto de Cências Sociais

integridade dos dados

Do ponto de vista da integridade dos dados, as técnicas de compressão dividem-se em:

Lossless: não há perdas irreversíveis

Ex: RLE (Run-Lenght Encoding). Cada frame é recodificada de modo a “eliminar” da representação binária zonas contínuas da mesma cor

Lossy: há perdas irreversíveis, mas que se tenta não serem perceptíveis ou que o sejam pouco

Page 7: video digital 3 teórico

Instituto de Cências Sociais

integridade dos dados

As técnicas lossless são relativamente eficazes apenas em situações não foto-realistas.

Podem reduzir a 50% o tamanho original de ficheiros contendo ilustrações animadas

As técnicas lossy podem reduzir a 10% o tamanho original de ficheiro.

ATENÇÃO: (tal como no áudio) sempre que há recompressão as perdas de qualidade aumentam

Page 8: video digital 3 teórico

Instituto de Cências Sociais

âmbito da compressão

Do ponto de vista do âmbito da compressão, as técnicas dividem-se em:

Espacial ou intraframe: actua em cada frame, não analisando a sua relação com outras frames.

Temporal ou interframe: relaciona cada frame com outras da mesma sequência, analisando as diferenças que ocorrem ao longo do tempo.

Page 9: video digital 3 teórico

Instituto de Cências Sociais

compressão espacial

As técnicas de compressão espacial analisam cada frame do vídeo individualmente, criando apenas sequências de imagens comprimidas.

São, por isso, independentes da quantidade de movimento do vídeo, que assim não acarreta efeitos indesejados.

Estas técnicas têm origem na compressão de imagens estáticas (JPEG, GIF, TIF), sendo de edição mais fácil e rápida mas produzindo ficheiros maiores.

Ex: Motion JPEG, usado em câmaras de vigilância

Microsoft RLE

São técnicas que tanto podem se lossy como lossless, dependendo da implementação.

Page 10: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal

As técnicas de compressão temporal (interframe) analisam as diferenças que se verificam na sucessão de imagens, eliminando as redundâncias encontradas. Assim, são sempre técnicas lossy.

São dependentes da quantidade de movimento do vídeo, o que acaba por provocar efeitos indesejados no cálculo das frames intermédias de cenas com muito movimento.

Ex: MPEG-1, MPEG-2, WMV, H.264

As técnicas interframe são cada vez mais sofisticadas, combinando 4 tipos de frames/imagens:

• I-Frames

• P-Frames

• B-Frames

• D-Frames (tendem a desaparecer)

Importa percebermos a função de cada um destes tipos de frame.

Page 11: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

i-frames vídeo digital original – 5 MB

vídeo digital com compressão – 200 KB

Page 12: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

i-frames

As Intra-Frames (keyframes ou i-frames) são imagens independentes, pois podem ser descodificadas independentemente de qualquer outra. Assim, cada i-Frame resulta de uma frame original que sofreu compressão espacial (lossy ou lossless).

As técnicas lossless baseiam-se na utilização apenas de i-frames com compressão lossless.

A evolução das técnicas levou a que entre duas i-frames se encontrem imagens (as p-frames) que são calculadas com base em técnicas preditivas e que tomam as i-frames como referência.

Quando fazemos fast-forward só vemos i-frames.

Page 13: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

i-frames

O número de frames existente entre duas i-frames consecutivas chama-se GOP-Size (Group Of Pictures) e tem impacto na qualidade do vídeo, mas também no tamanho do ficheiro.

Ex: o MPEG-1 usa GOP-Size=15 (PAL) a 18 (NTSC) (1 i-frame para 14 a 17 não i-frames)

Page 14: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

p-frames vídeo digital original – 5 MB

vídeo digital com compressão – 60 KB

Page 15: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

p-frames

As P-Frames (Predicted Frames ou Forward-Predicted-Frames) são imagens codificadas tomando a i-frame anterior ( assim designada anchor-frame) como referência.

Mais recentemente a anchor-frame pode também ser a P-Frame anterior.

Na compressão, apenas as diferenças entre uma p-frame e a anchor-frame de referência são guardadas no ficheiro (direcção e distância são calculadas por vectores de movimento).

No momento da descodificação (quando queremos ver o vídeo) toma-se a anchor-frame e ‘soma-se’ a p-frame para calcular a frame correspondente.

Esta técnica acarreta efeitos indesejáveis quando há mudanças drásticas no vídeo codificado (ex: movimentos rápidos na acção).

Têm sido desenvolvidas técnicas que procuram minorar esses efeitos, designadas por motion compensation.

Page 16: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

b-frames

vídeo digital original – 5 MB

vídeo digital com compressão – 48 KB

Page 17: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

b-frames

As B-Frames (Bidirectional Frames ou Backwards-Predicted Frames) são imagens cuja codificação resulta da comparação entre a frame a codificar e a i-frame anterior ou a p-frame posterior. Tem, assim, duas anchor-frames como referência, mas guarda apenas a menor das diferenças verificadas, que vai servir, na descodificação, para a reconstrução dessa imagem.

Esta técnica consegue realizar previsões baseadas nas anchor-frames anterior e posterior, mas a descodificação implica que os dados sejam lidos em avanço para que a p-frame possa ser conhecida antes do cálculo de cada b-frame.

Esta técnica é de complexa computação, mas obtém ficheiros mais compactos e permite mais facilmente o video-reverse;

Foi uma técnica inicialmente bastante controversa, mas progressivamente mais implementada.

Page 18: video digital 3 teórico

Instituto de Cências Sociais

compressão temporal: as

d-frames

As D-Frames são imagens de muito baixa qualidade guardadas no ficheiro para efeitos de fast-preview.

As d-frames nunca são usadas na sequência em movimento e nunca são referenciadas por frames I-, P- ou B-

Nas novas técnicas de compressão não são usadas d-frames, pois o fast-preview obtém-se por descompressão de i-frames, dado o aumento do potencial do hardware.

Page 19: video digital 3 teórico

Instituto de Cências Sociais

critérios de uso de i-, p- e

b-frames

Técnicas de compressão baseadas (exclusivamente) em i-frames

• Menos compressão

• Codificação e descodificação muito rápidas

• São técnicas tendencialmente simétricas (o tempo de compressão é muito semelhante ao de descompressão)

• Maior facilidade de edição

• Data-rate estimado de 1 bit por pixel, em cada frame

Page 20: video digital 3 teórico

Instituto de Cências Sociais

critérios de uso de i-, p- e

b-frames

Técnicas de compressão baseadas em i-frames e p-frames

• Compressão moderada.

• Codificação e descodificação mais lentas - tendencialmente com codificação mais lenta que descodificação.

• Atraso nas transmissões em directo.

• Alguma facilidade de edição.

• Data-rate estimado de 0,1 bit por pixel, em cada frame

Page 21: video digital 3 teórico

Instituto de Cências Sociais

critérios de uso de i-, p- e

b-frames

Técnicas de compressão baseadas em i-frames, p-frames e b-frames

• Compressão elevada e eficaz.

• Codificação e descodificação lentas, sendo a codificação extremamente lenta.

• A descodificação exige grande quantidade de memória, para ler em avanço as p-frames e assim poder calcular as b-frames.

• Não indicado para vídeo-telefonia ou videoconferência.

• Maior dificuldade de edição.

• Data-rate estimado de 0,015 bit por pixel, em cada frame

Page 22: video digital 3 teórico

Instituto de Cências Sociais

3. CODECs e Formatos

Page 23: video digital 3 teórico

Instituto de Cências Sociais

CODEC vs formato

Um CODEC é o conjunto de regras de compressão (no render) e descompressão (na leitura).

Ex: MPEG-2, H.264, DIVX

Um formato (ou container) é uma implementação específica de informação vídeo, que usa um dado CODEC. Daí a possível confusão.

Ex: MKV, AVI, VOB, …

A diversidade de formatos (uns mais abertos que outros) deve-se à guerra comercial entre fabricantes de software e hardware, que tentam impor o seu standard.

Page 24: video digital 3 teórico

Instituto de Cências Sociais

CODECs Ao longo dos tempos, diversas ‘famílias’ de CODECs se têm imposto como dominantes. As principais são:

• MPEG

• Windows Media

• QuickTime

• DivX

Page 25: video digital 3 teórico

Instituto de Cências Sociais

MPEG MPEG-1

O primeiro CODEC MPEG. Teve a virtude de ser o primeiro CODEC vídeo com compressão largamente difundido.

MPEG-2

Provavelmente o CODEC vídeo mais popular de sempre, a julgar pelo elevado nº de implementações (Ex: DVD-vídeo)

Alguns formatos que o implementaram: mpg, vob

Page 26: video digital 3 teórico

Instituto de Cências Sociais

MPEG MPEG-4

É um conjunto enorme de standards de codificação de conteúdos áudio, vídeo e multimédia.

É uma colecção de aproximadamente 20 componentes autónomos de codificação, desenhados para inter-operarem entre si.

Por isso, ao referirmos MPEG-4 é necessário identificar o componente desejado, para evitar ambiguidades.

Vejamos os principais componentes.

Page 27: video digital 3 teórico

Instituto de Cências Sociais

MPEG MPEG-4 – Parte 2

É o componente do MPEG-4 que originalmente especificou a codificação vídeo.

Tem vindo progressivamente a ser substituído pelo MPEG-4 parte 10, fruto da melhoria que este apresenta nas taxas de compressão.

Quando se refere MPEG4, sem mais, normalmente queremos indicar MPEG-4 parte 2.

Page 28: video digital 3 teórico

Instituto de Cências Sociais

MPEG MPEG-4 – Parte 10

É um sistema de codificação vídeo muito avançado e a sua importância tem sido crescente, tendo já um grande impacto na disseminação de vídeo.

É, nesta altura, o preferido para vídeo em alta definição (HD), mas é menos eficaz que o MPEG-4 parte 2 no que respeita a operações com transparência.

AVC (Advanced Video Coding) e H.264 são duas outras designações que identificam o standard associado a este CODEC.

O H.264 é usado em Blu-Ray e é a base do AVCHD (formato proprietário da Sony/Panasonic).

Page 29: video digital 3 teórico

Instituto de Cências Sociais

MPEG MPEG-4 – Parte 10

Hoje em dia, quase todos os ficheiros com a extensão mp4 usam este CODEC, que pode ainda ser usado por muitos outros formatos.

Ex: mkv, mov, TDT, flv, 3gpp, divx, avi …

Foi desenvolvido pela JVT – Joint Video Team, uma união de esforços da ISO-MPEG (Moving Picture Experts Group) e da ITU (International Telecommunication Union). Por essa razão, este standard pode ainda ser referido como JVT Video Codec.

A Microsoft foi pioneira na sua exploração comercial.

Page 30: video digital 3 teórico

Instituto de Cências Sociais

windows media

Windows AVI (audio-video interleaved)

Foi a primeira especificação vídeo da Microsoft, originalmente sem compressão.

Mas numa segunda fase, o AVI passou a ser o formato de vídeo do Windows, passando a usar CODECS proprietários Microsoft (RLE, por exemplo).

Actualmente é um formato capaz de lidar com diferentes CODECS de outros fabricantes (MPEG4-2, H.264, DIVX …).

Page 31: video digital 3 teórico

Instituto de Cências Sociais

windows media

Windows Media Series 9

Terminologia original, prévia à parceria com a SMPTE, que levou a que, uma vez transformado em standard, tenha passado a designar-se VC1 ou VC-1, tal como é conhecido hoje em dia.

Uma abreviatura muito usada é WM9 e é uma evolução de uma sequência iniciada com WM6.5, tendo passado sucessivamente por WM7 e WM8.

Está em (lento) desenvolvimento o WM10.

É o único CODEC suportado na plataforma Silverlight (que a RTP usa, por exemplo).

Page 32: video digital 3 teórico

Instituto de Cências Sociais

quicktime Quicktime

Originalmente era a especificação vídeo (sem compressão) proprietária da Apple MacIntosh – ficheiros mov.

Actualmente mov é um formato capaz de integrar diversos CODECS de vídeo, áudio, imagem e animação.

Desde a versão QuickTime 7 passou a integrar o CODEC H.264 (excepto AVCHD).

Page 33: video digital 3 teórico

Instituto de Cências Sociais

CODECS Algumas aplicações