FMUSER Transmitir vídeo e áudio sem fio mais fácil!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanês
ar.fmuser.org -> árabe
hy.fmuser.org -> armênio
az.fmuser.org -> Azerbaijão
eu.fmuser.org -> Basco
be.fmuser.org -> bielorrusso
bg.fmuser.org -> búlgaro
ca.fmuser.org -> catalão
zh-CN.fmuser.org -> Chinês (simplificado)
zh-TW.fmuser.org -> chinês (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> dinamarquês
nl.fmuser.org -> holandês
et.fmuser.org -> estoniano
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandês
fr.fmuser.org -> francês
gl.fmuser.org -> galego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemão
el.fmuser.org -> grego
ht.fmuser.org -> crioulo haitiano
iw.fmuser.org -> hebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> húngaro
is.fmuser.org -> islandês
id.fmuser.org -> indonésio
ga.fmuser.org -> irlandês
it.fmuser.org -> italiano
ja.fmuser.org -> Japonês
ko.fmuser.org -> coreano
lv.fmuser.org -> letão
lt.fmuser.org -> Lituano
mk.fmuser.org -> macedônio
ms.fmuser.org -> malaio
mt.fmuser.org -> maltês
no.fmuser.org - norueguês
fa.fmuser.org -> persa
pl.fmuser.org -> polonês
pt.fmuser.org -> português
ro.fmuser.org -> romeno
ru.fmuser.org -> russo
sr.fmuser.org -> Sérvio
sk.fmuser.org -> Eslovaco
sl.fmuser.org -> esloveno
es.fmuser.org -> espanhol
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandês
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> vietnamita
cy.fmuser.org -> Galês
yi.fmuser.org -> iídiche
H.264, ou MPEG-4 Part Ten (AVC, Advanced Video Coding), é a última geração de padrões de compressão de vídeo lançados conjuntamente pelo International Telecommunication Standardization Department ITU-T e pela International Organization for Standardization ISO / IEC em 2003. Em Atualmente, o padrão H.264 é amplamente utilizado em monitoramento remoto de vídeo com / sem fio, mídia interativa de rede, TV digital e videoconferência, etc.
Nome chinês H.264 + alias MPEG-4 Parte 10 Horário padrão para compactação de vídeo de qualidade em 2003
índice
1 introdução básica
2 destaques técnicos
Comparação de desempenho 3
Edição de introdução básica
H.264 é um novo vídeo digital desenvolvido pela equipe de vídeo conjunta (JVT: equipe de vídeo conjunta) do VCEG (Video Coding Experts Group) da ITU-T e MPEG (Moving Picture Coding Experts Group) da ISO / IEC
Servidor de vídeo
Servidor de vídeo
Padrão de codificação, é ITU-T H.264 e ISO / IEC MPEG-4 Parte 10. A solicitação de rascunhos começou em janeiro de 1998. O primeiro rascunho foi concluído em setembro de 1999. O modelo de teste TML-8 foi desenvolvido em maio 2001. O conselho da FCD do H.264 foi aprovado na 5ª reunião da JVT em junho de 2002.. Lançado oficialmente em março de 2003. Como o padrão anterior, o H.264 também é um modo de codificação híbrido de DPCM mais codificação de transformação. No entanto, adota um design simples de "retorno ao básico", sem muitas opções, e obtém um desempenho de compressão muito melhor do que o H.263 ++; fortalece a adaptabilidade a vários canais, adota uma estrutura e sintaxe "amigáveis à rede", propício ao processamento de erros e perda de pacotes; uma ampla gama de objetivos de aplicação para atender às necessidades de diferentes velocidades, diferentes resoluções e diferentes ocasiões de transmissão (armazenamento); seu sistema básico é aberto e nenhum copyright é exigido para uso. Tecnicamente, há muitos destaques no padrão H.264, como codificação de símbolo VLC unificada, alta precisão, estimativa de deslocamento multimodo, transformação de inteiro com base em blocos 4 × 4 e sintaxe de codificação em camadas. Essas medidas fazem com que o algoritmo H.264 tenha uma eficiência de codificação muito alta, sob a mesma qualidade de imagem reconstruída, pode economizar cerca de 50% da taxa de código do que H.263. A estrutura de fluxo de código do H.264 tem forte adaptabilidade de rede, aumenta os recursos de recuperação de erros e pode se adaptar bem a aplicativos de rede IP e sem fio.
Destaque técnico edição
Design em camadas
O algoritmo H.264 pode ser conceitualmente dividido em duas camadas: a camada de codificação de vídeo (VCL: Video Coding Layer) é responsável pela representação eficiente do conteúdo de vídeo, e a camada de abstração da rede (NAL: Network Abstraction Layer) é responsável pela maneira apropriada exigido pela rede Empacote e transmita os dados. Uma interface baseada em pacotes é definida entre VCL e NAL, e o empacotamento e a sinalização correspondente são parte do NAL. Desta forma, as tarefas de alta eficiência de codificação e facilidade de rede são concluídas pela VCL e NAL respectivamente. A camada VCL inclui codificação híbrida de compensação de movimento baseada em bloco e alguns novos recursos. Como os padrões de codificação de vídeo anteriores, o H.264 não inclui funções como pré-processamento e pós-processamento no rascunho, o que pode aumentar a flexibilidade do padrão. O NAL é responsável por encapsular dados usando o formato de segmento da rede subjacente, incluindo enquadramento, sinalização de canais lógicos, utilização de informações de temporização ou sinais de fim de sequência. Por exemplo, o NAL oferece suporte a formatos de transmissão de vídeo em canais comutados por circuito e oferece suporte a formatos de transmissão de vídeo na Internet usando RTP / UDP / IP. O NAL inclui suas próprias informações de cabeçalho, informações de estrutura de segmento e informações de carga real, ou seja, os dados VCL da camada superior. (Se a tecnologia de segmentação de dados for usada, os dados podem consistir em várias partes).
Estimativa de movimento multimodo de alta precisão
O H.264 oferece suporte a vetores de movimento com precisão de 1/4 ou 1/8 pixel. Com precisão de 1/4 de pixel, um filtro de 6 torneiras pode ser usado para reduzir o ruído de alta frequência. Para vetores de movimento com precisão de 1/8 pixel, um filtro de 8 toques mais complexo pode ser usado. Ao realizar a estimativa de movimento, o codificador também pode escolher filtros de interpolação "aprimorados" para melhorar o efeito da previsão. Na previsão de movimento do H.264, um macro-bloco (MB) pode ser dividido em diferentes sub-blocos, como mostrado na Figura 2, formando tamanhos de bloco de 7 modos diferentes. Essa divisão detalhada e flexível multimodo é mais adequada para a forma dos objetos em movimento reais na imagem, o que melhora muito a precisão da estimativa de movimento. Desta forma, 1, 2, 4, 8 ou 16 vetores de movimento podem ser incluídos em cada macro bloco. No H.264, o codificador pode usar mais de um quadro anterior para a estimativa de movimento, que é a chamada tecnologia de referência de múltiplos quadros. Por exemplo, se 2 ou 3 quadros são apenas quadros de referência codificados, o codificador selecionará um quadro de predição melhor para cada macrobloco alvo e indicará para cada macrobloco qual quadro é usado para predição.
Transformação de inteiro
H.264 é semelhante ao padrão anterior, usando a codificação de transformação baseada em bloco para o residual, mas a transformação é uma operação de número inteiro em vez de uma operação de número real, e seu processo é basicamente semelhante ao DCT. A vantagem desse método é que a mesma transformação de precisão e transformação inversa são permitidas no codificador e no decodificador, e é conveniente usar operações de ponto fixo simples. Em outras palavras, não há "erro de transformação inversa". A unidade de transformação é blocos de 4 × 4, em vez dos blocos de 8 × 8 comumente usados no passado. À medida que o tamanho do bloco de transformação é reduzido, a divisão do objeto em movimento é mais precisa, de modo que não apenas a quantidade de cálculo de transformação é menor, mas o erro de convergência na borda do objeto em movimento também é bastante reduzido. A fim de fazer com que o método de transformação de bloco de tamanho pequeno não produza a diferença de tons de cinza entre os blocos na área lisa maior na imagem, o coeficiente DC de 16 blocos 4 × 4 dos dados de brilho do macrobloco intra-frame (cada bloco pequeno Um , um total de 16) realiza a segunda transformação de bloco 4 × 4 e executa a transformação de bloco 2 × 2 nos coeficientes DC de 4 blocos 4 × 4 de dados de crominância (um para cada bloco pequeno, 4 no total).
A fim de melhorar a capacidade de controle de taxa de H.264, a mudança do tamanho da etapa de quantização é controlada em cerca de 12.5%, em vez de um aumento constante. A normalização da amplitude do coeficiente de transformação é processada no processo de quantização inversa para reduzir a complexidade computacional. A fim de enfatizar a fidelidade da cor, um tamanho de etapa de quantização menor é adotado para o coeficiente de crominância.
VLC unificado
Existem dois métodos de codificação de entropia em H.264, um é usar VLC unificado (UVLC: VLC universal) para todos os símbolos a serem codificados e o outro é usar codificação aritmética binária adaptável ao conteúdo (CABAC: Context-Adaptive Binary Codificação aritmética). CABAC é opcional e seu desempenho de codificação é ligeiramente melhor do que UVLC, mas a complexidade computacional também é maior. O UVLC usa um conjunto de palavras de código de comprimento ilimitado e a estrutura do projeto é muito regular, e diferentes objetos podem ser codificados com a mesma tabela de códigos. Este método pode gerar facilmente uma palavra-código e o decodificador pode identificar facilmente o prefixo da palavra-código e o UVLC pode obter rapidamente a ressincronização quando ocorre um erro de bit.
Predição intra
Nos padrões da série H.26x anterior e da série MPEG-x, são usados métodos de predição entre quadros. No H.264, a previsão intra-frame está disponível ao codificar imagens Intra. Para cada bloco 4 × 4 (exceto para o tratamento especial do bloco de borda), cada pixel pode ser previsto com a soma ponderada diferente dos 17 pixels mais próximos codificados anteriormente (alguns pesos podem ser 0), ou seja, este pixel 17 pixels no canto superior esquerdo do bloco. Obviamente, esse tipo de previsão intra-frame não ocorre no tempo, mas sim em um algoritmo de codificação preditiva realizado no domínio espacial, que pode remover a redundância espacial entre blocos adjacentes e obter uma compressão mais eficaz.
Como mostrado na Figura 4, a, b, ..., p no quadrado 4 × 4 são 16 pixels a serem previstos, e A, B, ..., P são pixels que foram codificados. Por exemplo, o valor do ponto m pode ser previsto pela fórmula (J + 2K + L + 2) / 4, ou pela fórmula (A + B + C + D + I + J + K + L) / 8, etc. De acordo com os pontos de referência de predição selecionados, existem 9 modos diferentes para brilho, mas apenas 1 modo para predição intra de croma.
Para ambientes IP e sem fio
O draft H.264 contém ferramentas de eliminação de erros para facilitar a transmissão de vídeo compactado em um ambiente com erros frequentes e perda de pacotes, como a robustez da transmissão em canais móveis ou canais IP. A fim de resistir a erros de transmissão, a sincronização de tempo no fluxo de vídeo H.264 pode ser realizada usando atualização de imagem intra-frame e a sincronização espacial é suportada por codificação estruturada em fatias. Ao mesmo tempo, a fim de facilitar a ressincronização após um erro de bit, um certo ponto de ressincronização também é fornecido nos dados de vídeo de uma imagem. Além disso, a atualização do macrobloco intra-frame e os macroblocos de referência múltiplos permitem que o codificador considere não apenas a eficiência da codificação, mas também as características do canal de transmissão ao determinar o modo do macrobloco.
Além de usar a mudança do tamanho da etapa de quantização para se adaptar à taxa de código do canal, no H.264, o método de segmentação de dados é freqüentemente usado para lidar com a mudança da taxa de código do canal. De um modo geral, o conceito de segmentação de dados consiste em gerar dados de vídeo com diferentes prioridades no codificador para suportar a qualidade do serviço QoS na rede. Por exemplo, o método de particionamento de dados baseado em sintaxe é adotado para dividir os dados de cada quadro em várias partes de acordo com sua importância, o que permite que as informações menos importantes sejam descartadas quando o buffer estourar. Um método de particionamento de dados temporais semelhante também pode ser adotado, o que é realizado usando vários quadros de referência em quadros P e B.
Na aplicação de comunicação sem fio, podemos suportar grandes mudanças na taxa de bits do canal sem fio, alterando a precisão de quantização ou a resolução espaço / tempo de cada quadro. No entanto, no caso de multicast, é impossível exigir que o codificador responda a taxas de bits variáveis. Portanto, ao contrário do método FGS (Fine Granular Scalability) usado no MPEG-4 (com menor eficiência), o H.264 usa quadros SP de comutação de fluxo em vez de codificação hierárquica.
Edição de comparação de desempenho
TML-8 é um teste para H.264. O PSNR fornecido pelos resultados do teste mostrou claramente que, em comparação com o desempenho do MPEG-4 (ASP: Advanced Simple Profile) e H.263 ++ (HLP: High Latency Profile), os resultados do H.264 apresentam vantagens óbvias.
O PSNR do H.264 é obviamente melhor do que o do MPEG-4 (ASP) e do H.263 ++ (HLP). No teste de comparação de 6 velocidades, o PSNR de H.264 é 2dB maior do que MPEG-4 (ASP) em média. É 3 dB superior a H.263 (HLP) em média. As 6 taxas de teste e suas condições relacionadas são: taxa de 32 kbit / s, taxa de quadros de 10 f / s e formato QCIF; Taxa de 64 kbit / s, taxa de quadros de 15 f / s e formato QCIF; Taxa de 128 kbit / s, taxa de quadros de 15 f / s e formato CIF; Taxa de 256 kbit / s, taxa de quadros de 15 f / s e formato QCIF; Taxa de 512 kbit / s, taxa de quadros de 30 f / s e formato CIF; Taxa de 1024 kbit / s, taxa de quadros de 30 f / s e formato CIF.
|
Digite o e-mail para obter uma surpresa
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanês
ar.fmuser.org -> árabe
hy.fmuser.org -> armênio
az.fmuser.org -> Azerbaijão
eu.fmuser.org -> Basco
be.fmuser.org -> bielorrusso
bg.fmuser.org -> búlgaro
ca.fmuser.org -> catalão
zh-CN.fmuser.org -> Chinês (simplificado)
zh-TW.fmuser.org -> chinês (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> dinamarquês
nl.fmuser.org -> holandês
et.fmuser.org -> estoniano
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandês
fr.fmuser.org -> francês
gl.fmuser.org -> galego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemão
el.fmuser.org -> grego
ht.fmuser.org -> crioulo haitiano
iw.fmuser.org -> hebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> húngaro
is.fmuser.org -> islandês
id.fmuser.org -> indonésio
ga.fmuser.org -> irlandês
it.fmuser.org -> italiano
ja.fmuser.org -> Japonês
ko.fmuser.org -> coreano
lv.fmuser.org -> letão
lt.fmuser.org -> Lituano
mk.fmuser.org -> macedônio
ms.fmuser.org -> malaio
mt.fmuser.org -> maltês
no.fmuser.org - norueguês
fa.fmuser.org -> persa
pl.fmuser.org -> polonês
pt.fmuser.org -> português
ro.fmuser.org -> romeno
ru.fmuser.org -> russo
sr.fmuser.org -> Sérvio
sk.fmuser.org -> Eslovaco
sl.fmuser.org -> esloveno
es.fmuser.org -> espanhol
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandês
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> vietnamita
cy.fmuser.org -> Galês
yi.fmuser.org -> iídiche
FMUSER Transmitir vídeo e áudio sem fio mais fácil!
Contato
Endereço:
No.305 Sala HuiLan Edifício No.273 Huanpu Road Guangzhou China 510620
Categorias
Newsletter