H264 princípios básicos

Prefácio
O algoritmo de compressão de vídeo H264 é agora, sem dúvida, o mais amplamente utilizado e mais popular de todas as técnicas de compressão de vídeo. Com a introdução de bibliotecas de código aberto, como x264 / openh264 e ffmpeg, a maioria dos usuários não precisa mais pesquisar muito sobre os detalhes do H264, o que reduz muito o custo das pessoas que usam o H264.

Mas, para fazer um bom uso do H264, ainda temos que descobrir os princípios básicos do H264. Hoje daremos uma olhada nos princípios básicos do H264.

A tecnologia de compressão H264 usa principalmente os seguintes métodos para comprimir dados de vídeo. incluir:

A compressão de predição intra-frame resolve o problema de redundância de dados espaciais.
A compressão de predição entre quadros (estimativa e compensação de movimento) resolve o problema de redundância de dados no domínio do tempo.
Transformada discreta cosseno inteira (DCT), que transforma a correlação espacial em dados irrelevantes no domínio da frequência e a quantifica.
Compressão CABAC.
O quadro comprimido é dividido em: quadro I, quadro P e quadro B:

I frame: key frame, usando tecnologia de compressão intra-frame.
Quadro P: quadro de referência avançado, ao comprimir, refere-se apenas ao quadro previamente processado. Use a tecnologia de compressão de áudio de quadro.
Quadro B: Um quadro de referência bidirecional. Durante a compressão, refere-se ao quadro anterior e ao quadro seguinte. Usando tecnologia de compressão entre quadros.
Além dos quadros I / P / B, também existem sequências de imagens GOP.

GOP: Entre dois quadros I está uma sequência de imagens, e há apenas um quadro I em uma sequência de imagens. Como mostrado abaixo:

Tecnologia de compressão H264
O princípio básico do H264 é realmente muito simples, vamos descrever brevemente o processo de compactação de dados do H264. Os quadros de vídeo capturados pela câmera (calculados a 30 quadros por segundo) são enviados para o buffer do codificador H264. O codificador deve primeiro dividir macroblocos para cada imagem.

Macrobloco de partição
O H264 usa uma área de 16X16 como um bloco de macro por padrão e também pode ser dividido em um tamanho de 8X8.

Por analogia, o valor do pixel de cada macrobloco em uma imagem é calculado e todos os macroblocos são processados da seguinte forma.

Sub-bloco
H264 usa macroblocos 16X16 para imagens relativamente planas. No entanto, a fim de atingir uma taxa de compressão mais alta, sub-blocos menores também podem ser divididos em macroblocos de 16X16. O tamanho do sub-bloco pode ser 8X16, 16X8, 8X8, 4X8, 8X4, 4X4, o que é muito flexível.

Na imagem acima, a maioria dos macroblocos 16X16 na moldura vermelha tem um fundo azul, e parte da imagem das três águias é desenhada neste macrobloco. Para processar melhor as imagens parciais das três águias, os sub-blocos múltiplos H264 são divididos em macroblocos 16X16.

Desta forma, após a compressão intra-frame, dados mais eficientes podem ser obtidos. A figura abaixo é o resultado da compressão dos macroblocos acima usando MPEG-2 e H264 respectivamente. A metade esquerda é o resultado da compressão após a divisão do sub-bloco MPEG-2, e a metade direita é o resultado da compressão do sub-bloco H264. Pode-se ver que o método de divisão H264 apresenta mais vantagens.

Após a divisão do bloco macro, todas as imagens no buffer do codificador H264 podem ser agrupadas.

Agrupamento de quadros
Para dados de vídeo, existem principalmente dois tipos de redundância de dados, um é redundância de dados no tempo e o outro é redundância de dados no espaço. Entre eles, a redundância de dados no tempo é a maior. Vamos primeiro falar sobre o problema de redundância do tempo de dados de vídeo.

Por que a redundância de tempo é maior? Supondo que a câmera capture 30 quadros por segundo, os dados desses 30 quadros são principalmente relacionados. Também é possível que mais de 30 quadros de dados, dezenas de quadros ou centenas de quadros de dados estejam intimamente relacionados.

Para esses quadros intimamente relacionados, na verdade, só precisamos salvar um quadro de dados, e outros quadros podem ser previstos a partir desse quadro de acordo com certas regras, de modo que os dados de vídeo tenham a maior redundância de tempo.

Para que os quadros relevantes comprimam os dados por meio do método de predição, é necessário agrupar os quadros do vídeo. Então, como determinar se certos quadros estão intimamente relacionados e podem ser agrupados? Vamos dar uma olhada em um exemplo. Abaixo está um quadro de vídeo capturado de um grupo de bolas de bilhar em movimento. As bolas de bilhar rolam do canto superior direito para o canto inferior esquerdo.

O codificador H264 tirará dois quadros adjacentes de cada vez para comparar os macroblocos a fim de calcular a similaridade dos dois quadros. Como mostrado abaixo:

Por meio da varredura de macroblocos e da pesquisa de macroblocos, pode-se verificar que a correlação entre os dois quadros é muito alta. Além disso, verifica-se que o grau de correlação deste grupo de frames é muito alto. Portanto, os quadros acima podem ser divididos em um grupo. O algoritmo é: nas imagens adjacentes, os pixels que geralmente são diferentes estão dentro de 10%, a diferença de brilho não excede 2% e a diferença de cromaticidade muda apenas dentro de 1%. Achamos que os gráficos podem ser agrupados.

Nesse grupo de quadros, após a codificação, mantemos apenas os dados completos do primeiro post, e os outros quadros são calculados com referência ao quadro anterior. Chamamos o primeiro quadro de quadro IDR / I e outros quadros chamamos de quadro P / B, então chamamos o grupo de quadro de dados codificado de GOP.

Estimativa e compensação de movimento
Depois que os frames são agrupados no codificador H264, é necessário calcular os vetores de movimento dos objetos no grupo de frames. Tomando o quadro de vídeo de bilhar em movimento acima como exemplo, vamos dar uma olhada em como ele calcula o vetor de movimento.

O codificador H264 primeiro tira dois quadros de dados de vídeo do cabeçalho do buffer em sequência e, em seguida, executa a varredura de macro block. Quando um objeto é encontrado em uma das imagens, a pesquisa é realizada nas proximidades da outra imagem (na janela de pesquisa). Se o objeto for encontrado em outra imagem neste momento, o vetor de movimento do objeto pode ser calculado. A imagem a seguir mostra a posição da bola de bilhar após a pesquisa.

Através da diferença entre as posições das bolas de bilhar na imagem acima, a direção e distância da imagem da mesa podem ser calculadas. H264 registra a distância e a direção do movimento da bola em cada quadro por vez, e se torna o seguinte.

Depois que o vetor de movimento é calculado, a mesma parte (ou seja, a parte verde) é subtraída para obter os dados de compensação. No final, precisamos apenas compactar e salvar os dados de compensação e, em seguida, a imagem original pode ser restaurada durante a decodificação. Os dados compactados só precisam registrar uma pequena quantidade de dados. Do seguinte modo:

Chamamos vetor de movimento e compensação de tecnologia de compressão entre quadros, que resolve a redundância de dados de quadros de vídeo no tempo. Além da compactação entre quadros, a compactação de dados também deve ser realizada dentro do quadro. A compressão de dados intra-quadro resolve a redundância de dados espaciais. Agora vamos apresentar a tecnologia de compressão intra-frame.

Predição intra
O olho humano tem um certo grau de reconhecimento da imagem, é muito sensível ao brilho de baixa frequência, e não é muito sensível ao brilho de alta frequência. Portanto, com base em algumas pesquisas, dados que não são sensíveis aos olhos humanos podem ser removidos de uma imagem. Desta forma, a tecnologia de predição intra é proposta.

A compressão intra-frame do H264 é muito semelhante ao JPEG. Depois que uma imagem é dividida em macroblocos, cada macrobloco pode ser previsto em 9 modos. Encontre o modo de previsão mais próximo da imagem original.

A imagem a seguir é o processo de previsão de cada bloco macro em toda a imagem.

A comparação entre a imagem após predição intra e a imagem original é a seguinte:

Em seguida, a imagem original e a imagem intrapreditada são subtraídas para obter um valor residual.

Em seguida, salve as informações do modo de previsão que obtivemos antes, para que possamos restaurar a imagem original durante a decodificação. O efeito é o seguinte:

Após a compressão intra-frame e inter-frame, embora os dados sejam bastante reduzidos, ainda há espaço para otimização.

Faça DCT em dados residuais
Os dados residuais podem ser submetidos à transformação discreta de cosseno inteiro para remover a correlação dos dados e compactar ainda mais os dados. Conforme mostrado na figura abaixo, o lado esquerdo é o macro bloco dos dados originais e o lado direito é o macro bloco dos dados residuais calculados.

O macrobloco de dados residuais é digitalizado conforme mostrado na figura abaixo:

Depois de remover os dados associados, podemos ver que os dados são ainda mais compactados.

Depois que o DCT é feito, não é suficiente e o CABAC é necessário para compactação sem perdas.

CABAC
A compressão intra-frame acima é uma técnica de compressão com perdas. Em outras palavras, depois que a imagem é compactada, ela não pode ser restaurada completamente. CABAC é uma tecnologia de compressão sem perdas.

A tecnologia de compressão sem perdas pode ser a mais familiar para todos é a codificação de Huffman, um código curto para palavras de alta frequência, um código longo para palavras de baixa frequência para atingir o propósito de compressão de dados. O VLC usado no MPEG-2 é esse tipo de algoritmo, tomamos AZ como exemplo, A pertence aos dados de alta frequência e Z pertence aos dados de baixa frequência. Veja como isso é feito.

CABAC também é um código curto para dados de alta frequência e um código longo para dados de baixa frequência. Ao mesmo tempo, ele será compactado com base no contexto, que é muito mais eficiente do que o VLC. O efeito é o seguinte:

É óbvio pela imagem acima que o esquema de compactação sem perdas usando CACBA é muito mais eficiente do que VLC.

resumo
Neste ponto, concluímos o princípio de codificação H264. Este artigo fala principalmente sobre os seguintes pontos:
1. Jianyin introduziu alguns conceitos básicos em H264. Como quadro I / P / B, GOP.
2. Explicou os princípios básicos da codificação H264 em detalhes, incluindo:

Divisão de macro bloco
Agrupamento de imagens
Princípio da tecnologia de compressão intra-frame
O princípio da tecnologia de compressão inter-frame.
DCT
Princípio de compressão CABAC.

Como distante (long) a tampa do transmissor?

A faixa de transmissão depende de muitos fatores. A distância real baseia-se na altura da antena de instalar, o ganho da antena, usando ambiente como a construção e outras obstruções, a sensibilidade do receptor, a antena do receptor. Instalação de antena mais alta e usando no campo, a distância vai muito mais longe.

EXEMPLO 5W FM Transmitter usar na cidade e cidade natal:

Eu tenho um uso do cliente 5W transmissor FM EUA com antena GP em sua cidade natal, e ele testá-lo com um carro, cobrir 10km (6.21mile).

I testar o transmissor FM 5W com antena GP na minha cidade natal, que cobrem cerca de 2km (1.24mile).

I testar o transmissor FM 5W com antena GP na cidade de Guangzhou, que abrangem cerca de única 300meter (984ft).

Abaixo estão o intervalo aproximado de diferentes transmissores de energia FM. (O intervalo é de diâmetro)

0.1W ~ 5W Transmissor FM: 100M ~ 1KM

5W ~ 15W FM Ttransmitter: 1KM ~ 3KM

15W ~ 80W Transmissor FM: 3KM ~ 10KM

80W ~ 500W Transmissor FM: 10KM ~ 30KM

500W ~ 1000W Transmissor FM: 30KM ~ 50KM

1KW ~ 2KW Transmissor FM: 50KM ~ 100KM

2KW ~ 5KW Transmissor FM: 100KM ~ 150KM

5KW ~ 10KW Transmissor FM: 150KM ~ 200KM

Como contactar-nos para o transmissor?

Ligue-me + 8618078869184 OR
Me mande um e-mail [email protegido]
1.How longe você quer cobrir de diâmetro?
2.How altura de vocês torre?
3.Where você é?
E vamos dar-lhe conselhos mais profissional.

Sobre Nós

A FMUSER.ORG é uma empresa de integração de sistemas com foco em transmissão de RF sem fio / equipamento de áudio de vídeo de estúdio / streaming e processamento de dados. Fornecemos desde consultoria e consultoria até integração de rack a instalação, comissionamento e treinamento.

Oferecemos Transmissor FM, Transmissor de TV Analógico, Transmissor de TV Digital, Transmissor UHF VHF, Antenas, Conectores Coaxiais, STL, Processamento On Air, Produtos Broadcast para Estúdio, Monitoramento de Sinais RF, Codificadores RDS, Processadores de Áudio e Unidades de Controle Remoto, Produtos de IPTV, codificador / decodificador de vídeo / áudio, projetados para atender às necessidades tanto de grandes redes de transmissão internacionais quanto de pequenas estações privadas.

Nossa solução possui Estação de Rádio FM / Estação de TV Analógica / Estação de TV Digital / Equipamento de Estúdio de Áudio / Vídeo / Link de Transmissor de Estúdio / Sistema de Telemetria de Transmissor / Sistema de TV de Hotel / Transmissão ao Vivo de IPTV / Transmissão ao Vivo de Transmissão / Conferência de Vídeo / Sistema de Transmissão de CATV.

Estamos usando produtos de tecnologia avançada para todos os sistemas, porque sabemos que a alta confiabilidade e o alto desempenho são tão importantes para o sistema e a solução. Ao mesmo tempo, também temos que garantir que nosso sistema de produtos tenha um preço muito razoável.

Temos clientes de radiodifusores públicos e comerciais, operadoras de telecomunicações e autoridades reguladoras, além de oferecer soluções e produtos para centenas de pequenas emissoras locais e comunitárias.

A FMUSER.ORG exporta há mais de 15 anos e tem clientes em todo o mundo. Com 13 anos de experiência neste campo, temos uma equipe profissional para resolver todos os tipos de problemas dos clientes. Nós nos dedicamos a fornecer preços extremamente razoáveis para produtos e serviços profissionais. Email de contato : [email protegido]

Nossa fábrica

Nós temos modernização da fábrica. Você está convidado a visitar nossa fábrica quando você vir para a China.

Actualmente, já existem clientes 1095 em todo o mundo visitaram nosso escritório Guangzhou Tianhe. Se você vir para a China, você está convidado a visitar-nos.

na Feira

Esta é a nossa participação em 2012 Global Sources Hong Kong Fair Eletrônica . Clientes de todo o mundo finalmente ter a chance de ficar juntos.

Onde está Fmuser?

Você pode pesquisar esses números " 23.127460034623816,113.33224654197693 "no google map, então você pode encontrar nosso escritório fmuser.

escritório FMUSER Guangzhou está em Tianhe District, que é a centro do cantão . Muito perto ao Feira de Cantão , Estação Ferroviária Guangzhou, estrada Xiaobei e dashatou , só precisa 10 minutos se tomar TÁXI . Bem-vindos amigos de todo o mundo para visitar e negociar.

Contato: Céu azul
Celular: + 8618078869184
WhatsApp: + 8618078869184
WeChat: + 8618078869184
E-mail [email protegido]
QQ: 727926717
Skype: sky198710021
Endereço: No.305 quarto Huilan Edifício No.273 Huanpu Estrada Guangzhou China Zip: 510620

Inglês: Aceitamos todos os pagamentos, como PayPal, cartão de crédito, Western Union, Alipay, Money Bookers, T / T, LC, DP, DA, OA, Payoneer, se você tiver alguma dúvida, entre em contato comigo [email protegido] ou WhatsApp + 8618078869184

PayPal.  www.paypal.com

Recomendamos que você use Paypal para comprar nossos produtos, o Paypal é uma forma segura de comprar na internet.

Cada da nossa lista de itens de página de fundo na parte superior tem um logotipo paypal para pagar.

Cartão de crédito.Se você não tem paypal, mas você tem cartão de crédito, você também pode clicar no botão amarelo PayPal para pagar com seu cartão de crédito.

-------------------------------------------------- -------------------

Mas se você não tiver um cartão de crédito e não tem uma conta paypal ou de difícil tem um accout PayPal, você pode usar o seguinte:
Western Union.  www.westernunion.com

Pagamento por Western Union para mim:

Nome próprio / nome próprio: Yingfeng
Sobrenome / sobrenome / sobrenome: Zhang
Nome completo: Yingfeng Zhang
País: China
Cidade: Guangzhou

-------------------------------------------------- -------------------

T / T.  Pagar por T / T (transferência bancária / transferência telegráfica / Transferência Bancária)
Primeiras INFORMAÇÕES BANCÁRIAS (CONTA DA EMPRESA):

SWIFT BIC: BKCHHKHHXXX
Nome do banco: BANK OF CHINA (HONG KONG) LIMITADA, HONG KONG
Endereço do Banco: BANK OF CHINA TOWER, 1 GARDEN ROAD, CENTRAL, HONG KONG
CÓDIGO BANCÁRIO: 012
Nome da conta: FMUSER INTERNATIONAL GROUP LIMITED
Conta NO. : 012-676-2-007855-0

-------------------------------------------------- -------------------
SEGUNDA INFORMAÇÃO BANCÁRIA (CONTA DA EMPRESA):
Beneficiário: Fmuser International Group Inc
Número da conta: 44050158090900000337
Banco do beneficiário: Sucursal do China Construction Bank em Guangdong
Código SWIFT: PCBCCNBJGDX
Endereço: NO.553 Tianhe Road, Guangzhou, Guangdong, distrito de Tianhe, China
** Nota: Quando você transferir dinheiro para nossa conta bancária, NÃO escreva nada na área de comentários, caso contrário, não poderemos receber o pagamento devido à política governamental sobre negócios de comércio internacional.

* Será enviada em 1 2-dia de trabalho quando o pagamento clara.

* Nós vamos enviá-lo para seu endereço de paypal. Se você quiser mudar de endereço, por favor, envie seu endereço correto e número de telefone para o meu e-mail [email protegido]

* Se os pacotes está abaixo 2kg, que serão enviados via correio aéreo, vai demorar cerca de 15-25days para sua mão.

Se o pacote é mais do que 2kg, nós enviamos via EMS, DHL, UPS, Fedex entrega rápida expressa, vai demorar cerca de 7 ~ 15days para sua mão.

Se o pacote de mais de 100kg, iremos enviar via DHL ou frete aéreo. Isso levará cerca de 3 ~ 7days para sua mão.

Todos os pacotes são a forma China Guangzhou.

* O pacote será enviado como um "presente" e descontar o menos possível, o comprador não precisa pagar por "TAX".

* Depois de navio, nós lhe enviaremos um e-mail e dar-lhe o número de rastreamento.

Para garantia.
Entre em contato conosco --- >> Devolva o item para nós --- >> Receba e envie outra substituição.

Nome: Liu Xiaoxia
Endereço: 305Fang HuiLanGe HuangPuDaDaoXi 273Hao TianHeQu Guangzhou China.
CEP: 510620
Telefone: + 8618078869184

Por favor, retorne a este endereço e escrever seu paypal endereço, nome, problema na nota: