FMUSER Transmitir vídeo e áudio sem fio mais fácil!
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanês
ar.fmuser.org -> árabe
hy.fmuser.org -> armênio
az.fmuser.org -> Azerbaijão
eu.fmuser.org -> Basco
be.fmuser.org -> bielorrusso
bg.fmuser.org -> búlgaro
ca.fmuser.org -> catalão
zh-CN.fmuser.org -> Chinês (simplificado)
zh-TW.fmuser.org -> chinês (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> dinamarquês
nl.fmuser.org -> holandês
et.fmuser.org -> estoniano
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandês
fr.fmuser.org -> francês
gl.fmuser.org -> galego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemão
el.fmuser.org -> grego
ht.fmuser.org -> crioulo haitiano
iw.fmuser.org -> hebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> húngaro
is.fmuser.org -> islandês
id.fmuser.org -> indonésio
ga.fmuser.org -> irlandês
it.fmuser.org -> italiano
ja.fmuser.org -> Japonês
ko.fmuser.org -> coreano
lv.fmuser.org -> letão
lt.fmuser.org -> Lituano
mk.fmuser.org -> macedônio
ms.fmuser.org -> malaio
mt.fmuser.org -> maltês
no.fmuser.org - norueguês
fa.fmuser.org -> persa
pl.fmuser.org -> polonês
pt.fmuser.org -> português
ro.fmuser.org -> romeno
ru.fmuser.org -> russo
sr.fmuser.org -> Sérvio
sk.fmuser.org -> Eslovaco
sl.fmuser.org -> esloveno
es.fmuser.org -> espanhol
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandês
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> vietnamita
cy.fmuser.org -> Galês
yi.fmuser.org -> iídiche
(1) Informação redundante de sinal de vídeo
Tomando o formato de componente YUV de gravação de vídeo digital como exemplo, YUV representa o brilho e dois sinais de diferença de cor, respectivamente. Por exemplo, para o sistema Pal TV existente, a frequência de amostragem do sinal de luminância é de 13.5 MHz; a banda de frequência do sinal de croma é geralmente metade ou menos do sinal de brilho, que é de 6.75 MHz ou 3.375 MHz. Tomando a frequência de amostragem de 4: 2: 2 como exemplo, o sinal Y adota 13.5 mhz, o sinal de croma U e V são amostrados por 6.75 mhz e o sinal de amostragem é quantizado por 8 bits, então a taxa de código do vídeo digital pode ser calculada do seguinte modo:
13.5 * 8 + 6.75 * 8 + 6.75 * 8 = 216Mbit / s
Se uma grande quantidade de dados for armazenada ou transmitida diretamente, será difícil usar a tecnologia de compressão para reduzir a taxa de bits. O sinal de vídeo digital pode ser comprimido de acordo com duas condições básicas:
L. redundância de dados. Por exemplo, redundância espacial, redundância de tempo, redundância de estrutura, redundância de entropia de informação, etc., ou seja, existe uma forte correlação entre os pixels da imagem. Eliminar essas redundâncias não leva à perda de informações e é uma compactação sem perdas.
L. redundância visual. Algumas características dos olhos humanos, como limiar de discriminação de brilho, limiar visual, são diferentes em sensibilidade ao brilho e croma, o que torna impossível introduzir erros apropriados na codificação e não serão detectados. As características visuais dos olhos humanos podem ser usadas para trocar por compressão de dados com certa distorção objetiva. Essa compressão é com perdas.
A compressão do sinal de vídeo digital é baseada nas duas condições acima, o que torna os dados de vídeo altamente comprimidos, o que é propício para transmissão e armazenamento. Os métodos comuns de compressão de vídeo digital são codificação mista, que combina codificação de transformação, estimativa de movimento e compensação de movimento, e codificação de entropia para compactar a codificação. Normalmente, a codificação de transformação é usada para eliminar a redundância intraquadro da imagem, e estimativa de movimento e compensação de movimento são usadas para remover a redundância intraquadro da imagem e a codificação de entropia é usada para melhorar ainda mais a eficiência de compressão. Os três métodos de codificação de compressão a seguir são apresentados resumidamente.
(a) Método de codificação de compressão
(b) Transformar codificação
A função da codificação de transformação é transformar o sinal de imagem descrito no domínio do espaço para o domínio da frequência e, em seguida, codificar os coeficientes transformados. De um modo geral, a imagem tem forte correlação no espaço, e a transformação para o domínio da frequência pode realizar decorrelação e concentração de energia. A transformação ortogonal comum inclui transformada discreta de Fourier, transformada discreta de cosseno e assim por diante. A transformada discreta de cosseno é amplamente usada na compressão de vídeo digital.
A transformação discreta do cosseno é conhecida como transformação DCT. Ele pode transformar o bloco de imagem de L * l do domínio do espaço para o domínio da frequência. Portanto, no processo de compactação e codificação de imagem com base em DCT, a imagem precisa ser dividida em blocos de imagem não sobrepostos. Suponha que o tamanho de uma imagem seja 1280 * 720, ela é dividida em 160 * 90 blocos de imagem com tamanho 8 * 8 sem sobreposição na forma de grade. Então a transformação DCT pode ser executada para cada bloco de imagem.
Depois que o bloco é dividido, cada bloco de imagem de 8 * 8 pontos é enviado para o codificador DCT e o bloco de imagem de 8 * 8 é transformado do domínio espacial para o domínio da frequência. A figura abaixo mostra um exemplo de um bloco de imagem de 8 * 8 em que o número representa o valor de brilho de cada pixel. Pode-se observar na figura que os valores de brilho de cada pixel neste bloco de imagem são relativamente uniformes, principalmente o valor de brilho dos pixels adjacentes não é muito grande, o que indica que o sinal da imagem possui forte correlação.
Um bloco de imagem real de 8 * 8
A figura a seguir mostra os resultados da transformação DCT do bloco de imagem na figura acima. Pode-se ver na figura que após a transformação DCT, o coeficiente de baixa frequência no canto superior esquerdo concentra muita energia, enquanto a energia no coeficiente de alta frequência no canto inferior direito é muito pequena.
Os coeficientes do bloco de imagem após a transformação DCT
O sinal precisa ser quantificado após a transformação DCT. Como os olhos humanos são sensíveis às características de baixa frequência das imagens, como o brilho geral dos objetos, e não aos detalhes de alta frequência da imagem, portanto, no processo de transmissão, as informações de alta frequência podem ser transmitidas menos ou não, apenas a parte de baixa frequência. O processo de quantização reduz a transmissão de informações ao quantificar os coeficientes da região de baixa frequência e quantização grosseira dos coeficientes da região de alta frequência, o que remove a informação de alta frequência que não é sensível ao olho humano. Portanto, a quantização é um processo de compressão com perdas e a principal razão para os danos à qualidade na codificação de compressão de vídeo.
O processo de quantificação pode ser expresso pela seguinte fórmula:
Entre eles, FQ (U, V) representa o coeficiente DCT após a quantização; f (U, V) representa o coeficiente DCT antes da quantização; Q (U, V) representa a matriz de ponderação de quantização; q é a etapa de quantização; round refere-se à consolidação e o valor a ser produzido é considerado o valor inteiro mais próximo.
Selecione o coeficiente de quantização razoavelmente e o resultado após quantizar o bloco de imagem transformado é mostrado na figura.
Coeficiente DCT após quantificação
A maioria dos coeficientes DCT são alterados para 0 após a quantização, enquanto apenas alguns coeficientes são valores diferentes de zero. Neste momento, apenas esses valores diferentes de zero precisam ser compactados e codificados.
(b) Codificação de entropia
A codificação de entropia é nomeada porque o comprimento médio do código após a codificação é próximo ao valor de entropia da fonte. A codificação de entropia é implementada por VLC (codificação de comprimento variável). O princípio básico é dar código curto ao símbolo com alta probabilidade na fonte e dar código longo ao símbolo com pequena probabilidade de ocorrência, de modo a obter estatisticamente o menor comprimento de código médio. A codificação de comprimento variável geralmente inclui código Hoffman, código aritmético, código de execução, etc. A codificação de comprimento de execução é um método de compressão muito simples, sua eficiência de compressão não é alta, mas a velocidade de codificação e decodificação é rápida e ainda é amplamente utilizada, especialmente após a transformação da codificação, usando a codificação run-length, tem um bom efeito.
Primeiro, o coeficiente AC imediatamente após o coeficiente DC de saída do quantizador deve ser varrido no tipo Z (como mostrado na linha de seta). O Z-scan transforma o coeficiente de quantização bidimensional em uma sequência unidimensional e, em seguida, continua a codificação do comprimento de execução. Finalmente, outro código de comprimento variável é usado para codificar os dados após a codificação de execução, como a codificação de Hoffman. Por meio desse tipo de codificação de comprimento variável, a eficiência da codificação é ainda melhorada.
(c) Estimativa de movimento e compensação de movimento
A estimativa de movimento e a compensação de movimento são métodos eficazes para eliminar a correlação da direção do tempo das sequências de imagens. Os métodos de transformação DCT, quantização e codificação de entropia descritos acima são baseados em uma imagem de quadro. Por meio desses métodos, a correlação espacial entre os pixels da imagem pode ser eliminada. Na verdade, além da correlação espacial, o sinal da imagem possui correlação temporal. Por exemplo, para vídeo digital com fundo estático como transmissão de notícias e pequeno movimento do corpo principal da imagem, a diferença entre cada imagem é muito pequena e a correlação entre as imagens é muito grande. Nesse caso, não precisamos codificar cada imagem de quadro separadamente, mas podemos codificar apenas as partes alteradas de quadros de vídeo adjacentes, de modo a reduzir ainda mais a quantidade de dados. Este trabalho é realizado por estimativa de movimento e compensação de movimento.
A tecnologia de estimativa de movimento geralmente divide a imagem de entrada atual em vários pequenos sub-blocos de imagem que não se sobrepõem, por exemplo, o tamanho de uma imagem de quadro é 1280 * 720. Em primeiro lugar, é dividido em 40 * 45 blocos de imagem com 16 * 16 tamanho que não se sobrepõem na forma de grade, e então, no âmbito de uma janela de busca da imagem anterior ou da última imagem, encontre um bloco para cada bloco de imagem para encontrar um bloco de imagem dentro do escopo de um janela de pesquisa O bloco de imagem mais semelhante. O processo de pesquisa é denominado estimativa de movimento. Calculando a informação de posição entre o bloco de imagem mais semelhante e o bloco de imagem, um vetor de movimento pode ser obtido. Desta forma, o bloco de imagem atual pode ser subtraído do bloco de imagem mais semelhante apontado pelo vetor de movimento da imagem de referência e um bloco de imagem residual pode ser obtido. Como cada valor de pixel no bloco de imagem residual é muito pequeno, uma taxa de compressão mais alta pode ser obtida na codificação de compressão. Este processo de subtração é denominado compensação de movimento.
Como a imagem de referência é necessária para ser usada para estimativa de movimento e compensação de movimento no processo de codificação, é muito importante selecionar a imagem de referência. Geralmente, o codificador divide cada entrada de imagem de quadro em três tipos diferentes de acordo com as diferentes imagens de referência: quadro I (intra), quadro B (previsão de orientação) e quadro P (previsão). Conforme mostrado na figura.
Sequência de estrutura de quadro I, B, P típica
Conforme mostrado na figura, o quadro I usa apenas os dados do quadro para codificação e não precisa de estimativa de movimento e compensação de movimento durante o processo de codificação. Obviamente, como o quadro I não elimina a correlação da direção do tempo, a taxa de compressão é relativamente baixa. No processo de codificação, o quadro P usa um quadro I frontal ou quadro P como imagem de referência para a compensação de movimento; na verdade, ele codifica a diferença entre a imagem atual e a imagem de referência. O modo de codificação do quadro B é semelhante ao quadro P, a única diferença é que ele precisa usar um quadro I frontal ou quadro P e um quadro I ou P posterior para prever durante o processo de codificação. Assim, cada codificação de quadro P precisa usar uma imagem de quadro como imagem de referência, enquanto o quadro B precisa de dois quadros como referência. Em contraste, o quadro B tem uma taxa de compressão mais alta do que o quadro P.
(d) Codificação mista
O artigo apresenta vários métodos importantes de compressão e codificação de vídeo. Na aplicação prática, esses métodos não são separados e geralmente são combinados para obter o melhor efeito de compressão. A figura a seguir mostra o modelo de codificação híbrida (ou seja, codificação de transformação + estimativa de movimento e compensação de movimento + codificação de entropia). O modelo é amplamente utilizado em MPEG1, MPEG2, H.264 e outros padrões. Pela figura, podemos ver que a imagem de entrada atual deve ser dividida em blocos primeiro, o bloco da imagem obtido pelo bloco deve ser subtraído do imagem prevista após compensação de movimento para obter a imagem de diferença x, e então a transformação e quantização DCT são realizadas para o bloco de imagem de diferença. Os dados de saída quantizados têm dois lugares diferentes: um é enviá-los para o codificador de entropia para codificação, e o fluxo de código codificado é enviado para um cache Salve no dispositivo e aguarde a transmissão. Outra aplicação é contra-quantificar e reverter a mudança para o sinal x ', que adiciona a saída do bloco de imagem com compensação de movimento para obter um novo sinal de imagem de previsão e envia um novo bloco de imagem de previsão para a memória de quadros.
|
Digite o e-mail para obter uma surpresa
es.fmuser.org
it.fmuser.org
fr.fmuser.org
de.fmuser.org
af.fmuser.org -> Afrikaans
sq.fmuser.org -> albanês
ar.fmuser.org -> árabe
hy.fmuser.org -> armênio
az.fmuser.org -> Azerbaijão
eu.fmuser.org -> Basco
be.fmuser.org -> bielorrusso
bg.fmuser.org -> búlgaro
ca.fmuser.org -> catalão
zh-CN.fmuser.org -> Chinês (simplificado)
zh-TW.fmuser.org -> chinês (tradicional)
hr.fmuser.org -> croata
cs.fmuser.org -> checo
da.fmuser.org -> dinamarquês
nl.fmuser.org -> holandês
et.fmuser.org -> estoniano
tl.fmuser.org -> filipino
fi.fmuser.org -> finlandês
fr.fmuser.org -> francês
gl.fmuser.org -> galego
ka.fmuser.org -> georgiano
de.fmuser.org -> alemão
el.fmuser.org -> grego
ht.fmuser.org -> crioulo haitiano
iw.fmuser.org -> hebraico
hi.fmuser.org -> Hindi
hu.fmuser.org -> húngaro
is.fmuser.org -> islandês
id.fmuser.org -> indonésio
ga.fmuser.org -> irlandês
it.fmuser.org -> italiano
ja.fmuser.org -> Japonês
ko.fmuser.org -> coreano
lv.fmuser.org -> letão
lt.fmuser.org -> Lituano
mk.fmuser.org -> macedônio
ms.fmuser.org -> malaio
mt.fmuser.org -> maltês
no.fmuser.org - norueguês
fa.fmuser.org -> persa
pl.fmuser.org -> polonês
pt.fmuser.org -> português
ro.fmuser.org -> romeno
ru.fmuser.org -> russo
sr.fmuser.org -> Sérvio
sk.fmuser.org -> Eslovaco
sl.fmuser.org -> esloveno
es.fmuser.org -> espanhol
sw.fmuser.org -> Swahili
sv.fmuser.org -> sueco
th.fmuser.org -> Tailandês
tr.fmuser.org -> turco
uk.fmuser.org -> ucraniano
ur.fmuser.org -> Urdu
vi.fmuser.org -> vietnamita
cy.fmuser.org -> Galês
yi.fmuser.org -> iídiche
FMUSER Transmitir vídeo e áudio sem fio mais fácil!
Contato
Endereço:
No.305 Sala HuiLan Edifício No.273 Huanpu Road Guangzhou China 510620
Categorias
Newsletter