Login| Sign Up| Help| Contact|

Patent Searching and Data


Title:
METHOD FOR IMAGE AND VIDEO COMPRESSION BY MEANS OF VECTORISATION AND EXECUTOR DEVICE (CHIP) THEREOF
Document Type and Number:
WIPO Patent Application WO/2017/041195
Kind Code:
A1
Abstract:
The present invention relates to a method for image and video compression by means of vectorisation, and to a device for executing the method, in the form of an integrated circuit or chip, for mobile and fixed equipment. The method comprises a logical structure of steps and is executed in the machine language of the executor device, the method consisting in: detecting the outlines of the monochrome segments or polygons of the image or video frame; and subsequently converting the vertex coordinates of each segment or polygon into corresponding vectors. Thus, the method enables lossless storage and compression of only the vectors, instead of compressing all the pixels of each image segment. The executor device is a combination of a multi-cell core having predictive and parallel computation, with a slave vector matrix and a LZW lossless data compression core. All the components are connected by two separate, independent, wide, asynchronous buses. Compression by means of vectorisation frees significant broadband and storage space in devices and equipment, and achieves greater transmission speed per video unit and lower power consumption.

Inventors:
GONZALEZ ORTEGA PAVEL (CL)
Application Number:
PCT/CL2015/000054
Publication Date:
March 16, 2017
Filing Date:
October 19, 2015
Export Citation:
Click for automatic bibliography generation   Help
Assignee:
TECNOLOGIA VVD LTDA (CL)
International Classes:
H04N19/436
Foreign References:
CA2689423C2015-12-01
KR20090006080A2009-01-14
US6865291B12005-03-08
US8908766B22014-12-09
US8917765B22014-12-23
DE102007033316A12009-01-22
Download PDF:
Claims:
REIVINDICACIONES

1 . Método de compresión de imagen y video por vectorización, liberando espacio significativo de banda ancha y de almacenamiento en dispositivos y equipos, CARACTERIZADO, porque está compuesto por la siguiente estructura lógica de pasos:

Paso 1 : ingreso de cuadro o bloque de video al módulo prevectorizador del Dispositivo Ejecutor;

Paso 2: detección del conjunto de colores en cada cuadro y construcción de lista de colores i0-in de los mismos;

Paso 3: separación de colores por comparación de pixeles con valor k de la lista de colores;

Paso 4: creación de una matriz binarizada que opone valores 0 y 1 ;

Paso 5: detección de contornos de segmentos monocromáticos;

Paso 6: conversión de coordenadas de pixeles a vectores;

Paso 7: compresión sin pérdida de datos de la lista de vectores generada.

2. - Dispositivo ejecutor del método de compresión de imagen y video por vectorización de la reivindicación N°l , en formato de circuito integrado o chip, incorporado a dispositivos y equipos fijos y móviles, CARACTERIZADO porque dispone de: i) un módulo de pre vectorización de detección simultánea y en paralelo de regiones de un mismo color (monocromáticas) y sus gradientes, de las imágenes que componen el video, por medio de una matriz de celdas de memoria inteligente; ii) un módulo de gestión y vectorización, que establece el contorno o perímetro de cada región detectada y que guarda las coordenadas del conjunto de vectores que la definen, más el color que la rellena, o las coordenadas del vector del gradiente de dicho color de relleno; iii) un módulo de compresión de vectores sin pérdida de datos para comprimir el conjunto de coordenadas resultantes (vectores); iv) la interconexión entre los módulos pre vectorizador y vectorizador, en que cada celda de memoria inteligente es intervenida Iocalmente por su correlativa celda Multiclet, evitando el trasiego de información y, con ello, el ahorro de ejecuciones reiteradas de funciones y de energía; y, v) de un set de buses para el intercambio de datos y comandos entre los módulos del ejecutor y entre éste y sus sistemas externos.

3. - Dispositivo ejecutor del método de compresión de imagen y video por vectorización en formato de circuito integrado o chip, incorporado a dispositivos y equipos fijos y móviles, según la reivindicación N° 2, CARACTERIZADO porque dispone de una matriz de celdas de memoria inteligente que permite la detección y separación de regiones de un mismo color o gradientes de dicho color, de las imágenes que componen el video, en que cada celda es capaz de aplicar de modo simultáneo y en paralelo con las demás celdas vecinas, todas las funciones lógicas y aritméticas a los valores de pixeles de fragmentos consecutivos de una misma imagen, dando como resultado un procesamiento sincrónico y secuencial (global) de cada imagen de video, precedido por un buffer de entrada de imagen y terminado por un buffer de salida de datos (matriz binaria).

4. Dispositivo ejecutor del método de compresión de imagen y video por vectorización en formato de circuito integrado o chip, incorporado a dispositivos y equipos fijos y móviles, según la reivindicación N° 2 y 3, CARACTERIZADO porque la organización de la matriz de celdas de memoria inteligente en 16 sub matrices de 32 x 32 celdas, permite que cada celda sea intervenida localmente por su correlativa celda ulticlet del módulo de gestión y vectorización, permitiendo la ejecución de los test de detección de vértices y bordes en la matriz misma de memoria inteligente, evitando el trasiego de información y, con ello, el ahorro de ejecuciones reiteradas de funciones y de consumo de energía.

5. Dispositivo ejecutor del método de compresión de imagen y video por vectorización en formato de circuito integrado o chip, incorporado a dispositivos y equipos fijos y móviles, según la reivindicación N° 2, CARACTERIZADO porque incluye una multicelda para la detección de procesamiento paralelo y predictivo, para definir el conjunto de vectores que caracterizan las regiones monocromáticas de cada imagen del video, a través de la detección simultánea y en paralelo de los bordes y vértices del perímetro de una región monocromática dentro de cada imagen, replicando así los contornos de la región monocromática previamente detectada.

Description:
METODO DE COMPRESION DE IMÁGENES Y VIDEO POR VECTORIZACION Y

SU DISPOSITIVO EJECUTOR (CHD?)

La presente patente de invención divulga un Método de Compresión de Imágenes y Video por Vectorización y su Dispositivo Ejecutor en formato de circuito integrado o Chip, para equipos móviles y fijos, con el objetivo de comprimir varias veces más que los métodos actuales de compresión de imágenes, liberando espacios de banda ancha y de almacenamiento, con el consiguiente ahorro de energía.

ESTADO DE LA TECNICA

La demanda de banda ancha móvil se ha ido incrementando exponenciaimente por la transferencia de imágenes y videos; actualmente la transferencia de videos en dispositivos móviles ocupa sobre el 60% del tráfico global, generando una creciente saturación de las redes, agudizada por el incremento del uso de video en HD. Esta situación presenta un gran desafío para toda la industria y los operadores. Las vías actuales de solución son, de una parte, la inversión en nuevas redes y, de otra, la liberación de espacio de la banda ancha a través de la compresión de video.

Los actuales métodos de compresión de imágenes y vídeo comparten el mismo principio básico de funcionamiento: sustituyen conjuntos de píxeles de la imagen original por un solo pixel en la imagen comprimida, cuyo valor es una función del conjunto de valores de los píxeles originales. El conjunto en sí de píxeles a sustituir, puede ser una matriz de tamaño fijo o variable, pero siempre elegida en forma consecutiva a partir de una de las esquinas de la imagen original.

Los principales métodos de compresión de video, H262 a H265, VP3/4 a VP9, Xvid, Theora, Dirac, RealVideo, independiente de sus formas de implementación, son evoluciones de un método común de compresión de video basado en el procesamiento del pixel en lo referente a la compresión del cuadro, considerado éste como imagen estática.

Los métodos actuales realizan un barrido secuencial de la imagen, empezando por alguna de sus esquinas, analizando grupos de píxeles ordenados en matrices de tamafio fijo (macro bloques o bloque básico) en algunos casos, o variable en otros (Coding Tree Units o CTU, por sus siglas en inglés). De dicha matriz de pixeles se extrae información suficiente como para representar en un solo pixel los valores de todos los elementos de la matriz original, tomando en cuenta la relación de luminosidad y respectivos pesos que los componentes del color (rojo, verde y azul) pudieran exhibir en la percepción visual del conjunto en cuestión.

El valor resultante es entonces almacenado en la imagen comprimida, en el lugar que ocuparía el bloque básico original. La imagen compuesta por los resultados es menor que la original, en términos de volumen de información, al menos N x M veces, donde N y M son los valores mínimos (ancho y alto) del bloque básico. La razón de compresión crece proporcionalmente al tamaño del bloque, pero la calidad de la imagen comprimida disminuye en la misma relación; a mayor bloque, mayor es el volumen de información desechada.

Los actuales métodos de compresión basados en pixeles presentan una limitada relación entre la razón de compresión y la calidad de imagen resultante. Actualmente casi todas las tecnologías de compresión de imagen y vídeo, MPEG incluido, se basan en algoritmos con pérdida de datos, centrados en el pixel.

La industria enfrenta el problema incrementando los recursos de almacenamiento y transporte de datos. De hecho, dada la enorme diferencia entre los niveles de demanda por parte de la industria y los niveles actuales de compresión que pueden ofrecer las tecnologías en uso, la tendencia ha sido la intensificación en bruto de los recursos de almacenamiento y transporte, transfiriendo por lo general los costos al usuario.

Otra limitación de los métodos actuales es la incapacidad de escalamiento sin pérdida de calidad, desde la imagen comprimida resultante hacia una resolución superior a la original. Por ejemplo, una imagen HD (1920 x l080 pixeles) comprimida por medio de métodos basados en pixel, al reproducirse en formato 4K (3840 x 2160 pixeles) y con mayor razón en 8 (7680 x 4320 pixeles), se degrada significativamente la calidad de la imagen en pantalla. Esto se explica porque al comprimir una imagen y posteriormente reproducirla en pantallas con resoluciones varias veces mayor que la original, proporcionalmente aumenta varias veces el tamaño de cada pixel de la imagen comprimida, lo cual se visualiza notoriamente.

Así es como surge la necesidad de nuevos métodos de compresión de imágenes en una razón varias veces mayor que las actuales, a fin de liberar espacios significativos de la banda ancha y de los sistemas de almacenamiento y procesamiento, y, a la vez, capaces de mantener la calidad de la imagen independientemente de los formatos de creciente resolución de las pantallas futuras.

Todo video es un conjunto de imágenes, cada imagen, a su vez, es un conjunto de polígonos monocromáticos (áreas de un solo color o gradientes de un color). La compresión de video que ofrece el presente invento se basa en detectar y almacenar solo las coordenadas de los vectores que definen los contornos (perímetros) de sectores monocromáticos de cada imagen y el color que lo rellena, en lugar de almacenar el conjunto de pixeles que los conforman, o, alternativamente, sus derivados.

En efecto, la información que define dichos vectores, es decir las coordenadas de inicio y fin de los mismos, es de un volumen varias veces menor que el conjunto de pixeles contenidos en cada sector monocromático. (Ver Anexo 1 ).

El método objeto de la presente solicitud, se implementa mediante un algoritmo de compresión por vectorización de los contornos de sectores monocromáticos (perímetros) de imágenes, el color que las rellena y sus gradientes, y de un Dispositivo especialmente diseñado para su ejecución.

La vectorización de imágenes no es algo nuevo. Sin embargo no ha sido usada para la compresión de imagen y videos. Principalmente la vectorización se ha usado para la conversión de imágenes de terreno a mapas digitales para sistemas de información geográfica. Así como para aplicaciones médicas en la reconstrucción de volúmenes anatómicos. En suma, las ventajas comparativas que presenta este método, son que al comprimir imagen y video por vectorización, se produce una liberación significativa del espacio de banda ancha, un ahorro en espacio de almacenamiento en dispositivos y equipos, una mayor velocidad de transmisión y un menor consumo de energía por unidad de video almacenado o trasmitido.

BREVE DESCRIPCION DE LAS FIGURAS

Figura 1 : representa la estructura lógica de los pasos del Método de Vectorización de Imagen y Video de la presente invención.

Figura 2: representa un esquema general del Dispositivo Ejecutor del Método de Vectorización de Imagen y Video, objeto de la presente solicitud, con todos sus componentes.

Figura 3: representa la estructura del Módulo Pre Vectorización del Dispositivo Ejecutor, componente de la solicitud presente.

Figura 4: representa la estructura del Módulo de Gestión y Vectorización del Dispositivo Ejecutor, componente de la solicitud que se presenta.

Figura 5: representa el esquema interno de una celda de la Matriz de Memoria Inteligente del Módulo Pre Vectorización del Dispositivo Ejecutor, componente de la solicitud que se presenta.

Figura 6: representa la Interconexión (buses) entre los Módulos de Pre-vectorización y de Gestión y Vectorización del Dispositivo Ejecutor, componente de la solicitud que se presenta.

Para una mejor comprensión de la invención se adjuntan los Anexos 1 y 2, en donde:

ANEXO 1 , Figura 7: Resultado experimental comparativo de compresión por método de pixel (MPEG), y de compresión con el método de vectorización.

ANEXO 2 Figura 8: Esquema auto explicativo de la estructura lógica de los pasos del Método de Vectorización de Imagen y Video.

DESCRIPCION DETALLADA DE LA INVENCION

La presente Invención consiste en un Método de compresión de imagen y video por vectorización y un Dispositivo Ejecutor de dicho método en formato de circuito integrado o Chip. El Método comprende una estructura lógica de pasos, y es ejecutado en lenguaje máquina del Ejecutor.

El Método de Compresión de Imagen y Video por Vectorización consiste en vectorizar los contornos de cada polígono monocromático que conforman la imagen o cuadro de video. El método supone: i) la detección de los contornos de los segmentos o polígonos monocromáticos de la imagen o cuadro de video; y ii) la posterior conversión de las coordenadas de los vértices de cada uno de aquellos segmentos o polígonos, a sus correspondientes vectores. De este modo, el método permite almacenar y comprimir, sin pérdida, solo los vectores en lugar de comprimir el universo de pixeles de cada segmento de imagen.

Acorde a la figura 1 , el Método de Compresión por Vectorización comprende una estructura lógica de pasos. Si bien estos pasos son parte de un instrumental conocido y usado, su secuencia e interrelaciones, son propias de la invención que se presenta, haciendo posible el proceso mismo de vectorización, a saber: ingreso de cuadro de video al módulo Pre vectorizador del Dispositivo Ejecutor (paso 1); detección del conjunto de colores en el cuadro y construcción de la lista de colores, asimismo la detección y almacenamiento de los vectores que definen el contorno de polígonos monocromáticos de cada imagen y el consiguiente listado de los colores i 0 -i n presentes en cada cuadro o frame, (paso 2); separación de colores por comparación con los pixeles de valor de la imagen (paso 3); construcción de una matriz binaria que otorga valores 1 a todos los segmentos monocromáticos de la imagen que cumplen los requisitos de selección, y 0 a todos aquellos que no los cumplen (paso 4); detección de los contornos de dichos segmentos monocromáticos (paso 5); conversión de las coordenadas de pixeles a vectores (paso 6); compresión sin pérdida de datos del conjunto de vectores definidos (paso 7), conservando la calidad de la imagen con independencia de los niveles de resolución de las pantallas.

Acorde a la figura 1 , los pasos 2, 4 y 6 generan instancias de información intermedia (8), (9), (10) y una instancia final de información (1 1): a través del paso 2 se genera una lista de colores en el segmento del cuadro (8), información de entrada para el paso 3 de separación de colores por comparación de pixeles. El paso 4 da lugar a un Conjunto de capas binarizadas por cada color del listado (9), que alimenta el paso 5 de detección de contornos de segmentos monocromáticos. Enseguida, el paso 6 genera un Meta Archivo (10) con valores de vectores, colores y gradientes, que son comprimidos sin pérdida de datos en el último paso del método, paso 7, y su ulterior salida a memoria (1 1 ).

El Dispositivo Ejecutor del Método, figura 2, está compuesto por 3 procesadores o módulos principales y 22 componentes auxiliares o sub componentes. Acorde a la figura 2, los módulos principales son: el Módulo de Pre Vectorización ( 12), el Módulo de Gestión y Vectorización (13) y el Módulo de Compresión de Vectores sin pérdida de Datos (14), un bus de Control y Comandos (15), un Interconector de módulos (16) y un bus de Video y Datos (17).

El Módulo de Pre Vectorización, acorde a la figura 3, está compuesto por una Matriz de Celdas de Memoria Inteligente ( 18) destinadas a separar la imagen en colores y detectar las zonas monocromáticas, además de un Buffer de Entrada de Imagen (19) y de un Buffer de Salida de Datos (20). Para los propósitos señalados, cada celda de Memoria Inteligente (21) está compuesta, acorde a figura 5, por una unidad de ejecución de operaciones lógicas y aritméticas o Comparador Lógico de pixeles de 24 bits (27), cada cual con su respectivo almacenamiento o Registro del Pixel Original (28), el Valor de Referencia o Limite de Gradiente (29) y el Registro de Resultado de la Comparación (30), capaz de guardar también el valor del otro extremo de un gradiente.

El Módulo de Gestión y Vectorización acorde a la figura 4, cumple la función de gestor general del funcionamiento del Chip y a la vez ejecuta las funciones principales del Método de Vectorización. Para tales fines dispone de una Matriz con una versión inicial de 16 celdas Multiclet (22); cada celda Multiclet (23) tiene la capacidad de ejecución de los programas de modo predictivo y en paralelo, con funciones aritméticas de doble precisión; así mismo de un Bus de interconexión de celdas (24), de un Arbitro de Memoria de programa (25), y de un Interface a memoria (26).

El Módulo de Compresión de Vectores sin pérdida (14) está compuesto por un ejecutor del método LZW (u otro de la misma familia) de compresión de datos sin pérdida y los respetivos módulos de interface a los buses (15) y ( 17). Estos buses están, a su vez, conectados a la memoria de entrada de video y de salida de datos respectivamente.

El Interconector (16), acorde a la figura 6, enlaza la matriz de Celdas de Memoria Inteligente, componente del módulo Pre Vectorización (12), organizada para estos efectos en 16 Sub Matrices de 32 x 32 celdas (31 ), cada una correspondiendo a una de las 16 celdas Multiclet (23), componentes éstas del Módulo de Gestión y Vectorización (13).

El Bus de Video y Datos (17) dispone de un Demultiplexor (32) y de una Interface de Relleno de Sub Matrices de Memoria Inteligente (33), desempeñando ambos elementos roles sustanciales en el manejo del flujo de la información.

La función de la Interface de Relleno de Sub Matrices de Memoria consiste en distribuir cuadros o partes del mismo en la matriz de Pre Vectorización acorde a su posición espacial en vez de su posición secuencial.

Acorde con la Interconexión, figura 5, la entrada al Chip del flujo de video la coordinan el Módulo de Gestión y Vectorización ( 13) con los buses (15) y (17). El flujo de video es separado en cuadros independientes en orden cronológico acorde a su llegada mediante el Demultiplexor (32) y son almacenados en un buffer de memoria manejado por el Módulo de Gestión y Vectorización. Los cuadros son cargados al Módulo Pre Vectorización ( 12) parcialmente o completos mediante la Interface de Relleno de Sub Matrices de Memoria Inteligente (33), dependiendo de la relación entre la resolución del video y el tamaño de la Matriz de celdas de Memoria Inteligente (18), componente de dicho módulo. En consecuencia, la ejecución del Método se inicia con el ingreso de un cuadro o bloque de video al Chip de Compresión, primera fase (1 ), continúa con la detección y generación de un listado del conjunto de colores en el cuadro, o segmento del mismo, segunda fase del Método (2).

Esta modalidad de interconexión entre los módulos Pre Vectorizador y de Gestión y Vectorización, resulta de particular importancia para optimizar el rendimiento del método y su dispositivo ejecutor: la Matriz de Celdas Memoria Inteligente (12) se divide en 16 Sub Matrices de 32 x 32 celdas (31 ) según figura 4, cada una de las cuales es intervenida localmente por su correlativa celda Multiclet (23), permitiendo la ejecución de los test de detección de vértices y bordes en la misma matriz de Memoria Inteligente, a diferencia de los métodos habituales, evitando el trasiego de información.

El paso 3 del Método, se ejecuta por medio de la matriz de Memoria Inteligente del Dispositivo Ejecutor: la matriz separa todos los sectores de un solo color contenidos en el cuadro o segmento del mismo, comparando simultáneamente todos los pixeles con cada uno de los valores del listado de colores presentes en el cuadro o segmento en proceso, detectados dinámicamente, o con un conjunto de valores de colores predefinidos. Como resultado se crea una matriz binaria que opone valores 0 yl , donde con 1 se rellenan todos los pixeles cuyo color coincide con el valor en curso de la lista y con 0 todo el resto, (ejecución del cuarto 4 paso), obteniéndose un arreglo de capas del cuadro o segmento, permitiendo que cada una contenga, separadamente, los sectores monocromáticos de cada uno de los colores contenidos en el segmento o cuadro en proceso.

Por medio de los buses (15) y (17) el arreglo de capas es trasladado al Módulo de Gestión y Vectorización, para la detección de contornos de segmentos de cada imagen, ejecución del paso 5 de la estructura lógica. La conversión de coordenadas de pixeles a vectores, paso 6, se ejecuta procesando capa por capa los bordes de los sectores destacados y trazando un conjunto de vectores que replique dichos bordes lo más fielmente posible (sub proceso del paso 6). Dicho conjunto de vectores es en sí la información a almacenar como representación de la imagen, en lugar del conjunto de pixeles que componen el original.

El total de vectores que componen un cuadro o segmento del mismo, es ordenado y optimizado de modo de excluir la redundancia endémica de los vectores comunes de sectores vecinos. Enseguida se genera la estructura de Meta Archivo o contenedor de información (10), donde son almacenados: i) los vectores, representados por sus coordenadas de inicio y fin, ii) los colores de relleno de los sectores definidos por dichos vectores y, eventualmente, iii) los vectores de propagación de los gradientes de color de relleno de múltiples sectores auto contenidos.

Posteriormente, el contenedor o Meta Archivo es comprimido, paso 7, por el Módulo de Compresión de Vectores sin Pérdida (14). Por último, los buses (15) y (17) según figural, permiten el intercambio de datos y comandos entre todos los módulos del chip y, una vez comprimido el contenedor de información, realizan la salida de datos a memoria externa (11 ), así como la conexión entre el chip y los sistemas externos al mismo.