Вказівка використання паралельної хвильової обробки у кодуванні відео
Формула / Реферат
1. Спосіб декодування відеоданих, який містить:
аналіз синтаксичного елемента з бітового потоку, причому бітовий потік включає в себе вузол рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL) кодованого слайса включає в себе множину підпотоків, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення;
визначення, на основі синтаксичного елемента, чи включають підпотоки біти заповнення, які забезпечують вирівнювання по байтах підпотоків;
у відповідь на визначення, що синтаксичний елемент має конкретне значення, декодування кожного мозаїчного фрагмента зображення з використанням паралельної хвильової обробки (WPP), причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
2. Спосіб за п. 1, який додатково містить аналіз з бітового потоку набору параметрів зображення, який включає в себе синтаксичний елемент.
3. Спосіб за п. 1, який додатково містить аналіз з бітового потоку набору параметрів послідовності, який включає в себе синтаксичний елемент.
4. Спосіб за п. 1, який додатково містить:
аналіз другого синтаксичного елемента з бітового потоку, причому бітовий потік включає в себе кодоване представлення другого зображення відеоданих, причому друге зображення розділене на блоки СТВ, причому друге зображення розділене на щонайменше перший мозаїчний фрагмент і другий мозаїчний фрагмент, і
у відповідь на визначення, що другий синтаксичний елемент не має конкретного значення паралельного декодування СТВ першого мозаїчного фрагмента і СТВ другого мозаїчного фрагмента.
5. Спосіб за п. 1, який додатково містить:
визначення, що набір параметрів включає в себе синтаксичний елемент кількості стовпців мозаїчного фрагмента і синтаксичний елемент кількості рядів мозаїчного фрагмента;
визначення на основі синтаксичного елемента кількості стовпців мозаїчного фрагмента заданої кількості стовпців мозаїчного фрагмента, причому кількість стовпців мозаїчних фрагментів для кожного зображення, зв'язаного з набором параметрів, дорівнює заданій кількості стовпців мозаїчного фрагмента; і
визначення на основі синтаксичного елемента кількості рядів мозаїчного фрагмента заданої кількості рядів мозаїчного фрагмента, причому кількість рядів мозаїчного фрагмента кожного зображення, зв'язаного з набором параметрів, дорівнює заданій кількості рядів мозаїчного фрагмента.
6. Спосіб за п. 1, в якому синтаксичний елемент є першим синтаксичним елементом, конкретне значення є першим значенням, і перший синтаксичний елемент, який має друге значення, вказує, що зображення включає в себе тільки один мозаїчний фрагмент і що бітовий потік включає в себе другий синтаксичний елемент, другий синтаксичний елемент вказує, чи дозволяються ентропійні слайси для кодованих представлень зображень, які належать до набору параметрів, який включає в себе перший і другий синтаксичні елементи.
7. Спосіб за п. 1, в якому вузол NAL кодованого слайса містить заголовок слайса і дані слайса, і спосіб додатково містить:
визначення на основі, щонайменше частково, синтаксичного елемента, чи включає заголовок слайса сукупність синтаксичних елементів зміщення; і
у відповідь на визначення, що заголовок слайса включає в себе сукупність синтаксичних елементів зміщення, використання множини синтаксичних елементів зміщення, щоб визначити точки входу підпотоків у даних слайса.
8. Спосіб за п. 1, в якому декодування зображення з використанням WPP містить:
у відповідь на визначення, що перший СТВ відділений від лівої межі зображення одним СТВ, збереження змінних контексту, зв'язаних з першим СТВ; і ентропійне кодування на основі, щонайменше частково, змінних контексту, зв'язаних з першим СТВ, одного або декількох синтаксичних елементів другого СТВ, другий СТВ є суміжним з лівою межею зображення і одним рядом СТВ-одиниць нижче першого СТВ.
9. Спосіб кодування відеоданих, який включає:
формування в бітовому потоці вузла рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL) кодованого слайса включає в себе множину підпотоків, формування синтаксичного елемента в бітовому потоці, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому підпотоки включають в себе біти заповнення, які забезпечують вирівнювання по байтах підпотоків, і кожний мозаїчний фрагмент зображення кодується з використанням паралельної хвильової обробки (WPP), причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення, причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
10. Спосіб за п. 9, в якому формування бітового потоку містить формування набору параметрів зображення, який включає в себе синтаксичний елемент.
11. Спосіб за п. 9, в якому формування бітового потоку містить формування набору параметрів послідовності, який включає в себе синтаксичний елемент.
12. Спосіб за п. 9, який додатково включає включення другого синтаксичного елемента в бітовий потік, причому бітовий потік включає в себе кодоване представлення другого зображення відеоданих, причому друге зображення розділене на блоки СТВ, другий синтаксичний елемент не має конкретного значення, причому друге зображення розділене на щонайменше перший мозаїчний фрагмент і другий мозаїчний фрагмент; і
кодування паралельно блока дерева кодування (СТВ) першого мозаїчного фрагмента і СТВ другого мозаїчного фрагмента.
13. Спосіб за п. 9, в якому:
формування бітового потоку містить формування набору параметрів, який включає в себе синтаксичний елемент кількості стовпців мозаїчного фрагмента і синтаксичний елемент кількості рядів мозаїчного фрагмента, кількість стовпців мозаїчного фрагмента є такою, що визначається на основі синтаксичного елемента кількості стовпців мозаїчного фрагмента, і кількість стовпців мозаїчних фрагментів кожного зображення, зв'язаного з набором параметрів, дорівнює кількості стовпців мозаїчного фрагмента, і кількість рядів мозаїчного фрагмента є такою, що визначається на основі синтаксичного елемента кількості рядів мозаїчного фрагмента, і кількість рядів мозаїчних фрагментів кожного зображення, зв'язаного з набором параметрів, дорівнює кількості рядів мозаїчного фрагмента.
14. Спосіб за п. 9, в якому синтаксичний елемент є першим синтаксичним елементом, конкретне значення являє собою перше значення, синтаксичний елемент має друге значення, яке вказує, що зображення розділене на одиночний мозаїчний фрагмент, і бітовий потік включає в себе другий синтаксичний елемент, другий синтаксичний елемент вказує, чи дозволяються ентропійні слайси для кодованого представлення зображень, які належать до набору параметрів, який включає в себе перший і другий синтаксичні елементи.
15. Спосіб за п. 9, в якому:
вузол NAL кодованого слайса містить заголовок слайса і дані слайса, і заголовок слайса включає в себе множину синтаксичних елементів зміщення, з яких можуть бути визначені точки входу підпотоків у даних слайса.
16. Спосіб за п. 9, який додатково включає використання WPP, щоб закодувати кожний мозаїчний фрагмент зображення, причому використання WPP, щоб закодувати кожний мозаїчний фрагмент зображення, містить:
у відповідь на визначення, що перший СТВ відділений від лівої межі зображення одним СТВ, збереження змінних контексту, зв'язаних з першим СТВ; і ентропійне кодування на основі, щонайменше частково, змінних контексту, зв'язаних з першим СТВ, одного або декількох синтаксичних елементів другого СТВ, другий СТВ є суміжним з лівою межею зображення і одним рядом СТВ-одиниць нижче першого СТВ.
17. Пристрій декодування відео, який містить носій даних, виконаний з можливістю зберігання відеоданих; і один або декілька процесорів, сконфігурованих з можливістю: аналізу синтаксичного елемента з бітового потоку, причому бітовий потік включає в себе вузол рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL) кодованого слайса включає в себе множину підпотоків, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення;
визначення, на підставі синтаксичного елемента, чи включають підпотоки біти заповнення, які забезпечують вирівнювання по байтах підпотоків;
у відповідь на визначення, що синтаксичний елемент має конкретне значення, декодування кожного мозаїчного фрагмента зображення з використанням паралельної хвильової обробки (WPP), причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
18. Пристрій декодування відео за п. 17, в якому один або декілька процесорів сконфігуровані для аналізу з бітового потоку набору параметрів зображення, який включає в себе синтаксичний елемент.
19. Пристрій декодування відео за п. 17, в якому один або декілька процесорів сконфігуровані для аналізу з бітового потоку набору параметрів послідовності, який включає в себе синтаксичний елемент.
20. Пристрій декодування відео за п. 17, в якому один або більше процесорів додатково виконані з можливістю: аналізу другого синтаксичного елемента з бітового потоку, причому бітовий потік включає в себе кодоване представлення другого зображення відеоданих, причому друге зображення розділене на блоки СТВ, причому друге зображення розділене на щонайменше перший мозаїчний фрагмент і другий мозаїчний фрагмент, і, у відповідь на визначення, що другий синтаксичний елемент не має конкретного значення, паралельного декодування СТВ першого мозаїчного фрагмента і СТВ другого мозаїчного фрагмента.
21. Пристрій декодування відео за п. 17, в якому один або декілька процесорів додатково сконфігуровані з можливістю:
визначати, що набір параметрів включає в себе синтаксичний елемент кількості стовпців мозаїчного фрагмента і синтаксичний елемент кількості рядів мозаїчного фрагмента;
визначати, на основі синтаксичного елемента кількості стовпців мозаїчного фрагмента, задану кількість стовпців мозаїчного фрагмента, причому кількість стовпців мозаїчних фрагментів кожного зображення, зв'язаного з набором параметрів, дорівнює заданій кількості стовпців мозаїчного фрагмента; і
визначати, на основі синтаксичного елемента кількості рядів мозаїчного фрагмента, задану кількість рядів мозаїчного фрагмента, причому кількість рядів мозаїчних фрагментів кожного зображення, зв'язаного з набором параметрів, дорівнює заданій кількості рядів мозаїчного фрагмента.
22. Пристрій декодування відео за п. 17, в якому синтаксичним елементом є перший синтаксичний елемент, конкретним значенням є перше значення, і перший синтаксичний елемент, який має друге значення, вказує, що зображення включає в себе тільки один мозаїчний фрагмент і що бітовий потік включає в себе другий синтаксичний елемент, другий синтаксичний елемент вказує, чи дозволяються ентропійні слайси для кодованих представлень зображень, які належить до набору параметрів, який включає в себе перший і другий синтаксичні елементи.
23. Пристрій декодування відео за п. 17, в якому вузол NAL кодованого слайса включає в себе заголовок слайса і дані слайса, і один або декілька процесорів додатково сконфігуровані з можливістю:
визначати, на основі, щонайменше частково, синтаксичного елемента, чи включає заголовок слайса сукупність синтаксичних елементів зміщення; і,
у відповідь на визначення, що заголовок слайса включає в себе сукупність синтаксичних елементів зміщення, використовувати сукупність синтаксичних елементів зміщення, щоб визначати точки входу підпотоків у даних слайса.
24. Пристрій декодування відео за п. 17, в якому, коли один або декілька процесорів використовують WPP, щоб декодувати мозаїчні фрагменти зображення, один або декілька процесорів виконані з можливістю:
у відповідь на визначення, що перший СТВ відділений від лівої межі зображення одним СТВ, зберігати змінні контексту, зв'язані з першим СТВ; і
ентропійно декодувати, на основі, щонайменше частково, змінних контексту, зв'язаних з першим СТВ, один або декілька синтаксичних елементів другого СТВ, другий СТВ є суміжним з лівою межею зображення і одним рядом блоків СТВ нижче першого СТВ.
25. Пристрій декодування відео за п. 17, що містить щонайменше одне з:
- інтегральної схеми;
- мікропроцесора; або
- бездротового пристрою зв'язку.
26. Пристрій декодування відео за п. 17, який додатково містить дисплей, виконаний з можливістю відображення декодованих відеоданих.
27. Пристрій кодування відео, який містить:
носій даних, виконаний з можливістю зберігання відеоданих; і один або декілька процесорів, сконфігурованих з можливістю формування в бітовому потоці вузла рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL) кодованого слайса включає в себе множину підпотоків, формування синтаксичного елемента в бітовому потоці, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому підпотоки включають в себе біти заповнення, які забезпечують вирівнювання по байтах підпотоків, і кожний мозаїчний фрагмент зображення кодується з використанням паралельної хвильової обробки (WPP), причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення, причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
28. Пристрій кодування відео за п. 27, в якому один або декілька процесорів сконфігуровані з можливістю формування набору параметрів зображення, який включає в себе синтаксичний елемент.
29. Пристрій кодування відео за п. 27, в якому один або декілька процесорів сконфігуровані з можливістю формування набору параметрів послідовності, який включає в себе синтаксичний елемент.
30. Пристрій кодування відео за п. 27, в якому один або більше процесорів додатково виконані з можливістю: включення другого синтаксичного елемента в бітовий потік, причому бітовий потік включає в себе кодоване представлення другого зображення відеоданих, друге зображення розділене на блоки СТВ, другий синтаксичний елемент розділений на щонайменше перший мозаїчний фрагмент і другий мозаїчний фрагмент; і
кодування паралельно блока дерева кодування (СТВ) першого мозаїчного фрагмента і СТВ другого мозаїчного фрагмента.
31. Пристрій кодування відео за п. 27, в якому:
один або декілька процесорів сконфігуровані з можливістю формування набору параметрів, який включає в себе синтаксичний елемент кількості стовпців мозаїчного фрагмента і синтаксичний елемент кількості рядів мозаїчного фрагмента, кількість стовпців мозаїчного фрагмента є такою, що визначається на основі синтаксичного елемента кількості стовпців мозаїчного фрагмента, і кількість стовпців мозаїчних фрагментів кожного зображення, зв'язаного з набором параметрів, дорівнює кількості стовпців мозаїчного фрагмента, і кількість рядів мозаїчного фрагмента є такою, що визначається на основі синтаксичного елемента кількості рядів мозаїчного фрагмента, і кількість рядів мозаїчних фрагментів кожного зображення, зв'язаного з набором параметрів, дорівнює кількості рядів мозаїчного фрагмента.
32. Пристрій кодування відео за п. 27, в якому синтаксичний елемент є першим синтаксичним елементом, конкретне значення являє собою перше значення, синтаксичний елемент має друге значення, яке вказує, що зображення кодоване згідно з другим режимом кодування, причому зображення розділяється на одиночний мозаїчний фрагмент, і бітовий потік включає в себе другий синтаксичний елемент, другий синтаксичний елемент, вказує, чи дозволяються ентропійні слайси для кодованого представлення зображень, які належать до набору параметрів, який включає в себе перший і другий синтаксичні елементи.
33. Пристрій кодування відео за п. 27, в якому:
вузол NAL кодованого слайса містить заголовок слайса і дані слайса, і заголовок слайса включає в себе сукупність синтаксичних елементів зміщення, з яких можуть бути визначені точки входу підпотоків у даних слайса.
34. Пристрій кодування відео за п. 27, в якому, коли один або декілька процесорів використовують WPP, щоб закодувати СТВ-одиниці для кожного мозаїчного фрагмента зображення, один або декілька процесорів виконані з можливістю:
у відповідь на визначення, що перший СТВ відділений від лівої межі зображення одним СТВ, зберігати змінні контексту, зв'язані з першим СТВ; і
ентропійно кодувати на основі, щонайменше частково, змінних контексту, зв'язаних з першим СТВ, один або декілька синтаксичних елементів другого СТВ, другий СТВ є суміжним з лівою межею зображення і одним рядом СТВ-одиниць нижче першого СТВ.
35. Пристрій кодування відео за п. 27, в якому пристрій кодування відео містить щонайменше одне з:
- інтегральної схеми;
- мікропроцесора; або
- бездротового пристрою зв'язку.
36. Пристрій кодування відео за п. 27, який додатково містить камеру, виконану з можливістю захоплення відеоданих.
37. Пристрій декодування відео, який містить:
засіб для аналізу синтаксичного елемента з бітового потоку, причому бітовий потік включає в себе вузол рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL) кодованого слайса включає в себе множину підпотоків, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення, засіб для визначення, на основі синтаксичного елемента, чи включають підпотоки біти заповнення, які забезпечують вирівнювання по байтах підпотоків; і
засіб для декодування, у відповідь на визначення, що синтаксичний елемент має конкретне значення, кожного мозаїчного фрагмента зображення з використанням паралельної хвильової обробки (WPP), причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
38. Пристрій кодування відео, який містить засіб для формування в бітовому потоці вузла рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL) кодованого слайса включає в себе множину підпотоків; і
засіб для формування синтаксичного елемента в бітовому потоці, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому підпотоки включають в себе біти заповнення, які забезпечують вирівнювання по байтах підпотоків, і кожний мозаїчний фрагмент зображення кодується з використанням паралельної хвильової обробки (WPP), причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення, причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
39. Машиночитаний носій даних, який зберігає інструкції, які при виконанні одним або декількома процесорами пристрою декодування відео конфігурують пристрій декодування відео, щоб:
аналізувати синтаксичний елемент з бітового потоку, причому бітовий потік включає в себе вузол рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL) кодованого слайса включає в себе множину підпотоків, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення;
визначати, на підставі синтаксичного елемента, чи включають підпотоки біти заповнення, які забезпечують вирівнювання по байтах підпотоків;
у відповідь на визначення, що синтаксичний елемент має конкретне значення, декодувати кожний мозаїчний фрагмент зображення з використанням паралельної хвильової обробки (WPP), причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
40. Постійний машиночитаний носій даних, який зберігає інструкції, які при виконанні одним або декількома процесорами пристрою кодування відео конфігурують пристрій кодування відео, щоб формувати в бітовому потоці вузол рівня мережевої абстракції (NAL) кодованого слайса для слайса зображення відеоданих, яке розділене на блоки дерева кодування (СТВ), причому кожний з блоків СТВ асоційований з різними рівнорозмірними блоками пікселів в зображенні, причому вузол рівня мережевої абстракції (NAL ) кодованого слайса включає в себе множину підпотоків, формувати синтаксичний елемент в бітовому потоці, причому синтаксичний елемент, який має конкретне значення, яке вказує кожний відповідний ряд блоків СТВ зображення, формує відповідний мозаїчний фрагмент зображення, причому підпотоки включають в себе біти заповнення, які забезпечують вирівнювання по байтах підпотоків, і кожний мозаїчний фрагмент зображення кодується з використанням паралельної хвильової обробки (WPP), причому кожний відповідний підпотік множини підпотоків містить всі кодовані біти відповідного мозаїчного фрагмента зображення, кількість кінцевих кодованих бітів відповідного мозаїчного фрагмента або початкових кодованих бітів відповідного мозаїчного фрагмента, і жоден з підпотоків не містить кодовані біти більш ніж одного мозаїчного фрагмента зображення, причому синтаксичний елемент, який не має конкретного значення, вказує, що кожний мозаїчний фрагмент зображення декодується без використання WPP.
Текст
Реферат: Відеокодер формує бітовий потік, який включає в себе синтаксичний елемент, який вказує, чи кодується зображення згідно з першим режимом кодування або згідно з другим режимом кодування. У першому режимі кодування зображення кодується повністю з використанням паралельної хвильової обробки (WPP). У другому режимі кодування кожний мозаїчний фрагмент зображення кодується без використання WPP, і зображення може мати один або декілька мозаїчних фрагментів. Відеодекодер може здійснювати аналіз синтаксичного елемента з бітового потоку. У відповідь на визначення, що синтаксичний елемент має конкретне значення, відеодекодер декодує зображення повністю з використанням WPP. У UA 112675 C2 (12) UA 112675 C2 відповідь на визначення, що синтаксичний елемент не має конкретного значення, відеодекодер декодує кожний мозаїчний фрагмент зображення без використання WPP. UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 Дана заявка заявляє пріоритет за попередньою заявкою на патент США № 61/588096, поданою 18 січня 2012, весь зміст якої таким чином включений в документ за допомогою посилання. ГАЛУЗЬ ТЕХНІКИ, ДО ЯКОЇ НАЛЕЖИТЬ ВИНАХІД Дане розкриття належить до кодування відео (тобто, кодування і/або декодування відеоданих). РІВЕНЬ ТЕХНІКИ Можливості цифрового відео можуть включатися в широкий спектр пристроїв, включаючи цифрові телевізори, цифрові системи прямого мовлення, системи бездротового зв’язку, персональні цифрові асистенти (PDA), ноутбуки або настільні комп'ютери, планшетні комп'ютери, пристрої читання електронних книг, цифрові (фото)камери, пристрої цифрового запису, цифрові мультимедійні програвачі, пристрої відеоігор, ігрові приставки, стільникові або супутникові радіотелефони, так звані "інтелектуальні телефони", відеопристрої відеоконференцзв'язку, пристрої потокового відео і подібне. Пристрої цифрового відео реалізовують способи стиснення відеоінформації, такі як описані в стандартах, визначених стандартами MPEG-2, MPEG-4 Експертної групи з питань рухомого зображення, стандартами Міжнародного союзу електрозв'язку - сектора телекомунікацій (ITU-T) H.263, ITU-T H.264/MPEG4, Частина 10, Вдосконалене кодування відеозображення (AVC), стандартом Високоефективного кодування відеозображень (HEVC), що розробляється в цей час, і розширеннями таких стандартів. Відео пристрої можуть передавати, приймати, кодувати, декодувати і/або зберігати інформацію цифрового відео більш ефективно шляхом реалізації таких способів стиснення відео. Способи стиснення відео виконують просторове (внутрішньокадрове) прогнозування і/або часове (міжкадрове) прогнозування, щоб зменшувати або видаляти надмірність, властиву відео послідовностям. Для основаного на блоках кодування відеозображення, "слайс" (slice) відеозображення (тобто, кадр зображення або частина кадру зображення) може бути розділений на блоки відео, які можуть також іменуватися деревоподібними блоками, одиницями кодування (CU) і/або вузлами кодування. Блоки відео у внутрішньокадрово-кодованому слайсі (I) зображення кодуються з використанням просторового прогнозування по відношенню до опорних вибірок у сусідніх блоках у тому самому зображенні. Блоки відео в міжкадровокодованому слайсі (Р або В) зображення можуть використовувати просторове прогнозування по відношенню до опорних вибірок у сусідніх блоках у тому самому зображенні або часове прогнозування по відношенню до опорних вибірок в інших опорних зображеннях. Зображення можуть іменуватися кадрами, і опорні зображення можуть іменуватися опорними кадрами. Просторове або часове прогнозування дає в результаті прогнозований блок для блока, що підлягає кодуванню. Залишкові дані представляють піксельні різниці між вихідним блоком, що підлягає кодуванню, і прогнозованим блоком. Блок з міжкадровим кодуванням кодується згідно з вектором руху, який вказує на блок опорних вибірок, утворюючих прогнозований блок, і залишковими даними, які вказують різницю між кодованим блоком і прогнозованим блоком. Блок з внутрішнім кодуванням кодується згідно з режимом внутрішньокадрового кодування і залишковими даними. Для додаткового стиснення залишкові дані можуть бути перетворені з піксельної ділянки в ділянку перетворення, даючи в результаті залишкові коефіцієнти, які потім можуть квантуватися. Квантовані коефіцієнти, спочатку організовані у вигляді двомірного масиву, можна сканувати, щоб створити одномірний вектор коефіцієнтів, і може застосовуватися ентропійне кодування, щоб досягти ще більшого стиснення. КОРОТКИЙ ОПИС СУТІ ВИНАХОДУ Загалом, дане розкриття описує способи для кодування відео, в яких комбінації мозаїчних фрагментів (tiles) і паралельної хвильової обробки (WPP) всередині одного зображення не дозволяються. Більш конкретно, відеокодер формує бітовий потік, який включає в себе синтаксичний елемент, який вказує, чи кодоване зображення згідно з або першим режимом кодування, або другим режимом кодування. У першому режимі кодування зображення кодується повністю з використанням WPP. У другому режимі кодування кожний мозаїчний фрагмент зображення кодується без використання WPP. Відеодекодер аналізує синтаксичний елемент з бітового потоку і визначає, чи має синтаксичний елемент конкретне значення. У відповідь на визначення, що синтаксичний елемент має конкретне значення, відеодекодер декодує зображення повністю з використанням WPP. У відповідь на визначення, що синтаксичний елемент не має конкретного значення, відеодекодер декодує кожний мозаїчний фрагмент зображення без використання WPP. В одному аспекті це розкриття описує спосіб декодування відеоданих. Спосіб містить аналіз синтаксичного елемента з бітового потоку, який включає в себе кодоване представлення 1 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 зображення у вигляді відеоданих. Крім того, спосіб містить, у відповідь на визначення, що синтаксичний елемент має конкретне значення, декодування зображення повністю з використанням WPP. Спосіб також містить у відповідь на визначення, що синтаксичний елемент не має конкретне значення, декодування кожного мозаїчного фрагмента зображення без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. В іншому аспекті це розкриття описує спосіб кодування відеоданих. Спосіб містить формування бітового потоку, який включає в себе синтаксичний елемент, який вказує, чи кодується зображення згідно з першим режимом кодування або згідно з другим режимом кодування. У першому режимі кодування зображення кодується повністю з використанням WPP. У другому режимі кодування кожний мозаїчний фрагмент зображення кодується без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. В іншому аспекті це розкриття описує пристрій декодування відео, який містить один або декілька процесорів, сконфігурованих для аналізу синтаксичного елемента з бітового потоку, що включає в себе кодоване представлення зображення у відеоданих. Один або декілька процесорів конфігуруються з можливістю, у відповідь на визначення, що синтаксичний елемент має конкретне значення, декодувати зображення повністю з використанням WPP. Крім того, один або декілька процесорів конфігуруються з можливістю, у відповідь на визначення, що синтаксичний елемент не має конкретне значення, декодувати кожний мозаїчний фрагмент зображення без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. В іншому аспекті це розкриття описує пристрій кодування відео, який містить один або декілька процесорів, сконфігурованих для формування бітового потоку, що включає в себе синтаксичний елемент, який вказує, чи кодується зображення згідно з першим режимом кодування або згідно з другим режимом кодування. У першому режимі кодування зображення кодується повністю з використанням WPP. У другому режимі кодування кожний мозаїчний фрагмент зображення кодується без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. В іншому аспекті це розкриття описує пристрій декодування відео, який містить засіб для аналізу синтаксичного елемента з бітового потоку, що включає в себе кодоване представлення зображення у відеоданих. Пристрій декодування відео також містить засіб для декодування, у відповідь на визначення, що синтаксичний елемент має конкретне значення, зображення повністю з використанням WPP. Крім того, пристрій декодування відео містить засіб для декодування, у відповідь на визначення, що синтаксичний елемент не має конкретне значення, кожного мозаїчного фрагмента зображення без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. В іншому аспекті це розкриття описує пристрій кодування відео, який містить засіб для формування бітового потоку, що включає в себе синтаксичний елемент, який вказує, чи кодується зображення згідно з першим режимом кодування або згідно з другим режимом кодування. У першому режимі кодування зображення кодується повністю з використанням WPP. У другому режимі кодування кожний мозаїчний фрагмент зображення кодується без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. В іншому аспекті це розкриття описує машинозчитуваний носій даних, який зберігає інструкції, які при виконанні одним або декількома процесорами пристрою декодування відео конфігурують пристрій декодування відео для аналізу синтаксичного елемента з бітового потоку, що включає в себе кодоване представлення зображення у відеоданих. Інструкції також спонукають пристрій декодування відео декодувати, у відповідь на визначення, що синтаксичний елемент має конкретне значення, зображення повністю з використанням WPP. Крім того, інструкції спонукають пристрій декодування відео декодувати, у відповідь на визначення, що синтаксичний елемент не має конкретне значення, кожний мозаїчний фрагмент зображення без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. В іншому аспекті, машинозчитуваний носій даних, який зберігає інструкції, які при виконанні одним або декількома процесорами пристрою кодування відео, конфігурують пристрій кодування відео для формування бітового потоку, що включає в себе синтаксичний елемент, який вказує, чи кодоване зображення згідно з першим режимом кодування або згідно з другим режимом кодування. У першому режимі кодування зображення кодується повністю з використанням WPP. У другому режимі кодування кожний мозаїчний фрагмент зображення кодується без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. 2 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 Деталі одного або декількох прикладів розкриття викладені на супровідних кресленнях і в описі нижче. Інші ознаки, об'єкти та переваги будуть очевидними з опису, креслень і формули винаходу. КОРОТКИЙ ОПИС КРЕСЛЕНЬ Фіг. 1 - блок-схема, що ілюструє зразкову систему кодування відео, яка може використовувати способи, описані в цьому розкритті. Фіг. 2 - блок-схема, що ілюструє зразковий відеокодер, який може здійснювати способи, описані в цьому розкритті. Фіг. 3 - блок-схема, що ілюструє зразковий відеодекодер, який може здійснювати способи, описані в цьому розкритті. Фіг. 4 - структурна схема, що ілюструє зразкову роботу відеокодера з кодування відеоданих, в якому не дозволяються комбінації мозаїчних фрагментів і паралельної хвильової обробки (WPP) всередині одного зображення, відповідно до одного або декількох аспектів цього розкриття. Фіг. 5 - структурна схема, що ілюструє зразкову роботу відеодекодера з декодування відеоданих, в якому не дозволяються комбінації мозаїчних фрагментів і WPP всередині одного зображення, відповідно до одного або декількох аспектів цього розкриття. Фіг. 6 - блок-схема, що ілюструє інший приклад роботи відеодекодера з декодування відеоданих, в якому не дозволяються комбінації мозаїчних фрагментів і WPP всередині одного зображення, відповідно до одного або декількох аспектів цього розкриття. Фіг. 7 - структурна схема, що ілюструє зразкову роботу відеокодера з кодування відеоданих, в якому кожний ряд блоків дерева кодування (CTB) зображення знаходиться в окремому підпотоці, відповідно до одного або декількох аспектів цього розкриття. Фіг. 8 - структурна схема, що ілюструє зразкову роботу відеодекодера з декодування відеоданих, в якому кожний ряд СТВ-одиниць зображення знаходиться в окремому підпотоці, відповідно до одного або декількох аспектів цього розкриття. Фіг. 9A - блок-схема, що ілюструє перший сегмент прикладу процесу аналізу в контекстнозалежному адаптивному двійковому арифметичному кодуванні (CABAC), щоб аналізувати дані слайса, відповідно до одного або декількох аспектів цього розкриття. Фіг. 9B - структурна схема, що ілюструє продовження прикладу процесу аналізу в CABAC Фіг. 9A. Фіг. 10 - концептуальна схема, яка ілюструє приклад WPP. Фіг. 11 - концептуальна схема, яка ілюструє зразкову черговість кодування, коли зображення розділене на множину мозаїчних фрагментів. ДОКЛАДНИЙ ОПИС СУТІ ВИНАХОДУ Під час кодування відео, зображення може бути розділене на множинні мозаїчні фрагменти, хвилі паралельної хвильової обробки (WPP) і/або ентропійні слайси. Мозаїчні фрагменти зображення задаються горизонтальними і/або вертикальними межами мозаїчного фрагмента, які проходять через зображення. Мозаїчні фрагменти зображення кодуються відповідно до порядку растрового сканування, і блоки дерева кодування (CTB) всередині кожного мозаїчного фрагмента також кодуються відповідно до порядку растрового сканування. У WPP кожний ряд СТВ-одиниць в зображенні представляє "WPP хвилю". Коли відеокодер використовує WPP, щоб кодувати зображення, кодер відео може починати кодування СТВ-одиниць WPP хвилі зліва направо після того, як кодер відео закодував два або більшу кількість СТВ-одиниць безпосередньо вище WPP хвилі. Ентропійний слайс може включати в себе серію послідовних СТВ-одиниць відповідно до порядку растрового сканування. Використання інформації через межі ентропійних слайсів забороняється для використання у виборі контекстів ентропійного кодування, але може дозволятися для інших цілей. В існуючих системах кодування відео зображення може мати довільну комбінацію мозаїчних фрагментів, WPP хвиль і ентропійних слайсів. Наприклад, зображення може бути розділене на сукупність мозаїчних фрагментів. У цьому прикладі СТВ-одиниці в деяких з мозаїчних фрагментів можуть бути кодовані відповідно до порядку растрового сканування, тоді як СТВодиниці в інших мозаїчних фрагментах можуть бути кодовані з використанням WPP. Дозвіл зображенню включати в себе комбінації мозаїчних фрагментів, WPP хвиль та ентропійних слайсів може надміру підвищувати складність реалізації і витрати для таких систем кодування відео. Способи цього розкриття можуть усунути цю проблему. Тобто, відповідно до способів цього розкриття, комбінації всередині зображення з будь-яких двох або більшої кількості мозаїчних фрагментів, WPP хвиль та ентропійних слайсів не дозволяються. Наприклад, відеокодер може формувати бітовий потік, який включає в себе синтаксичний елемент, який вказує, чи є 3 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 зображення кодованим згідно з першим режимом кодування або згідно з другим режимом кодування. У першому режимі кодування зображення кодується повністю з використанням WPP. У другому режимі кодування зображення має один або декілька мозаїчних фрагментів, і кожний мозаїчний фрагмент зображення кодується без використання WPP. Крім того, в цьому прикладі, відеодекодер може аналізувати синтаксичний елемент з бітового потоку, який включає в себе кодоване представлення зображення. У відповідь на визначення, що синтаксичний елемент має конкретне значення, відеодекодер може декодувати зображення повністю з використанням WPP. У відповідь на визначення, що синтаксичний елемент не має конкретне значення, відеодекодер може декодувати кожний мозаїчний фрагмент зображення без використання WPP. Зображення може мати один або декілька мозаїчних фрагментів. Супровідні креслення ілюструють приклади. Елементи, позначені посилальними позиціями на супровідних кресленнях, відповідають елементам, позначеним подібними посилальними позиціями в подальшому описі. У цьому розкритті елементи, що мають імена, які починаються з порядкових слів (наприклад, "перший", "другий", "третій" і так далі) не обов'язково мають на увазі, що у елементів є конкретний порядок. Переважніше, такі порядкові слова просто використовуються для посилання на різні елементи такого самого або подібного типу. На фіг. 1 показана блок-схема, що ілюструє зразкову систему 10 кодування відео, яка може використовувати способи цього розкриття. Як використовується в описі в документі, термін "кодер відео" відноситься узагальнено і до відеокодерів, і до відеодекодерів. У цьому розкритті терміни "кодування відео" або "кодування" можуть відноситися узагальнено до кодування відео або декодування відео. Як показано на фіг. 1, система 10 кодування відео включає в себе вихідний пристрій 12 і цільовий пристрій 14. Вихідний пристрій 12 формує кодовані відеодані. Відповідно, вихідний пристрій 12 може іменуватися пристроєм кодування відео або апаратом кодування відео. Цільовий пристрій 14 може декодувати кодовані відеодані, сформовані вихідним пристроєм 12. Відповідно, цільовий пристрій 14 може іменуватися пристроєм декодування відео або апаратом декодування відео. Вихідний пристрій 12 і цільовий пристрій 14 можуть бути прикладами пристроїв кодування відео або апаратів кодування відео. Вихідний пристрій 12 і цільовий пристрій 14 можуть містити широкий спектр пристроїв, включаючи настільні комп'ютери, мобільні обчислювальні пристрої, портативні (наприклад, переносні) комп'ютери, планшетні комп'ютери, телевізійні абонентські приставки, телефонні трубки, такі як так звані "інтелектуальні" телефони, телевізійні приймачі, камери, пристрої відображення, цифрові мультимедійні програвачі, ігрові відео приставки, вбудовані в автомобілі комп'ютери тощо. Цільовий пристрій 14 може приймати кодовані відеодані від вихідного пристрою 12 через канал 16. Канал 16 може містити одну або декілька середовищ передачі і/або пристроїв, здатних переміщувати кодовані відеодані від вихідного пристрою 12 на цільовий пристрій 14. В одному прикладі канал 16 може містити одне або декілька середовищ передачі даних, які дозволяють вихідному пристрою 12 передавати кодовані відеодані безпосередньо на цільовий пристрій 14 в реальному часі. У цьому прикладі вихідний пристрій 12 може модулювати кодовані відеодані згідно зі стандартом зв'язку, таким як протокол бездротового зв’язку, і може передавати модульовані відеодані на цільовий пристрій 14. Одне або декілька середовищ передачі даних можуть включати в себе дротове і/або бездротове середовища передачі, такі як радіочастотний (RF) спектр або одна або декілька фізичних ліній передачі. Одне або декілька середовищ передачі даних можуть утворювати підсистему мережі з передачею пакетів, такою як локальна мережа, регіональна мережа або глобальна мережа (наприклад, мережа Інтернет). Одне або декілька середовищ зв'язку можуть включати в себе маршрутизатори, комутатори, базові станції або інше обладнання, яке сприяє передачі даних від вихідного пристрою 12 на цільовий пристрій 14. В іншому прикладі канал 16 може включати в себе в носій даних, який зберігає кодовані відеодані, сформовані вихідним пристроєм 12. У цьому прикладі цільовий пристрій 14 може здійснювати доступ до носія даних за допомогою доступу до диска або доступу до карти. Носій даних може включати в себе множину носіїв даних для локально-доступних даних, такі як диски формату Blue-ray, цифрові багатофункціональні диски (DVD), ПЗП на компакт-дисках (CDROM), флеш-пам'ять або інші придатні носії цифрових даних для зберігання кодованих відеоданих. У додатковому прикладі канал 16 може включати в себе файловий сервер або інший проміжний пристрій зберігання даних, який зберігає кодоване відеозображення, сформоване вихідним пристроєм 12. У цьому прикладі цільовий пристрій 14 може здійснювати доступ до кодованих відеоданих, збережених у файловому сервері або іншому проміжному пристрої 4 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 зберігання даних, за допомогою потокової передачі або завантаження через мережу. Файловий сервер може бути типом сервера, здатним зберігати кодовані відеодані і передавати кодовані відеодані на цільовий пристрій 14. Зразкові файлові сервери включають в себе веб-сервери (наприклад, для веб-сайта), сервери з підтримкою протоколу передачі файлів (FTP), пристрої накопичувачів (NAS), що підключаються до мережі, і локальні накопичувачі на дисках. Цільовий пристрій 14 може здійснювати доступ до кодованих відеоданих за допомогою стандартного інформаційного з'єднання, такого як Інтернет-з'єднання. Зразкові типи з'єднань даних включають в себе бездротові канали (наприклад, з'єднання бездротового доступу стандарту Wi-Fi), дротові з'єднання (наприклад, цифрову абонентську лінію (DSL), кабельний модем тощо), або їх комбінації, які є придатними для здійснення доступу до кодованих відеоданих, збережених на файловому сервері. Передача кодованих відеоданих від файлового сервера може бути потоковою передачею, передачею завантаження з головної системи, або їх комбінацією. Способи цього розкриття не обмежуються додатками або встановлювальними параметрами для бездротового зв’язку. Способи можуть застосовуватися до кодування відео в підтримці різних мультимедійних додатків, таких як бездротове телемовлення, передачі кабельного телебачення, передачі супутникового телебачення, передачі потокового відео, наприклад, через мережу Інтернет, кодування відеоданих для збереження на носії даних, декодування відеоданих, збережених на носії даних, або інших додатків. У деяких прикладах система 10 кодування відео може бути сконфігурована з можливістю підтримувати односторонню або двосторонню передачу відео для підтримки додатків, таких як потокова передача відео, відтворення відео, телевізійне мовлення і/або відеотелефонія. У прикладі за фіг. 1 вихідний пристрій 12 включає в себе джерело 18 відеосигналу, відеокодер 20 і вихідний інтерфейс 22. У деяких прикладах вихідний інтерфейс 22 може включати в себе модулятор/демодулятор (модем) і/або передавач. Джерело 18 відеосигналу може включати в себе пристрій одержання відео, наприклад, відеокамеру, архів відео, що містить одержані раніше відеодані, інтерфейс зовнішнього відеосигналу для прийому відеоданих від постачальника відеоконтенту і/або систему комп'ютерної графіки для формування відеоданих, або комбінацію таких джерел відеоданих. Відеокодер 20 може закодувати відеодані від джерела 18 відеосигналу. У деяких прикладах вихідний пристрій 12 безпосередньо передає кодовані відеодані на цільовий пристрій 14 через вихідний інтерфейс 22. Кодовані відеодані також можуть зберігатися на носії даних або файловому сервері для доступу згодом цільовим пристроєм 14 для декодування і/або відтворення. У прикладі за фіг. 1 цільовий пристрій 14 включає в себе вхідний інтерфейс 28, відеодекодер 30 і пристрій 32 відображення. У деяких прикладах вхідний інтерфейс 28 включає в себе приймач і/або модем. Вхідний інтерфейс 28 може приймати кодовані відеодані через канал 16. Пристрій 32 відображення може бути вбудованим в цільовий пристрій 14 або може бути зовнішнім до нього. Звичайно пристрій 32 відображення відображає декодовані відеодані. Пристрій 32 відображення може містити різні пристрої відображення, такі як рідкокристалічний дисплей (LCD), плазмовий дисплей, дисплей на органічних світлодіодах (OLED) або інший тип пристрою відображення. Відеокодер 20 і відеодекодер 30 можуть працювати згідно зі стандартом стиснення відеозображення, таким як стандарт високоефективного кодування відеозображень (HEVC), що розробляється в цей час, і можуть відповідати тестовій моделі HEVC (HM). Проект майбутнього стандарту HEVC, який називається "HEVC Working Draft 5" (Робочий проект 5 з HEVC) або "WD5", описується в роботі Bross та інш., "WD5: Working Draft 5 of High-Efficiency Video Coding", (WD5: Робочий проект 5 з високоефективного кодування відеозображень) в робочих матеріалах WP3 дослідницької групи секторів SG16 Об'єднаної спільної групи з кодування відеозображень (JCT-VC) Міжнародного союзу електрозв'язку - сектора телекомунікацій (ITU-T) і матеріалах 7-ої Конференції JTC1/SC29/WG11 ISO/IEC: Женева, Швейцарія, листопад 2011, які з 10 жовтня 2012 доступні для завантаження з адреси: http://phenix.intevry.fr/jct/doc_end_user/documents/7_Geneva/wg11/JCTVC-G1103-v3.zip, зміст яких повністю включений в документ за допомогою посилання. Інший проект майбутнього стандарту HEVC, який називається "HEVC Working Draft 9" (Робочий проект 9 з HEVC), описується авторами Bross та інш. в робочих матеріалах WP3 дослідницької групи секторів SG16 Об'єднаної спільної групи з кодування відеозображень (JCT-VC) ITU-T та ІСО/МЕК (ISO/IEC) JTC1/SC29/WG11, 11-а Конференція: Шанхай, Китай, жовтень 2012, які з 7 листопада 2012 доступні для завантаження з адреси: http://phenix.int-evry.fr/jct/doc_end_user/documents/11_Shanghai/wg11/JCTVC-K1003v8.zip, зміст яких повністю включений в документ за допомогою посилання. 5 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 Альтернативно, відеокодер 20 і відеодекодер 30 можуть працювати згідно з іншими приватними або промисловими стандартами, включаючи стандарти ITU-T H.261, ISO/IEC MPEG-1 Visual, ITU-T H.262 або ISO/IEC MPEG-2 Visual, ITU-T H.263, ISO/IEC MPEG-4 Visual та ITU-T H.264 (також відомий як ISO/1EC MPEG-4 AVC), включаючи його розширення Масштабованого кодування відеозображень (SVC) і Кодування багатовидових відеозображень (MVC). Способи цього розкриття, однак, не обмежуються яким-небудь конкретним стандартом або способом кодування. Знову, фіг. 1 є просто прикладом, і способи цього розкриття можна застосовувати до встановлювальних параметрів кодування відео (наприклад, кодування відео або декодування відео), які не обов'язково включають в себе яку-небудь передачу даних між пристроями кодування і декодування. В інших прикладах дані витягуються з локальної пам'яті, передаються потоком через мережу, або подібне. Пристрій кодування може закодувати і зберегти дані в пам'яті, і/або пристрій декодування може витягнути і декодувати дані з пам'яті. У багатьох прикладах кодування і декодування виконуються пристроями, які не здійснюють зв'язок один з одним, а просто кодують дані в пам'ять і/або витягують і декодують дані по пам'яті. Відеокодер 20 і відеодекодер 30 кожний може бути здійснений у вигляді будь-якого з різних придатних схемних рішень, такого як один або декілька мікропроцесорів, цифрові процесори сигналів (DSP), спеціалізовані інтегральні схеми (ASIC), програмовані вентильні матриці (FPGA), дискретна логіка, апаратні засоби, або будь-які комбінації таких. Якщо способи здійснені частково програмно, пристрій може зберігати інструкції для програмного забезпечення у придатному машинозчитуваному носії даних, що не є часовим, і може виконувати інструкції в апаратних засобах, що використовують один або декілька процесорів, щоб виконувати способи цього розкриття. Будь-що з вищевикладеного (включаючи апаратні засоби, програмне забезпечення, комбінацію апаратних засобів і програмного забезпечення тощо), можна розглядати таким, що є одним або декількома процесорами. Кожний з відеокодера 20 і відеодекодера 30 може бути включений в один або декілька кодерів або декодерів, будь-який з яких може вбудовуватися у вигляді частини комбінованого кодера/декодера (КОДЕК) у відповідний пристрій. Це розкриття може в цілому відноситися до відеокодера 20, "сигналізуючого" деяку інформацію на інший пристрій, такий як відеодекодер 30. Термін "сигналізація" може в цілому відноситися до передачі синтаксичних елементів і/або інших даних, які представляють кодовані відеодані. Така передача може відбуватися в реальному або псевдореальному часі. Альтернативно, така передача може відбуватися за проміжок часу, такий як міг мати місце при збереженні синтаксичних елементів у машинозчитуваному носії даних у кодованому бітовому потоці під час кодування, які потім можуть витягуватися пристроєм декодування в будь-який час, будучи збереженими в цьому носії. Як стисло згадано вище, відеокодер 20 кодує відеодані. Відеодані можуть містити одне або декілька зображень. Кожне із зображень може бути нерухомим (фотографічним) зображенням. У деяких випадках, зображення може іменуватися "кадром" відео. Відеокодер 20 може формувати бітовий потік, який включає в себе послідовність бітів, які утворюють кодоване представлення відеоданих. Бітовий потік може включати в себе кодовані зображення і зв'язані з ними дані. Кодоване зображення є кодованим представленням зображення. Зв'язані з ним дані можуть включати в себе набори параметрів послідовності (SPS), набори параметрів зображення (PPS) та інші синтаксичні структури. SPS може містити параметри, застосовні до нуля або більшої кількості послідовностей зображень. PPS може містити параметри, застосовні до нуля або більшої кількості зображень. Для формування кодованого представлення зображення, відеокодер 20 може розділити зображення на "сітку" блоків дерева кодування (CTB). У деяких випадках, CTB може іменуватися "деревоподібним блоком", "найбільшою одиницею кодування" (LCU) або "одиницею дерева кодування". СТВ-одиниці в HEVC можуть у загальних рисах бути схожими на макроблоки з попередніх стандартів, наприклад, H.264/AVC. Однак, CTB не обов'язково обмежується конкретним розміром і може включати в себе один або декілька одиниць кодування (CU). Кожний з СТВ-одиниць може бути зв'язаний з іншим рівнорозмірним блоком пікселів всередині зображення. Кожний піксель може містити вибірку яскравості (luma) і дві вибірки кольоровості (chroma). Таким чином, кожний CTB може бути зв'язаний з блоком вибірок яскравості і двома блоками вибірок кольоровості. Для простоти пояснення в цьому розкритті двомірний масив пікселів може називатися піксельним блоком і двомірний масив вибірок може називатися блоком вибірок. Відеокодер 20 може використовувати розділення типу 6 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 квадрадерево, щоб розділяти піксельний блок, зв’язаний з CTB, на піксельні блоки, зв’язані з CU-одиницями, звідси назва "блоки дерева кодування". СТВ-одиниці в зображенні можуть групуватися в один або декілька слайсів. У деяких прикладах кожний зі слайсів включає в себе ціле число СТВ-одиниць. Як частина кодування зображення, відеокодер 20 може формувати кодовані представлення кожного слайса зображення (тобто, кодовані слайси). Щоб формувати кодований слайс, відеокодер 20 може закодувати кожний CTB зі слайса, щоб сформувати кодовані представлення кожного з СТВодиниць слайса (тобто, кодовані СТВ-одиниці). Щоб формувати кодований CTB, відеокодер 20 може рекурсивно виконувати розділення типу квадрадерево на піксельному блоці, зв’язаному з CTB, щоб розділити піксельний блок на прогресивно більш дрібні піксельні блоки. Кожний з менших піксельних блоків може бути зв'язаний з CU. Розділеною CU може бути CU, піксельний блок якої розділений на піксельні блоки, зв'язані з іншими CU. Нерозділеною CU може бути CU, піксельний блок якої не є розділеним на піксельні блоки, зв’язані з іншими CU. Відеокодер 20 може формувати одну або декілька одиниць прогнозування (PU) для кожної нерозділеної CU. Кожна з PU-одиниць CU може бути зв’язана з іншим піксельним блоком всередині піксельного блока CU. Відеокодер 20 може формувати піксельні блоки з прогнозування для кожної PU у CU. Прогнозований піксельний блок для PU може бути блоком пікселів. Відеокодер 20 може використовувати внутрішньокадрове (intra) прогнозування або міжкадрове (inter) прогнозування, щоб формувати прогнозований піксельний блок для PU. Якщо відеокодер 20 використовує внутрішньокадрове прогнозування, щоб сформувати прогнозований піксельний блок PU, відеокодер 20 може формувати прогнозований піксельний блок PU на основі декодованих пікселів зображення, зв’язаного з PU. Якщо відеокодер 20 використовує міжкадрове прогнозування, щоб сформувати прогнозований піксельний блок для PU, відеокодер 20 може формувати прогнозований піксельний блок для PU на основі декодованих пікселів одного або декількох зображень, відмінних від зображення, зв'язаного з PU. Відеокодер 20 може формувати залишковий піксельний блок для CU на основі прогнозованих піксельних блоків PU для CU. Залишковий піксельний блок для CU може вказувати різниці між вибірками в прогнозованих піксельних блоках для PU-одиниць CU і відповідними вибірками у вихідній піксельній одиниці CU. Крім того, як частина кодування нерозділеної CU відеокодер 20 може виконувати рекурсивне розділення типу квадрадерево на залишковому піксельному блоці CU, щоб розділити залишковий піксельний блок CU на один або декілька менших залишкових піксельних блоків, зв'язаних з одиницями перетворення (TU) у CU. Оскільки пікселі в піксельних блоках, зв'язаних з TU-одиницями, кожний включає вибірку яскравості і дві вибірки кольоровості, кожна з TU-одиниць може бути зв'язана із залишковим блоком вибірок з вибірок яскравості і двома залишковими блоками вибірок з вибірок кольоровості. Відеокодер 20 може застосовувати одне або декілька перетворень до залишкових блоків вибірок, зв'язаних з TU-одиницями, щоб сформувати блоки коефіцієнтів (тобто, блоки з коефіцієнтів). Відеокодер 20 може виконувати процес квантування на кожному з блоків коефіцієнтів. Квантування в цілому відноситься до процесу, в якому коефіцієнти квантують, щоб можливо зменшити обсяг даних, що використовується для представлення коефіцієнтів, забезпечуючи додаткове стиснення. Відеокодер 20 може формувати набори синтаксичних елементів, які представляють коефіцієнти в блоках квантованих коефіцієнтів. Відеокодер 20 може застосовувати операції ентропійного кодування, такі як операції контекстно-залежного адаптивного двійкового арифметичного кодування (CABAC) щонайменше до деяких з цих синтаксичних елементів. Як частина виконання операції ентропійного кодування відеокодер 20 може вибирати контекст кодування. У випадку CABAC контекст кодування може вказувати імовірності послідовностей двійкових сигналів (bin) зі значенням 0 і значенням 1. Бітовий потік, сформований відеокодером 20, може включати в себе серію вузлів рівня мережної абстракції (NAL). Кожний з вузлів NAL може бути синтаксичною структурою, що містить вказівку типу даних у вузлі NAL і байти, що містять дані. Наприклад, вузол NAL може містити дані, що представляють SPS, PPS, кодований слайс, додаткову інформацію про розширення (SEI), роздільник модуля доступу, дані заповнювача або інший тип даних. Вузли NAL кодованого слайса є вузлами NAL, які включають в себе кодовані слайси. Відеодекодер 30 може приймати бітовий потік. Бітовий потік може включати в себе кодоване представлення відеоданих, закодованих відеокодером 20. Відеодекодер 30 може 7 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 аналізувати бітовий потік, щоб витягувати синтаксичні елементи з бітового потоку. Як частина витягання деяких синтаксичних елементів з бітового потоку відеодекодер 30 може ентропійно декодувати (наприклад, декодувати за CABAC, декодувати експонентним кодом Голомба тощо) дані в бітовому потоці. Відеодекодер 30 може відновлювати зображення з відеоданих на основі синтаксичних елементів, витягнутих з бітового потоку. Процес для відновлення відеоданих на основі синтаксичних елементів може бути в цілому взаємооберненим процесу, що виконується відеокодером 20 для формування синтаксичних елементів. Наприклад, відеодекодер 30 може формувати на основі синтаксичних елементів, зв'язаних з CU-одиницями, піксельні блоки з прогнозування для PU-одиниць CU. Крім того, відеодекодер 30 може здійснювати обернене квантування блоків коефіцієнтів, зв'язаних з TUодиницями в CU. Відеодекодер 30 може виконувати обернене перетворення на блоках коефіцієнтів, щоб відновлювати залишкові піксельні блоки, зв’язані з TU-одиницями для CU. Відеодекодер 30 може відновлювати піксельний блок для CU на основі прогнозованих піксельних блоків і залишкових піксельних блоків. У деяких прикладах відеокодер 20 може ділити зображення на множину ентропійних слайсів. Це розкриття може використовувати термін "звичайний слайс", щоб відрізняти слайси від ентропійних слайсів. Ентропійний слайс може включати в себе підмножину CU-одиниць звичайного слайса. У деяких прикладах відеокодер 20 може розділяти CU-одиниці між ентропійними слайсами так, що жоден з ентропійних слайсів не включає в себе більше елементів кодованого сигналу (наприклад, ентропійно кодованих бітів), ніж верхня межа. Кожний ентропійний слайс може бути включений в окремий вузол NAL. У цьому розкритті прогнозування всередині зображення може відноситися до використання інформації, зв’язаної з першою одиницею (наприклад, CTB, CU, PU тощо) зображення, для кодування другої одиниці того самого зображення. Прогнозування всередині зображення через межі ентропійних слайсів дозволяється, крім мети ентропійного кодування. Наприклад, якщо кодер відео (наприклад, відеокодер 20 або відеодекодер 30) виконує внутрішньокадрове прогнозування на конкретній PU, кодер відео може використовувати вибірки із сусідньої PU, навіть якщо сусідня PU знаходиться в іншому ентропійному слайсі, ніж конкретна PU. У цьому прикладі відеокодер, можливо не зможе використовувати вибірки із сусідньої PU, якщо сусідня PU знаходиться в іншому слайсі, ніж конкретна PU. Однак, коли відеокодер виконує ентропійне кодування на даних, зв’язаних з конкретною PU, кодеру відео дозволяється тільки вибирати контексти кодування на основі інформації, зв’язаної із сусідньою PU, якщо конкретна PU і сусідня PU знаходяться в одному тому самому ентропійному слайсі. Внаслідок цього обмеження кодер відео може бути здатним виконувати операції ентропійного кодування (тобто, ентропійне кодування або декодування) на множинних ентропійних слайсах для слайса паралельно. Отже, відеодекодер 30 може бути здатним аналізувати синтаксичні елементи множинних ентропійних слайсів паралельно. Однак відеодекодер 30 не є здатним відновлювати піксельні блоки множинних ентропійних слайсів для слайса паралельно. Як вказано вище, вузол NAL кодованого слайса може містити кодований слайс. Цей слайс може бути або ентропійним слайсом, або звичайним слайсом. Заголовок слайса у вузлі NAL кодованого слайса може включати в себе синтаксичний елемент (наприклад, entropy_slice_flag), який вказує, чи є слайс ентропійним слайсом або звичайним слайсом. Наприклад, якщо синтаксичний елемент рівний 1, слайс у вузлі NAL кодованого слайса може бути ентропійним слайсом. Кожний кодований слайс може включати в себе заголовок слайса і дані слайса. Заголовки слайса для ентропійних слайсів можуть відрізнятися від заголовків слайса звичайних слайсів. Наприклад, синтаксичні елементи в заголовках слайсів для ентропійних слайсів можуть включати в себе підмножину синтаксичних елементів із заголовків слайсів для звичайних слайсів. Оскільки заголовки слайсів для ентропійних слайсів включають в себе менше синтаксичних елементів, ніж заголовки слайсів для звичайних слайсів, ентропійні слайси можуть також іменуватися легковаговими слайсами, слайсами з короткими заголовками слайсів або короткими слайсами. Ентропійний слайс може успадкувати із заголовка слайса звичайного слайса, який передує ентропійному слайсу в черговості декодування, синтаксичні елементи, виключені із заголовка слайса для ентропійного слайса. Традиційно, відеокодери формують окремі вузли NAL для кожного ентропійного слайса. Окремі вузли NAL часто транспортуються через мережу в окремих пакетах. Іншими словами, може бути один вузол NAL на один пакет протягом передачі вузлів NAL через мережу. Це може бути складним для вузлів NAL, які містять ентропійні слайси. Якщо пакет, який містить вузол NAL, що включає в себе звичайний слайс, втрачається протягом передачі, відеодекодер 30 8 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 може бути нездатним використовувати ентропійні слайси, які успадковують синтаксичні елементи із заголовка слайса для звичайного слайса. Крім того, якщо одна або декілька СТВодиниць першого ентропійного слайса основуються на одній або декількох СТВ-одиницях другого ентропійного слайса для прогнозування всередині зображення, і пакет, який містить вузол NAL, що включає в себе другий ентропійний слайс, втрачається протягом передачі, відеокодер 30 може бути нездатним декодувати СТВ-одиниці першого ентропійного слайса. У деяких прикладах кодер відео може кодувати щонайменше сегменти зображення, використовуючи паралельну хвильову обробку (WPP). На фіг. 9, описаній детально нижче, показана концептуальна схема, яка ілюструє приклад WPP. Якщо кодер відео кодує зображення, використовуючи WPP, кодер відео може розділити СТВ-одиниці зображення на множину "WPP хвиль". Кожна з WPP хвиль може відповідати відмінному ряду СТВ-одиниць в зображенні. Якщо кодер відео кодує зображення, використовуючи WPP, кодер відео може почати кодування верхнього ряду СТВ-одиниць. Після того, як кодер відео закодував дві або більшу кількість СТВ-одиниць верхнього ряду, кодер відео може почати кодування другого зверху ряду СТВ-одиниць паралельно з кодуванням верхнього ряду СТВ-одиниць. Після того, як відеокодер закодував дві або більшу кількість СТВ-одиниць другого зверху ряду, кодер відео може починати кодувати третій зверху ряд СТВ-одиниць паралельно з кодуванням верхніх рядів СТВ-одиниць. Ця схема може продовжуватися вниз по рядах СТВ-одиниць в зображенні. Якщо відеокодер використовує WPP, кодер відео може використовувати інформацію, зв’язану з просторово сусідніми CU поза поточного CTB, щоб виконувати прогнозування всередині зображення на конкретній CU в поточному CTB за умови, що просторово сусідніми CU є лівий, вище зліва, вище, або вище праворуч для поточного CTB. Якщо поточним CTB є крайній лівий CTB в ряду, відмінному від найвищого ряду, кодер відео може використовувати інформацію, зв’язану з другим CTB ряду безпосередньо вище, щоб вибирати контекст для кодування за CABAC одного або декількох синтаксичних елементів для поточного CTB. Інакше, якщо поточний CTB не є крайнім лівим CTB в ряду, відеокодер може використовувати інформацію, зв’язану з CTB зліва від поточного CTB, щоб вибирати контекст для кодування за CABAC одного або декількох синтаксичних елементів для поточного CTB. Таким чином, кодер відео може ініціалізувати стани CABAC для ряду на основі станів CABAC ряду безпосередньо вище після кодування двох або більшої кількості СТВ-одиниць ряду безпосередньо вище. Таким чином, у відповідь на визначення, що перший CTB відділений від лівої межі зображення одним CTB, кодер відео може зберегти змінні контексту, зв’язані з першим CTB. Кодер відео може ентропійно кодувати (наприклад, ентропійно закодувати або ентропійно декодувати) на основі щонайменше, частково, змінних контексту, зв’язаних з першим CTB, одного або декількох синтаксичних елементів другого CTB, другий CTB є суміжним з лівою межею зображення і одним рядом СТВ-одиниць нижче першого CTB. Кодовані СТВ-одиниці слайса звичайно розташовуються у вузлі NAL кодованого слайса відповідно до порядку растрового сканування, навіть коли використовується WPP. Це може ускладнити побудову кодерів відео, що реалізовують WPP. Коли кількість WPP хвиль більше одиниці і менше кількості рядів CTB в зображенні, порядок бітового потоку (тобто, черговість декодування, якщо кодоване зображення обробляється одним ядром декодера, не декодується паралельно) кодованих бітів для СТВ-одиниць змінюється в порівнянні з тим, коли WPP не застосовується, як викладено нижче. CTB, кодований пізніше в черговості бітового потоку/декодування, може бути необхідним для прогнозування всередині зображення іншим кодованим CTB, більш раннім в черговості декодування. Це може зруйнувати причиннонаслідкову залежність бітового потоку, в якій ніякі більш ранні дані не залежать від даних, що надходять пізніше в черговості бітового потоку/декодування. Причинно-наслідкова залежність бітового потоку була загальнодотримуваним принципом у проектних рішеннях кодування відео, включаючи стандарти кодування відеозображення. Тоді як процес декодування працює, процес декодування може бути більш складним, якщо покажчик бітового потоку, який вказує поточну позицію в бітовому потоці може переміщатися назад і вперед всередині сегмента бітового потоку, зв’язаного з вузлом NAL кодованого слайса. У деяких прикладах відеокодер 20 може ділити зображення на один або декілька мозаїчних фрагментів. Мозаїчні фрагменти можуть містити неперекривні множини СТВ-одиниць для зображення. Відеокодер 20 може ділити зображення на мозаїчні фрагменти шляхом задавання двох або більшої кількості вертикальних меж мозаїчного фрагмента і двох або більшої кількості горизонтальних меж мозаїчного фрагмента. Кожний вертикальний бік зображення може бути вертикальною межею мозаїчного фрагмента. Кожний горизонтальний бік поточного зображення може бути горизонтальною межею мозаїчного фрагмента. Наприклад, якщо відеокодер 20 9 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 визначає чотири вертикальні межі мозаїчного фрагмента і три горизонтальні межі мозаїчного фрагмента для зображення, поточне зображення ділиться на шість мозаїчних фрагментів. Кодер відео, такий як відеокодер 20 або відеодекодер 30, може кодувати СТВ-одиниці мозаїчних фрагментів зображення згідно з порядком сканування мозаїчного фрагмента. Щоб кодувати СТВ-одиниці згідно з порядком сканування мозаїчного фрагмента, кодер відео може кодувати мозаїчні фрагменти зображення відповідно до порядку растрового сканування. Таким чином, кодер відео може кодувати кожний мозаїчний фрагмент в ряду мозаїчних фрагментів у порядку зліва направо, починаючи з верхнього ряду мозаїчних фрагментів і потімпереходячи нижче в зображенні. Крім того, кодер відео може кодувати кожний CTB всередині мозаїчного фрагмента відповідно до порядку растрового сканування. Таким чином, кодер відео може кодувати кожний CTB даного мозаїчного фрагмента зображення до кодування якого-небудь CTB іншого мозаїчного фрагмента зображення. Іншими словами, порядок сканування мозаїчного фрагмента обходить СТВ-одиниці в порядку растрового сканування CTB всередині мозаїчного фрагмента і обходить мозаїчні фрагменти в порядку растрового сканування мозаїчного фрагмента всередині зображення. Отже, черговість, в якій кодер відео кодує СТВодиниці зображення, може бути іншим, якщо зображення розділяється на множинні мозаїчні фрагменти, ніж якби зображення не було розділеним на множинні мозаїчні фрагменти. Фіг. 10, описана нижче, є концептуальною схемою, що ілюструє зразковий порядок сканування мозаїчного фрагмента, коли зображення розділене на множину мозаїчних фрагментів. У деяких випадках кодер відео може виконувати прогнозування всередині зображення через межі мозаїчного фрагмента, але не через межі слайса. В інших випадках прогнозування всередині зображення забороняється через межі мозаїчного фрагмента і межі слайса. У випадках, де прогнозування всередині зображення забороняється через межі мозаїчного фрагмента і межі слайса, кодер відео може бути здатним кодувати паралельно множинні мозаїчні фрагменти. У деяких прикладах прогнозування всередині зображення через межі мозаїчного фрагмента керується прапором (наприклад, "tile_boundary_independence_idc" (незалежність від межі мозаїчного фрагмента)). Якщо прапор рівний 1, прогнозування всередині зображення через межі мозаїчного фрагмента забороняється в межах зображення. Інакше, прогнозування всередині зображення через межі мозаїчного фрагмента дозволяється, крім меж мозаїчного фрагмента, які є також межами зображення або межами слайса. Якщо прогнозування всередині зображення через межі мозаїчного фрагмента дозволяється, функціональністю мозаїчних фрагментів може бути зміна порядку сканування СТВ-одиниць в порівнянні з випадком, де зображення не має мозаїчних фрагментів, або еквівалентно - має тільки один мозаїчний фрагмент. Якщо прогнозування всередині зображення через межі мозаїчного фрагмента не дозволяється, крім зміни порядку сканування СТВ-одиниць, мозаїчні фрагменти можуть також забезпечувати незалежне розділення, яке може використовуватися, щоб паралельно кодувати (закодувати і/або декодувати) мозаїчні фрагменти. Таким чином, якщо зображення розділене на щонайменше перший мозаїчний фрагмент і другий мозаїчний фрагмент, коли відеодекодер 30 декодує мозаїчні фрагменти без використання WPP, відеодекодер 30 може декодувати паралельно CTB першого мозаїчного фрагмента і CTB другого мозаїчного фрагмента. У деяких випадках, зображення може бути розділене на комбінацію мозаїчних фрагментів, WPP хвиль та ентропійних слайсів. Наприклад, зображення може бути розділене на мозаїчний фрагмент і набір WPP хвиль. В іншому прикладі зображення може бути розділене на два мозаїчних фрагменти та ентропійний слайс. Допущення комбінації мозаїчних фрагментів, WPP хвиль та ентропійних слайсів всередині зображення може бути складним, оскільки допущення таких комбінацій може підвищити складність і вартості відеокодерів і/або відеодекодерів. Способи цього розкриття можуть вирішити проблеми, описані вище. Відповідно до способів цього розкриття, зображення не може розділятися на яку-небудь комбінацію мозаїчних фрагментів, WPP хвиль та ентропійних слайсів. Іншими словами, зображення може бути розділене на один або декілька мозаїчних фрагментів, зображення може бути розділене на WPP хвилі, або зображення може бути розділене на один або декілька ентропійних слайсів. Однак, зображення не може бути розділене ні на одну з наступних комбінацій: (a) мозаїчні фрагменти, WPP хвилі та ентропійні слайси, (b) мозаїчні фрагменти і WPP хвилі, (с) мозаїчні фрагменти та ентропійні слайси, або (d) WPP хвилі та ентропійні слайси. Для здійснення цього відеокодер 20 може включати в бітовий потік синтаксичний елемент, який вказує, що зображення є кодованим або згідно з першим режимом кодування, або згідно з другим режимом кодування. У першому режимі кодування зображення повністю кодується з використанням WPP. Таким чином, кожний ряд СТВ-одиниць в зображенні може бути 10 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 закодований як WPP хвиля. У другому режимі кодування зображення може мати один або декілька мозаїчних фрагментів. Крім того, у другому режимі кодування кожний мозаїчний фрагмент зображення може бути закодований без використання WPP. Наприклад, у другому режимі кодування відеокодер 20 може для кожного мозаїчного фрагмента зображення кодувати СТВ-одиниці всередині мозаїчного фрагмента послідовно в порядку зліва направо по рядах СТВ-одиниць і вниз по рядах СТВ-одиниць мозаїчного фрагмента. Для простоти пояснення цей синтаксичний елемент може іменуватися в документі синтаксичним елементом режиму кодування. Відеодекодер 30 може здійснювати аналіз синтаксичного елемента з бітового потоку, що включає в себе кодоване представлення зображення у відеоданих. У відповідь на визначення, що синтаксичний елемент має конкретне значення, відеодекодер 30 може декодувати зображення повністю з використанням WPP. У відповідь на визначення, що синтаксичний елемент не має конкретне значення, відеодекодер 30 може декодувати кожний мозаїчний фрагмент зображення без використання WPP, причому зображення має один або декілька мозаїчних фрагментів. Різні сегменти бітового потоку можуть включати в себе синтаксичний елемент режиму кодування. Наприклад, відеокодер 20 може формувати SPS, який включає в себе синтаксичний елемент режиму кодування. У цьому прикладі відеодекодер 30 може здійснювати аналіз з бітового потоку SPS, який включає в себе синтаксичний елемент режиму кодування. В іншому прикладі відеокодер 20 може формувати PPS, який включає в себе синтаксичний елемент режиму кодування. У цьому прикладі відеодекодер 30 може здійснювати аналіз з бітового потоку PPS, який включає в себе синтаксичний елемент режиму кодування. Крім того, якщо зображення кодується згідно з другим режимом кодування, бітовий потік може включати в себе один або декілька синтаксичних елементів, які вказують, чи дозволяються ентропійні слайси для зображення. Різні сегменти бітового потоку можуть включати в себе один або декілька синтаксичних елементів, які вказують, чи дозволяються ентропійні слайси для зображення. Наприклад, SPS може включати в себе один або декілька синтаксичних елементів, які вказують, що ентропійні слайси дозволяються для зображень, зв’язаних з SPS. В іншому прикладі PPS може включати в себе один або декілька синтаксичних елементів, які вказують, що ентропійні слайси дозволяються для зображень, зв’язаних з PPS. Наприклад, в цьому прикладі, PPS може включати в себе синтаксичний елемент entropy_slice_enabled_flag (прапор дозволу ентропійних слайсів), який вказує, чи можуть кодовані слайси, які відносяться до PPS, складатися з ентропійних слайсів. Якщо зображення включає в себе один або декілька ентропійних слайсів, кожний ентропійний слайс, зв’язаний зі слайсом зображення, може бути включений в один вузол NAL кодованого слайса замість включення в окремі вузли NAL. Таким чином, ентропійний слайс може бути визначений у вигляді підмножини слайса, причому процес ентропійного декодування ентропійного слайса є незалежним від інших ентропійних слайсів у тому самому слайсі. Як стисло згадано вище, бітовий потік може включати в себе вузли NAL кодованих слайсів, які включають в себе кодовані слайси. Кодований слайс може містити заголовок слайса і дані слайса. Дані слайса можуть включати в себе один або декілька підпотоків. Відповідно до способів цього розкриття, якщо зображення кодується в першому режимі кодування (тобто, зображення кодується повністю з використанням WPP), кожний ряд блоків CTB в слайсі представляється одним деяким з підпотоків. Якщо зображення кодується у другому режимі кодування (тобто, кожний мозаїчний фрагмент зображення кодується без використання WPP), кожний мозаїчний фрагмент зображення, у якого є одна або декілька СТВ-одиниць в слайсі, представляється одним деяким з підпотоків. Крім того, відповідно до способів цього розкриття, заголовок слайса для кодованого слайса може включати в себе набір синтаксичних елементів, які вказують точки входу для мозаїчних фрагментів, WPP хвиль або ентропійних слайсів всередині даних слайса у вузлі NAL кодованого слайса. Точкою входу підпотоку може бути перший біт підпотоку. Крім того, мозаїчні фрагменти, WPP хвилі або ентропійні слайси всередині даних слайса у вузлі NAL кодованого слайса можуть включати в себе біти заповнення, які забезпечують, що мозаїчні фрагменти, WPP хвилі або ентропійні слайси є вирівняними по байтах. На фіг. 2 показана блок-схема, яка ілюструє приклад відеокодера 20, який сконфігурований для здійснення способів цього розкриття. Фіг. 2 наведена з метою пояснення і не повинна розглядатися такою, що обмежує способи, як в широкому значенні проілюстровано та описано в цьому розкритті. З метою пояснення, це розкриття описує відеокодер 20 в контексті кодування за HEVC. Однак, способи цього розкриття можуть бути застосовними до інших стандартів або способів кодування. 11 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 У прикладі за фіг. 2 відеокодер 20 включає в себе модуль 100 обробки прогнозування, модуль 102 формування залишку, модуль 104 обробки перетворення, модуль 106 квантування, модуль 108 оберненого квантування, модуль 110 обробки оберненого перетворення, модуль 112 відновлення, модуль 113 фільтра, буфер 114 декодованих зображень і модуль 116 ентропійного кодування. Модуль 100 обробки прогнозування включає в себе модуль 121 обробки міжкадрового прогнозування і модуль 126 обробки внутрішньокадрового прогнозування. Модуль 121 обробки міжкадрового прогнозування включає в себе модуль 122 оцінки руху і модуль 124 компенсації руху. В інших прикладах відеокодер 20 може включати в себе більше, менше компонентів або інші функціональні компоненти. Відеокодер 20 може приймати відеодані. Щоб закодувати відеодані, відеокодер 20 може закодувати кожний слайс кожного зображення у відеоданих. Як частина кодування слайса, відеокодер 20 може закодувати кожний CTB в слайсі. Як частина кодування CTB, модуль 100 обробки прогнозування може виконувати розділення типу "квадрадерево" на піксельному блоці, зв’язаному з CTB, щоб розділити піксельний блок на прогресивно менші піксельні блоки. Менші піксельні блоки можуть зв'язуватися з CU-одиницями. Наприклад, модуль 100 обробки прогнозування може розділити піксельний блок CTB на чотири рівно-розмірних суб-блоки, розділити один або декілька суб-блоків на чотири рівно-розмірних суб-суб-блоків, і так далі. Відеокодер 20 може закодувати CU-одиниці в CTB, щоб сформувати кодовані представлення CU-одиниць (тобто, кодовані CU). Відеокодер 20 може кодувати CU-одиниці CTB згідно з порядком z-сканування. Іншими словами, відеокодер 20 може закодувати верхню ліву CU, верхню праву CU, нижню ліву CU і потім нижню праву CU в цьому порядку. Коли відеокодер 20 кодує розділену CU, відеокодер 20 може кодувати CU-одиниці, зв’язані із субблоками піксельного блока для розділеної CU згідно з порядком z-сканування. Як частина кодування CU, модуль 100 обробки прогнозування може розділити піксельний блок CU між одним або декількома PU-одиницями в CU. Відеокодер 20 і відеодекодер 30 можуть підтримувати PU різного розміру. За умови, що розміром конкретної CU є 2N2N, відеокодер 20 і відеодекодер 30 можуть підтримувати розміри PU в 2N2N або NN для внутрішньокадрового прогнозування, і симетричні PU розмірів 2N2N, 2NN, N2N, NN, або подібне для міжкадрового прогнозування. Відеокодер 20 і відеодекодер 30 можуть також підтримувати асиметричне розділення для PU розміром 2NnU, 2NnD, nL2N та nR2N для міжкадрового прогнозування. Модуль 121 обробки міжкадрового прогнозування може формувати за прогнозуванням дані для PU шляхом виконання міжкадрового прогнозування на кожній PU в CU. Дані за прогнозуванням для PU можуть включати в себе піксельний блок з прогнозування, який відповідає PU, і інформацію руху для PU. Слайсами можуть бути I-слайси, Р-слайси або Вслайси. Модуль 121 обробки міжкадрового прогнозування може виконувати різні операції для PU в CU залежно від того, чи знаходиться PU в I-слайсі, Р-слайсі або В-слайсі. У I-слайсі всі PU є прогнозованими внутрішньокадрово. Отже, якщо PU знаходиться в I-слайсі, модуль 121 міжкадрового прогнозування не виконує міжкадрове прогнозування на PU. Якщо PU знаходиться в Р-слайсі, модуль 122 оцінки руху може здійснювати пошук опорних зображень у списку опорних зображень (наприклад, "списку 0") для опорного блока для PU. Опорний блок для PU може бути піксельним блоком, який найбільш близько відповідає піксельному блоку в PU. Модуль 122 оцінки руху може формувати індекс опорного зображення, який вказує опорне зображення в списку 0, що містить опорний блок для PU, і вектор руху, який вказує просторове зміщення між піксельним блоком PU і опорним блоком. Модуль 122 оцінки руху може виводити індекс опорного зображення і вектор руху як інформацію руху для PU. Модуль 124 компенсації руху може сформувати прогнозований піксельний блок для PU на основі опорного блока, вказаного інформацією руху для PU. Якщо PU знаходиться в В-слайсі, модуль 122 оцінки руху може виконувати однонаправлене міжкадрове прогнозування або двонаправлене міжкадрове прогнозування для PU. Щоб виконувати однонаправлене міжкадрове прогнозування для PU, модуль 122 оцінки руху може здійснювати пошук опорних зображень в першому списку опорних зображень ("списку 0"), або другому списку опорних зображень ("списку 1") для опорного блока для PU. Модуль 122 оцінки руху може виводити як інформацію руху для PU індекс опорного зображення, який вказує позицію в списку 0 або списку 1 опорного зображення, яке містить опорний блок, вектор руху, який вказує просторове зміщення між піксельним блоком PU і опорним блоком, та індикатор напрямку прогнозування, який вказує, чи знаходиться опорне зображення в списку 0 або списку 1. Для виконання двонаправленого міжкадрового прогнозування для PU модуль 122 оцінки руху може здійснювати пошук опорних зображень в списку 0 для опорного блока для PU і може 12 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 також здійснювати пошук опорних зображень в списку 1 для іншого опорного блока для PU. Модуль 122 оцінки руху може формувати індекси опорних зображень, які вказують позиції в списку 0 і списку 1 опорних зображень, які містять опорні блоки. Крім того, модуль 122 оцінки руху може формувати вектори руху, які вказують просторові зміщення між опорними блоками і піксельним блоком для PU. Інформація руху для PU може включати в себе індекси опорних зображень і вектори руху для PU. Модуль 124 компенсації руху може сформувати прогнозований піксельний блок PU на основі опорних блоків, вказаних інформацією руху для PU. Модуль 126 обробки внутрішньокадрового прогнозування може формувати прогнозовані дані для PU шляхом виконання внутрішньокадрового прогнозування на PU. Прогнозовані дані для PU можуть включати в себе прогнозований піксельний блок для PU і різні синтаксичні елементи. Модуль 126 обробки внутрішньокадрового прогнозування може виконувати внутрішньокадрове прогнозування на PU-одиницях в I-слайсі, Р-слайсі та В-слайсі. Для виконання внутрішньокадрового прогнозування на PU, модуль 126 обробки внутрішньокадрового прогнозування може використовувати множинні режими внутрішньокадрового прогнозування для формування множинних наборів прогнозованих даних для PU. Щоб використовувати режим внутрішнього прогнозування для формування множини прогнозованих даних для PU, модуль 126 обробки внутрішньокадрового прогнозування може розширювати вибірки з блоків вибірок сусідніх PU по блоках вибірок для PU в напрямку, зв’язаному з режимом внутрішнього прогнозування. Сусідні PU можуть знаходитися вище, вище і праворуч, вище і зліва, або зліва від PU, в припущенні черговості кодування зліва - направо, зверху - вниз для множини PU, CU та CTB. Модуль 126 обробки внутрішньокадрового прогнозування може використовувати різні числа режимів внутрішньокадрового прогнозування, наприклад, 33 направлених режими внутрішньокадрового прогнозування. У деяких прикладах число режимів внутрішньокадрового прогнозування може залежати від розміру піксельного блока у PU. Модуль 100 обробки прогнозування може вибирати прогнозовані дані для PU в CU з числа прогнозованих даних, сформованих модулем 121 обробки міжкадрового прогнозування для PUодиниць або прогнозованих даних, сформованих модулем 126 обробки внутрішньокадрового прогнозування для PU-одиниць. У деяких прикладах модуль 100 обробки прогнозування вибирає прогнозовані дані для PU-одиниць CU на основі метрик швидкості/спотворення множин прогнозованих даних. Прогнозовані піксельні блоки для вибраних прогнозованих даних можуть іменуватися в документі вибраними прогнозованими піксельними блоками. Модуль 102 формування залишку може формувати на основі піксельного блока CU і вибраних прогнозованих піксельних блоків PU-одиниць в CU залишковий піксельний блок CU. Наприклад, модуль 102 формування залишку може формувати залишковий піксельний блок CU таким чином, що кожна вибірка в залишковому піксельному блоці має значення, що дорівнює різниці між вибіркою в піксельному блоці CU і відповідною вибіркою у вибраному прогнозованому піксельному блоці у PU в CU. Модуль 100 обробки прогнозування може виконувати розділення типу квадрадерева, щоб розділити залишковий піксельний блок CU на суб-блоки. Кожний нерозділений залишковий піксельний блок може зв'язуватися з різними TU в CU. Розміри і позиції залишкових піксельних блоків, зв’язаних з одиницями TU в CU, можуть або не можуть основуватися на розмірах і позиціях піксельних блоків у PU в CU. Оскільки пікселі залишкових піксельних блоків TU-одиниць можуть містити вибірку яскравості і дві вибірки кольоровості, кожна з TU-одиниць може зв'язуватися з блоком вибірок яскравості і двома блоками вибірок кольоровості. Модуль 104 обробки перетворення може формувати блоки коефіцієнтів для кожного TU в CU шляхом застосування одного або декількох перетворень дозалишкових блоків вибірок, зв’язаних з TU. Модуль 104 обробки перетворення може застосовувати різні перетворення до залишкового блока вибірок, зв’язаного з TU. Наприклад, модуль 104 обробки перетворення може застосовувати до залишкового блока вибірок дискретне косинусне перетворення (DCT), направлене перетворення або концептуально схоже перетворення. Модуль 106 квантування може квантувати коефіцієнти в блоці коефіцієнтів, зв’язаному з TU. Процес квантування може зменшити бітову глибину, зв'язану з деякими або всіма коефіцієнтами. Наприклад, n-бітовий коефіцієнт може бути округлений в менший бік до mбітового коефіцієнта протягом квантування, де n більше m. Модуль 106 квантування може квантувати блок коефіцієнтів, зв’язаний з TU в CU, на основі значення параметра квантування (QP), зв’язаного з CU. Відеокодер 20 може настроювати рівень квантування, що застосовується до блоків коефіцієнтів, зв’язаних з CU, настроюванням значення QP, зв’язаного з CU. 13 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 60 Модуль 108 оберненого квантування і модуль 110 обробки оберненого перетворення можуть застосовувати обернене квантування і обернені перетворення до блока коефіцієнтів, відповідно, щоб відновлювати блок вибірок залишку з блока коефіцієнтів. Модуль 112 відновлення може додавати відновлений блок вибірок залишку до відповідних вибірок з одного або декількох прогнозованих блоків вибірок, сформованих модулем 100 обробки прогнозування, щоб видати відновлений блок вибірок, зв’язаний з TU. Шляхом відновлення блоків вибірок для кожної TU в CU таким чином, відеокодер 20 може відновлювати піксельний блок для CU. Модуль 113 фільтра може виконувати операцію деблокування, щоб зменшити артефакти блочності в піксельному блоці, зв’язаному з CU. Буфер 114 декодованих зображень може зберігати відновлені піксельні блоки після того, як модуль 113 фільтра виконує одну або декілька деблокуючих операцій на відновлених піксельних блоках. Модуль 121 (обробки) міжкадрового прогнозування може використовувати опорне зображення, яке містить відновлені піксельні блоки, щоб виконувати міжкадрове прогнозування на PU-одиницях інших зображень. Крім того, модуль 126 обробки внутрішньокадрового прогнозування може використовувати відновлені піксельні блоки в буфері 114 декодованих зображень, щоб виконувати внутрішньокадрове прогнозування на інших PU-одиницях в тому самому зображенні, що і CU. Модуль 116 ентропійного кодування може приймати дані від інших функціональних компонентів відеокодера 20. Наприклад, модуль 116 ентропійного кодування може приймати блоки коефіцієнтів від модуля 106 квантування і може приймати синтаксичні елементи від модуля 100 обробки прогнозування. Модуль 116 ентропійного кодування може виконувати одну або декілька операцій ентропійного кодування над даними для формування ентропійно кодованих даних. Наприклад, модуль 116 ентропійного кодування може виконувати операцію контекстно-залежного адаптивного кодування із змінною довжиною кодового слова (CAVLC), операцію контекстно-залежного адаптивного двійкового арифметичного кодування (CABAC), операцію кодування з довжиною "із змінної в змінну" (V2V), операцію синтаксичного контекстнозалежного адаптивного двійкового арифметичного кодування (SBAC), операцію імовірнісного з розбиттям на інтервали ентропійного кодування (PIPE), операцію кодування експонентним кодом Голомба або інший тип операції ентропійного кодування над даними. Відеокодер 20 може виводити бітовий потік, який включає в себе ентропійно кодовані дані, сформовані модулем 116 ентропійного кодування. Бітовий потік може включати в себе серію вузлів NAL. Вузли NAL можуть включати в себе вузли NAL кодованих слайсів, вузли NAL SPS, вузли NAL PPS і так далі. Щоб забезпечити, що зображення не включає в себе комбінації мозаїчних фрагментів, WPP хвиль та ентропійних слайсів, бітовий потік може включати в себе синтаксичний елемент, який вказує, чи є зображення кодованим повністю з використанням WPP або чи є кожний мозаїчний фрагмент зображення кодованим без використання WPP. На фіг. 3 показана блок-схема, що ілюструє зразковий відеодекодер 30, який сконфігурований для реалізації способів цього розкриття. Фіг. 3 наводиться з метою пояснення і не є такою, що обмежує способи, як в широкому значенні проілюстровано та описано в цьому розкритті. З метою пояснення це розкриття описує відеодекодер 30 в контексті стандарту кодування HEVC. Однак способи цього розкриття можуть бути застосовними до інших стандартів або способів кодування. У прикладі за фіг. 3 відеодекодер 30 включає в себе модуль 150 ентропійного декодування, модуль 152 обробки прогнозування, модуль 154 оберненого квантування, модуль 156 обробки оберненого перетворення, модуль 158 відновлення, модуль 159 фільтра і буфер 160 декодованих зображень. Модуль 152 обробки прогнозування включає в себе модуль 162 компенсації руху і модуль 164 обробки внутрішньокадрового прогнозування. В інших прикладах відеодекодер 30 може включати в себе більше, менше компонентів або інші функціональні компоненти. Відеодекодер 30 може приймати бітовий потік. Модуль 150 ентропійного декодування може здійснювати аналіз бітового потоку, щоб витягувати синтаксичні елементи з бітового потоку. Як частина аналізу бітового потоку модуль 150 ентропійного декодування може ентропійно декодувати ентропійно кодовані синтаксичні елементи в бітовому потоці. Модуль 152 обробки прогнозування, модуль 154 оберненого квантування, модуль 156 обробки оберненого перетворення, модуль 158 відновлення і модуль 159 фільтра можуть формувати декодовані відеодані на основі синтаксичних елементів, витягнутих з бітового потоку. Бітовий потік може містити серію вузлів NAL. Вузли NAL бітового потоку можуть включати в себе вузли NAL кодованих слайсів. Як частина аналізу бітового потоку модуль 150 ентропійного декодування може витягувати та ентропійно декодувати синтаксичні елементи з вузлів NAL кодованого слайса. Кожний з кодованих слайсів може включати в себе заголовок слайса і дані 14 UA 112675 C2 5 10 15 20 25 30 35 40 45 50 55 слайса. Заголовок слайса може містити синтаксичні елементи, що відносяться до слайсу. Синтаксичні елементи в заголовку слайса можуть включати в себе синтаксичний елемент, який ідентифікує PPS, зв’язане із зображенням, яке містить слайс. Крім того, відеодекодер 30 може виконувати операцію відновлення на нерозділеній CU. Для виконання операції відновлення на нерозділеній CU відеодекодер 30 може виконувати операцію відновлення на кожній TU в CU. Шляхом виконання операції відновлення для кожної TU в CU, відеодекодер 30 може відновити залишковий піксельний блок, зв'язаний з CU. Як частина виконання операції відновлення на TU в CU модуль 154 оберненого квантування може здійснювати обернене квантування, тобто, виконувати операцію обернену квантуванню, блоків коефіцієнтів, зв'язаних з TU. Модуль 154 оберненого квантування може використовувати значення QP, зв'язане з CU в TU, щоб визначати рівень квантування і, аналогічно, рівень оберненого квантування для модуля 154 оберненого квантування, для застосування. Після того, як модуль 154 оберненого квантування обернено квантує блок коефіцієнтів, модуль 156 обробки оберненого перетворення може застосовувати одне або декілька обернених перетворень до блока коефіцієнтів для формування блока вибірок залишку, зв’язаного з TU. Наприклад, модуль 156 обробки оберненого перетворення може застосовувати до блока коефіцієнтів обернене DCT, обернене цілочисельне перетворення, обернене перетворення Карунена - Лоева (KLT), обернене обертальне перетворення, обернене направлене перетворення або інше обернене перетворення. Якщо PU кодується з використанням внутрішньокадрового прогнозування, модуль 164 обробки внутрішньокадрового прогнозування може виконувати внутрішньокадрове прогнозування для формування прогнозованого блока вибірок для PU. Модуль 164 обробки внутрішньокадрового прогнозування може використовувати режим внутрішньокадрового прогнозування для формування прогнозованого піксельного блока для PU на основі піксельних блоків просторово сусідніх PU. Модуль 164 обробки внутрішньокадрового прогнозування може визначити режим внутрішньокадрового прогнозування для PU на основі одного або декількох синтаксичних елементів, одержаних за допомогою аналізу з бітового потоку. Модуль 162 компенсації руху може будувати перший список опорних зображень (список 0) і другий список опорних зображень (список 1) на основі синтаксичних елементів, витягнутих з бітового потоку. Крім того, якщо PU кодований з використанням міжкадрового прогнозування, модуль 150 ентропійного декодування може витягувати інформацію руху для PU. Модуль 162 компенсації руху може визначати на основі інформації руху відносно PU, один або декілька опорних блоків для PU. Модуль 162 компенсації руху може сформувати на основі одного або декількох опорних блоків для PU прогнозований піксельний блок для PU. Модуль 158 відновлення може використовувати залишкові піксельні блоки, зв'язані з TUодиницями в CU, і прогнозовані піксельні блоки для PU-одиниць в CU, тобто, або дані внутрішньокадрового прогнозування, або дані міжкадрового прогнозування, як застосовні для відновлення піксельного блока для CU. Зокрема модуль 158 відновлення може підсумовувати вибірки залишкових піксельних блоків з відповідними вибірками прогнозованих піксельних блоків, щоб відновити піксельний блок для CU. Модуль 159 фільтра може виконувати операцію деблокування, щоб зменшити артефакти блочності, зв'язані з піксельним блоком CU. Відеодекодер 30 може зберігати піксельний блок CU в буфері 160 декодованих зображень. Буфер 160 декодованих зображень може забезпечувати опорні зображення для подальшої компенсації руху, внутрішньокадрового прогнозування і відтворення на пристрої відображення, такому як пристрій 32 відображення за фіг. 1. Наприклад, відеодекодер 30 може виконувати на основі піксельних блоків у буфері декодованих зображень 160 операції внутрішньокадрового прогнозування або міжкадрового прогнозування на PU-одиницях іншої CU. Як згадано вище, відеодекодер 30 може приймати бітовий потік, який включає в себе синтаксичний елемент режиму кодування. Якщо синтаксичний елемент режиму кодування має конкретне значення, синтаксичний елемент режиму кодування вказує, що зображення кодується повністю з використанням WPP. У різних прикладах синтаксичний елемент режиму кодування може знаходитися в різних сегментах бітового потоку. Наприклад, SPS може включати в себе синтаксичний елемент "режим кодування". Нижче Таблиця 1 наводить зразковий синтаксис для SPS, яке включає в себе синтаксичний елемент режиму кодування ("tile_mode"). 15 UA 112675 C2 Таблиця 1 Синтаксис RBSP набору параметрів послідовності seq_parameter_set_rbsp() { … inter_44_enabled_flag tile_mode//0: тільки один мозаїчний фрагмент в одному зображенні; 1: однорідне взаємне розташування; 2: неоднорідне взаємне розташування; 3: WPP if( tile_mode == 1 || tile_mode == 2 ) { num_tile_columns_minus1 num_tile_rows_minus1 } if( tile_mode== 2 ) { for (i=0; i
ДивитисяДодаткова інформація
Автори англійськоюWang, Ye-Kui, Coban, Muhammed Zeyd
Автори російськоюВан Е-Куй, Кобан Мухаммед Зэйд
МПК / Мітки
МПК: H04N 7/00
Мітки: паралельно, хвильової, вказівка, відео, кодуванні, використання, обробки
Код посилання
<a href="https://ua.patents.su/52-112675-vkazivka-vikoristannya-paralelno-khvilovo-obrobki-u-koduvanni-video.html" target="_blank" rel="follow" title="База патентів України">Вказівка використання паралельної хвильової обробки у кодуванні відео</a>
Попередній патент: Визначення контекстів для кодування даних коефіцієнтів перетворення при кодуванні відео
Наступний патент: Спосіб виготовлення катодного блока для електролітичної комірки для одержання алюмінію
Випадковий патент: Спосіб резервування та перевірки достовірності електронних квитків за допомогою двомірного штрихового коду