Способи відеокодування для кодування залежних зображень після довільного доступу

Номер патенту: 108155

Опубліковано: 25.03.2015

Автори: Карчевіч Марта, Чень Пейсун, Чен Ін, Кобан Мухаммед Зейд

Формула / Реферат

1. Спосіб кодування відеоданих, причому спосіб містить:

кодування з використанням відеокодера групи зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому загадані одне або більше потенційно зайвих зображень слідують за зображеннями довільного доступу в порядку відображення;

визначення з використанням відеодекодера, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і

сигналізування з використанням відеодекодера синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), який вказує, визначається чи ні одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу.

2. Спосіб за п. 1, який додатково включає

визначення з використанням відеокодера, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього прогнозування щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

3. Спосіб за п. 1, який додатково містить сигналізування з використанням відеокодера синтаксичного елемента в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень.

4. Спосіб за п. 1, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

5. Спосіб декодування відеоданих, причому спосіб включає:

прийом з використанням відеокодера групи зображень, що включають в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і

прийом з використанням відеодекодера синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), який вказує, є чи ні одне із згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу.

6. Спосіб за п. 5, який додатково включає:

прийом з використанням відеокодера запиту на довільний доступ до зображення довільного доступу;

декодування з використанням відеокодера зображення довільного доступу у відповідь на запит на довільний доступ; і

декодування з використанням відеокодера згаданих одного або більше потенційних зайвих зображень згідно з прийнятим синтаксичним елементом.

7. Спосіб за п. 6, який додатково містить:

пропуск з використанням відеокодера декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента.

8. Спосіб за п. 5, який додатково містить визначення з використанням відеодекодера, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і використання залежного зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

9. Спосіб за п. 5, в якому синтаксичний елемент зберігається в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень.

10. Спосіб за п. 5, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

11. Пристрій, сконфігурований з можливістю кодувати відеодані, причому пристрій містить:

відеокодер, сконфігурований з можливістю:

кодувати групу зображень, причому група зображень включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення;

визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і

сигналізувати синтаксичний елемент в заголовку блока мережного рівня абстракції (NAL), який вказує, чи визначається одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу.

12. Пристрій за п. 11, в якому відеокодер додатково сконфігурований з можливістю визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього прогнозування щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

13. Пристрій за п. 11, в якому відеокодер додатково сконфігурований з можливістю сигналізувати синтаксичний елемент в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень.

14. Пристрій за п. 11, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

15. Пристрій, сконфігурований з можливістю декодувати відеодані, причому пристрій містить:

відеодекодер, сконфігурований з можливістю:

приймати групу зображень, причому група зображень включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і

приймати синтаксичний елемент в заголовку блока мережного рівня абстракції (NAL), який вказує, є чи ні одне із згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу.

16. Пристрій за п. 15, в якому відеодекодер додатково сконфігурований з можливістю:

приймати запит на довільний доступ до зображення довільного доступу;

декодувати зображення довільного доступу у відповідь на запит на довільний доступ; і

декодувати одне потенційно зайве зображення згідно з прийнятим синтаксичним елементом.

17. Пристрій за п. 16, в якому відеодекодер додатково сконфігурований з можливістю:

пропускати декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента.

18. Пристрій за п. 15, в якому відеодекодер додатково сконфігурований з можливістю визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і

використовувати залежне зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

19. Пристрій за п. 15, в якому синтаксичний елемент зберігається в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень.

20. Пристрій за п. 15, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

21. Пристрій, сконфігурований з можливістю кодувати відеодані, причому пристрій містить:

засіб для кодування групи зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення;

засіб для визначення, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і

засіб для сигналізування синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), яке вказує, визначається чи ні одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу.

22. Пристрій за п. 21, який додатково містить:

засіб для визначення, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

23. Пристрій за п. 21, який додатково містить:

засіб для сигналізування синтаксичного елемента в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень.

24. Пристрій за п. 21, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

25. Пристрій, сконфігурований з можливістю декодувати відеодані, причому пристрій містить:

засіб для прийому групи зображень, які включають в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і

засіб для прийому синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), який вказує, є чи ні одне зі згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу.

26. Пристрій за п. 25, який додатково містить:

засіб для прийому запиту на довільний доступ до зображення довільного доступу;

засіб для декодування зображення довільного доступу у відповідь на запит на довільний доступ; і

засіб для декодування одного потенційно зайвого зображення згідно з прийнятим синтаксичним елементом.

27. Пристрій за п. 26, який додатково містить:

засіб для пропуску декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента.

28. Пристрій за п. 25, який додатково містить:

засіб для визначення, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і

засіб для використання залежного зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

29. Пристрій за п. 25, в якому синтаксичний елемент зберігається в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень.

30. Пристрій за п. 25, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

31. Постійний машиночитаний носій, який зберігає інструкції для спонукання одного або більше процесорів пристрою, сконфігурованого з можливістю кодувати відеодані:

кодувати групу зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення;

визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і

сигналізувати синтаксичний елемент в заголовку блока мережного рівня абстракції (NAL), який вказує, чи визначається одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу.

32. Постійний машиночитаний носій за п. 31, в якому інструкції додатково спонукають один або більше процесорів визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього передбачення, щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

33. Постійний машиночитаний носій за п. 31, який додатково містить інструкції для спонукання одного або більше процесорів сигналізувати синтаксичний елемент в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень.

34. Постійний машиночитаний носій за п. 31, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

35. Постійний машиночитаний носій, який зберігає інструкції для спонукання одного або більше процесорів пристрою, сконфігурованого з можливістю декодувати відеодані:

приймати групу зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і

приймати синтаксичний елемент в заголовку блока мережевого рівня абстракції (NAL), який вказує, є чи ні одне зі згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу.

36. Постійний машиночитаний носій за п. 35, в якому інструкції додатково спонукають один або більше процесорів:

приймати запит на довільний доступ до зображення довільного доступу;

декодувати зображення довільного доступу у відповідь на запит на довільний доступ; і

декодувати одне потенційно зайве зображення згідно з прийнятим синтаксичним елементом.

37. Постійний машиночитаний носій за п. 36, в якому інструкції додатково спонукають один або більше процесорів:

пропускати декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента.

38. Постійний машиночитаний носій за п. 35, який додатково містить інструкції для спонукання одного або більше процесорів визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і використовувати залежне зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення.

39. Постійний машиночитаний носій за п. 35, в якому синтаксичний елемент зберігається в форматі файлів.

40. Постійний машиночитаний носій за п. 35, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR).

Текст

Реферат: Загалом, даний винахід описує способи кодування відеоданих для довільного доступу. Зокрема, даний винахід пропонує кодувати синтаксичний елемент, який вказує, чи може залежне зображення успішно декодуватися у випадку запиту довільного доступу до зображення чистого оновлення декодування (CDR) і чи може вимагатися для декодування зображень, що йдуть за зображенням чистого оновлення декодування (CDR) в порядку відображення. UA 108155 C2 (12) UA 108155 C2 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 Дана заявка заявляє пріоритет за попередньою заявкою США № 61/451,453, поданою 10 березня 2011 року, і попередньою заявкою США № 61/454,548, поданою 20 березня 2011 року, вміст кожної з яких повністю включений в даний документ за допомогою посилання. Галузь техніки, до якої належить винахід Дане розкриття належить до відеокодування і, більш конкретно, до способів відеокодування для довільного доступу. Рівень техніки Можливості цифрового відео можуть входити в широкий діапазон пристроїв, що включають в себе цифрові телевізори, системи цифрового прямого широкомовлення, системи бездротового широкомовлення, персональні цифрові помічники (PDA), портативні або настільні комп'ютери, цифрові камери, цифрові записуючі пристрої, цифрові мультимедійні програвачі, пристрої відеоігор, консолі відеоігор, стільникові або супутникові радіотелефони, пристрої відеотелеконференцзв'язку тощо. Пристрої цифрового відео реалізують способи стиснення відео, такі як ті, що описані в стандартах, визначених за допомогою MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, Part 10, Поліпшеного відеокодування (AVC), стандарту високоефективного відеокодування (HEVC), що в цей час знаходиться в розробці, і розширення таких стандартів, щоб передавати, приймати і зберігати інформацію цифрового відео більш ефективно. Способи стиснення відео можуть включати в себе просторове (внутрішньокадрове) прогнозування і/або часове (міжкадрове) прогнозування, щоб зменшувати або усувати надмірність, властиву відеопослідовностям. Для основаного на блоках відеокодування, відеозріз може розбиватися на відеоблоки, які також можуть згадуватися як блоки з деревоподібною структурою, блоки кодування (CU) і/або вузли кодування. Відеоблоки у внутрішньо кодованому (I) зрізі зображення кодуються з використанням просторового прогнозування по відношенню до посилальних відліків у сусідніх блоках в тому самому зображенні. Відеоблоки у ззовні кодованому (Р або В) зрізі зображення можуть використовувати просторове прогнозування по відношенню до посилальних відліків у сусідніх блоках в тому самому зображенні або часовий прогнозування по відношенню до посилальних відліків в інших посилальних зображеннях. Зображення можуть згадуватися як кадри, і посилальні зображення можуть згадуватися як посилальні кадри. Просторове або часове прогнозування використовує прогнозуючий блок для блока, що підлягає кодуванню. Залишкові дані представляють пікселні різниці між вихідним блоком, що підлягає кодуванню, і прогнозуючим блоком. Ззовні кодований блок кодується згідно з вектором руху, який посилається на блок посилальних відліків, які формують прогнозуючий блок, і залишкові дані, що вказують різницю між кодованим блоком і прогнозуючим блоком. Внутрішньо кодований блок кодується згідно з режимом внутрішнього кодування і залишковими даними. Для додаткового стиснення залишкові дані можуть перетворюватися з пікселної ділянки в ділянку перетворення, даючи результатом залишкові коефіцієнти перетворення, які потім можуть квантуватися. Квантовані коефіцієнти перетворення, спочатку розміщені у двомірній матриці, можуть скануватися в конкретному порядку, щоб виробляти одномірний вектор коефіцієнтів перетворення для ентропійного кодування. Розкриття винаходу Загалом, дане розкриття описує способи кодування відеоданих для довільного доступу. Зокрема, дане розкриття пропонує кодувати синтаксичний елемент, який вказує, чи є потенційно зайве зображення залежним зображенням, яке може успішно декодуватися у випадку запиту довільного доступу до зображення чистого оновлення декодування (CDR). Залежне зображення є зображенням, яке використовується для декодування зображень, що йдуть за зображенням чистого оновлення декодування (CDR) в порядку відображення. В одному прикладі розкриття спосіб кодування відеоданих містить кодування групи зображень, яка включає в себе зображення чистого оновлення декодування (CDR) і одне або більше потенційно зайвих зображень, які можуть потребуватися зображенням, що йдуть за зображенням CDR в порядку відображення, визначення, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень залежним зображенням, визначення, чи є залежне зображення декодованим у випадку, коли зображення CDR використовується для довільного доступу, і сигналізування синтаксичного елемента, яке вказує, що залежне зображення визначається як декодоване у випадку, коли зображення CDR використовується для довільного доступу. В іншому прикладі розкриття спосіб декодування відеоданих містить прийом групи зображень, що включають в себе зображення чистого оновлення декодування (CDR) і одне або більше потенційно зайвих зображень, і прийом синтаксичного елемента, що вказує, чи є чи ні 1 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 яке-небудь із згаданих одного або більше потенційно зайвих зображень залежним зображенням, яке є декодованим у випадку, коли приймається запит на довільний доступ до зображення CDR. Спосіб декодування може додатково містити прийом запиту на довільний доступ до зображення CDR, декодування зображення CDR у відповідь на запит на довільний доступ, декодування залежного зображення, що відповідає прийнятому синтаксичному елементу, і пропуск декодування для будь-якого із згаданих одного або більше потенційно зайвих зображень, які не вказані як залежні зображення за допомогою прийнятого синтаксичного елемента. Способи кодування та декодування, описані вище, також можуть реалізовуватися за допомогою пристрою (наприклад, за допомогою відеокодера або відеодекодера) або за допомогою інструкцій, збережених на машинозчитуваному носії. Деталі одного або більше прикладів викладаються у супроводжуючих кресленнях та нижченаведеному описі. Інші ознаки, цілі та переваги стануть очевидні з опису і креслень та з формули винаходу. Короткий опис креслень Фіг. 1 є концептуальною діаграмою, що ілюструє ілюстративний порядок декодування групи зображень із зображенням чистого оновлення декодування (CDR) і внутрішньо прогнозованим залежним зображенням. Фіг. 2 є концептуальною діаграмою, що ілюструє ілюстративний порядок декодування групи зображень із зображенням чистого оновлення декодування (CDR) і ззовні прогнозованим залежним зображенням. Фіг. 3 є блок-схемою, яка ілюструє ілюстративну систему кодування та декодування відео, яка може використовувати способи, описані в даному розкритті. Фіг. 4 є блок-схемою, яка ілюструє ілюстративний відеокодер, який може здійснювати способи, описані в даному розкритті. Фіг. 5 є блок-схемою, яка ілюструє ілюстративний відеодекодер, який може здійснювати способи, описані в даному розкритті. Фіг. 6 є ілюстративною блок-схемою послідовності операцій способу кодування відео згідно зі способами даного розкриття. Фіг. 7 є ілюстративною блок-схемою послідовності операцій способу декодування відео згідно зі способами розкриття. Фіг. 8 є концептуальною діаграмою ілюстративного базового формату мультимедійних файлів ISO. Здійснення винаходу Довільний доступ у відеокодуванні забезпечує можливість відеодекодеру відеокодувати відео в конкретні моменти часу з малою кількістю до відсутності посилань на попередні відеокадри. Насправді, відеокодування "починається наново" на зображенні, призначеному як точка довільного доступу. Приклад зображення точки довільного доступу чистого оновлення декодування (CDR) показаний на Фіг. 1. Зображення на Фіг. 1 показані в порядку відображення. Поточна група зображень (GOP) 1 включає в себе зображення з відліком порядку зображень (POC) від 141-156, включаючи сюди зображення точки довільного доступу. У цьому прикладі, зображення точки довільного доступу є зображенням 148 чистого оновлення декодування (CDR). Зображення CDR є зображенням, яке може бути декодоване без посилання на інші зображення. Наприклад, зображення CDR може бути зображенням, яке містить тільки внутрішньо прогнозовані зрізи. Зображення CDR відрізняється від зображення миттєвого оновлення декодування (IDR), яке є іншим типом зображення "чистого" довільного доступу. Коли зображення IDR використовується для довільного доступу, буфер декодованих зображень (DPB) негайно встановлюється у вихідне положення. Коли зображення CDR використовується для довільного доступу, DPB не встановлюється у вихідне положення негайно. Це поліпшує ефективність кодування по відношенню до довільного доступу до зображень IDR. На Фіг. 1, зображення, помічені за допомогою малої букви "b" (тобто зображення 139, 141, 143, 145, та 147) є зображеннями, які є двонапралено ззовні прогнозованими по двох інших зображеннях, як показано за допомогоюстрілок. Зображення, на які повернуті стрілки, використовують зображення, з яких виходять стрілки, як прогнозувальники в обробці кодування зовнішнього прогнозування. Зображення з малою буквою "b" не використовуються, щоб прогнозувати інші зображення. Зображення, помічені за допомогою великої букви "B" (тобто зображення 140, 142, 144, та 156), також є зображеннями, які двонапралено ззовні прогнозованими по двох інших зображеннях. На противагу зображенням "b", зображення, помічені за допомогою великої букви "B", використовуються як прогнозувальники для інших зображень, як показано за допомогою стрілок. Зображення I146 є внутрішньо прогнозованим 2 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 зображенням. Тобто, зображення I146 не кодується з посиланням на інші зображення, але швидше, використовує внутрішнє просторове прогнозування для кодування зображення. Однак зображення I46 може використовуватися, щоб прогнозувати інші зображення (наприклад, зображення b147 та b145, як показано на Фіг. 1). Деякі зображення в поточній GOP 1 (наприклад, зображення з POC 141 по 147) можуть не декодуватися успішно, якщо декодування починається на CDR148 після довільного доступу, оскільки зображення з попередньої GOP 2 не будуть доступними для зовнішнього прогнозування. Тобто, якщо декодування починається з CDR148, зображення з попередньої GOP можуть бути або можуть не бути декодованими. Як такі, зображення з попередньої GOP можуть не бути доступними для зовнішнього прогнозування. Зображення 141-147 можуть бути або можуть не бути необхідними для зовнішнього прогнозування для зображень, що йдуть за зображенням CDR в порядку виведення (зображення з POC>148). Зображення, які передують CDR в порядку відображення, часто викликаються "потенційно зайвими зображеннями" 3 (зображення 141-147 на Фіг. 1). У прикладі з Фіг. 1, є одне потенційно зайве зображення, I 146, яке може успішно декодуватися, навіть якщо CDR148 використовується для довільного доступу. I146 є все ще декодованим, оскільки воно є внутрішньо прогнозованим зображенням, яке не покладається на які-небудь інші зображення, що підлягають декодування. За деяких обставин, зображення (наприклад, B156, що йде за CDR148 в порядку виведення) може використовувати потенційно зайве зображення (в цьому випадку, I146) для зовнішнього прогнозування. Потенційно зайве зображення, яке використовується для зовнішнього прогнозування для зображень після CDR в порядку декодування і порядку відображення, називається залежним зображенням 4. В прикладі з Фіг. 1, B156 є першим зображенням після зображення CDR в обох порядку декодування та порядку відображення. CDR148 може все ж використовуватися як точка довільного доступу, якщо декодування I146 гарантується, оскільки I146 необхідне, щоб відеокодувати деяке зображення після CDR148 як в порядку декодування, так і в порядку виведення (наприклад, зображення B156). Якщо залежне зображення 4 є внутрішньо прогнозованим зображенням, декодер може легко визначати, що таке зображення є декодованим. Фіг. 2 є концептуальною діаграмою, що ілюструє ілюстративний порядок декодування групи зображень із зображенням чистого оновлення декодування і ззовні прогнозованим залежним зображенням. У прикладі з Фіг. 2, залежне зображення 4 є ззовні прогнозованим зображенням (P246 або B246). На основі поточного визначення CDR в стандарті високоефективного відеокодування (HEVC), така ситуація не дозволяється. Це через те, що декодування залежного Р або В зображення не гарантується. Якщо декодування відео починається на зображенні CDR після довільного доступу, є невизначеним, чи є потенційно зайві зображення, включаючи сюди будь-які залежні зображення, декодованими, оскільки вони можуть бути ззовні прогнозованими з ланцюга прогнозування, який включає в себе зображення в попередній GOP, або із зображень в поточній GOP, які самі покладаються на зображення в попередній GOP. Знову, після довільного доступу до зображення CDR, зображення в попередній GOP можуть бути недоступними. Поточні дизайни відеокодеків (кодера/декодерів) не підтримують декодування залежних зображень. Як такі, поточні дизайни відеокодеків також не підтримують зовнішнє прогнозування по залежних зображеннях, при тому, що також не декодують які-небудь інші потенційно зайві зображення. Декодування потенційно зайвих зображень не дозволяється, оскільки є дуже складним визначити, чи може потенційно зайве зображення бути декодоване успішно чи ні після довільного доступу. Якщо потенційно зайве зображення є I зображенням, декодування є можливим, оскільки I зображення може декодуватися без використання якого-небудь іншого зображення. Однак, якщо потенційно зайве зображення є В або Р зображенням (наприклад, P246 або B246 на Фіг. 2), відеодекодер повинен спочатку визначити ускладнений ланцюг прогнозування, щоб ідентифікувати, чи є чи ні потенційно зайве зображення декодованим. Наприклад, відеодекодер повинен спочатку визначити ланцюг прогнозування зображень 239248 на Фіг. 2, щоб визначити, чи може яке-небудь з цих потенційно зайвих зображень бути успішно декодоване. Також, поточні дизайни відеокодеків не забезпечують ніякого механізму для забезпечення можливості декодеру визначати, чи буде потенційно зайве зображення використовуватися у зовнішньому прогнозуванні для зображень, що йдуть за CDR в порядку декодування (тобто визначати, чи є потенційно зайве зображення залежним зображенням). З огляду на вищеописані недоліки, дане розкриття пропонує використання синтаксичного елемента (наприклад, прапора), що підлягає додаванню у синтаксис рівня зображення і/або синтаксис заголовка зрізу як індикація, що потенційно зайве зображення є декодованим і може 3 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 використовуватися для зовнішнього прогнозування для зображень, що йдуть за CDR в порядку декодування (тобто прапор показує, що потенційно зайве зображення є декодованим залежним зображенням). Прапор може сигналізуватися кодером у кодованому бітовому відеопотоці, оскільки кодер може визначати, чи дозволяє чи ні ланцюг прогнозування для потенційно зайвого зображення успішне декодування після довільного доступу і чи може чи ні потенційно зайве зображення використовуватися для зовнішнього прогнозування для зображень після CDR в порядку декодування. Кодер може відстежувати ланцюг прогнозування, по мірі того, як зображення кодуються, та ідентифікувати зображення як такі, що є потенційно зайвими зображеннями, коли вони знаходяться в тій самій GOP, що і CDR. Конкретним потенційно зайвим зображенням може потім призначатися прапор (наприклад, прапор залежного зображення), щоб показувати, що вони є декодованими після довільного доступу до CDR і що вони можуть використовуватися для зовнішнього прогнозування для зображень після CDR в порядку декодування (тобто прапор показує, що потенційно зайві зображення є залежним зображенням). В одному прикладі, додатковий прапор індикації (наприклад, прапор індикації залежності) може сигналізуватися для кожної GOP, яка включає в себе зображення CDR. Прапор індикації залежності зі значенням 1, наприклад, показує, що щонайменше одне з потенційно зайвих зображень в GOP є залежним зображенням. Якщо це так, прапор залежного зображення тоді сигналізується для кожного потенційно зайвого зображення. Прапор залежного зображення показує, чи є чи ні конкретне потенційно зайве зображення залежним зображенням. Якщо прапор індикації залежності має значення 0, це показує, що ніяке потенційно зайве зображення не є залежним зображенням в GOP. Як такий, прапор залежного зображення не повинен сигналізуватися для цієї GOP. В іншому прикладі, прапор індикації залежності не використовується. Замість цього, прапор залежного зображення сигналізується для всіх потенційно зайвих зображень в GOP, що має зображення CDR. Як приклади, прапор індикації залежності та прапор залежного зображення можуть сигналізуватися в заголовку блока мережного рівня абстракції (NAL), повідомленні додаткової розширеної інформації (SEI) рівня зображення, заголовку зрізу, або іншому синтаксичному елементі рівня зображення або повідомленні, щоб показувати, що потенційно зайве зображення є залежним зображенням (тобто воно є як декодованим, так і може використовуватися для зовнішнього прогнозування після довільного доступу). Блок NAL є дискретним пакетом відеоданих, який містить відеодані для множини зображень, що містяться в частині зрізу. Повідомлення SEI рівня зображення є додатковою інформацією, яка може застосовуватися до декодування зображення. У випадку, коли CDR в поточній GOP просто було вибране для довільного доступу, декодер може використовувати цей прапор, щоб визначати, чи можуть які-небудь потенційно зайві зображення в поточній GOP бути успішно декодованими і можуть використовуватися для зовнішнього прогнозування для зображень, що йдуть за CDR в порядку декодування і порядку виведення (тобто визначати, що потенційно зайве зображення є залежним зображенням). В іншому прикладі розкриття, прапор індикації залежності і/або прапор залежного зображення може додаватися у формат файлів, наприклад, формат файлів ISO, так що зображення, які не є залежними зображеннями повинні декодуватися і/або не повинні передаватися, якщо файл є інкапсульованим для передачі в сценаріях додатків, таких як потокове відео на основі HTTP. Базовий формат мультимедійних файлів ISO сконструйований, щоб містити часову мультимедійну інформацію для представлення в гнучкому форматі, що розширюється, який забезпечує взаємозамінність, керування, редагування, і представлення мультимедіа. Базовий формат мультимедійних файлів ISO (ISO/IEC 14496-12:2004) визначений в MPEG-4 Part-12, який визначає загальну структуру для основаних на часі мультимедійних файлів. Він використовується як основа для інших форматів файлів у сімействі, як, наприклад, підтримка, що визначається форматом файлів Поліпшеного відеокодування (AVC) (ISO/IEC 14496-15) для відеостиснення H.264/MPEG-4 AVC, формат файлів 3GPP і формат файлів SVC і формат файлів MVC, обидва з яких є розширеннями формату файлів AVC. Формат мультимедійних файлів ISO також може, загалом, розширятися до інших стандартів відеокодування, таких як HEVC. Базовий формат мультимедійних файлів ISO може містити синхронізацію, структуру і мультимедійну інформацію для часових послідовностей мультимедійних даних, таких як аудіовізуальні представлення. Файлова структура є об'єктно-орієнтованою. Файл може розкладатися на базові об'єкти дуже просто і структура об'єктів витікає з їх типу. 4 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 Представлення (послідовність руху) може міститися в декількох файлах. Інформація синхронізації та кадрування (положення і розмір) знаходиться в базовому мультимедійному файлі ISO і допоміжні файли можуть, по суті, використовувати будь-який формат. Це представлення може бути 'локальним' для системи, що містить представлення, або може здійснюватися за допомогою мережі або іншого потокового механізму доставки. Файли, що відповідають базовому формату мультимедійних файлів ISO, формуються як послідовність об'єктів, які називаються "блоки". В одному прикладі, всі дані містяться в блоках і не є ніяких інших даних всередині файла. Це включає в себе будь-яку початкову сигнатуру, щ вимагається конкретним форматом файлів. "Блок" є об'єктно-орієнтованим компонувальним блоком, визначеним за допомогою однозначного ідентифікатора типу і довжини. Ілюстративна файлова структура, що дотримується базового формату мультимедійних файлів ISO, показана на Фіг. 8. Звичайно, представлення міститься в одному файлі 300, при цьому мультимедійне представлення є автономним. Контейнер 302 фільмів (наприклад, блок фільму) містить метадані мультимедіа, і відео і аудіокадри містяться в контейнері 350 мультимедійних даних і/або в інших файлах. Контейнер 302 фільмів може містити метадані для відеодоріжки 304. Контейнер 302 фільмів також може містити інші доріжки, такі як аудіодоріжка (не показана). Метадані у аудіодоріжці 304 можуть зберігатися в контейнері 308 мультимедійної інформації. Мультимедійна інформація може включати в себе опис 310 відліків. Опис 310 відліків може містити 'ім'я' точного типу мультимедіа (наприклад, типу декодера, необхідного, щоб відеокодувати потік) і будь-яку параметризацію того необхідного декодера. Ім'я також може приймати форму коду з чотирьох символів, наприклад, "moov", або "trak". Визначені формати входжень відліків не тільки для мультимедіа MPEG-4, але також для типів мультимедіа, що використовуються іншими організаціями, які використовують це сімейство форматів файлів. Контейнер 350 мультимедійних даних може включати в себе впорядковані за часом відліки відео та аудіокадри, що чергуються. Зокрема, контейнер 350 мультимедійних даних може включати в себе множину шматків відеоданих (наприклад, шматок 352 та 362 відеоданих). Кожний шматок відеоданих може включати в себе множину відліків відео (наприклад, відліки 353a-c та 363a-c відео). Файли мають логічну структуру, часову структуру і фізичну структуру. Від цих структур не потрібно, щоб вони були зв'язаними. Логічна структура файла призначена для фільму, який в свою чергу містить набір паралельних за часом доріжок. Часова структура файла полягає в тому, що доріжки містять послідовності відліків у часі, і ці послідовності перетворюються у часову шкалу повного фільму за допомогою необов'язкових монтажних списків. Фізична структура файла відділяє дані, необхідні для логічного, часового і структурного розкладання, від самих відліків мультимедійних даних. Ця структурна інформація концентрується в блоці фільму, можливо розширеному у часі за допомогою блоків фрагментів фільму. Блок фільму документує логічні та часові відношення відліків, і також містить покажчики на те, де вони розташовуються. Ці покажчики можуть бути на той самий файл або інший файл, вказаний за допомогою URL. Підтримка для метаданих приймає дві форми. По-перше, зв'язані з часом метадані можуть зберігатися у відповідній доріжці, синхронізовані, як вимагається, з мультимедійними даними, які вони описують (наприклад, шматками відеоданих в контейнері 350 мультимедіа). По-друге, є загальна підтримка для не зв'язаних з часом метаданих, прикріплених до фільму або до індивідуальної доріжки. Структурна підтримка є загальною, і забезпечує можливість, як в мультимедійних даних, зберігання ресурсів метаданих де-небудь в файлі або в іншому файлі. Додатково, цим ресурсам можуть привласнюватися імена, і вони можуть бути захищеними. У базовому форматі мультимедійних файлів ISO, групуванням відліків є призначення кожного з відліків у доріжці, щоб він був членом однієї групи відліків. Від відліків у групі відліків не вимагається, щоб вони були безперервними. Наприклад, при представленні H.264/AVC в форматі файлів AVC, відліки відео в одному часовому рівні можуть дискретизуватися в одну групу відліків. Групи відліків представляються за допомогою двох структур даних: блока SampleToGroup (sbdp) і блока SampleGroupDescription. Блок SampleToGroup представляє призначення відліків групам відліків. Є один екземпляр другого блока для кожного входження групи відліків, щоб описувати властивості цієї групи. У базовому форматі мультимедійних файлів ISO, визначається друга група, яка називається групування відліків точки довільного доступу (RAP) 312. Відлік синхронізації визначається як точка довільного доступу (наприклад, зображення CDR), після якої всі відліки в порядку декодування можуть коректно декодуватися. Однак може бути можливим кодувати "відкриту" точку довільного доступу, після якої всі відліки в порядку виведення можуть коректно 5 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 декодуватися, але деякі відліки, що йдуть за точкою довільного доступу в порядку декодування і передують точці довільного доступу в порядку виведення, не зобов'язані бути коректно декодованими. Наприклад, за внутрішньо кодованим зображенням, що починає відкриту групу зображень, можуть слідувати в порядку декодування (двонаправлено) прогнозовані зображення, які передують внутрішньо кодованому зображенню в порядку виведення. Є можливим, що такі (двонапралено) прогнозовані зображення не можуть коректно декодуватися, якщо декодування починається з внутрішньо кодованого зображення, і як такі, вони не є необхідними. Такі "відкриті" відліки довільного доступу можуть позначатися як такі, що є членом цієї групи (визначено за допомогою стрілок з RAP 312 у відліки відео в шматку 352 та 362 відео на Фіг. 8). Відліки, помічені за допомогою цієї групи, є точками довільного доступу, і також можуть бути точками синхронізації (тобто не потрібно, щоб відліки, помічені за допомогою таблиці відліків синхронізації, виключалися). Приклад синтаксису довільного доступу для базового формату файлів ISO показаний нижче. class VisualRandomAccessEntry() extends VisualSampleGroupEntry ('rap ') { unsigned int(1) num_leading_samples_known; unsigned int(7) num_leading_samples; } Синтаксичний елемент num_leading_samples_known, рівний 1, показує, що кількість ведучих відліків перед точкою синхронізації (наприклад, зображенням CDR) є відомою для кожного відліку в цій групі, і кількість визначається синтаксичним елементом num_leading_samples. Ведучий відлік є таким відліком, зв'язаним з "відкритою" точкою довільного доступу (RAP). Він передує RAP (наприклад, зображенню CDR) в порядку відображення і слідує за RAP або іншим ведучим відліком в порядку декодування. Коли декодування починається з RAP, відлік не може коректно декодуватися. Синтаксичний елемент num_leading_samples визначає кількість ведучих відліків для кожного відліку в цій групі. Коли num_leading_samples_known дорівнює 0, це поле повинно ігноруватися. Щоб додатково забезпечувати можливість сигналізації прапора залежності (dependent_flag), пропонується наступний синтаксис: class VisualRandomAccessEntry() extends VisualSampleGroupEntry ('rap ') { unsigned int(1) num_leading_samples_known; unsigned int(6) num_leading_samples; unsigned int(1) depedent_indication_flag; if (depedent_indication_flag) { for (i=0; i < num_leading_samples; i++) unsigned int (1) dependent_flag; while (i%8!= 0) unsigned int (1) byte_aligne_zero_bit; } } У вищеописаному прикладі, значення dependent_indication_flag 314 для ведучих зображень сигналізується в порядку декодування. dependent_indication_flag 314 показує, чи є які-небудь з ведучих відліків (наприклад, потенційно зайві зображення) залежними зображеннями, які є коректно декодованими, після довільного доступу до RAP (наприклад, зображення CDR), і використовуються для декодування зображень, що йдуть за RAP в порядку виведення. Якщо dependent_indication_flag 314 є істиною (наприклад, має значення 1), dependent_flag 316 тоді сигналізується для кожного з потенційно зайвих зображень, щоб показувати, чи є конкретне зображення залежним чи ні. Якщо dependent_indication_flag 314 є помилкою (наприклад, має значення 0), dependent_flag 316 не повинен сигналізуватися. В іншому прикладі розкриття, dependent_indication_flag 314 не сигналізується, і замість цього, dependent_flag 316 сигналізується для всіх потенційно зайвих зображень в групі, що має RAP (наприклад, зображення CDR). Наприклад, інший блок може бути зв'язаним для кожного відліку, і блок може містити такий dependent_flag 316. Якщо dependent_flag 316 є істиною, і, таким чином, поточне зображення є залежним зображенням після довільного доступу, прапор показує, що залежне зображення є успішно декодованим і може використовуватися для зовнішнього прогнозування за допомогою зображень, що йдуть за CDR в порядку виведення, 6 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 якщо найближче CDR використовується для довільного доступу. Якщо dependent_flag 316 є помилкою, зображення не є необхідними для зовнішнього прогнозування для зображень, що йдуть за CDR в порядку виведення, і додатково, зображення не є необхідними, коли відбувається довільний доступ з використанням CDR. Якщо визначення CDR модифікується відповідним чином, всі інші потенційно зайві зображення, за винятком залежного зображення (наприклад, зображення I146/P246/B246 на Фіг. 1 та Фіг. 2), не повинні декодуватися, коли CDR використовується для довільного доступу. Потенційно зайві зображення, які помічені прапорами як такі, що не є декодованими залежними зображеннями, не повинні декодуватися, коли для довільного доступу використовується зображення CDR, що може спрощувати декодування. Фіг. 3 є блок-схемою, яка ілюструє ілюстративну систему 10 кодування та декодування відео, яка може використовувати способи кодування довільного доступу, описані в цьому розкритті. Як показано на Фіг. 3, система 10 включає в себе пристрій 12 джерела, який генерує кодовані відеодані, що підлягають декодуванню в більш пізній час за допомогою пристрою 14 призначення. Пристрій 12 джерела і пристрій 14 призначення можуть містити будь-який з широкого діапазону пристроїв, включаючи сюди настільні комп'ютери, блокнотні (тобто портативні) комп'ютери, планшетні комп'ютери, приставки до телевізора, мікротелефонні трубки, такі як, так звані, "смартфони", так звані планшети "smart pad", телевізори, камери, пристрої відображення, цифрові мультимедійні програвачі, консолі відеоігор, або подібне. У деяких випадках, пристрій 12 джерела і пристрій 14 призначення можуть мати оснащення для бездротового зв'язку. Пристрій 14 призначення може приймати кодовані відеодані, що підлягають декодуванню, за допомогою лінії зв'язку 16. Лінія зв'язку 16 може містити будь-який тип носія або пристрою, виконаного з можливістю переміщення кодованих відеоданих від пристрою 12 джерела в пристрій 14 призначення. В одному прикладі, лінія зв'язку 16 може містити носій зв'язку, щоб забезпечувати можливість пристрою 12 джерела передавати кодовані відеодані напряму в пристрій 14 призначення в реальному часі. Кодовані відеодані можуть модулюватися згідно зі стандартом зв'язку, таким як протокол бездротового зв'язку, і передаватися в пристрій 14 призначення. Носій зв'язку може містити будь-який бездротовий або дротовий носій зв'язку, такий як радіочастотний (RF) спектр або одну або більше фізичних ліній передачі. Носій зв'язку може формувати частину основаної на пакетах мережі, такої як локальна мережа, широкомасштабна мережа, або глобальна мережа, така як мережа Інтернет. Носій зв'язку може включати в себе маршрутизатори, комутатори, базові станції, або будь-яке інше обладнання, яке може бути корисним, щоб забезпечувати зв'язок від пристрою 12 джерела до пристрою 14 призначення. В іншому прикладі, кодоване відео також може зберігатися на запам'ятовуючому носії 34 або файловому сервері 36, і до нього може здійснюватися доступ пристроєм 14 призначення, як вимагається. Запам'ятовуючий носій може включати в себе будь-який з різноманіття носіїв зберігання даних, до яких може здійснюватися локальний доступ, таких як диски Blu-ray, DVD, CD-ROM, флеш-пам'ять, або будь-які інші підходящі цифрові запам'ятовуючі носії для зберігання кодованих відеоданих. Запам'ятовуючий носій 34 або файловий сервер 36 може бути будь-яким іншим проміжним запам'ятовуючим пристроєм, який може зберігати кодоване відео, згенероване за допомогою пристрою 12 джерела, і до якого пристрій 14 призначення може здійснювати доступ, як вимагається, за допомогою потокової передачі або завантаження. Файловий сервер може бути будь-яким типом сервера, виконаним з можливістю зберігання кодованих відеоданих і передачі цих кодованих відеоданих в пристрій 14 призначення. Ілюстративні файлові сервери включають в себе Веб-сервер (наприклад, для Веб-сайта), FTP сервер, пристрої мережної системи зберігання даних (NAS), або локальний привід дисків. Пристрій 14 призначення може здійснювати доступ до кодованих відеоданих за допомогою будь-якого стандартного з'єднання передачі даних, що включає в себе Інтернет з'єднання. Він може включати в себе бездротовий канал (наприклад, з'єднання Wi-Fi), дротове з'єднання (наприклад, DSL, кабельний модем, тощо), або комбінацію обох, що є підходящим для здійснення доступу до кодованих відеоданих, збережених на файловому сервері. Передача кодованих відеоданих від файлового сервера може бути потоковою передачею, передачею завантаження, або комбінацією обох. Способи цього розкриття не є необхідно обмеженими бездротовими додатками або настройками. Способи можуть застосовуватися до відеокодування при підтримці будь-якого з різноманіття мультимедійних додатків, таких як ефірне телевізійне широкомовлення, кабельні телепередачі, супутникові телепередачі, потокові передачі відео, наприклад, за допомогою мережі Інтернет, кодування цифрового відео для зберігання на носії зберігання даних, 7 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 декодування цифрового відео, збереженого на носії зберігання даних, або інших додатків. У деяких прикладах, система 10 може бути сконфігурованою з можливістю підтримки односторонньої або двосторонньої передачі відео, щоб підтримувати додатки, такі як потокове відео, програвання відео, широкомовлення відео, і/або відео-телефонія. У прикладі з Фіг. 3, пристрій 12 джерела включає в себе джерело 18 відео, відеокодер 20 і вихідний інтерфейс 22. У деяких випадках, вихідний інтерфейс 22 може включати в себе модулятор/демодулятор (модем) і/або передавач. У пристрої 12 джерела, джерело 18 відео може включати в себе джерело, таке як пристрій захоплення відео, наприклад, відеокамеру, архів відео, що містить раніше захоплене відео, інтерфейс джерела відеосигналу, щоб приймати відео від провайдера відеоконтенту, і/або систему комп'ютерної графіки для генерування даних комп'ютерної графіки як джерело відео, або комбінацію таких джерел. Як один приклад, якщо джерело 18 відео є відеокамерою, пристрій 12 джерела і пристрій 14 призначення можуть формувати так звані камерофони або відеофони. Однак способи, описані в цьому розкритті, можуть бути застосовними до відеокодування загалом, і можуть застосовуватися до бездротових і/або дротових додатків. Захоплене, заздалегідь захоплене або машино-згенероване відео може кодуватися за допомогою відеокодера 20. Кодована відеоінформація може модулюватися за допомогою модему 22 згідно зі стандартом зв'язку, таким як протокол бездротового зв'язку, і передаватися в пристрій 14 призначення за допомогою передавача 24. Модем 22 може включати в себе різні міксери, фільтри, підсилювачі або інші компоненти, призначені для модуляції сигналу. Передавач 24 може включати в себе схеми, призначені для передачі даних, включаючи сюди підсилювачі, фільтри і одну або більше антен. Пристрій 14 призначення, в прикладі з Фіг. 3, включає в себе приймач 26, модем 28, відеодекодер 30 і пристрій 32 відображення. Приймач 26 пристрою 14 призначення приймає інформацію по каналу 16, і модем 28 демодулює інформацію, щоб виробляти демодульований бітовий потік для відеодекодера 30. Інформація, передана по каналу 16, може включати в себе різноманіття синтаксичної інформації, згенерованої за допомогою відеокодера 20 для використання відеодекодером 30 в декодуванні відеоданих. Такий синтаксис також може міститися з кодованими відеоданими, збереженими на запам'ятовуючому носії 34 або файловому сервері 36. Кожний з відеокодера 20 і відеодекодера 30 може формувати частину відповідного кодера-декодера (CODEC), який здатний кодувати або відеокодувати відеодані. Пристрій 32 відображення може бути інтегрованим з, або зовнішнім до, пристроєм 14 призначення. У деяких прикладах, пристрій 14 призначення може включати в себе інтегрований пристрій відображення і також бути сконфігурованим з можливістю з'єднання із зовнішнім пристроєм відображення. В інших прикладах, пристрій 14 призначення може бути пристроєм відображення. Загалом, пристрій 32 відображення відображає декодовані відеодані користувачу, і може містити будь-який з різноманіття пристроїв відображення, таких як рідкокристалічний дисплей (LCD), плазмовий дисплей, дисплей на органічних світловипромінюючих діодах (OLED) або інший тип пристрою відображення. Відеокодер 20 і відеодекодер 30 можуть працювати згідно зі стандартом стиснення відео, таким як стандарт високоефективного відеокодування (HEVC), що в цей час знаходиться в розробці, і можуть відповідати тестовій моделі HEVC (HM). Поточна чорнова версія стандарту HEVC представлена в JCTVC-H1003, "High Efficiency Video Coding (HEVC) text specification draft 6", версія 21, під редакцією B. Bross, W.-J. Han, G. J. Sullivan, J.-R. Ohm, T. Wiegand, датована 17 лютого, 2012. Альтернативно, відеокодер 20 і відеодекодер 30 можуть працювати згідно з іншими пропрієтарними або промисловими стандартами, такими як стандарт ITU-T H.264, що альтернативно вказуються як MPEG-4, Part 10, Поліпшене відеокодування (AVC), або розширеннями таких стандартів. Способи цього розкриття, однак, не є обмеженими якимнебудь конкретним стандартом кодування. Інші приклади стандартів стиснення відео включають в себе MPEG-2 та ITU-T H.263. Хоча на Фіг. 3 не показано, в деяких аспектах, відеокодер 20 та відеодекодер 30 можуть кожний бути інтегрованим з кодером і декодером аудіо, і можуть включати в себе відповідні блоки MUX-DEMUX, або інше апаратне забезпечення і програмне забезпечення, щоб забезпечувати кодування обох аудіо та відео в загальному потоці даних або окремих потоках даних. Якщо застосовно, в деяких прикладах, блоки MUX-DEMUX можуть відповідати протоколу мультиплексора ITU H.223, або іншим протоколам, таким як протокол користувацьких дейтаграм (UDP). Відеокодер 20 та відеодекодер 30 кожний можуть здійснюватися як один або більше процесорів, що містять будь-яку з різноманіття підходящих схем кодера і/або декодера, таких як один або більше мікропроцесорів, цифрових сигнальних процесорів (DSP), спеціалізованих 8 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 інтегральних схем (ASIC), програмованих користувачем вентильних матриць (FPGA), дискретна логіка, програмне забезпечення, апаратне забезпечення, вбудоване програмне забезпечення або будь-які комбінації переліченого. Коли способи здійснюються частково в програмному забезпеченні, пристрій може зберігати інструкції для програмного забезпечення у підходящому, нетранзиторному машинозчитуваному носії і виконувати інструкції в апаратному забезпеченні з використанням одного або більше процесорів, щоб виконувати способи цього розкриття. Кожний з відеокодера 20 і відеодекодера 30 може міститися в одному або більше кодерах або декодерах, кожний з яких може бути інтегрованим як частина комбінованого кодера/декодера (CODEC) у відповідному пристрої. Відеокодер 20 може здійснювати будь-який або всі зі способів цього розкриття. Подібним чином, відеодекодер 30 може здійснювати будь-який або всі з цих способів. Як один приклад, відеокодер 20 може бути сконфігурованим з можливістю кодувати групу зображень, яка включає в себе зображення чистого оновлення декодування (CDR) і одне або більше потенційно зайвих зображень, визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень залежним зображенням, визначати, чи є залежне зображення декодованим у випадку, коли зображення CDR використовується для довільного доступу, і сигналізувати синтаксичний елемент, який показує, що залежне зображення визначається як декодоване у випадку, коли зображення CDR використовується для довільного доступу. Як інший приклад, відеодекодер 30 може бути сконфігурованим з можливістю приймати групу зображень, що включають в себе зображення чистого оновлення декодування (CDR) і одне або більше потенційно зайвих зображень, і приймати синтаксичний елемент, що показує, чи є чи ні яке-небудь із згаданих одного або більше потенційно зайвих зображень залежним зображенням, яке є декодованим у випадку, коли приймається запит на довільний доступ до зображення CDR. Відеодекодер 30 може бути додатково сконфігурованим з можливістю приймати запит на довільний доступ до зображення CDR, відеокодувати зображення CDR у відповідь на запит на довільний доступ, і відеокодувати залежне зображення, яке відповідає прийнятому синтаксичному елементу. Відеокодер, як описано в цьому розкритті, може вказувати на відеокодер або відеодекодер. Аналогічно, відеокодер та відеодекодер можуть згадуватися як блоки кодування відео і блоки декодування відео, відповідно. Подібним чином, відеокодування може вказувати на кодування відео або декодування відео. Об'єднана спільна команда з відеокодування (JCT-VC) в цей час працює над розробкою стандарту HEVC. Зусилля стандартизації HEVC основуються на вдосконаленій моделі пристрою відеокодування, що вказується як тестова модель HEVC (HM). Поточна HM передбачає декілька додаткових можливостей пристроїв відеокодування в порівнянні з існуючими пристроями згідно з, наприклад, ITU-T H.264/AVC. Наприклад, тоді як H.264 забезпечує дев'ять режимів кодування внутрішнього прогнозування, HM може забезпечувати настільки багато як тридцять три режими кодування внутрішнього прогнозування Загалом, робоча модель HM описує те, що відеокадр або зображення може розділятися на послідовність блоків з деревоподібною структурою або найбільших блоків кодування (LCU), які включають в себе як відліки яскравості, так і кольоровості. Блок з деревоподібною структурою має аналогічне призначення, що і макроблок стандарту H.264. Зріз включає в себе деяку кількість послідовних блоків з деревоподібною структурою в порядку кодування. Відеокадр або зображення може розбиватися на один або більше зрізів. Кожний блок з деревоподібною структурою може розбиватися на блоки кодування (CU) згідно з квадрадеревом. Наприклад, блок з деревоподібною структурою, як кореневий вузол квадрадерева, може розбиватися на чотири дочірніх вузли, і кожний дочірній вузол може в свою чергу бути батьківським вузлом і розбиватися на інші чотири дочірніх вузли. Кінцевий, нерозбитий дочірній вузол, як листовий вузол квадрадерева, містить вузол кодування, тобто кодований відеоблок. Синтаксичні дані, зв'язані з кодованим бітовим потоком, можуть визначати максимальну кількість разів, скільки блок з деревоподібною структурою може розбиватися, і також можуть визначати мінімальний розмір вузлів кодування. CU включає в себе вузол кодування і блоки прогнозування (PU) і блоки перетворення (TU), зв'язані з вузлом кодування. Розмір блока CU відповідає розміру вузла кодування і є квадратним за формою. Розмір блока CU може знаходитися в діапазоні від 8 × 8 пікселів аж до розміру блока з деревоподібною структурою з максимум 64 × 64 пікселів або більше. Кожний CU може містити один або більше блоків PU і один або більше блоків TU. Синтаксичні дані, зв'язані з CU, можуть описувати, наприклад, розбиття блока CU на один або більше блоків PU. Режими розбиття можуть розрізнюватися між тим, чи є CU кодованим в режимі з пропуском або прямому, кодованим в режимі внутрішнього прогнозування, або кодованим в режимі 9 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 зовнішнього прогнозування PU можуть розбиватися, щоб бути неквадратними за формою. Синтаксичні дані, зв'язані з CU, також можуть описувати, наприклад, розбиття блока CU на один або більше блоків TU згідно з квадрадеревом. TU може бути квадратним або неквадратним за формою. Загалом, PU включає в себе дані, що відносяться до обробки прогнозування Наприклад, коли PU є кодованим у внутрішньому режимі, PU може включати в себе дані, що описують режим внутрішнього прогнозування для PU. Як інший приклад, коли PU є кодованим у зовнішньому режимі, PU може включати в себе дані, що визначають вектор руху для PU. Дані, що визначають вектор руху для PU, можуть описувати, наприклад, горизонтальний компонент вектора руху, вертикальний компонент вектора руху, розрізнення для вектора руху (наприклад, точність одна чверть пікселя або точність одна восьма пікселя), посилальне зображення, на яке посилається вектор руху, і/або список посилальних зображень (наприклад, список 0, список 1, або список С) для вектора руху. Загалом, TU використовується для обробок перетворення і квантування. CU, що має один або більше блоків PU, може також включати в себе один або більше блоків перетворення (TU). Після прогнозування, відеокодер 20 може обчислювати залишкові значення, що відповідають PU. Залишкові значення містять значення пікселної різниці між поточним блоком відеоданих і прогнозуючим блоком відеоданих. Залишкові значення можуть перетворюватися в коефіцієнти перетворення, квантуватися, і скануватися з використанням блоків TU, щоб виробляти перетворені в послідовну форму коефіцієнти перетворення для ентропійного кодування. Це розкриття звичайно використовує ознаку "відеоблок", щоб вказувати на вузол кодування блока CU. У деяких конкретних випадках, це розкриття також може використовувати ознаку "відеоблок", щоб вказувати на блок з деревоподібною структурою, тобто LCU, або CU, який включає в себе вузол кодування і блоки PU і блоки TU. Відеопослідовність звичайно включає в себе послідовність відеокадрів або зображень. Група зображень (GOP), загалом, містить послідовність з одного або більше відеозображень. GOP може включати в себе синтаксичні дані в заголовку групи GOP, заголовку одного або більше із зображень, або десь в іншому місці, які описують кількість зображень, включених в GOP. Кожний зріз зображення може включати в себе синтаксичні дані зрізу, які описують режим кодування для відповідного зрізу. Відеокодер 20 звичайно працює над відеоблоками всередині індивідуальних відеозрізів, щоб кодувати відеодані. Відеоблок може відповідати вузлу кодування всередині CU. Відеоблоки можуть мати фіксовані розміри або розміри, що змінюються, і можуть розрізнюватися в розмірі згідно з визначеним стандартом кодування. Як приклад, HM підтримує прогнозування в різних розмірах PU. Припускаючи, що розмір конкретного CU дорівнює 2Nx2N, HM підтримує внутрішнє прогнозування в розмірах PU, рівних 2Nx2N або NxN, і зовнішнє прогнозування в симетричних розмірах PU 2Nx2N, 2NxN, Nx2N, або NxN. HM також підтримує асиметричне розбиття для зовнішнього прогнозування в розмірах PU 2NxnU, 2NxnD, nLx2N та nRx2N. В асиметричному розбитті, один напрямок блока CU не розбивається, в той час як інший напрямок розбивається на 25 % та 75 %. Частина блока CU, що відповідає розбиттю 25 %, показується за допомогою "n", за яким слідує індикація "вгору", "вниз", "ліворуч", або "праворуч". Таким чином, наприклад, "2NxnU" вказує на CU 2Nx2N, який розбитий горизонтально з PU 2Nx0.5N вгорі та PU 2Nx1.5N внизу. У цьому розкритті, "NxN" та "N на N" можуть використовуватися взаємозамінно, щоб вказувати на пікселні розмірності відеоблока в термінах вертикального та горизонтального вимірювань, наприклад, 16 × 16 пікселів або 16 на 16 пікселів. Загалом, блок 16 × 16 має 16 пікселів у вертикальному напрямку (у=16) і 16 пікселів в горизонтальному напрямку (х=16). Подібним чином, блок NxN, загалом, має N пікселів у вертикальному напрямку і N пікселів в горизонтальному напрямку, де N представляє ненегативне цілочисельне значення. Пікселі в блоці можуть розташовуватися в рядках і стовпцях. Більше того, блоки не повинні необхідно мати одну і ту саму кількість пікселів як в горизонтальному напрямку, так і у вертикальному напрямку. Наприклад, блоки можуть містити NxM пікселів, де M не є необхідно рівним N. Після кодування з внутрішнім прогнозуванням або зовнішнім прогнозуванням з використанням блоків PU блока CU, відеокодер 20 може обчислювати залишкові дані. Блоки PU можуть містити пікселні дані в просторовій ділянці (що також вказується як пікселна ділянка). TU може містити коефіцієнти в ділянці перетворення після застосування перетворення, наприклад, дискретного косинусного перетворення (DCT), цілочисельного перетворення, вейвлетперетворення, або концептуально аналогічного перетворення, до залишкових відеоданих. Залишкові дані можуть відповідати пікселним різницям між пікселями некодованого зображення і прогнозуючого відеоблока. Відеокодер 20 може формувати блоки TU, що включають в себе 10 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 залишкові дані для CU, і потім перетворювати блоки TU, щоб виробляти коефіцієнти перетворення для CU. Після будь-яких перетворень для вироблення коефіцієнтів перетворення, відеокодер 20 може виконувати квантування коефіцієнтів перетворення. Квантування, загалом, вказує на обробку, в якій коефіцієнти перетворення квантуються, щоб можливо зменшувати величину даних, що використовуються, щоб представляти коефіцієнти, забезпечуючи додаткове стиснення. Обробка квантування може зменшувати бітову глибину, зв'язану з деякими або усіма коефіцієнтами. Наприклад, n-бітне значення може округлятися вниз до m-бітного значення під час квантування, де n більше, ніж m. У деяких прикладах, відеокодер 20 може використовувати заздалегідь визначений порядок сканування, щоб сканувати квантовані коефіцієнти перетворення, щоб виробляти перетворений в послідовну форму вектор, який може піддаватися ентропійному кодуванню. В інших прикладах, відеокодер 20 може виконувати адаптивне сканування. Після сканування квантованих коефіцієнтів перетворення для формування одномірного вектора, відеокодер 20 може здійснювати ентропійне кодування одномірного вектора, наприклад, згідно з контекстноадаптивним кодуванням змінної довжини (CAVLC), контекстно-адаптивним двійковим арифметичним кодуванням (CABAC), основаним на синтаксисі контекстно-адаптивним двійковим арифметичним кодуванням (SBAC), ентропійними кодами розбиття на імовірнісні інтервали (PIPE) або іншим способом ентропійного кодування. Відеокодер 20 також може здійснювати ентропійне кодування синтаксичних елементів, зв'язаних з кодованими відеоданими, для використання відеодекодером 30 при декодуванні відеоданих. Щоб виконувати CABAC, відеокодер 20 може призначати контекст всередині контекстної моделі символу, що підлягає передачі. Контекст може відноситися, наприклад, до того, чи є сусідні значення символу ненульовими чи ні. Щоб виконувати CAVLC, відеокодер 20 може вибирати код змінної довжини для символу, що підлягає передачі. Кодові слова в VLC можуть конструюватися так, що відносно більш короткі коди відповідають більш імовірним символам, в той час як більш довгі коди відповідають менш імовірним символам. Цим способом, використання VLC може досягати збереження бітів в порівнянні, наприклад, з використанням кодових слів рівної довжини для кожного символу, що підлягає передачі. Визначення імовірності може основуватися на контексті, призначеному символу. Фіг. 4 є блок-схемою, яка ілюструє ілюстративний відеокодер 20, який може здійснювати способи, описані в цьому розкритті. Відеокодер 20 може виконувати внутрішнє та зовнішнє кодування відеоблоків всередині відеозрізів. Внутрішнє кодування покладається на просторове прогнозування, щоб зменшувати або видаляти просторову надмірність у відео всередині заданого відеокадру або зображення. Зовнішнє кодування покладається на часове прогнозування, щоб зменшувати або видаляти часову надмірність у відео всередині суміжних кадрів або зображень відеопослідовності. Внутрішній режим (режим I) може вказувати на будьякий з декількох основаних на просторовому стисненні режимів. Зовнішні режими, такі як однонаправлене прогнозування (режим Р) або двонаправлене прогнозування (режим В), можуть вказувати на будь-який з декількох основаних на часовому стисненні режимів. У прикладі з Фіг. 4, відеокодер 20 включає в себе модуль 41 прогнозування, пам'ять 64 посилальних зображень, суматор 50, модуль 52 перетворення, блок 54 квантування, і блок 56 ентропійного кодування. Модуль 41 прогнозування включає в себе блок 40 вибору режиму, блок 42 оцінки руху, блок 44 компенсації руху, і модуль 46 внутрішнього прогнозування. Модуль 41 прогнозування, що включає в себе блок 40 вибору режиму, блок 42 оцінки руху, блок 44 компенсації руху, і модуль 46 внутрішнього прогнозування, що містяться там, може розглядатися як частина повної схеми відеокодера. Будь-який модуль або блок, описаний для відеокодера 20 може бути структурований як один або більше програмованих процесорів, як апаратна логіка, або будь-яка комбінація переліченого. Для відновлення відеоблока, відеокодер 20 також включає в себе блок 58 оберненого квантування, модуль 60 оберненого перетворення, і суматор 62. Фільтр розблокування (на Фіг. 4 не показаний) також може включатися в межі блока фільтра, щоб видаляти артефакти блочності з відновленого відео. Якщо потрібно, фільтр розблокування звичайно фільтрує виведення суматора 62. Як показано на Фіг. 4, відеокодер 20 приймає поточний відеоблок всередині відеозрізу, що підлягає кодуванню. Зріз може розділятися на множинні відеоблоки. Блок 40 вибору режиму може вибирати один з режимів кодування, внутрішній або зовнішній, для поточного відеоблока на основі результатів помилки, і модуль 41 прогнозування може забезпечувати результуючий внутрішньо або ззовні кодований блок в суматор 50, щоб генерувати залишкові дані блока, і в суматор 62, щоб відновлювати кодований блок для використання як посилального зображення. 11 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 Модуль 41 прогнозування (або інший структурний блок відеокодера 20) також може конфігуруватися з можливістю визначати, чи містить поточна GOP які-небудь залежні зображення. Як описано вище, залежне зображення є зображенням, яке слідує за зображенням CDR в порядку кодування, але також використовується як зображення прогнозування для іншого зображення, яке слідує за CDR в порядку як кодування, так і відображення. Модуль 41 прогнозування може відстежувати ланцюг прогнозування для GOP, який містить CDR. Якщо зображення визначається як залежне зображення, модуль 41 прогнозування може додатково визначати, чи є залежне зображення декодованим у випадку, коли здійснюється довільний доступ до CDR. Залежне зображення визначається як декодоване, якщо ланцюг прогнозування для залежного зображення не залежить від яких-небудь зображень з попередньої GOP (наприклад, ззовні прогнозоване В або Р зображення, яке ззовні прогнозується по CDR або іншим декодованим зображенням у випадку довільного доступу до CDR), або якщо залежне зображення є внутрішньо прогнозованим зображенням (наприклад, зображенням I146 з Фіг. 1). Модуль 41 прогнозування може сигналізувати синтаксичний елемент 63 залежного зображення (наприклад, прапор залежності) в кодованому бітовому відеопотоці, щоб показувати, чи є чи ні конкретне потенційно зайве зображення залежним зображенням, яке є декодованим у випадку довільного доступу до зображення CDR. Синтаксичний елемент 63 залежного зображення може піддаватися ентропійному кодуванню за допомогою блока 56 ентропійного кодування для включення в кодований бітовий відеопотік. Як описувалося вище, синтаксичний елемент залежного зображення може сигналізуватися в заголовку блока мережного рівня абстракції (NAL), повідомленні додаткової розширеної інформації (SEI) рівня зображення, заголовку зрізу, або іншому синтаксичному елементі рівня зображення або повідомленні. Синтаксичний елемент 63 залежного зображення також може зберігатися в форматі файлів, як описано вище. Потрібно розуміти, що модуль 41 прогнозування є тільки одним прикладом структурного компонента відеокодера 20, який може генерувати синтаксичний елемент 63 залежного зображення. Інші структурні або функціональні блоки відеокодера 20, або одиночно, або в комбінації, можуть конфігуруватися з можливістю генерувати синтаксичний елемент залежного зображення з використанням способів, описаних вище. Модуль 46 внутрішнього прогнозування всередині модуля 41 прогнозування може виконувати кодування з внутрішнім прогнозуванням поточного відеоблока по відношенню до одного або більше сусідніх блоків у тому самому кадрі або зрізі, що і поточний блок, що підлягає кодуванню, щоб забезпечувати просторове стиснення. Блок 42 оцінки руху і блок 44 компенсації руху всередині модуля 41 прогнозування виконують кодування із зовнішнім прогнозуванням поточного відеоблока по відношенню до одного або більше прогнозуючих блоків в одному або більше посилальних зображеннях, щоб забезпечувати часове стиснення. Блок 42 оцінки руху може бути сконфігурованим з можливістю визначати режим зовнішнього прогнозування для відеозрізу згідно із заздалегідь визначеним шаблоном для відеопослідовності. Заздалегідь визначений шаблон може призначати відеозрізи в послідовності як Р зрізи, В зрізи або GPB зрізи. Блок 42 оцінки руху і блок 44 компенсації руху можуть бути високо інтегрованими, але проілюстровані окремо для концептуальних цілей. Оцінка руху, що виконується блоком 42 оцінки руху, є обробкою генерування векторів руху, які оцінюють рух для відеоблоків. Вектор руху, наприклад, може показувати зміщення PU відеоблока всередині поточного відеокадру або зображення відносно прогнозуючого блока всередині посилального зображення. Прогнозуючий блок є блоком, який шукають, щоб він близько відповідав PU відеоблока, що підлягає кодуванню, в термінах пікселної різниці, що може визначатися за допомогою підсумовування абсолютних різниць (SAD), підсумовування квадратів різниць (SSD), або інших метрик різниці. У деяких прикладах, відеокодер 20 може обчислювати значення для субцілочисельних пікселних положень посилальних зображень, збережених в пам'яті 64 посилальних зображень. Наприклад, відеокодер 20 може обчислювати значення пікселних положень в одну чверть, пікселних положень в одну восьму, або інших дробових пікселних положень посилального зображення. Тому, блок 42 оцінки руху може виконувати пошук руху відносно повних пікселних положень і дробових пікселних положень і виводити вектор руху з дробовою пікселною точністю. Блок 42 оцінки руху обчислює вектор руху для PU відеоблока у ззовні кодованому зрізі за допомогою порівняння положення PU з положенням прогнозуючого блока посилального зображення. Посилальне зображення може вибиратися з першого списку посилальних зображень (Списку 0) або другого списку посилальних зображень (Списку 1), кожний з яких ідентифікують одне або більше посилальних зображень, збережених в пам'яті 64 посилальних 12 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 зображень. Блок 42 оцінки руху посилає обчислений вектор руху в блок 56 ентропійного кодування і блок 44 компенсації руху. Компенсація руху, що виконується блоком 44 компенсації руху, може включати в себе вибірку або генерування прогнозуючого блока на основі вектора руху, визначеного за допомогою оцінки руху. При прийомі вектора руху для PU поточного відеоблока, блок 44 компенсації руху може визначати місцеположення прогнозуючого блока, на який вказує вектор руху, в одному зі списків посилальних зображень. Відеокодер 20 формує залишковий відеоблок за допомогою віднімання пікселних значень прогнозуючого блока з пікселних значень поточного відеоблока, який кодується, формуючи значення пікселної різниці. Значення пікселної різниці формують залишкові дані для блока, і можуть включати в себе компоненти різниці як яскравості, так і кольоровості. Суматор 50 представляє компонент або компоненти, які виконують цю операцію віднімання. Блок 44 компенсації руху також може генерувати синтаксичні елементи, зв'язані з відеоблоками та відеозрізом, для використання відеодекодером 30 в декодуванні відеоблоків відеозрізу. Після того, як блок 44 компенсації руху згенерує прогнозуючий блок для поточного відеоблока, відеокодер 20 формує залишковий відеоблок за допомогою віднімання прогнозуючого блока з поточного відеоблока. Залишкові відеодані в залишковому блоці можуть включатися в один або більше блоків TU і направлятися в модуль 52 перетворення. Модуль 52 перетворення перетворює залишкові відеодані в залишкові коефіцієнти перетворення з використанням перетворення, такого як дискретне косинусне перетворення (DCT) або концептуально аналогічне перетворення. Модуль 52 перетворення може перетворювати залишкові відеодані з пікселної ділянки в ділянку перетворення, таку як частотна ділянка. Модуль 52 перетворення може посилати результуючі коефіцієнти перетворення в блок 54 квантування. Блок 54 квантування квантує коефіцієнти перетворення, щоб додатково зменшувати бітову швидкість. Обробка квантування може зменшувати бітову глибину, зв'язану з деякими або усіма коефіцієнтами. Ступінь квантування може модифікуватися за допомогою регулювання параметра квантування. У деяких прикладах, блок 54 квантування може потім виконувати сканування матриці, що включає в себе квантовані коефіцієнти перетворення. Альтернативно, блок 56 ентропійного кодування може виконувати сканування. Після квантування, блок 56 ентропійного кодування здійснює ентропійне кодування квантованих коефіцієнтів перетворення. Наприклад, блок 56 ентропійного кодування може виконувати контекстно-адаптивне кодування змінної довжини (CAVLC), контекстно-адаптивне двійкове арифметичне кодування (CABAC), або інший спосіб ентропійного кодування. Після ентропійного кодування за допомогою блока 56 ентропійного кодування, кодований бітовий потік може передатися у відеодекодер 30, або архівуватися для більш пізньої передачі або витягання за допомогою відеодекодера 30. Блок 56 ентропійного кодування також може здійснювати ентропійне кодування векторів руху та інших синтаксичних елементів для поточного відеозрізу, який кодується. Блок 58 оберненого квантування і модуль 60 оберненого перетворення застосовують обернене квантування та обернене перетворення, відповідно, щоб відновлювати залишковий блок в пікселній ділянці для більш пізнього використання як посилальний блок посилального зображення. Блок 44 компенсації руху може обчислювати посилальний блок за допомогою додавання залишкового блока до прогнозуючого блока одного з посилальних зображень всередині одного зі списків посилальних зображень. Блок 44 компенсації руху також може застосовувати один або більше фільтрів інтерполяції до відновленого залишкового блока, щоб обчислювати субцілочисельні пікселні значення для використання в оцінці руху. Суматор 62 додає відновлений залишковий блок до блока прогнозування компенсованого руху, виробленого блоком 44 компенсації руху, щоб виробляти посилальний блок для зберігання в пам'яті 64 посилальних зображень. Посилальний блок може використовуватися блоком 42 оцінки руху і блоком 44 компенсації руху як посилальний блок, щоб здійснювати зовнішнє прогнозування блока в подальшому відекадрі або зображенні. Фіг. 5 є блок-схемою, яка ілюструє ілюстративний відеодекодер 30, який може здійснювати способи, описані в цьому розкритті. У прикладі з Фіг. 5, відеодекодер 30 включає в себе блок 80 ентропійного декодування, модуль 81 прогнозування, блок 86 оберненого квантування, блок 88 оберненого перетворення, суматор 90 і пам'ять 92 посилальних зображень. Модуль 81 прогнозування включає в себе блок 82 компенсації руху і модуль 84 внутрішнього прогнозування. Модуль 81 прогнозування, може розглядатися як частина повної схеми відеодекодера. Будь-який модуль або блок, описаний для відеодекодера 30, може структуруватися як один або більше програмованих процесорів, як апаратна логіка, або будьяка комбінація переліченого. Відеодекодер 30 може, в деяких прикладах, виконувати прохід 13 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 декодування, загалом, обернений до проходу кодування, описаного по відношенню до відеокодера 20 з Фіг. 4. Протягом обробки декодування, відеодекодер 30 приймає кодований бітовий відеопотік, який представляє відеоблоки кодованого відеозрізу і зв'язані синтаксичні елементи, що включають в себе синтаксичний елемент 63 залежного зображення, згенеровані відеокодером (наприклад, відеокодером 20). Блок 80 ентропійного декодування відеодекодера 30 здійснює ентропійне декодування бітового потоку, щоб генерувати квантовані коефіцієнти, вектори руху, і інші синтаксичні елементи. Блок 80 ентропійного декодування передає вектори руху та інші синтаксичні елементи в модуль 81 прогнозування Відеодекодер 30 може приймати синтаксичні елементи на рівні відеозображення, рівні відеозрізу і/або рівні відеоблока. Як описувалося вище, синтаксичний елемент залежного зображення може сигналізуватися в заголовку блока мережного рівня абстракції (NAL), повідомленні додаткової розширеної інформації (SEI) рівня зображення, заголовку зрізу, або іншому синтаксичному елементі рівня зображення або повідомленні. Синтаксичний елемент 63 залежного зображення також може зберігатися в форматі файлів, як описано вище. Деякі групи зображень, прийняті відеодекодером 30 в кодованому бітовому відепотоці, можуть включати в себе зображення CDR. Зображення в GOP із зображенням CDR можуть також включати в себе синтаксичний елемент 63 залежного зображення, який показує, чи є якінебудь з потенційно зайвих зображень залежними зображеннями в GOP і чи є декодованими у випадку запиту на довільний доступ до CDR в цій GOP. У випадку, коли приймається запит 83 довільного доступу, наприклад, від користувача через користувацький інтерфейс обчислювального пристрою, що забезпечує програвання відео, відеодекодер 30 може починати декодування на CDR, зв'язаному з GOP, і може відеокодувати будь-які залежні зображення відповідно до прийнятого синтаксичного елемента 63 залежного зображення. Тобто, якщо синтаксичний елемент 63 залежного зображення показує, що зв'язане потенційно зайве зображення є залежним зображенням, яке є декодованим у випадку довільного доступу, це залежне зображення декодується. Якщо синтаксичний елемент 63 залежного зображення показує, що зв'язане потенційно зайве зображення не є декодованим залежним зображенням, це потенційно зайве зображення може відкидатися і не декодуватися. Знову, потенційно зайве зображення може ідентифікуватися декодером 30 як зображення в тій самій GOP, що і CDR, але яке передує CDR в порядку відображення. Коли відеозріз кодується як внутрішньо кодований (I) зріз, модуль 84 внутрішнього прогнозування модуля 81 прогнозування може генерувати дані прогнозування для відеоблока поточного відеозрізу на основі сигналізованого режиму внутрішнього прогнозування і даних з раніше декодованих блоків поточного кадру або зображення. Коли відеокадр кодований як ззовні кодований (тобто В, Р або GPB) зріз, блок 82 компенсації руху модуля 81 прогнозування виробляє прогнозуючі блоки для відеоблока поточного відеозрізу на основі векторів руху та інших синтаксичних елементів, прийнятих від блока 80 ентропійного декодування. Прогнозуючі блоки можуть вироблятися з одного з посилальних зображень всередині одного зі списків посилальних зображень. Відеодекодер 30 може конструювати списки посилальних кадрів, Список 0 і Список 1, з використанням способів побудови, що встановлюються за умовчанням, на основі посилальних зображень, збережених в пам'яті 92 посилальних зображень. Блок 82 компенсації руху визначає інформацію прогнозування для відеоблока поточного відеозрізу за допомогою синтаксичного розбору векторів руху та інших синтаксичних елементів, і використовує інформацію прогнозування, щоб виробляти прогнозуючі блоки для поточного відеоблока, який декодується. Наприклад, блок 82 компенсації руху використовує деякі з прийнятих синтаксичних елементів, щоб визначати режим прогнозування (наприклад, внутрішнє або зовнішнє прогнозування), використаний для кодування відеоблоків відеозрізу, тип зрізу зовнішнього прогнозування (наприклад, В зріз, Р зріз, або GPB зріз), інформацію побудови для одного або більше зі списків посилальних зображень для зрізу, вектори руху для кожного ззовні кодованого відеоблока зрізу, стан зовнішнього прогнозування для кожного ззовні кодованого відеоблока зрізу, і іншу інформацію, щоб відеокодувати відеоблоки в поточному відеозрізі. Блок 82 компенсації руху також може виконувати інтерполяцію на основі фільтрів інтерполяції. Блок 82 компенсації руху може використовувати фільтри інтерполяції, як вони використовувалися відеокодером 20 під час кодування відеоблоків, щоб обчислювати інтерпольовані значення для субцілочисельних пікселів посилальних блоків. Блок 82 компенсації руху може визначати фільтри інтерполяції, що використовуються відеокодером 20, з прийнятих синтаксичних елементів і використовувати фільтри інтерполяції, щоб виробляти прогнозуючі блоки. 14 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 Блок 86 оберненого квантування здійснює обернене квантування, тобто деквантування, квантованих коефіцієнтів перетворення, забезпечених в бітовому потоці і декодованих за допомогою блока 80 ентропійного декодування. Обробка оберненого квантування може включати в себе використання параметра квантування, обчисленого відеокодером 20 для кожного відеоблока у відеозрізі, щоб визначати ступінь квантування і, таким саме чином, ступінь оберненого квантування, яке повинно застосовуватися. Модуль 88 оберненого перетворення застосовує обернене перетворення, наприклад, обернене DCT, обернене цілочисельне перетворення, або концептуально аналогічну обробку оберненого перетворення, до коефіцієнтів перетворення, щоб виробляти залишкові блоки в пікселній ділянці. Після того, як блок 82 компенсації руху згенерує прогнозуючий блок для поточного відеоблока на основі векторів руху та інших синтаксичних елементів, відеодекодер 30 формує декодований відеоблок за допомогою підсумовування залишкових блоків з модуля 88 оберненого перетворення з відповідними прогнозуючими блоками, згенерованими за допомогою блока 82 компенсації руху. Суматор 90 представляє компонент або компоненти, які виконують цю операцію підсумовування. Якщо потрібно, також може застосовуватися фільтр розблокування, щоб фільтрувати декодовані блоки, щоб видаляти артефакти блочності. Декодовані відеоблоки в заданому кадрі або зображенні потім зберігаються в пам'яті 92 посилальних зображень, яка зберігає посилальні зображення, що використовуються для подальшої компенсації руху. Пам'ять 92 посилальних зображень також зберігає декодоване відео для більш пізнього представлення на пристрої відображення, такому як пристрій 32 відображення з Фіг. 3. Фіг. 6 є ілюстративною блок-схемою послідовності операцій способу кодування відео згідно зі способами цього розкриття, описаними вище. Способи з Фіг. 6 можуть здійснюватися за допомогою відеокодера, такого як відеокодер 20 з Фіг. 4. Відеокодер 20 може бути сконфігурованим з можливістю кодувати групу зображень (GOP), яка включає в себе зображення чистого оновлення декодування (CDR) і одне або більше потенційно зайвих зображень (110). Згадані одне або декілька потенційно зайвих зображень слідують за зображенням CDR в порядку декодування і передують зображенню CDR в порядку відображення. Відеокодер 20 також може визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень залежним зображенням (112). Залежне зображення використовується для зовнішнього прогнозування зображення, яке слідує за зображенням CDR в обох порядку декодування і порядку відображення. Якщо яке-небудь з потенційно зайвих зображень є залежним зображенням, відеокодер 20 може додатково визначати, чи є залежне зображення декодованим у випадку, коли зображення CDR використовується для довільного доступу (114), як описано вище з посиланням на Фіг. 4. Відеокодер 20 може додатково сигналізувати синтаксичний елемент в бітовому потоці кодованих відеоданих, який показує, що потенційно зайве зображення є залежним зображенням, яке визначається як декодоване у випадку, коли зображення CDR використовується для довільного доступу (116). В одному прикладі, синтаксичний елемент може сигналізуватися в одному або більше із заголовка блока мережного рівня абстракції і повідомлення додаткової розширеної інформації (SEI) рівня зображення. В іншому прикладі, синтаксичний елемент сигналізується в форматі файлів, як описано вище. Фіг. 7 є ілюстративною блок-схемою послідовності операцій способу декодування відео згідно зі способами розкриття, описаними вище. Способи з Фіг. 7 можуть здійснюватися за допомогою відеодекодера, такого як відеодекодер 30 з Фіг. 5. Відеодекодер 30 може бути сконфігурованим з можливістю приймати групу зображень, що включають в себе зображення чистого оновлення декодування (CDR) і одне або більше потенційно зайвих зображень (120). Відеодекодер 30 може бути додатково сконфігурованим з можливістю приймати синтаксичний елемент, який показує, що потенційно зайве зображення є залежним зображенням і є декодованим у випадку, коли приймається запит на довільний доступ до зображення CDR (122). Залежне зображення використовується для зовнішнього прогнозування зображення, який слідує за зображенням CDR в обох порядку декодування і порядку відображення. Відеодекодер 30 може бути додатково сконфігурованим з можливістю приймати запит на довільний доступ до зображення (124) CDR. У випадку, коли приймається запит довільного доступу, відеодекодер 30 може бути додатково сконфігурованим з можливістю відеокодувати зображення CDR у відповідь на запит на довільний доступ (126), і відеокодувати залежне зображення, що відповідає прийнятому синтаксичному елементу (128). Додатково, відеодекодер 30 також може бути сконфігурованим з можливістю пропускати декодування для будь-якого із згаданих одного або більше потенційно зайвих зображень, показаних як такі, що не є залежними зображеннями за допомогою синтаксичного елемента (130). В одному прикладі, 15 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 синтаксичний елемент приймається в одному або більше із заголовка блока мережного рівня абстракції та повідомлення додаткової розширеної інформації (SEI) рівня зображення. В іншому прикладі, синтаксичний елемент зберігається у форматі файлів, як описано вище. В одному або більше прикладах, описані функції можуть здійснюватися в апаратному забезпеченні, програмному забезпеченні, вбудованому програмному забезпеченні, або будьякій комбінації переліченого. Якщо здійснюються в програмному забезпеченні, функції можуть зберігатися в або передаватися по, як одна або більше інструкцій або код, машинозчитуваному носії, і виконуватися за допомогою основаного на апаратному забезпеченні блока обробки. Машинозчитувані носії можуть включати в себе машинозчитувані запам'ятовуючі носії, які відповідають матеріальному носію, такому як носії зберігання даних, або носії зв'язку, що включає в себе будь-який носій, який забезпечує передачу комп'ютерної програми з одного місця в інше, наприклад, згідно з протоколом зв'язку. Таким чином, машинозчитувані носії, загалом, можуть відповідати (1) матеріальним машинозчитуваним запам'ятовуючим носіям, які є нетранзиторними, або (2) носію зв'язку, такому як сигнал або несуче коливання. Носії зберігання даних можуть бути будь-якими доступними носіями, до яких може здійснюватися доступ одним або більше комп'ютерів або одним або більше процесорів, щоб витягувати інструкції, код і/або структури даних для реалізації способів, описаних в цьому розкритті. Комп'ютерний програмний продукт може включати в себе машинозчитуваний носій. Як приклад, і не обмеження, такі машинозчитувані запам'ятовуючі носії можуть містити RAM, ROM, EEPROM, CD-ROM або інше оптичне дискове сховище, магнітне дискове сховище, або інші магнітні зберігаючі пристрої, флеш-пам'ять, або будь-який інший носій, який може використовуватися, щоб зберігати необхідний програмний код у формі інструкцій або структур даних, і до якого може здійснюватися доступ за допомогою комп'ютера. Також, будь-яке з'єднання власне називається машинозчитуваним носієм. Наприклад, якщо інструкції передаються від Веб-сайта, сервера або іншого віддаленого джерела з використанням коаксіального кабелю, волоконно-оптичного кабелю, витої пари, цифрової абонентської лінії (DSL), або бездротових технологій, таких як інфрачервона, радіозв'язок, і мікрохвильова, то коаксіальний кабель, волоконно-оптичний кабель, вита пара, DSL або бездротові технології, такі як інфрачервона, радіозв'язок, і мікрохвильова включаються у визначення носія. Потрібно розуміти, однак, що машинозчитувані запам'ятовуючі носії і носії зберігання даних не включають в себе з'єднання, несучі коливання, сигнали або інші транзієнтні носії, але замість цього націлені на нетранзієнтні, матеріальні запам'ятовуючі носії. Диск (disk, disc), як тут використовується, включає в себе компакт-диск (CD), лазерний диск, оптичний диск, універсальний цифровий диск (DVD), гнучкий диск і диск Blu-ray, де диски (disk) звичайно відтворюють дані магнітним чином, а також диски (disc) відтворюють дані оптично за допомогою лазерів. Комбінації вищеописаного повинні також включатися в обсяг машинозчитуваних носіїв. Інструкції можуть виконуватися за допомогою одного або більше процесорів, таких як один або більше цифрових сигнальних процесорів (DSP), мікропроцесорів загального призначення, спеціалізованих інтегральних схем (ASIC), програмованих вентильних матриць (FPGA), або інших еквівалентних інтегрованих або дискретних логічних схем. Відповідно, ознака "процесор", як тут використовується, може вказувати на будь-яку з попередньої структури або будь-яку іншу структуру, підходящу для реалізації способів, тут описаних. Додатково, в деяких аспектах, функціональність, тут описана, може забезпечуватися всередині призначених апаратних і/або програмних модулів, сконфігурованих з можливістю для кодування і декодування, або бути вбудованою в комбінований кодек. Також, способи можуть повністю здійснюватися в одній або більше схемах або логічних елементах. Способи цього розкриття можуть здійснюватися в широкому різноманітті пристроїв або апаратури, що включають в себе бездротову телефонну трубку, інтегральну схему (IC) або набір IC (наприклад, набір мікросхем). Різні компоненти, модулі, або блоки описуються в цьому розкритті, щоб підкреслити функціональні аспекти пристроїв, сконфігурованих з можливістю виконувати розкриті способи, але не обов'язково вимагають реалізації за допомогою різних апаратних блоків. Швидше, як описано вище, різні блоки можуть бути скомбінованими в апаратному блоці кодека або забезпечуватися за допомогою сукупності впливаючих апаратних блоків, що включають в себе один або більше процесорів, як описано вище, в поєднанні з підходящими програмним забезпеченням і/або вбудованим програмним забезпеченням. Були описані різні приклади. Ці та інші приклади знаходяться в межах обсягу подальшої формули винаходу. Посилальні позиції 10 система кодування та декодування відео 12 пристрій джерела 16 UA 108155 C2 5 10 15 20 25 30 35 40 14 пристрій призначення 16 лінія зв'язку 18 джерело відео 20 відеокодер 22 вихідний інтерфейс 24 передавач 26 приймач 28 модем 30 відеодекодер 32 пристрій відображення 34 запам'ятовуючий носій 36 файловий сервер 40 блок вибору 41 модуль прогнозування 42 блок оцінки руху 44 блок компенсації руху 46 модуль внутрішнього прогнозування 50 суматор 52 модуль перетворення 54 блок квантування 56 блок ентропійного кодування 58 блок оберненого квантування 60 модуль оберненого перетворення 62 суматор 63 синтаксичний елемент залежного зображення 64 пам'ять посилальних зображень 80 блок ентропійного декодування 81 модуль прогнозування 82 блок компенсації руху 84 модуль внутрішнього прогнозування 86 блок оберненого квантування 88 блок оберненого перетворення 90 суматор 92 пам'ять посилальних зображень 312 групування відліків точки довільного доступу 314 значення dependent_indication_flag 316 dependent_flag 350 контейнер мультимедійних даних 352, 362 шматки відеоданих 353a-c, 363a-c відліки відео ФОРМУЛА ВИНАХОДУ 45 50 55 1. Спосіб кодування відеоданих, причому спосіб містить: кодування з використанням відеокодера групи зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому загадані одне або більше потенційно зайвих зображень слідують за зображеннями довільного доступу в порядку відображення; визначення з використанням відеодекодера, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і сигналізування з використанням відеодекодера синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), який вказує, визначається чи ні одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу. 2. Спосіб за п. 1, який додатково включає визначення з використанням відеокодера, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього прогнозування щонайменше одного 17 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 3. Спосіб за п. 1, який додатково містить сигналізування з використанням відеокодера синтаксичного елемента в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень. 4. Спосіб за п. 1, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 5. Спосіб декодування відеоданих, причому спосіб включає: прийом з використанням відеокодера групи зображень, що включають в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і прийом з використанням відеодекодера синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), який вказує, є чи ні одне із згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу. 6. Спосіб за п. 5, який додатково включає: прийом з використанням відеокодера запиту на довільний доступ до зображення довільного доступу; декодування з використанням відеокодера зображення довільного доступу у відповідь на запит на довільний доступ; і декодування з використанням відеокодера згаданих одного або більше потенційних зайвих зображень згідно з прийнятим синтаксичним елементом. 7. Спосіб за п. 6, який додатково містить: пропуск з використанням відеокодера декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента. 8. Спосіб за п. 5, який додатково містить визначення з використанням відеодекодера, чи є якенебудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і використання залежного зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 9. Спосіб за п. 5, в якому синтаксичний елемент зберігається в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень. 10. Спосіб за п. 5, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 11. Пристрій, сконфігурований з можливістю кодувати відеодані, причому пристрій містить: відеокодер, сконфігурований з можливістю: кодувати групу зображень, причому група зображень включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і сигналізувати синтаксичний елемент в заголовку блока мережного рівня абстракції (NAL), який вказує, чи визначається одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу. 12. Пристрій за п. 11, в якому відеокодер додатково сконфігурований з можливістю визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього прогнозування щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 13. Пристрій за п. 11, в якому відеокодер додатково сконфігурований з можливістю сигналізувати синтаксичний елемент в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень. 14. Пристрій за п. 11, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 15. Пристрій, сконфігурований з можливістю декодувати відеодані, причому пристрій містить: відеодекодер, сконфігурований з можливістю: 18 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 приймати групу зображень, причому група зображень включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і приймати синтаксичний елемент в заголовку блока мережного рівня абстракції (NAL), який вказує, є чи ні одне із згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу. 16. Пристрій за п. 15, в якому відеодекодер додатково сконфігурований з можливістю: приймати запит на довільний доступ до зображення довільного доступу; декодувати зображення довільного доступу у відповідь на запит на довільний доступ; і декодувати одне потенційно зайве зображення згідно з прийнятим синтаксичним елементом. 17. Пристрій за п. 16, в якому відеодекодер додатково сконфігурований з можливістю: пропускати декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента. 18. Пристрій за п. 15, в якому відеодекодер додатково сконфігурований з можливістю визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і використовувати залежне зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 19. Пристрій за п. 15, в якому синтаксичний елемент зберігається в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень. 20. Пристрій за п. 15, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 21. Пристрій, сконфігурований з можливістю кодувати відеодані, причому пристрій містить: засіб для кодування групи зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; засіб для визначення, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і засіб для сигналізування синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), яке вказує, визначається чи ні одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу. 22. Пристрій за п. 21, який додатково містить: засіб для визначення, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 23. Пристрій за п. 21, який додатково містить: засіб для сигналізування синтаксичного елемента в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень. 24. Пристрій за п. 21, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 25. Пристрій, сконфігурований з можливістю декодувати відеодані, причому пристрій містить: засіб для прийому групи зображень, які включають в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і засіб для прийому синтаксичного елемента в заголовку блока мережного рівня абстракції (NAL), який вказує, є чи ні одне зі згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу. 26. Пристрій за п. 25, який додатково містить: засіб для прийому запиту на довільний доступ до зображення довільного доступу; засіб для декодування зображення довільного доступу у відповідь на запит на довільний доступ; і засіб для декодування одного потенційно зайвого зображення згідно з прийнятим синтаксичним елементом. 27. Пристрій за п. 26, який додатково містить: 19 UA 108155 C2 5 10 15 20 25 30 35 40 45 50 55 60 засіб для пропуску декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента. 28. Пристрій за п. 25, який додатково містить: засіб для визначення, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і засіб для використання залежного зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 29. Пристрій за п. 25, в якому синтаксичний елемент зберігається в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень. 30. Пристрій за п. 25, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 31. Постійний машиночитаний носій, який зберігає інструкції для спонукання одного або більше процесорів пристрою, сконфігурованого з можливістю кодувати відеодані: кодувати групу зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень декодованим у випадку, коли зображення довільного доступу використовується для довільного доступу; і сигналізувати синтаксичний елемент в заголовку блока мережного рівня абстракції (NAL), який вказує, чи визначається одне зі згаданих потенційно зайвих зображень як декодоване у випадку, коли зображення довільного доступу використовується для довільного доступу. 32. Постійний машиночитаний носій за п. 31, в якому інструкції додатково спонукають один або більше процесорів визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, причому залежне зображення використовується для зовнішнього передбачення, щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 33. Постійний машиночитаний носій за п. 31, який додатково містить інструкції для спонукання одного або більше процесорів сигналізувати синтаксичний елемент в контейнері форматів файлів для згаданих одного або більше потенційно зайвих зображень. 34. Постійний машиночитаний носій за п. 31, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 35. Постійний машиночитаний носій, який зберігає інструкції для спонукання одного або більше процесорів пристрою, сконфігурованого з можливістю декодувати відеодані: приймати групу зображень, яка включає в себе зображення довільного доступу і одне або більше потенційно зайвих зображень, причому згадані одне або більше потенційно зайвих зображень слідують за зображенням довільного доступу в порядку відображення; і приймати синтаксичний елемент в заголовку блока мережевого рівня абстракції (NAL), який вказує, є чи ні одне зі згаданих потенційно зайвих зображень декодованим у випадку, коли приймається запит на довільний доступ до зображення довільного доступу. 36. Постійний машиночитаний носій за п. 35, в якому інструкції додатково спонукають один або більше процесорів: приймати запит на довільний доступ до зображення довільного доступу; декодувати зображення довільного доступу у відповідь на запит на довільний доступ; і декодувати одне потенційно зайве зображення згідно з прийнятим синтаксичним елементом. 37. Постійний машиночитаний носій за п. 36, в якому інструкції додатково спонукають один або більше процесорів: пропускати декодування для одного потенційно зайвого зображення, яке не вказане як декодоване за допомогою прийнятого синтаксичного елемента. 38. Постійний машиночитаний носій за п. 35, який додатково містить інструкції для спонукання одного або більше процесорів визначати, чи є яке-небудь із згаданих одного або більше потенційно зайвих зображень, визначене як декодоване, залежним зображенням, і використовувати залежне зображення для зовнішнього передбачення щонайменше одного зображення, яке слідує за зображенням довільного доступу в порядку декодування і порядку відображення. 39. Постійний машиночитаний носій за п. 35, в якому синтаксичний елемент зберігається в форматі файлів. 40. Постійний машиночитаний носій за п. 35, в якому зображення довільного доступу є зображенням чистого поновлення декодування (CDR). 20 UA 108155 C2 21 UA 108155 C2 22 UA 108155 C2 23 UA 108155 C2 24 UA 108155 C2 25 UA 108155 C2 Комп’ютерна верстка І. Скворцова Державна служба інтелектуальної власності України, вул. Урицького, 45, м. Київ, МСП, 03680, Україна ДП “Український інститут промислової власності”, вул. Глазунова, 1, м. Київ – 42, 01601 26

Дивитися

Додаткова інформація

Автори англійською

Chen, Ying, Coban, Muhammed Zeyd, Chen, Peisong, Karczewicz, Marta

Автори російською

Чень Ин, Кобан Мухаммед Зейд, Чень Пейсун, Карчевич Марта

МПК / Мітки

МПК: H04N 7/24

Мітки: способи, зображень, відеокодування, кодування, доступу, залежних, довільного

Код посилання

<a href="https://ua.patents.su/28-108155-sposobi-videokoduvannya-dlya-koduvannya-zalezhnikh-zobrazhen-pislya-dovilnogo-dostupu.html" target="_blank" rel="follow" title="База патентів України">Способи відеокодування для кодування залежних зображень після довільного доступу</a>

Подібні патенти