Довільний доступ з вдосконаленим керуванням буфером декодованих зображень кадрів (dpb) при кодуванні відео

Формула / Реферат | Подібні патенти | МПК / Мітки | Додаткова інформація | Код посилання

Номер патенту: 109981

Опубліковано: 26.10.2015

Автори: Чен Ін, Ван Є-Куй, Чень Цзяньле

Завантажити PDF файл.

Формула / Реферат

1. Спосіб декодування відеоданих, причому спосіб включає:

прийом потоку бітів, що містить одне або більше зображень кодованої відеопослідовності (GVS);

декодування першого зображення зі згаданого одного або більше зображень згідно з порядком декодування, асоційованим з CVS, при цьому згадане перше зображення є зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR);

декодування щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, що йдуть після згаданого першого зображення згідно з порядком декодування, на основі декодованого першого зображення;

ідентифікацію щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує першому зображенню згідно з порядком відображення, асоційованим з CVS; і

декодування згаданого щонайменше одного зі згаданого одного або більше зображень, при цьому декодування кожного зі згаданого щонайменше одного зі згаданого одного або більше зображень включає в себе:

ідентифікацію одного або більше опорних зображень, що використовуються для кодування відповідного зображення;

визначення, чи є яке-небудь з ідентифікованих одного або більше опорних зображень недоступним для декодування;

для кожного з ідентифікованих одного або більше опорних зображень, яке визначене як недоступне для декодування, генерування віртуального опорного зображення; і

декодування відповідного зображення на основі відповідних одного або більше згенерованих віртуальних опорних зображень.

2. Спосіб за п. 1, в якому генерування віртуального опорного зображення містить генерування зображення, яке включає в себе одне або більше піксельних значень, кожне з яких відповідає середині діапазону піксельних значень, асоційованих з СVS.

3. Спосіб за п. 1, який додатково включає:

ідентифікацію щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню,

асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

уникання виведення одного або більше зі згаданого щонайменше одного зі згаданого одного або більше зображень, для якого прапор виведення вказує, що відповідне зображення повинне бути виведене.

4. Спосіб за п. 1, який додатково включає:

ідентифікацію щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

уникання використання одного або більше зі згаданого щонайменше одного зі згаданого одного або більше зображень як опорного зображення для декодування щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке йде після згаданого першого зображення згідно з порядком декодування і згідно з порядком відображення, асоційованим з CVS.

5. Спосіб за п. 1, в якому згадане перше зображення містить зображення на основі чистого довільного доступу (CRA), при цьому зображення на основі CRA містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого одне або більше зображень, включених в CVS разом з зображенням на основі CRA, які йдуть після зображення на основі CRA згідно з порядком декодування, асоційованим з CVS, можуть бути декодовані з посиланням на одне або більше зображень, які передують зображенню CRA згідно з порядком декодування.

6. Спосіб за п. 1, в якому зображення на основі IDR містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого всі інші зображення, включені в CVS разом з зображенням на основі IDR, які йдуть після зображення на основі IDR згідно з порядком декодування, асоційованим з CVS, декодуються без посилання на які-небудь зображення, які передують зображенню на основі IDR згідно з порядком декодування.

7. Спосіб за п. 1, який додатково включає:

декодування першого набору параметрів початкової затримки буфера кодованих зображень (СРВ), і коли згадане одне або більше зображень не включають в себе щонайменше одне початкове зображення, асоційоване зі згаданим першим зображенням, декодування одного другого набору параметрів початкової затримки СРВ, при цьому згаданий другий набір відрізняється від згаданого першого набору, і набору параметрів зміщення затримки СРВ,

при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з СVS.

8. Спосіб за п. 7, в якому один або більше зі згаданого першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ включаються в одне з повідомлення з додатковою поліпшуючою інформацією (SEI), повідомлення з SEI періоду буферизації зображень і заголовка слайса, асоційованого зі згаданим першим зображенням.

9. Спосіб за п. 7, в якому час видалення з СРВ кожного зображення, що йде після згаданого першого зображення в порядку декодування, зсувається до моменту раніше у часі, як вказано за допомогою одного або більше зі згаданого першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ.

10. Спосіб кодування відеоданих, причому спосіб включає:

генерування потоку бітів, що містить одне або більше зображень кодованої відеопослідовності (CVS), при цьому перше зображення зі згаданого одного або більше зображень згідно з порядком декодування, асоційованим з CVS, є зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR),

при цьому генерування потоку бітів містить уникання включення до складу щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS,

при цьому згадане перше зображення є декодованим, і при цьому щонайменше одне зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, що йдуть після згаданого першого зображення згідно з порядком декодування, є декодованим на основі згаданого першого зображення; і

при цьому кодування додатково включає в себе процес декодування, який включає:

ідентифікацію щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

декодування щонайменше одного зі згаданого одного або більше зображень, при цьому декодування кожного зі згаданого щонайменше одного зі згаданого одного або більше зображень включає в себе:

11. Пристрій, сконфігурований з можливістю декодувати відеодані, причому пристрій містить відеодекодер, сконфігурований з можливістю:

приймати потік бітів, що містить одне або більше зображень кодованої відеопослідовності (CVS);

декодувати перше зображення зі згаданого одного або більше зображень згідно з порядком декодування, асоційованим з CVS, при цьому згадане перше зображення є зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR);

декодувати щонайменше одне зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, що йдуть після згаданого першого зображення згідно з порядком декодування, на основі декодованого першого зображення;

ідентифікувати щонайменше одне зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

декодувати згадане щонайменше одне зі згаданого одного або більше зображень, при цьому для декодування кожного зі згаданого щонайменше одного зі згаданого одного або більше зображень, відеодекодер сконфігурований з можливістю:

ідентифікувати одне або більше опорних зображень, що використовуються для кодування відповідного зображення;

визначати, чи є яке-небудь з ідентифікованих одного або більше опорних зображень недоступним для декодування;

для кожного з ідентифікованих одного або більше опорних зображень, яке визначене як недоступне для декодування, генерувати віртуальне опорне зображення; і

декодувати відповідне зображення на основі відповідних одного або більше згенерованих віртуальних опорних зображень.

12. Пристрій за п. 11, в якому для генерування віртуального опорного зображення відеодекодер сконфігурований з можливістю генерувати зображення, яке включає в себе одне або більше піксельних значень, кожне з яких відповідає середині діапазону піксельних значень, асоційованих з CVS.

13. Пристрій за п. 11, в якому відеодекодер додатково сконфігурований з можливістю:

уникати виведення одного або більше зі згаданого щонайменше одного зі згаданого одного або більше зображень, для якого прапор виведення вказує, що відповідне зображення повинне бути виведене.

14. Пристрій за п. 11, в якому відеодекодер додатково сконфігурований з можливістю:

уникати використання одного або більше зі згаданого щонайменше одного зі згаданого одного або більше зображень як опорного зображення для декодування щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке йде після згаданого першого зображення згідно з порядком декодування і згідно з порядком відображення, асоційованим з СVS.

15. Пристрій за п. 11, в якому згадане перше зображення містить зображення на основі чистого довільного доступу (CRA), при цьому зображення на основі CRA містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого одне або більше зображень, включених в CVS разом з зображенням на основі CRA, які йдуть після зображення на основі CRA згідно з порядком декодування, асоційованим з CVS, можуть бути декодовані з посилання на одне або більше зображень, які передують зображенню на основі CRA згідно з порядком декодування.

16. Пристрій за п. 11, в якому зображення на основі IDR містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого всі інші зображення, включені в CVS разом з зображенням на основі IDR, які йдуть після зображення на основі IDR згідно з порядком декодування, асоційованим з CVS, декодуються без посилання на які-небудь зображення, які передують зображенню на основі IDR згідно з порядком декодування.

17. Пристрій за п. 11, в якому відеодекодер додатково сконфігурований з можливістю:

декодувати перший набір параметрів початкової затримки буфера кодованих зображень (СРВ), і коли згадане одне або більше зображень не включають в себе щонайменше одне початкове зображення, асоційоване зі згаданим першим зображенням, декодувати один з другого набору параметрів початкової затримки СРВ, при цьому згаданий другий набір відрізняється від згаданого першого набору, і набору параметрів зміщення затримки СРВ,

18. Пристрій за п. 17, в якому один або більше зі згаданого першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ включаються в одне з повідомлення з додатковою поліпшуючою інформацією (SEI), повідомлення з SEI періоду буферизації зображень і заголовка слайса, асоційованого зі згаданим першим зображенням.

19. Пристрій за п. 17, в якому час видалення з СРВ кожного зображення, що йде після згаданого першого зображення в порядку декодування, зсувається до моменту раніше у часі, як вказано за допомогою одного або більше зі згаданих першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ.

20. Пристрій за п. 11, при цьому пристрій містить щонайменшеодне з: інтегральної схеми;

мікропроцесора; і

пристрою бездротового зв'язку, який включає в себе відеодекодер.

21. Пристрій, сконфігурований з можливістю кодувати відеодані, причому пристрій містить відеокодер, сконфігурований з можливістю:

генерувати потік бітів, що містить одне або більше зображень кодованої відеопослідовності (CVS), при цьому перше зображення зі згаданого одного або більше зображень згідно з порядком декодування, асоційованим з CVS, є зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR),

при цьому для генерування потоку бітів, відеокодер сконфігурований з можливістю уникати включення до складу щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS,

при цьому перше зображення є декодованим, і при цьому щонайменше одне зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, що йдуть після згаданого першого зображення згідно з порядком декодування, є декодованим на основі згаданого першого зображення; і

при цьому кодування додатково включає в себе процес декодування,

який включає:

ідентифікацію щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

декодування відповідного зображення на основі відповідного одного або більше згенерованих віртуальних опорних зображень.

22. Пристрій за п. 21, при цьому пристрій містить щонайменше одне з: інтегральної схеми;

мікропроцесора; і

пристрою бездротового зв'язку, який включає в себе відеокодер.

23. Пристрій для декодування відеоданих, при цьому пристрій містить:

засіб для прийому потоку бітів, що містить одне або більше зображень кодованої відеопослідовності (CVS);

засіб для декодування першого зображення зі згаданого одного або більше зображень згідно з порядком декодування, асоційованим з CVS, при цьому згадане перше зображення є зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR); і

засіб для декодування щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, що йдуть після згаданого першого зображення згідно з порядком декодування, на основі декодованого першого зображення;

засіб для ідентифікації щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

засіб для декодування згаданого щонайменше одного зі згаданого одного або більше зображень, при цьому засіб для декодування кожного зі згаданого щонайменше одного зі згаданих одного або більше зображень включає в себе:

засіб для ідентифікації одного або більше опорних зображень, що використовується для кодування відповідного зображення;

засіб для визначення того, чи є яке-небудь з ідентифікованих одного або більше опорних зображень недоступним для декодування;

засіб для генерування, для кожного з ідентифікованих одного або більше опорних зображень, яке визначене як недоступне для декодування, віртуального опорного зображення; і

засіб для декодування відповідного зображення на основі відповідних одного або більше згенерованих віртуальних опорних зображень.

24. Пристрій за п. 23, в якому засіб для генерування віртуального опорного зображення містить засіб для генерування зображення, яке включає в себе одне або більше піксельних значень, кожне з яких відповідає середині діапазону піксельних значень, асоційованих з СVS.

25. Пристрій за п. 23, який додатково містить:

засіб для уникнення виведення одного або більше зі згаданого щонайменше одного зі згаданого одного або більше зображень, для якого прапор виведення вказує, що відповідне зображення повинне бути виведене.

26. Пристрій за п. 23, який додатково містить:

засіб для уникнення використання одного або більше зі згаданого щонайменше одного зі згаданого одного або більше зображень як опорного зображення для декодування щонайменше одного зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке йде після першого зображення згідно з порядком декодування і згідно з порядком відображення, асоційованим з CVS.

27. Пристрій за п. 23, в якому згадане перше зображення містить зображення на основі чистого довільного доступу (CRA), при цьому зображення на основі CRA містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого одне або більше зображень, включених в CVS разом з зображенням на основі CRA, які йдуть після зображення на основі CRA згідно з порядком декодування, асоційованим з CVS, можуть бути декодовані з посиланням на одне або більше зображень, які передують зображенню на основі CRA згідно з порядком декодування.

28. Пристрій за п. 23, в якому зображення на основі IDR містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого всі інші зображення, включені в CVS разом із зображенням на основі IDR, які йдуть після зображення на основі IDR згідно з порядком декодування, асоційованим з CVS, декодуються без посилання на які-небудь зображення, які передують зображенню на основі IDR згідно з порядком декодування.

29. Пристрій за п. 23, який додатково містить:

засіб для декодування першого набору параметрів початкової затримки буфера кодованих зображень (СРВ), і коли згадане одне або більше зображень не включають в себе щонайменше одне початкове зображення, асоційоване зі згаданим першим зображенням, декодування одного з другого набору параметрів початкової затримки СРВ, при цьому згаданий другий набір відрізняється від згаданого першого набору, і набору параметрів зміщення затримки СРВ,

30. Пристрій за п. 29, в якому один або більше зі згаданих першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ включаються в одне з повідомлення з додатковою поліпшуючою інформацією (SEI), повідомлення з SEI періоду буферизації зображень і заголовка слайса, асоційованого зі згаданим першим зображенням.

31. Пристрій за п. 29, в якому час видалення з СРВ кожного зображення, що йде після згаданого першого зображення в порядку декодування, зсувається до моменту раніше у часі, як вказано за допомогою одного або більше зі згаданих першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ.

32. Зчитуваний комп'ютером носій даних, що зберігає інструкції, які при виконанні спонукують один або більше процесорів декодувати відеодані, при цьому інструкції спонукують згаданий один або більше процесорів:

приймати потік бітів, що містить одне або більше зображень кодованої відеопослідовності (CVS);

ідентифікувати щонайменше одне зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після першого згаданого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

декодувати згадане щонайменше одне зі згаданого одного або більше зображень, при цьому інструкції, які спонукають згаданий один або більше процесорів декодувати кожне зі згаданого щонайменше одного зі згаданого одного або більше зображень, включають в себе інструкції, які спонукають один або більше процесорів:

33. Зчитуваний комп'ютером носій даних за п. 32, в якому інструкції, які спонукають згаданий один або більше процесорів генерувати віртуальне опорне зображення, містять інструкції, які спонукають згаданий один або більше процесорів генерувати зображення, яке включає в себе одне або більше піксельних значень, кожне з яких відповідає середині діапазону піксельних значень, асоційованих з СVS.

34. Зчитуваний комп'ютером носій даних за п. 32, який додатково містить інструкції, які спонукають згаданий один або більше процесорів:

визначати щонайменше одне зі згаданого одного або більше зображень, відмінних від згаданого першого зображення, яке відповідає початковому зображенню, асоційованому зі згаданим першим зображенням, при цьому початкове зображення містить зображення, яке йде після згаданого першого зображення згідно з порядком декодування і передує згаданому першому зображенню згідно з порядком відображення, асоційованим з CVS; і

35. Зчитуваний комп'ютером носій даних за п. 32, який додатково містить інструкції, які спонукають один або більше процесорів:

36. Зчитуваний комп'ютером носій даних за п. 32, при цьому згадане перше зображення містить зображення на основі чистого довільного доступу (CRA), при цьому зображення на основі CRA містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого одне або більше зображень, включених в CVS разом з зображенням на основі CRA, які йдуть після зображення на основі CRA згідно з порядком декодування, асоційованим з CVS, можуть бути декодовані з посиланням на одне або більше зображень, які передують зображенню на основі CRA згідно з порядком декодування.

37. Зчитуваний комп'ютером носій даних за п. 32, при цьому зображення на основі IDR містить зображення, яке кодується з використанням кодування з інтра-передбаченням і є декодованим без посилання на які-небудь інші зображення, і для якого всі інші зображення, включені в CVS разом із зображенням на основі IDR, які йдуть після зображення на основі IDR згідно з порядком декодування, асоційованим з CVS, декодуються без посилання на які-небудь зображення, які передують зображенню на основі IDR згідно з порядком декодування.

38. Зчитуваний комп'ютером носій даних за п. 32, який додатково містить інструкції, які спонукають один або більше процесорів:

39. Зчитуваний комп'ютером носій даних за п. 38, при цьому один або більше зі згаданих першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ включаються в одне з повідомлення з додатковою поліпшуючою інформацією (SEI), повідомлення з SEI періоду буферизації зображень і заголовка слайса, асоційованого зі згаданим першим зображенням.

40. Зчитуваний комп'ютером носій даних за п. 38, при цьому час видалення з СРВ кожного зображення, що йде після згаданого першого зображення в порядку декодування, зсувається до моменту раніше у часі, як вказано за допомогою одного або більше зі згаданих першого і другого наборів параметрів початкової затримки СРВ і згаданого набору параметрів зміщення затримки СРВ.

Текст

Реферат: Технології для декодування відеоданих включають в себе прийом потоку бітів, який включає в себе одне або більше зображень кодованої відеопослідовності (CVS), декодування першого зображення згідно з порядком декодування, при цьому перше зображення є зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR), і декодування щонайменше одного іншого зображення, що йде після першого зображення згідно з порядком декодування, на основі декодованого першого зображення. Як інший приклад, технології для кодування відеоданих включають в себе формування потоку бітів, який включає в себе одне або більше зображень CVS, при цьому перше зображення згідно з порядком декодування є RAP-зображенням, яке не є IDRзображенням, і недопущення включення щонайменше одного іншого зображення, відмінного від першого зображення, яке відповідає початковому зображенню, асоційованому з першим зображенням, в потік бітів. UA 109981 C2 (12) UA 109981 C2 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 Дана заявка заявляє пріоритет попередньої заявки на патент (США) номер 61/553802, поданої 31 жовтня 2011 року, і попередньої заявки на патент (США) номер 61/595605, поданої 6 лютого 2012 року, вміст кожної з яких повністю міститься в даному документі по посиланню. ГАЛУЗЬ ТЕХНІКИ, ДО ЯКОЇ НАЛЕЖИТЬ ВИНАХІД Дане розкриття суті стосується кодування відео, а більш конкретно, кодування кадрів відеоданих, що формуються за допомогою процесів кодування відео. РІВЕНЬ ТЕХНІКИ Підтримка цифрового відео може бути включена в широкий діапазон пристроїв, що включають в себе цифрові телевізійні приймачі, системи цифрової прямої широкомовної передачі, бездротові широкомовні системи, персональні цифрові пристрої (PDA), переносні або настільні комп'ютери, планшетні комп'ютери, пристрої для читання електронних книг, цифрові камери, цифрові записуючі пристрої, цифрові мультимедійні програвачі, пристрої відеогри, консолі для відеогри, стільникові або супутникові радіотелефони, так звані "смартфони", пристрої відеоконференцзв'язку, пристрої потокової передачі відео і т. п. Цифрові відеопристрої реалізовують такі технології стиснення відео, як технології стиснення відео, описані в стандартах, заданих за допомогою стандартів, що розробляються в цей час, MPEG-2, MPEG-4, ITU-T H.263, ITU-T H.264/MPEG-4, частина 10, вдосконалене кодування відео (AVC), стандарту високоефективного кодування відео (HEVC), і розширень таких стандартів. Відеопристрої можуть передавати, приймати, кодувати, декодувати і/або зберігати цифрову відеоінформацію більш ефективно за допомогою реалізації таких технологій стиснення відео. Технології стиснення відео виконують просторове (інтра-кадрове) прогнозування і/або часове (інтер-кадрове) прогнозування для того, щоб зменшувати або видаляти надмірність, внутрішньо властиву у відеопослідовностях. Для блокового кодування відео відеослайс (тобто відеокадр або частина відеокадра) може бути сегментований на відеоблоки, які також можуть згадуватися як деревовидні блоки, одиниці кодування (CU) і/або вузли кодування. Відеоблоки в інтра(внутрішньо)-кодованому (I) слайсі зображення кодуються з використанням просторового прогнозування відносно опорних вибірок в сусідніх блоках в ідентичному зображенні. Відеоблоки в інтер(зовнішньо)-кодованому (Р- або В-) слайсі зображення можуть використовувати просторове прогнозування відносно опорних вибірок в сусідніх блоках в ідентичному зображенні або часове прогнозування відносно опорних вибірок в інших опорних зображеннях. Зображення можуть згадуватися як кадри, і опорні зображення можуть згадуватися як опорні кадри. Просторове або часове прогнозування приводить в результаті до прогнозного блока для блока, який повинен бути кодований. Залишкові дані представляють піксельні різниці між початковим блоком, який повинен бути кодований, і прогнозним блоком. Інтер-кодований блок кодується згідно з вектором руху, який вказує на блок опорних вибірок, що формують прогнозний блок, і залишковим даним, який вказує різницю між кодованим блоком і прогнозним блоком. Інтра-кодований блок кодується згідно з режимом інтра-кодування і залишковими даними. Для додаткового стиснення залишкові дані можуть бути перетворені з піксельної області в область перетворення, приводячи до залишкових коефіцієнтів перетворення, які потім можуть бути квантовані. Квантовані коефіцієнти перетворення, що спочатку розміщуються в двовимірній матриці, можуть бути скановані для того, щоб формувати одновимірний вектор коефіцієнтів перетворення. Ентропійне кодування потім може застосовуватися, щоб досягати ще більшого стиснення. СУТЬ ВИНАХОДУ Це розкриття суті описує технології для довільного доступу при кодуванні відео. Зокрема, розкриття суті описує декілька технологій для кодування відеопослідовностей, які включають в себе один або більше кадрів або "зображень", при цьому перше кодоване зображення конкретної кодованої відеопослідовності (CVS) у відповідному потоці бітів може бути зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR). Наприклад, відповідно до технологій, перше кодоване зображення може бути зображенням на основі чистого довільного доступу (CRA). Як один приклад, технології цього розкриття суті можуть забезпечувати можливість відеодекодеру, який відповідає технологіям, успішно декодувати потік бітів, що починається з такого не-IDR RAP-зображення, прогнозованим і заданим (або "стандартним") способом. Наприклад, розкриті технології можуть забезпечувати можливість відповідному відеодекодеру обробляти різні властивості виведення і опорні властивості так званих "початкових зображень", асоційованих з першим кодованим зображенням, які також включаються в потік бітів. Як результат, технології можуть забезпечувати відносно поліпшений довільний доступ для потоку бітів за допомогою відеодекодера, в порівнянні з іншими технологіями. Наприклад, технології 1 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 можуть сприяти "більш точному" або більш деталізованому довільному доступу потоку бітів за рахунок надання можливості відеодекодеру декодувати потік бітів у відносно більшому числі початкових точок або зображень доступу (тобто не-IDR-зображень) потоку бітів, в порівнянні з іншими технологіями (наприклад, технологіями, які дають можливість довільного доступу для потоку бітів тільки з IDR-зображень). Додатково, технології можуть забезпечувати можливість відповідному відеодекодеру підвищувати візуальну якість одного або більше інших зображень, також що включаються в потік бітів, наприклад, за допомогою уникнення виведення і/або як опорні зображення початкових зображень, асоційованих з першим зображенням. Альтернативно, як інший приклад, розкриті технології можуть забезпечувати можливість відеокодеру, який відповідає технологіям, формувати потік бітів, який виключає початкові зображення, асоційовані з першим кодованим зображенням потоку бітів, яке є не-IDR RAPзображенням. Як результат, відеодекодер, також відповідний розкритим технологіям, може успішно декодувати потік бітів прогнозованим і заданим способом. Відповідно, використання технологій цього розкриття суті дозволяє підвищувати функціональну сумісність систем і пристроїв кодування і декодування відео і поліпшувати можливості роботи користувачів, загалом, для довільного доступу для потоку бітів, що може часто виникати в різних відеододатках. У одному прикладі розкриття суті, спосіб декодування відеоданих включає в себе прийом потоку бітів, що містить одне або більше зображень CVS, декодування першого зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, при цьому перше зображення є RAP-зображенням, яке не є IDR-зображенням і декодування щонайменше одного з одного або більше зображень, відмінних від першого зображення, що йдуть після першого зображення згідно з порядком декодування, на основі декодованого першого зображення. У іншому прикладі розкриття суті, спосіб кодування відеоданих включає в себе формування потоку бітів, що містить одне або більше зображень CVS, при цьому перше зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, є RAPзображенням, яке не є IDR-зображенням, при цьому формування потоку бітів містить недопущення включення щонайменше одного з одного або більше зображень, відмінних від першого зображення, яке відповідає початковому зображенню, асоційованому з першим зображенням, в потік бітів, при цьому початкове зображення містить зображення, яке йде після першого зображення згідно з порядком декодування і передує першому зображенню згідно з порядком відображення, асоційованим з CVS, і при цьому перше зображення є декодованим, і при цьому щонайменше одне з одного або більше зображень, відмінних від першого зображення, що йдуть після першого зображення згідно з порядком декодування, є декодованим на основі першого зображення. У іншому прикладі розкриття суті, апарат, сконфігурований з можливістю декодувати відеодані, включає в себе відеодекодер, сконфігурований з можливістю приймати потік бітів, що містить одне або більше зображень CVS, декодувати перше зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, при цьому перше зображення є RAP-зображенням, яке не є IDR-зображенням, і декодувати щонайменше одне з одного або більше зображень, відмінних від першого зображення, що йдуть після першого зображення згідно з порядком декодування, на основі декодованого першого зображення. У іншому прикладі розкриття суті, апарат, сконфігурований з можливістю кодувати відеодані, включає в себе відеокодер, сконфігурований з можливістю формувати потік бітів, що містить одне або більше зображень CVS, при цьому перше зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, є RAP-зображенням, яке не є IDRзображенням, при цьому для того, щоб формувати потік бітів, відеокодер сконфігурований з можливістю не допускати включення щонайменше одного з одного або більше зображень, відмінних від першого зображення, яке відповідає початковому зображенню, асоційованому з першим зображенням, в потік бітів, при цьому початкове зображення містить зображення, яке йде після першого зображення згідно з порядком декодування і передує першому зображенню згідно з порядком відображення, асоційованим з CVS, і при цьому перше зображення є декодованим, і при цьому щонайменше одне з одного або більше зображень, відмінних від першого зображення, що йдуть після першого зображення згідно з порядком декодування, є декодованим на основі першого зображення. У іншому прикладі розкриття суті, пристрій для декодування відеоданих включає в себе засіб для прийому потоку бітів, що містить одне або більше зображень CVS, засіб для декодування першого зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, при цьому перше зображення є RAP-зображенням, яке не є 2 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 IDR-зображенням, і засіб для декодування щонайменше одного з одного або більше зображень, відмінних від першого зображення, що йдуть після першого зображення згідно з порядком декодування, на основі декодованого першого зображення. У іншому прикладі розкриття суті, пристрій для кодування відеоданих включає в себе засіб для формування потоку бітів, що містить одне або більше зображень CVS, при цьому перше зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, є RAP-зображенням, яке не є IDR-зображенням, при цьому засіб для формування потоку бітів містить засіб для недопущення включення щонайменше одного з одного або більше зображень, відмінних від першого зображення, яке відповідає початковому зображенню, асоційованому з першим зображенням, в потік бітів, при цьому початкове зображення містить зображення, яке йде після першого зображення згідно з порядком декодування і передує першому зображенню згідно з порядком відображення, асоційованим з CVS, і при цьому перше зображення є декодованим, і при цьому щонайменше одне з одного або більше зображень, відмінних від першого зображення, що йде після першого зображення згідно з порядком декодування, є декодованим на основі першого зображення. Технології, описані в даному розкритті суті, можуть бути реалізовані в апаратних засобах, програмному забезпеченні, мікропрограмному забезпеченні або в комбінаціях вищезазначеного. При реалізації в апаратних засобах, апарат може бути здійснений як інтегральна схема, процесор, дискретна логіка або будь-яка комбінація вищезазначеного. При реалізації в програмному забезпеченні, програмне забезпечення може виконуватися в одному або більше процесорах, таких як мікропроцесор, спеціалізована інтегральна схема (ASIC), програмована користувачем вентильна матриця (FPGA) або процесор цифрових сигналів (DSP). Програмне забезпечення, яке виконує технології, може бути спочатку збережене на матеріальному зчитуваному комп'ютером носії і завантажене і наведене у виконання в процесорі. Відповідно, в іншому прикладі, це розкриття суті розглядає зчитуваний комп'ютером носій даних, що зберігає інструкції, які при виконанні інструктують один або більше процесорів приймати потік бітів, що містить одне або більше зображень CVS, декодувати перше зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, при цьому перше зображення є RAP-зображенням, яке не є IDR-зображенням, і декодувати щонайменше одне з одного або більше зображень, відмінних від першого зображення, що йдуть після першого зображення згідно з порядком декодування, на основі декодованого першого зображення. У іншому прикладі, це розкриття суті розглядає зчитуваний комп'ютером носій даних, що зберігає інструкції, які при виконанні інструктують один або більше процесорів формувати потік бітів, що містить одне або більше зображень CVS, при цьому перше зображення з одного або більше зображень згідно з порядком декодування, асоційованим з CVS, є RAP-зображенням, яке не є IDR-зображенням, при цьому інструкції, які інструктують один або більше процесорів формувати потік бітів, містять інструкції, які інструктують один або більше процесорів уникати включення до складу щонайменше одного з одного або більше зображень, відмінних від першого зображення, яке відповідає початковому зображенню, асоційованому з першим зображенням, в потік бітів, при цьому початкове зображення містить зображення, яке йде після першого зображення згідно з порядком декодування і передує першому зображенню згідно з порядком відображення, асоційованим з CVS, і при цьому перше зображення є декодованим, і при цьому щонайменше одне з одного або більше зображень, відмінних від першого зображення, що йдуть після першого зображення згідно з порядком декодування, є декодованим на основі першого зображення. Подробиці одного або більше прикладів викладені на прикладених кресленнях і в нижченаведеному описі. Інші ознаки, цілі і переваги повинні ставати очевидними з опису і креслень і з формули винаходу. КОРОТКИЙ ОПИС КРЕСЛЕНЬ Фіг. 1 є блок-схемою, яка ілюструє приклад системи кодування і декодування відео, яка може виконувати технології для довільного доступу з вдосконаленим керуванням буфером зображень декодера (DPB), відповідно до технологій цього розкриття суті. Фіг. 2 є блок-схемою, яка ілюструє приклад відеокодера, який може виконувати технології для довільного доступу з вдосконаленим DPB-керуванням, відповідно до технологій цього розкриття суті. Фіг. 3 є блок-схемою, яка ілюструє приклад відеодекодера, який може виконувати технології для довільного доступу з вдосконаленим DPB-керуванням, відповідно до технологій цього розкриття суті. 3 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 Фіг. 4 є концептуальною схемою, яка ілюструє приклад опорних ієрархій між зображеннями груп зображень (GOP) відеоданих, відповідно до технологій цього розкриття суті. Фіг. 5 є блок-схемою послідовності операцій способу, яка ілюструє зразковий спосіб виконання довільного доступу для потоку бітів, який включає в себе одне або більше зображень відеоданих, за допомогою відеодекодера, відповідно до технологій цього розкриття суті. Фіг. 6 є блок-схемою послідовності операцій способу, яка ілюструє зразковий спосіб формування потоку бітів, який включає в себе одне або більше зображень відеоданих, за допомогою відеокодера, відповідно до технологій цього розкриття суті. ДЕТАЛЬНИЙ ОПИС ВИНАХОДУ Це розкриття суті описує технології для довільного доступу при кодуванні відео. Зокрема, розкриття суті описує декілька технологій для кодування відеопослідовностей, які включають в себе один або більше кадрів або "зображень", при цьому перше кодоване зображення конкретної кодованої відеопослідовності (CVS) у відповідному потоці бітів може бути зображенням на основі точки довільного доступу (RAP), яке не є зображенням на основі миттєвого оновлення при декодуванні (IDR). Наприклад, відповідно до технологій, перше кодоване зображення може бути зображенням на основі чистого довільного доступу (CRA). Як один приклад, технології цього розкриття суті можуть забезпечувати можливість відеодекодеру, який відповідає технологіям, успішно декодувати потік бітів, що починається з такого не-IDR RAP-зображення, прогнозованим і заданим (або "стандартним") способом. Наприклад, розкриті технології можуть забезпечувати можливість відповідному відеодекодеру обробляти різні властивості виведення і опорні властивості так званих "початкових зображень", асоційованих з першим кодованим зображенням, які також включаються в потік бітів. Як результат, технології можуть забезпечувати відносно поліпшений довільний доступ для потоку бітів за допомогою відеодекодера, в порівнянні з іншими технологіями. Наприклад, технології можуть сприяти "більш точному" або більш деталізованому довільному доступу потоку бітів за рахунок надавання можливості відеодекодеру декодувати потік бітів у відносно більшому числі початкових точок або зображень доступу (тобто не-IDR-зображень) потоку бітів, в порівнянні з іншими технологіями (наприклад, технологіями, які дають можливість довільного доступу для потоку бітів тільки з IDR-зображень). Додатково, технології можуть забезпечувати можливість відповідному відеодекодеру підвищувати візуальну якість одного або більше інших зображень, що також включаються в потік бітів, наприклад, за допомогою уникнення виведення і/або як опорні зображення початкових зображень, асоційованих з першим зображенням. Альтернативно, як інший приклад, розкриті технології можуть забезпечувати можливість відеокодеру, який відповідає технологіям, формувати потік бітів, який виключає початкові зображення, асоційовані з першим кодованим зображенням потоку бітів, яке є не-IDR RAPзображенням. Як результат, відеодекодер, також відповідний розкритим технологіям, може успішно декодувати потік бітів прогнозованим і заданим способом. Відповідно, використання технологій цього розкриття суті дозволяє підвищувати функціональну сумісність систем і пристроїв кодування і декодування відео і поліпшувати можливості роботи користувачів, загалом, для довільного доступу для потоку бітів, що може часто виникати в різних відеододатках. Зокрема, технології, описані в даному документі, можуть включати в себе щонайменше один або більше наступних аспектів новизни, в порівнянні з іншими технологіями: (1) виявлення здійснення довільного доступу з не-IDR RAP-зображення (наприклад, CRA-зображення); 2) ідентифікації і декодування одного або більше зображень, які йдуть після не-IDR RAPзображення в порядку декодування, але передують не-IDR RAP-зображенню в порядку виведення (тобто одного або більше "початкових зображень" для не-IDR RAP-зображення); і (3) указування, що кожне з одного або більше початкових зображень для не-IDR RAP-зображення не виводиться навіть у випадку, якщо відповідний елемент output_flag синтаксису, що передається в службових сигналах дорівнює істині або 1 (тобто output_flag вказує, що відповідне зображення повинне бути виведене), і що відповідне зображення не використовується як опорне зображення для інших зображень, які йдуть після не-IDR RAPзображення в порядку декодування і порядку виведення. Таким чином, потік бітів, який включає в себе одне або більше зображень відеоданих і починається з не-IDR RAP-зображення, може бути декодований прогнозованим і заданим способом за допомогою відеодекодера, відповідного технологіям цього розкриття суті. Альтернативно, відеокодер, відповідний розкритим технологіям, може формувати потік бітів, який включає в себе одне або більше зображень відеоданих і починається з не-IDR RAPзображення, так що потік бітів може бути декодований прогнозованим і заданим способом за допомогою відеодекодера, також відповідного технологіям. Як результат, може бути відносне 4 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 поліпшення можливостей роботи користувачів при виконанні довільного доступу для потоку бітів, який включає в себе одне або більше зображень відеоданих, при використанні технологій цього розкриття суті. Зокрема, може бути відносне підвищення деталізування довільного доступу, а також візуальної якості одного або більше зображень потоку бітів і/або CVS, яка включає в себе одне або більше зображень загалом, при використанні розкритих технологій. Фіг. 1 є блок-схемою, яка ілюструє приклад системи кодування і декодування відео, яка може виконувати технології для довільного доступу з вдосконаленим керуванням буфером зображень декодера (DPB), відповідно до технологій цього розкриття суті. Як показано на фіг. 1, система 10 включає в себе пристрій-джерело 12, яке формує кодовані відеодані, які повинні бути декодовані згодом за допомогою пристрою-адресата 14. Пристрій-джерело 12 і пристрійадресат 14 можуть містити будь-який з широкого діапазону пристроїв, що включають в себе настільні комп'ютери, ноутбуки (тобто переносні комп'ютери), планшетні комп'ютери, абонентські приставки, телефонні трубки, наприклад, так звані смартфони, так звані інтелектуальні сенсорні панелі, телевізійні приймачі, камери, пристрої відображення, цифрові мультимедійні програвачі, консолі для відеогри, пристрої потокової передачі відео і т. п. В деяких випадках, пристрій-джерело 12 і пристрій-адресат 14 можуть бути оснащені можливостями бездротового зв'язку. Пристрій-адресат 14 може приймати кодовані відеодані, які повинні бути декодовані, через лінію 16 зв'язку. Лінія 16 зв'язку може містити будь-який тип носія або пристрою, що допускає переміщення кодованих відеоданих з пристрою-джерела 12 в пристрій-адресата 14. У одному прикладі, лінія16 зв'язку може містити середовище зв'язку, щоб забезпечувати можливість пристрою-джерелу 12 передавати кодовані відеодані безпосередньо в пристрій-адресат 14 в реальному часі. Кодовані відеодані можуть бути модульовані згідно зі стандартом зв'язку, таким як протокол бездротового зв'язку, і передані в пристрій-адресат 14. Середовище зв'язку може містити будь-яке бездротове або дротове середовище зв'язку, таке як радіочастотний (RF) спектр або одна або більше фізичних ліній передачі. Середовище зв'язку може формувати частину мережі з комутацією пакетів, такою як локальна обчислювальна мережа, глобальна обчислювальна мережа або глобальна мережа, така як Інтернет. Середовище зв'язку може включати в себе маршрутизатори, комутатори, базові станції або будь-яке інше обладнання, яке може бути корисним для того, щоб спрощувати передачу з пристрою-джерела 12 в пристрійадресат 14. Альтернативно, кодовані дані можуть виводитися з інтерфейсу 22 виведення в пристрій 24 зберігання. Аналогічно, доступ до кодованих даних може здійснюватися з пристрою 24 зберігання за допомогою інтерфейсу 26 введення. Пристрій 24 зберігання може включати в себе будь-який з множини розподілених або локально доступних носіїв зберігання, таких як жорсткий диск, Blu-Ray-диски, DVD, CD-ROM, флеш-пам'ять, енергозалежний або енергонезалежний запам'ятовуючий пристрій або будь-які інші відповідні цифрові носії даних для збереження кодованих відеоданих. У додатковому прикладі, пристрій 24 зберігання може відповідати файловому серверу або іншому проміжному пристрою зберігання, який може зберігати кодоване відео, сформоване за допомогою пристрою-джерела 12. Пристрій-адресат 14 може здійснювати доступ до збережених відеоданих з пристрою 24 зберігання через потокову передачу або завантаження. Файловий сервер може бути будь-яким типом сервера, що допускає збереження кодованих відеоданих і передачу цих кодованих відеоданих в пристрій-адресат 14. Зразкові файлові сервери включають в себе веб-сервер (наприклад, для веб-вузла), FTP-сервер, пристрої системи зберігання з підключенням по мережі (NAS) або локальний накопичувач на дисках. Пристрій-адресат 14 може здійснювати доступ до кодованих відеоданих через будь-яке стандартне підключення для передачі даних, яке включає в себе Інтернет-підключення. Воно може включати в себе бездротовий канал (наприклад, Wi-Fiпідключення), дротове підключення (наприклад, DSL, кабельний модем і т. д.) або комбінацію зазначеного, яка є відповідною для того, щоб здійснювати доступ до кодованих відеоданих, збережених на файловому сервері. Передача кодованих відеоданих з пристрою 24 зберігання може являти собою потокову передачу, передачу на основі завантаження або комбінацію вищезазначеного. Технології цього розкриття суті не обов'язково обмежені додатками або настройками бездротового зв'язку. Технології можуть застосовуватися до кодування відео в підтримку будьяких з множини мультимедійних додатків, таких як широкомовні телепередачі по радіоінтерфейсу, кабельні телепередачі, супутникові телепередачі, потокові передачі відео, наприклад, через Інтернет, кодування цифрового відео для зберігання на носії даних, декодування цифрового відео, збереженого на носії даних, або інші додатки. У деяких прикладах, система 10 може бути сконфігурована з можливістю підтримувати односторонню 5 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 або двосторонню передачу відео, щоб підтримувати такі додатки, як потокова передача відео, відтворення відео, широкомовна передача відео і/або відеотелефонія. У прикладі по фіг. 1, пристрій-джерело 12 включає в себе відеоджерело 18, відеокодер 20 і інтерфейс 22 виведення. У деяких випадках, інтерфейс 22 виведення може включати в себе модулятор/демодулятор (модем) і/або передавальний пристрій. У пристрої-джерелі 12 відеоджерело 18 може включати в себе джерело, таке як пристрій відеозахоплення, наприклад, відеокамера, відеоархів, що містить раніше захоплене відео, інтерфейс прямих відеотрансляцій, щоб приймати відео від постачальника відеоконтента, і/або комп'ютерну графічну систему для формування комп'ютерних графічних даних як початкове відео, або комбінацію таких джерел. Як один приклад, якщо відеоджерелом 18 є відеокамера, пристрійджерело 12 і пристрій-адресат 14 можуть формувати так звані камерофони або відеофони. Проте, технології, описані в цьому розкритті суті, можуть бути застосовним до кодування відео загалом і можуть застосовуватися до бездротових і/або дротових варіантів застосування. Захоплене, попередньо захоплене або машиногенероване відео може бути кодоване за допомогою відеокодера 20. Кодовані відеодані можуть бути передані безпосередньо в пристрійадресат 14 через інтерфейс 22 виведення 12. Кодовані відеодані також (або альтернативно) можуть зберігатися на пристрій 24 зберігання для подальшого доступу за допомогою пристроюадресата 14 або інших пристроїв для декодування і/або відтворення. Пристрій-адресат 14 включає в себе інтерфейс 26 введення, відеодекодер 30 і пристрій 28 відображення. У деяких випадках, інтерфейс 26 введення може включати в себе приймальний пристрій і/або модем. Інтерфейс 26 введення пристрою-адресата 14 приймає кодовані відеодані по лінії 16 зв'язку або з пристрою 24 зберігання. Кодовані відеодані, що передаються по лінії 16 зв'язку або надані на пристрої 24 зберігання, можуть включати в себе множину елементів синтаксису, сформованих за допомогою відеокодера 20 для використання за допомогою відеодекодера, такого як відеодекодер 30, при декодуванні відеоданих. Такі елементи синтаксису можуть бути включені з кодованими відеоданими, що передаються на середовищі зв'язку, збереженими на носії зберігання або збереженими на файловому сервері. Пристрій 28 відображення може бути інтегрованим або зовнішнім для пристрою-адресата 14. У деяких прикладах, пристрій-адресат 14 може включати в себе інтегрований пристрій відображення, а також сконфігурований з можливістю взаємодіяти із зовнішнім пристроєм відображення. У інших прикладах, пристрій-адресат 14 може бути пристроєм відображення. Загалом, пристрій 28 відображення відображає декодовані відеодані користувачеві і може містити будь-який з множини пристроїв відображення, таких як рідкокристалічний дисплей (LCD), плазмовий дисплей, дисплей на органічних світлодіодах (OLED) або інший тип пристрою відображення. Відеокодер 20 і відеодекодер 30 можуть працювати згідно зі стандартом стиснення відео, таким як стандарт високоефективного кодування відео (HEVC), що розробляється в даний момент за допомогою Об'єднаної групи для спільної роботи над відеостандартами (JCT-VC) Експертної групи в області кодування відео (VCEG) ITU-T і Експертної групи по кінозображенню (MPEG) ISO/IEC, і можуть відповідати тестовій моделі HEVC (HM). Альтернативно, відеокодер 20 і відеодекодер 30 можуть працювати згідно з іншими власними або галузевими стандартами, такими як стандарт ITU-T H.264, який альтернативно називається "MPEG-4, частина 10, AVC", або розширенням таких стандартів. Проте, технології цього розкриття суті не обмежені якимнебудь конкретним стандартом кодування. Інші приклади стандартів стиснення відео включають в себе MPEG-2 і ITU-T H.263. Останній проект HEVC-стандарту, який називається "робочим проектом HEVC 8" або "WD8", описується в документі JCTVC-J1003_d7, Bross і інш., "High efficiency video coding (HEVC) text specification draft 8", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 10th Meeting: Стокгольм, SE, 11-20 липня 2012 року, який, з 17 жовтня 2012 року, можна завантажити за адресою http://phenix.int-evry.fr/jct/doc_end_user/documents/10_Stockholm/wg11/JCTVC-J1003-v8.zip. Інший проект HEVC-стандарту, який називається в цьому розкритті суті "робочим проектом HEVC 4" або "WD4", описується в документі JCTVC-F803, Bross і інш., "WD4: Working Draft 4 °F High-Efficiency Video Coding", Joint Collaborative Team on Video Coding (JCT-VC) of ITU-T SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 6th Meeting: Torino, IT, 14-22 липня 2011 року, який, з 17 жовтня 2012 року, можна завантажити за адресою http://phenix.intevry.fr/jct/doc_end_user/documents/6_Torino/wg11/JCTVC-F803-v8.zip. Ще один інший проект HEVC-стандарту, який називається в цьому розкритті суті "робочим проектом HEVC 5" або "WD5", описується в документі JCTVC-G1103, Bross і інш., "WD5: Working Draft 5 °F High-Efficiency Video Coding", Joint Collaborative Team on Video Coding (JCT-VC) of ITUT SG16 WP3 and ISO/IEC JTC1/SC29/WG11, 7th Meeting: Женева, CH, 21-30 листопада 2011 6 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 року, який, з 17 жовтня 2012 року, можна завантажити за адресою http://phenix.intevry.fr/jct/doc_end_user/documents/7_Geneva/wg11/JCTVC-G1103-v12.zip. Хоча не показано на фіг. 1, в деяких аспектах, відеокодер 20 і відеодекодер 30 можуть бути інтегровані з аудіо-кодером і декодером, відповідно, і можуть включати в себе відповідні модулі мультиплексора-демультиплексора або інші апаратні засоби і програмне забезпечення, щоб обробляти кодування як аудіо, так і відео в загальному потоці даних або в окремих потоках даних. Якщо застосовно, в деяких прикладах блоки мультиплексора-демультиплексора можуть відповідати протоколу мультиплексора ITU H.223 або іншим протоколам, такому як протокол користувацьких дейтаграм (UDP). Відеокодер 20 і відеодекодер 30 можуть бути реалізовані як будь-яка з множини належних схем кодера або декодера, наприклад, один або більше мікропроцесорів, процесорів цифрових сигналів (DSP), спеціалізованих інтегральних схем (ASIC), програмованих користувачем вентильних матриць (FPGA), дискретна логіка, програмне забезпечення, апаратні засоби, мікропрограмне забезпечення або будь-які комбінації вищезазначеного. Коли технології реалізовуються частково в програмному забезпеченні, пристрій може зберігати інструкції для програмного забезпечення на відповідному енергонезалежному зчитуваному комп'ютером носії і виконувати інструкції в апаратних засобах з використанням одного або більше процесорів, щоб здійснювати технології цього розкриття суті. Кожний з відеокодера 20 і відеодекодера 30 може бути включений в один або більше кодерів або декодерів, будь-який з яких може бути інтегрований як частина комбінованого кодера/декодера (кодека) у відповідному пристрої. Робота по стандартизації HEVC основана на вдосконаленій моделі пристрою кодування відео, яка називається "тестовою моделлю HEVC (HM)". HM передбачає декілька додаткових можливостей пристроїв кодування відео відносно існуючих пристроїв згідно, наприклад, з ITU-T H.264/AVC. Наприклад, тоді як H.264 надає дев'ять режимів кодування з інтра-прогнозуванням, HM може надавати цілих тридцять п'ять режимів кодування з інтра-прогнозуванням. Загалом, робоча модель HM описує, що відеокадр або зображення може бути розділено на послідовність деревовидних блоків або найбільших одиниць кодування (LCU), які включають в себе вибірки як сигналу яскравості, так і сигналу кольоровості. Деревовидний блок має призначення, аналогічне призначенню макроблока по стандарту H.264. Слайс включає в себе певне число послідовних деревовидних блоків в порядку кодування. Відеокадр або зображення може бути сегментований на один або більше слайсів. Кожний деревовидний блок може розбиватися на одиниці кодування (CU) згідно з деревом квадрантів. Наприклад, деревовидний блок, як кореневий вузол дерева квадрантів, може розбиватися на чотири дочірні вузли, і кожний дочірній вузол, в свою чергу, може бути батьківським вузлом і розбиватися ще на чотири дочірні вузли. Кінцевий, нерозбитий дочірній вузол, як кінцевий вузол дерева квадрантів, містить вузол кодування, тобто кодований відеоблок. Синтаксичні дані, асоційовані з кодованим потоком бітів, можуть задавати максимальну кількість разів, яку може розбиватися деревовидний блок, і також може задавати мінімальний розмір вузлів кодування. CU включає в себе вузол кодування і одиниці прогнозування (PU) і одиниці перетворення (TU), асоційовані з вузлом кодування. Розмір CU відповідає розміру вузла кодування і повинен мати квадратну форму. Розмір CU може коливатися від 8×8 пікселів аж до розміру деревовидного блоку максимум в 64×64 пікселів або більше. Кожна CU може містити одну або більше PU і одну або більше TU. Синтаксичні дані, асоційовані з CU, можуть описувати, наприклад, сегментування CU на одну або більше PU. Режими сегментування можуть відрізнятися тим часом, є CU кодованою в режимі пропуску або прямому режимі, кодованою в режимі інтра-прогнозування або кодованою в режимі інтер-прогнозування. PU можуть бути сегментовані таким чином, що вони мають неквадратну форму. Синтаксичні дані, асоційовані з CU, також можуть описувати, наприклад, сегментування CU на одну або більше TU згідно з деревом квадрантів. TU може мати квадратну або неквадратну форму. HEVC-стандарт забезпечує можливість перетворень згідно з TU, які можуть відрізнятися для різних CU. Розміри NU типово задаються на основі розміру PU в даній CU, заданого для сегментованої LCU, хоча це може не завжди мати місце. TU типово має ідентичний розмір або менший, ніж PU. У деяких прикладах, залишкові вибірки, відповідні CU, можуть поділятися на менші одиниці з використанням структури у вигляді дерева квадрантів, відомої як "залишкове дерево квадрантів" (RQT). Кінцеві вузли RQT можуть згадуватися як TU. Значення піксельних різниць, асоційовані з TU, можуть бути перетворені, щоб формувати коефіцієнти перетворення, які можуть бути квантовані. Загалом, PU включає в себе дані, пов'язані з процесом прогнозування. Наприклад, коли PU кодується в інтра-режимі, PU може включати в себе дані, що описують режим інтрапрогнозування для PU. Як інший приклад, коли PU кодується в інтер-режимі, PU може включати 7 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 в себе дані, які задають вектор руху для PU. Дані, які задають вектор руху для PU, можуть описувати, наприклад, горизонтальний компонент вектора руху, вертикальний компонент вектора руху, розділення для вектора руху (наприклад, точність в одну чверть пікселя або точність в одну восьму пікселя), опорний кадр, на який вказує вектор руху, і/або список опорних зображень (наприклад, список 0, список 1 або список С) для вектора руху. Загалом, TU використовується для процесів перетворення і квантування. Дана CU, що має одну або більше PU, також може включати в себе одну або більше TU. Після прогнозування відеокодер 20 може обчислювати залишкові значення, відповідні PU. Залишкові значення містять значення піксельних різниць, які можуть бути перетворені в коефіцієнти перетворення, квантовані і скановані з використанням TU, щоб формувати перетворені в послідовну форму коефіцієнти перетворення для ентропійного кодування. Це розкриття суті типово використовує термін "відеоблок" або просто "блок" для того, щоб позначати вузол кодування CU. У деяких конкретних випадках це розкриття суті також може використовувати термін "відеоблок", щоб означати деревовидний блок, тобто LCU або CU, яка включає в себе вузол кодування і PU і TU. Відеопослідовність типово включає в себе серії відеокадрів або зображень. Група зображень (GOP), загалом, містить послідовність з одного або більше відеозображення. GOP може включати в себе в заголовку GOP, в заголовку одного або більше зображень або в іншому місці синтаксичні дані, які описують число зображень, включених в GOP. Кожний слайс зображення може включати в себе синтаксичні дані слайса, які описують режим кодування для відповідного слайса. Відеокодер 20 типово оперує з відеоблоками в межах окремих відеослайсів, щоб кодувати відеодані. Відеоблок може відповідати вузлу кодування в CU. Відеоблоки можуть мати фіксовані або варійовані розміри і можуть відрізнятися по розміру згідно з вказаним стандартом кодування. Як приклад, HM підтримує прогнозування для різних PU-розмірів. При умові, що розмір конкретної CU становить 2N×2N, HM підтримує інтра-прогнозування для PU-розмірів 2N×2N або N×N і інтер-прогнозування для симетричних PU-розмірів 2N×2N, 2N×N, N×2N або N×N. HM також підтримує асиметричне сегментування для інтер-прогнозування для PU-розмірів 2N×nU, 2N×nD, nL×2N і nR×2N. При асиметричному сегментуванні один напрямок CU не сегментується, в той час як інший напрямок сегментується на 25 % і 75 %. Частина CU, відповідна 25 %-ому сегменту, вказується за допомогою "n", після чого йде індикатор відносно "вгору (Up)", "вниз (Down)", "ліворуч (Left)" або "праворуч (Right)". Таким чином, наприклад, "2N×nU" посилається на CU 2N×2N, яка сегментується горизонтально з PU 2N×0,5N вгорі і PU 2N×1,5N внизу. У цьому розкритті суті, "N×N" і "N×N" можуть бути використані взаємозамінно для того, щоб посилатися на розміри пікселя відеоблока з точки зору розмірів по вертикалі і горизонталі, наприклад, 16×16 пікселів або 16 на 16 пікселів. Загалом, блок 16×16 повинен мати 16 пікселів у вертикальному напрямку (у=16) і 16 пікселів в горизонтальному напрямку (х=16). Аналогічно, блок N×N, загалом, має N пікселів у вертикальному напрямку і N пікселів в горизонтальному напрямку, при цьому N представляє ненегативне цілочисельне значення. Пікселі в блоці можуть розміщуватися в рядках і стовпцях. Крім того, блок не обов'язково повинен мати співпадаюче число пікселів в горизонтальному напрямку і у вертикальному напрямку. Наприклад, блоки можуть містити N×M пікселів, причому M не обов'язково дорівнює N. Після кодування з інтра-прогнозуванням або кодування з інтер-прогнозуванням з використанням PU CU, відеокодер 20 може обчислювати залишкові дані для TU CU. PU можуть містити піксельні дані в просторовій області (яка також називається "піксельний областю"), і TU можуть містити коефіцієнти в області перетворення після застосування перетворення, наприклад, дискретного косинусного перетворення (DCT), цілочисельного перетворення, вейвлет-перетворення або концептуально аналогічного перетворення до залишкових відеоданих. Залишкові дані можуть відповідати піксельним різницям між пікселями некодованого зображення і прогнозними значеннями, відповідними PU. Відеокодер 20 може формувати TU, що включає в себе залишкові дані для CU, і потім перетворювати TU таким чином, щоб формувати коефіцієнти перетворення для CU. Після перетворень, щоб формувати коефіцієнти перетворення, відеокодер 20 може виконувати квантування коефіцієнтів перетворення. Квантування, загалом, означає процес, в якому коефіцієнти перетворення квантуються, щоб, можливо, зменшувати об'єм даних, які використовуються для того, щоб представляти коефіцієнти, забезпечуючи додаткове стиснення. Процес квантування може зменшувати бітову глибину, асоційовану з деякими або всіма коефіцієнтами. Наприклад, n-бітове значення може бути округлене в меншу сторону до mбітового значення в ході квантування, при цьому n більше m. У деяких прикладах, відеокодер 20 може використовувати плпередньо заданий порядок сканування (або "сканування") для того, щоб сканувати квантовані коефіцієнти перетворення, 8 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 так щоб формувати перетворений в послідовну форму вектор, який може ентропійно кодуватися. У інших прикладах, відеокодер 20 може виконувати адаптивне сканування. Після сканування квантованих коефіцієнтів перетворення, щоб формувати одновимірний вектор, відеокодер 20 може ентропійно кодувати одновимірний вектор, наприклад, згідно з контекстноадаптивним кодуванням змінної довжини (CAVLC), контекстно-адаптивним двійковим арифметичним кодуванням (CABAC), синтаксичним контекстно-адаптивним двійковим арифметичним кодуванням (SBAC), ентропійним кодуванням на основі сегментування на інтервали імовірності (PIPE) або іншою технологією ентропійного кодування. Відеокодер 20 також може ентропійно кодувати елементи синтаксису, асоційовані з кодованими відеоданими, для використання за допомогою відеодекодера 30 при декодуванні відеоданих. Щоб виконувати CABAC, відеокодер 20 може призначати контекст в контекстній моделі символу, який повинен бути переданий. Контекст може бути пов'язаний, наприклад, з тим, мають сусідні значення символу нульове значення чи ні. Щоб виконувати CAVLC, відеокодер 20 може вибирати код змінної довжини для символу, який повинен бути переданий. Кодові слова в VLC можуть мати таку структуру, що відносно більш короткі коди відповідають більш ймовірним символам, в той час як відносно більш довгі коди відповідають менш ймовірним символам. Таким чином, використання VLC дозволяє досягати економії бітів, наприклад, в порівнянні з використанням кодових слів однакової довжини для кожного символу, який повинен бути переданий. Визначення імовірності може бути основане на контексті, що призначається символу. У деяких прикладах, технології цього розкриття суті направлені на довільний доступ при кодуванні відео. Зокрема, це розкриття суті описує декілька технологій для кодування відеопослідовностей, які включають в себе один або більше кадрів або зображень, при цьому перше кодоване зображення конкретної CVS у відповідному потоці бітів може бути RAPзображенням, яке не є IDR-зображенням. Наприклад, відповідно до розкритих технологій, перше кодоване зображення може бути CRA-зображенням. Іншими словами, потік бітів, який включає в себе одне або більше зображень CVS, при цьому перше кодоване зображення потоку бітів є не-IDR RAP-зображенням, може вважатися "відповідним" потоком бітів згідно з технологіями цього розкриття суті. Інакше кажучи, відеодекодер, який відповідає розкритим технологіям, може декодувати такий потік бітів успішно прогнозованим і заданим способом. Зокрема, технології цього розкриття суті включають в себе способи обробки, за допомогою відеодекодера, декодування, а також властивостей виведення і опорних властивостей, початкових зображень, асоційованих з першим кодованим зображенням. Альтернативно, технології також включають в себе формування, за допомогою відеокодера, відповідного потоку бітів, який виключає початкові зображення, асоційовані з першим кодованим зображенням потоку бітів, яке є не-IDR RAP-зображенням, з потоку бітів, так що потік бітів може бути успішно декодований за допомогою відеодекодера прогнозованим і заданим способом. У цьому розкритті суті, IDR-зображення CVS може, загалом, посилатися на зображення, включене в CVS, яка кодується з використанням кодування з інтра-прогнозуванням, тобто на Iзображення, кодоване без посилання на інші зображення в межах або за межами CVS. Додатково, IDR-зображення може посилатися на зображення, для якого всі інші зображення, включені в CVS, що йдуть після IDR-зображення згідно з порядком декодування, асоційованим з CVS, декодуються незалежно від зображень, які передують IDR-зображенню згідно з порядком декодування. Наприклад, відповідно до деяких технологій (наприклад, H.264/MPEG-4 Частина 10/AVC; в подальшому "H.264/AVC"), CVS може включати в себе IDR-зображення як перше зображення CVS згідно з порядком декодування, асоційованим з CVS, а також одне або більше додаткових IDR-зображень. Як один приклад, CVS може включати в себе одну або більше GOP, при цьому кожна GOP починається з IDR-зображення, після якого йдуть одне або більше інших не-IDR-зображень (наприклад, так звані Р- і В-зображення, які кодуються з використанням кодування з інтер-прогнозуванням на основі прямого і двонаправленого прогнозування з інших опорних зображень). Відповідно до вищеописаних технологій (наприклад, H.264/AVC), довільний доступ для CVS може бути виконаний за допомогою декодування спочатку IDR-зображення CVS, наприклад, IDR-зображення конкретної GOP, включеної в CVS. Оскільки IDR-зображення можуть бути декодовані без опори на які-небудь інші зображення, як описано вище, згідно з цими технологіями, довільний доступ для CVS може бути виконаний на базисі GOP за допомогою декодування спочатку IDR-зображення, розташованого на початку кожної GOP. Іншими словами, згідно з деякими технологіями (наприклад, H.264/AVC), довільний доступ для CVS може бути виконаний тільки з IDR-зображення, включеного в CVS. У зв'язку з цим, в цих 9 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 технологіях, для щоб перше кодоване зображення конкретної CVS у відповідному потоці бітів було RAP-зображенням, зображення повинне бути IDR-зображенням. На відміну від вищеописаних технологій, відповідно до технологій цього розкриття суті, довільний доступ для потоку бітів, що починається з не-IDR-зображення (наприклад, CRAзображення), може бути виконаний прогнозованим і заданим (або "стандартним") способом за допомогою відповідних відеодекодерів. Як результат, розкриті технології дозволяють значно підвищувати функціональну сумісність систем і пристроїв відеокодера і відеодекодера, а також поліпшувати можливості роботи користувачів, загалом, для довільного доступу для потоку бітів, що може часто виникати в різних відеододатках. Наприклад, технології, описані в даному документі, можуть включати в себе щонайменше один або більше наступних аспектів новизни, в порівнянні з іншими технологіями: (1) виявлення здійснення довільного доступу з не-IDR RAP-зображення (наприклад, CRAзображення); 2) ідентифікація і декодування одного або більше зображень, які йдуть після не-IDR RAPзображення в порядку декодування, але передують не-IDR RAP-зображенню в порядку виведення (тобто одне або більше "початкових зображень" для не-IDR RAP-зображення); і (3) указування, що кожне з одного або більш початкових зображень для не-IDR RAPзображення не виводиться навіть у випадку, якщо відповідний передаваний в службових сигналах output_flag дорівнює істині або 1 (тобто output_flag вказує, що відповідне зображення повинне бути виведене), і що відповідне зображення не використовується як опорне зображення для інших зображень, які йдуть після не-IDR RAP-зображення в порядку декодування і порядку виведення. Як описано вище, згідно з деякими технологіями (наприклад, H.264/AVC), IDR-зображення може служити як традиційна точка доступу (наприклад, зображення на основі точки довільного доступу, або "RAP") для CVS. Наприклад, IDR-зображення може бути включене на початку незалежно декодованої частини CVS, яка іноді називається як GOP. Ця реалізація довільного доступу для CVS іноді згадується як реалізація в формі "закритої GOP", в якій зображення в конкретній GOP не посилаються на зображення, які виникають до IDR-зображення GOP, наприклад, зображення, включені в попередню GOP CVS або GOP інший попередньої CVS, згідно з порядком декодування, асоційованим з CVS. Як вже пояснено вище, в цьому контексті, GOP може задаватися як IDR-зображення, після якого йдуть одне або більше Р-і/або Взображень. У так званій реалізації в формі "відкритої GOP" CRA-зображення служить меті, аналогічній меті IDR-зображення, описаного вище відносно реалізації в формі закритої GOP. Наприклад, в цьому контексті, GOP може задаватися як CRA-зображення, після якого йдуть одне або більше Р-і/або В-зображень. Проте, на відміну від реалізації в формі закритої GOP, в реалізації в формі відкритої GOP, зображення, включені в конкретну GOP, можуть посилатися на зображення, які виникають до CRA-зображення GOP, наприклад, на зображення, включені в попередню GOP CVS або GOP інший попередньої CVS, згідно з порядком декодування, асоційованим з CVS. Наприклад, відповідно до реалізації в формі відкритої GOP, В-зображення, яке йде після CRAзображення (яке, аналогічно IDR-зображенню, є інтра-прогнозованим або I-зображенням) однієї GOP CVS згідно з порядком декодування, асоційованим з CVS, може посилатися на зображення (наприклад, Р- або В-зображення), включене в попередню GOP CVS. Згідно з деякими технологіями, В-зображення CVS традиційно прогнозується за допомогою посилання на зображення, яке передує В-зображенню, і зображення, яке йде після Взображення в порядку виведення, асоційованому з CVS. Наприклад, В-зображення цього прикладу може посилатися (тобто використовувати як опорне зображення) зображення, включене в попередню GOP, яка може передувати В-зображенню в порядку виведення, асоційованому з CVS, а також посилатися (тобто використовувати як опорне зображення) CRAзображення, яке може йти після В-зображення в порядку виведення. Іншими словами, в цьому прикладі, В-зображення йде після CRA-зображення в порядку декодування, але передує CRAзображенню в порядку виведення. У зв'язку з цим, В-зображення може вважатися "початковим зображенням" для CRA-зображення. Проте, в інших прикладах В-зображення може бути будьяким іншим типом зображення, яке також є початковим зображенням CRA-зображення, як задане вище. Вищеописаний приклад ілюструє щонайменше одну проблему, асоційовану з реалізацією в формі відкритої GOP, описаної вище. Зокрема, у випадках, коли довільний доступ для CVS виконується з CRA-зображення, включеного в CVS, початкові зображення для CRA-зображення не можуть бути коректно декодовані. Це зумовлене цим фактом, що у випадках, коли CRAзображення є першим кодованим зображенням CVS, будь-які зображення, які передують CRA 10 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 зображенню в порядку декодування, асоційованому з CVS, не декодуються і, як наслідок, недоступні як опорне зображення для початкових зображень. Відповідно, в реалізації в формі відкритої GOP, описаної вище, початкові зображення не можуть бути коректно декодовані і внаслідок цього можуть порушувати можливості роботи користувачів при відображенні. Наприклад, при декодуванні початкові зображення можуть включати в себе помилкові відеодані і, при відображенні, можуть погіршувати візуальну якість самих зображень, а також CVS загалом. По ідентичних причинах, в реалізації в формі відкритої GOP, інші зображення CVS, які йдуть після CRA-зображення як в порядку декодування, так і в порядку виведення (наприклад, Р-зображення), можуть не посилатися на початкові зображення (наприклад, оскільки ці початкові зображення при декодуванні можуть включати в себе помилкові відеодані), або до будь-яких інших зображень, які передують CRA-зображенню в порядку декодування і порядку виведення (наприклад, оскільки ці зображення не декодуються і, отже, недоступні як опорні зображення). Взагалі кажучи, будь-яка з вищеописаних технологій (тобто реалізація в формі закритої GOP з використанням IDR-зображень і реалізація в формі відкритої GOP з використанням CRAзображень) може забезпечувати довільний доступ для CVS відеоданих. Проте, згідно з деякими стандартами кодування, такими як, наприклад, H.264/AVC, потік бітів, який починається з CRAзображення, вважається "невідповідним" потоком бітів. Наприклад, як описано вище, згідно з деякими технологіями, такими як, наприклад, H.264/AVC, потік бітів повинен починатися з IDRзображення. Іншими словами, згідно з цими технологіями, тільки реалізація на основі довільного доступу в формі закритої GOP, описана вище, може підтримуватися. Технології цього розкриття суті можуть забезпечувати можливість відеодекодеру обробляти такий невідповідний потік бітів (тобто потік бітів, який починається з CRA-зображення і відповідає реалізації в формі відкритої GOP). Інакше кажучи, технології, описані в даному документі, націлені на задавання такого потоку бітів як "відповідний" потік бітів. У деяких прикладах, відповідний потік бітів згідно з технологіями цього розкриття суті включає в себе потоки бітів, які починаються з CRA-зображень і відповідають реалізації в формі відкритої GOP, а також потоки бітів, які починаються з IDR-зображень і відповідають реалізації в формі закритої GOP. Як вже пояснено вище, одна проблема, яка ідентифікується відносно довільного доступу, який здійснюється в CRA-зображенні, пов'язана з тим фактом, що початкові зображення для CRA-зображення не можуть бути коректно декодовані і, як наслідок, можуть порушувати можливості роботи користувачів при відображенні. Технології цього розкриття суті можуть вирішувати цю проблему за допомогою забезпечення довільного доступу для CVS з CRAзображення за допомогою виконання декодування, а також обробки властивостей виведення і опорних властивостей початкових зображень, асоційованих з CRA-зображенням, конкретним способом. Зокрема, технології можуть включати в себе деякі або всі наступні етапи: Етап 1. Ідентифікація одного або більше зображень CVS як початкових зображень для CRAзображення CVS, коли значення номера в послідовності зображень (POC) кожного з одного або більше зображень менше РОС-значення CRA-зображення (тобто відповідне зображення передує CRA-зображенню в порядку виведення, асоційованому з CVS), і коли відповідне зображення йде після CRA-зображення в порядку декодування, асоційованому з CVS. Етап 2. Визначення, для кожного з одного або більше початкових зображень, того, посилається чи ні відповідне початкове зображення на зображення, яке недоступне для декодування. Етап 3. Формування, для кожного з одного або більше початкових зображень, для якого визначено, що воно посилається на зображення, яке недоступне для декодування віртуального опорного зображення (наприклад, формування зображення "середнього" сигналу яскравості (або сигналу кольоровості), яке має значення сигналу яскравості (або сигналу кольоровості), кожне з яких відповідає середині діапазону значень сигналу яскравості (або сигналу кольоровості), асоційованого з CVS, наприклад, "сірого" зображення). Етап 4. Декодування кожного з одного або більш початкових зображень, для яких віртуальне опорне зображення формується з використанням відповідного сформованого віртуального опорного зображення, а також декодування всіх початкових зображень, що залишилися. (Декодування одного або більше початкових зображень виконується для того, щоб підтримувати початкові часові параметри CVS у відеодекодері, наприклад, в DPB відеодекодера, хоч, як показано нижче, декодовані початкові зображення можуть не виводитися або використовуватися як опорні зображення для інших зображень CVS). Етап 5. Задавання output_flag, асоційованого з кожним з декодованих одного або більше початкових зображень, які дорівнюють значенню "брехня" або 0, з тим щоб не виводити відповідне початкове зображення, навіть у випадку, якщо поточний output_flag дорівнює істині 11 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 або 1. (Альтернативно, технології можуть включати в себе просто ігнорування або "маскування" поточного output_flag, який дорівнює істині або 1, з тим, щоб не виводити відповідне початкове зображення). Етап 6. Запобігання використанню кожного з декодованих одного або більше початкових зображень як прогнозне (тобто опорне) зображення для інших зображень CVS, які йдуть після CRA-зображення як в порядку декодування, так і в порядку виведення. Додатково, технології, описані в даному документі, можуть бути застосовними до пристрою кодування (наприклад, відеокодера 20), а не декодування (наприклад, відеодекодера 30). Наприклад, у випадках, коли перше кодоване зображення CVS містить CRA-зображення, інтелектуальний відеокодер, який відповідає технологіям цього розкриття суті, може бути сконфігурований з можливістю не допускати відправки початкових зображень для CRAзображення у відеодекодер. Як один приклад, відеокодер може бути сконфігурований з можливістю відправляти тільки Р-зображення, які йдуть після CRA-зображення згідно з порядком декодування, асоційованим з CVS. Щоб досягати цього, відеокодер може бути сконфігурований з можливістю формувати так званий "піднабір" потоку бітів за допомогою відкидання всіх "одиниць доступу" або порівнянних наборів даних, які в деяких прикладах містять початкові зображення, асоційовані з CRA-зображенням. Відповідно, в альтернативному прикладі, проілюстрованому вище, відеокодер, а не відеодекодер може бути сконфігурований з можливістю обробляти (тобто видаляти) початкові зображення для CRA CVS як частину формування потоку бітів, який включає в себе CVS, з тим, щоб підвищувати функціональну сумісність і поліпшувати можливості роботи користувачів для довільного доступу для потоку бітів у відеодекодері. У зв'язку з цим, відповідно до технологій, описаних в даному документі, перше кодоване зображення CVS згідно з порядком декодування, асоційованим з CVS у відповідному потоці бітів, може бути IDR-зображенням або CRA-зображенням. Іншими словами, технології цього розкриття суті можуть забезпечувати довільний доступ, який здійснюється в CRA-зображенні CVS, за допомогою задавання потоку бітів, в якому перше кодоване зображення CVS згідно з порядком декодування, асоційованим з CVS, є CRA-зображенням, як відповідний потік бітів. Наприклад, технології цього розкриття суті можуть бути застосовними до конкретного стандарту кодування (наприклад, H.265/HEVC) або розширення стандарту кодування (наприклад, H.264/AVC). У будь-якому випадку, згідно з розкритими технологіями, такий потік бітів може бути відповідним потоком бітів. Іншими словами, такий потік бітів може бути успішно декодований за допомогою відеодекодера, відповідного технологіям цього розкриття суті, заданим і прогнозованим способом. Нижченаведений опис надає додаткову інформацію і приклади, пов'язані з технологіями цього розкриття суті, описаними вище, а також додаткову інформацію і технології. Зокрема, технології, описані в даному документі, можуть включати в себе один або більше наступних аспектів новизни, в порівнянні з іншими технологіями: (1) виявлення здійснення довільного доступу з не-IDR-зображення; (2) указування, що зображення не виводиться навіть у випадку, якщо відповідний передаваний в службових сигналах output_flag для зображення дорівнює істині або "1;" і (3) передача в службових сигналах оновлених параметрів часу видалення з буфера кодованих зображень (CPB) для зображень, що йдуть після не-IDR RAPзображення в порядку декодування, коли не-IDR RAP-зображення є першим кодованим зображенням потоку бітів, і коли початкові зображення, асоційовані з першим кодованим зображенням, не присутні. У деяких прикладах, відповідно до розкритих технологій, оновлені параметри часу видалення з CPB можуть вказуватися за допомогою зміщення, яке застосовується до всіх зображень, що йдуть після не-IDR RAP-зображення в порядку декодування, після виконання довільного доступу з не-IDR RAP-зображення. Технології, описані в даному документі, можуть бути застосовними до різних стандартів кодування відео, що включають в себе ITU-T H.261, ISO/IEC MPEG-1 Visual, ITU-T H.262 або ISO/IEC MPEG-2 Visual, ITU-T H.263, ISO/IEC MPEG-4 Visual і ITU-T H.264 (також відомий як ISO/IEC MPEG-4 AVC), що включає в себе його розширення масштабованого кодування відео (SVC) і кодування багатовидового відео (MVC). Крім цього, розкриті технології можуть бути застосовними до HEVC-стандарту, що розробляється в даний момент за допомогою JCT-VC Експертної групи в області кодування відео (VCEG) ITU-T і Експертної групи по кінозображенню (MPEG) ISO/IEC. Як пояснено вище, однією конкретною версією HEVC, що згадується в цьому розкритті суті, є WD4, описаний в документі JCTVC-F803. Далі описуються деякі технології DPB-керування. Згідно з деякими технологіями кодування відео, можуть бути реалізовані різні способи DPB-керування. Як один приклад, декодовані зображення, що використовуються для прогнозування подальших кодованих зображень і для 12 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 майбутнього виведення, можуть бути буферизовані в DPB. Щоб ефективно використовувати запам'ятовуючий пристрій процесів DPB, DPB-керування, що включають в себе процес зберігання декодованих зображень в DPB, може вказуватися процес маркування опорних зображень і процеси виведення і видалення декодованих зображень з DPB. DPB-керування може включати в себе щонайменше наступні аспекти: (1) ідентифікація зображень і ідентифікація опорних зображень; (2) складання списків опорних зображень; (3) маркування опорних зображень; (4) виведення з DPB; (5) вставка зображень в DPB; і (6) видалення зображень з DPB. Нижче надається деяке введення в маркування опорних зображень і складання списків опорних зображень. Як один приклад, далі описуються технології маркування списків опорних зображень. Згідно з деякими технологіями кодування відео, можуть бути реалізовані різні способи маркування опорних зображень. Як один приклад, маркування опорних зображень в H.264/AVC може узагальнюватися таким чином. Максимальне число, яке може згадуватися як "M" (наприклад, відповідне елементу num_ref_frames синтаксису), опорних зображень, що використовуються для інтер-прогнозування, може вказуватися в активному наборі параметрів послідовності (SPS). Коли опорне зображення декодується, воно може маркуватися як "використовується для посилання". Якщо декодування опорного зображення викликає маркування більше ніж M зображень як "використовується для посилання" щонайменше одне зображення може маркуватися як "не використовується для посилання". Потім, процес видалення DPB може видаляти зображення, марковані як "не використовується для посилання", з DPB, якщо зображення також не потрібні для виведення. Коли зображення декодується, воно може являти собою або неопорне зображення, або опорне зображення. Опорне зображення може бути довготривалим опорним зображенням або короткочасним опорним зображенням, і при маркуванні як "не використовується для посилання", зображення може ставати неопорним зображенням. H.264/AVC включає в себе операції маркування опорних зображень, які змінюють стан опорних зображень. Наприклад, в H.264/AVC, існує два типи операцій для маркування опорних зображень, а саме, вікно змінної тривалості і адаптивне керування запам'ятовуючим пристроєм. Робочий режим для маркування опорних зображень вибирається на основі зображень. Як один приклад, маркування опорних зображень на основі вікна змінної тривалості виступає як черга "перший на вході - перший на виході" (FIFO) з фіксованим числом короткочасних опорних зображень. Іншими словами, короткочасне опорне зображення з найбільш раннім часом декодування є першим на видалення (тобто на маркування як зображення "не використовується для посилання"), неявним способом. Як інший приклад, маркування опорних зображень при адаптивному керуванні запам'ятовуючим пристроєм видаляє короткочасні або довготривалі зображення явно. Це також забезпечує перемикання стану короткочасних і довготривалих зображень. Як інший приклад, далі описуються технології складання списків опорних зображень. Згідно з деякими технологіями кодування відео, можуть бути реалізовані різні способи складання списків опорних зображень. Як один приклад, типово, складання списків опорних зображень для першого або другого списку опорних зображень В-зображення може включати в себе два етапи: (1) ініціалізація списку опорних зображень і (2) переупорядковування списку опорних зображень (яке може згадуватися як "модифікація"). Ініціалізація списку опорних зображень може являти собою явний механізм, який вміщує опорні зображення в запам'ятовуючому пристрої опорних зображень (також відомому як DPB) в список на основі порядку значень POC (який, як пояснено вище, являє собою "номер в послідовності зображень" і суміщується з порядком виведення або порядком відображення зображення). Механізм переупорядковування списку опорних зображень може модифікувати позицію зображення, яке вміщене в список під час ініціалізації списку опорних зображень, в будь-яку нову позицію або вміщувати будь-яке опорне зображення в запам'ятовуючий пристрій опорних зображень в будь-якій позиції, навіть якщо зображення не належить ініціалізованому списку. Деякі зображення, після переупорядковування (або модифікації) списку опорних зображень, можуть бути вміщені в "дуже далекі" позиції в списку. Проте, якщо позиція зображення перевищує число активних опорних зображень списку, зображення може не розглядатися як запис кінцевого списку опорних зображень. Число активних опорних зображень може бути передане в службових сигналах в заголовку слайса для кожного списку. Альтернативно, інший підхід до DPB-керування описаний в документі "JCTVC-F493: Absolute Signaling of Reference Pictures", by Sjöberg et al., 6th Meeting, Torino, 2011 рік (далі згадується як JCTVC-F493), вміст якого повністю міститься по посиланню в даному документі. 13 UA 109981 C2 5 10 15 20 25 30 35 40 Далі описуються деякі технології на основі наборів опорних зображень (RPS). Наприклад, заявка на патент (США) № 13/622972, подана 19 вересня 2012 року, зміст якої також повністю міститься по посиланню в даному документі, описує RPS, який включає в себе, для кожного зображення, число опорних зображень, які можуть бути використані за допомогою поточного або поточного кодованого зображення і зображення після поточного кодованого зображення в порядку декодування. Докладне задавання RPS може надаватися таким чином: набір опорних зображень, асоційованих із зображенням, що складається зі всіх опорних зображень за винятком безпосередньо асоційованого зображення, який може використовуватися для інтерпрогнозування асоційованого зображення або будь-якого зображення після асоційованого зображення в порядку декодування і яке має елемент temporal_id синтаксису, який менший або дорівнює елементу temporal_id синтаксису асоційованого зображення. Далі описуються приклади RAP і відповідного RPS. Як пояснено вище, в цьому розкритті суті, "довільний доступ" означає декодування CVS, що починається з кодованого зображення, яке не є традиційним першим кодованим зображенням, тобто IDR-зображенням, в CVS. Не-IDR RAP-зображення, яке може згадуватися як "picR", може задаватися як кодоване зображення, для якого всі наступні умови є істинними: (1) picR не є IDR-зображенням; (2) нехай POC picR являє собою "rPoc", і нехай "picA" являє собою зображення в ідентичній CVS і що йде після picR як в порядку декодування, так і в порядку виведення, і нехай POC picA являє собою "aPoc". Коли довільний доступ виконується в picR, всі зображення, які знаходяться в ідентичній CVS і йдуть після picA в порядку виведення, можуть бути коректно декодовані. У цьому прикладі, для не-IDR RAP-зображення picR, якщо наступна умова є істинною, зображення може згадуватися як CRA-зображення: коли довільний доступ виконується в picR, всі зображення, які знаходяться в ідентичній CVS і йдуть після picR в порядку виведення, можуть бути коректно декодовані. Якщо вищезгадана умова не є істинною для не-IDR RAPзображення picR, зображення може згадуватися як зображення на основі поступового оновлення при декодуванні (GDR). Додатково, для CRA-зображення, відповідний RPS може не містити опорного зображення для CRA-зображення, але типово може містити щонайменше одне зображення для зображень, що йдуть після CRA-зображення в порядку декодування. Фіг. 4 є концептуальною схемою, яка ілюструє приклад опорних ієрархій між зображеннями GOP відеоданих, відповідно до технологій цього розкриття суті. Зокрема, фіг. 4 ілюструє ієрархічне кодування В-зображень з чотирма часовими рівнями і розміром GOP в 8. Як показано на фіг. 4, коли зображення з РОС-значенням, дорівнює 8, кодується як інтра- (тобто Iзображення), зображення може бути CRA-зображенням. На основі задавання RPS, RPS містить зображення з РОС-значенням, що дорівнює 0, для зображень після цього зображення в порядку декодування. Далі описуються початкові зображення і відповідні RPS. Як пояснено вище, зображення, що йдуть після RAP-зображення в порядку декодування, але які передують RAP-зображенню в порядку відображення, можуть згадуватися як відповідні "початкові зображення" для RAPзображення. У прикладі по фіг. 4, RPS відповідних початкових зображень для CRA-зображення (тобто зображення з РОС-значенням в 8) є такими, як показано в таблиці I нижче. Таблиця I POC 4 2 1 3 6 5 7 45 50 RPS {0, 8} {0, 8, 4} {0, 8, 4, 2} {8, 4, 2} {8, 4, 2} {8, 4, 6} {8, 6} Далі описуються технології виведення зображень. У HEVC WD4, кожному зображенню може призначатися output_flag. Коли цей прапор дорівнює значенню "брехня" або 0, відповідне зображення не використовується для виведення, і, отже, не повинне відображатися. Далі описується приклад CPB. CPB може вимагатися за допомогою відеодекодера для прийому і буферизації одиниць доступу, кожна з яких містить кодоване зображення і асоційовані одиниці рівня абстрагування від мережі (NAL), до того як вони декодуються. У HEVC WD4, наприклад, відсутні СРВ-операції, але, проте, можуть застосовуватися СРВ-операції, як указано 14 UA 109981 C2 5 10 15 20 25 30 35 40 45 50 55 60 в H.264/AVC. Як один приклад, згідно з H.264/AVC, для відповідного потоку бітів, список умов, як указано в підрозділі C.3 в H.264/AVC, може задовольнятися повністю. Дві з умов відповідності потоку бітів полягають в наступному: (1) СРВ-переповнення вказується як умова, в якому загальне число бітів в CPB перевищує СРВ-розмір. CPB може ніколи не переповнюватися; (2) СРВ-спустошення вказується як умова, в якому tr, n(n) менше "taf(n)". Коли low_delay_hrd_flag дорівнює 0, CPB може ніколи не спустошуватися. Далі пояснюються деякі потенційні проблеми вищеописаних технологій. Різні підходи, описані вище відносно довільного доступу, який здійснюється в CRA-зображенні, мають декілька недоліків. Як один приклад, у випадку, якщо початкове зображення не присутнє, відповідний декодер може не знати, втрачене початкове зображення внаслідок втрат при передачі або внаслідок навмисних відкидань зображень (наприклад, за допомогою сервера потокової передачі, навмисно для операції довільного доступу). Як інший приклад, початкові зображення не можуть бути коректно декодовані і, як наслідок, можуть порушувати можливості роботи користувачів при відображенні. Як ще один інший приклад, у випадку, якщо деякі кодовані зображення відкидаються навмисно, результуючий потік бітів, що починається з CRAзображення, може конфліктувати з однією або більше умовами відповідності потоку бітів, і, як наслідок, можуть виникати непередбачена поведінка при декодуванні і некеровані результати декодування. Наприклад, коли всі початкові зображення відкидаються, наступне зображення після CRA-зображення в порядку декодування стає кодованим зображенням після останнього початкового зображення в порядку декодування. У порівнянні з випадком, в якому присутні початкові зображення, це наступне зображення протікає CPB раніше за часом, і, отже, його кінцевий час taf(n) надходження в CPB стає раніше за часом. Час видалення з CPB, що витягується з елемента cpb_removal_delay синтаксису в асоційованому повідомленні з додатковою поліпшуючою інформацією (SEI) по синхронізації зображень, може не змінюватися. Таким чином, СРВ-спустошення не виникає. Проте, якщо число бітів цього зображення і наступних зображень в порядку декодування значно перевищує число бітів відкинутих початкових зображень, може виникати СРВ-переповнення. Це розкриття суті описує декілька технологій, які можуть, в деяких випадках, зменшувати або виключати деякі недоліки, описані вище. Зокрема, технології цього розкриття суті можуть вирішувати проблеми, описані вище, пов'язані з довільним доступом з CRA-зображень, за допомогою використання різних способів, щоб забезпечувати те, що потік бітів, для якого перше кодоване зображення є CRA-зображенням, є відповідним, незалежно від того, присутні чи ні початкові зображення, асоційовані з CRA-зображенням. Розкриті технології включають в себе щонайменше наступні аспекти, які можуть бути використані для того, щоб реалізовувати ознаки, описані вище. Як один приклад, необов'язково може додаватися процес для виявлення здійснення довільного доступу. Виявлення здійснення довільного доступу для кожного зображення і для кожного початкового зображення незалежно від того, призначене воно для декодування і/або виведення, може бути виконане за допомогою складання набору зникаючих зображень (VPS), який містить зображення, які не можуть бути коректно прийняті і декодовані внаслідок довільного доступу, але повинні бути коректно прийняті і декодовані в нормальному випадку. При умові, що VPS не є пустим, може вимагатися виявлення. Як інший приклад, обробка властивості виведення початкових зображень може бути виконана таким чином, що початкові зображення можуть не використовуватися для виведення, коли здійснюється випадковий доступ, що починається з асоційованого CRA-зображення. Як інший приклад, процеси декодування для початкового зображення можуть бути модифіковані таким чином, що якщо приймається початкове зображення, може виконуватися тільки синтаксичний аналіз високорівневого синтаксису і виклику асоційованих процесів декодування, наприклад, витягання набору опорних зображень (RPS), і декодування такого зображення може пропускатися. Як інший приклад, може додаватися обмеження потоку бітів таким чином, що навіть коли декодер починає декодування CRA-зображення, і відсутні початкові зображення, що йдуть після CRA-зображення, пов'язана з відповідністю CPB інформація, що включає в себе параметри гіпотетичного опорного декодера (HRD), SEI-повідомлення періоду буферизації зображень і SEI-повідомлення по синхронізації зображень, може бути використана для того, щоб задовольняти обмеженням CPB, і, як наслідок, не може виникати переповнення або спустошення буфера. Як інший приклад, SEI-повідомлення, асоційоване з CRA-зображенням, може бути передане в службових сигналах як таке, що включає в себе додатковий набір параметрів початкової 15 UA 109981 C2 5 10 затримки CPB, так що коли не присутні початкові зображення, обмеження на відповідність CPB можуть задовольнятися при застосуванні додаткового набору параметрів початкової затримки CPB. Більш конкретно, в SEI-повідомленні по періоду буферизації зображень, два набори параметрів початкової затримки CPB можуть бути передані в службових сигналах, якщо поточне зображення є CRA-зображенням. Наступні приклади демонструють вищеописані ознаки технологій цього розкриття суті. Для цілей опису наступних прикладів задаються наступні терміни: - початкове зображення: зображення, асоційоване з CRA-зображенням, яке йде за CRAзображенням в порядку декодування і передує CRA-зображенню в порядку виведення або. VPS: набір опорних зображень, асоційованих з CRA-зображенням, які мають порядок відображення раніше за часом порядку відображення CRA-зображення. Далі описуються приклади синтаксису і, зокрема, приклади синтаксису SEI-повідомлень по періоду буферизації. Таблиця II buffering_period (payloadSize) { seq_parameter_set_id cra_para_present_flag if(NalHrdBpPresentFlag) { for(SchedSelIdx=0; SchedSelIdx=taf(n), час видалення одиниці n доступу може вказуватися за допомогою наступного: tr(n)=tr, n(n), рівняння 9 (2) інакше (якщо low_delay_hrd_flag дорівнює 1, і tr, n(n)

Дивитися

Додаткова інформація

Назва патенту англійською

Random access with advanced decoded picture buffer (dpb) management in video coding

Автори англійською

Chen, Ying, Wang, Ye-Kui, Chen, Jianle

Назва патенту російською

Произвольный доступ с усовершенствованным управлением буфером декодированных изображений кадров (dpb) при кодировании видео

Автори російською

Чэнь Ин, Ван Е-Куй, Чэнь Цзяньлэ

МПК / Мітки

МПК: H04N 7/00

Мітки: кодуванні, dpb, доступ, кадрів, вдосконаленим, довільний, відео, буфером, керуванням, зображень, декодованих

Код посилання

<a href="https://ua.patents.su/45-109981-dovilnijj-dostup-z-vdoskonalenim-keruvannyam-buferom-dekodovanikh-zobrazhen-kadriv-dpb-pri-koduvanni-video.html" target="_blank" rel="follow" title="База патентів України">Довільний доступ з вдосконаленим керуванням буфером декодованих зображень кадрів (dpb) при кодуванні відео</a>

Подібні патенти