к библиотеке   к мультимедиа технологиям   высокоуровн. языки - 3GL   визуальные среды - 4GL   технологии программирования

Форматы мультимедиа

Форматы мультимедиа намного более сложны чем большинство других форматов файла из-за широкого разнообразия данных, которые они должны сохранить. Такие данные включают текст, данные изображения, аудио и видео данные, машинную мультипликацию, и другие формы двоичных данных, типа Цифрового интерфейса музыкальных инструментов (MIDI) и графические шрифты. Типичные форматы мультимедиа не определяют новые методы для того, чтобы сохранить эти типы данных. Вместо этого, они предлагают способность сохранить данные в одном или более существующих форматов данных.

Например, формат мультимедиа может содержать текст, сохраненный как PostScript или RTF, а не в обычном формате открытого текста ASCII. Растровые данные, могут быть сохранены как BMP или файлы TIFF, а не как необработанные точечные рисунки. Точно так же аудио, видео, и данные анимации могут быть сохранены, используя существующие форматы, поддерживаемые форматом файла мультимедиа.

Формат Windows Media

Формат Windows Media - формат мультимедиа для приложений потоковой передачи, загрузки и воспроизведения, установленных на ПК, приставках и переносных устройствах. Формат Windows Media включает в себя кодеки для аудио и видео Windows Media, дополнительно интегрированную систему управления цифровыми правами (УЦП) и контейнер файлов.

Система управления цифровыми правами, интегрированная в формат Windows Media, предлагает поставщикам и продавцам содержимого гибкий формат для безопасного распределения содержимого с цифровыми правами. Внедрена схема лицензирования.

Справочник по расширениям файлов Windows Media

WMV

Файл Windows Media, который содержит как видео, так и аудио

WMA

Файл Windows Media, который содержит только аудио

WVX

Метафайл, в котором содержится ссылка на файл WMV (Windows Media Video)

WAX

Метафайл, в котором содержится ссылка на файл Windows Media Audio (WMA)

ASF

Структурированный файл ASF, содержащий аудио- и видеосодержимое, сжатое с помощью кодеков сторонних разработчиков

Контейнер файла ASF позволяет хранить следующие элементы в одном файле: аудио, видео с несколькими скоростями передачи данных, метаданные (например, название и автор файла), а также команды индекса и сценария (например, URL-адрес и закрытые подписи). Контейнер файла поддерживает файлы размером до 17 миллионов терабайт.

Чтобы обеспечить связь содержимого с поддерживаемыми проигрывателями, предусмотрено несколько расширений файлов. Используемые расширения файлов должны быть следующими:

WMA для файлов, которые содержат аудио, сжатое с помощью кодека Windows Media Audio или WMV для файлов, которые содержат аудио и видео, сжатые с помощью кодеков Windows Media Audio и Windows Media Video.

Содержимое, сжатое с помощью других кодеков, должно храниться в файле с расширением ASF. Благодаря использованию разных расширений пользователи могут устанавливать несколько проигрывателей в одной системе, некоторые из которых могут воспроизводить только аудио с расширением WMA, а другие проигрыватели - аудио и видео с расширением WMV

ASX

Метафайл, в котором содержится ссылка на структурированный файл ASF

RIFF

RIFF (англ. Resource Interchange File Format) — один из форматов файлов-контейнеров для хранения мультимедиа-данных (видео, аудио). Наиболее известными форматами, использующими RIFF в качестве контейнера, являются: AVI (видео), WAV (аудио), RMI (MIDI-треки). Разработан он был в 1991 году компаниями Microsoft и IBM.

Основной концепцией RIFF-формата является chunk, порция данных с заголовком и сигнатурой, указывающей на содержимое chunk'а.

Формат chunk'а

DWORD DWORD

FOURCC

Размер

Данные

Первое двойное слово заголовка содержит четырехбуквенный код FOURCC, который идентифицирует данные, хранящиеся во фрагменте. FOURCC занимает 4 байта; это размер 32-битного числа, так что иногда FOURCC записывают в виде числа (представления числа в ASCII little-endian).

Например:

FOURCC число (шестнадцатиричное) число (десятичное)

'RIFF' 0x46464952 1179011410

'AVI ' 0x20495641 541677121

'XVID' 0x44495658 1145656920

'idx1' 0x31786469 829973609

Второе двойное слово заголовка - размер области данных в байтах (без учета размера самого заголовка).

Область данных имеет переменную длину, однако она должна быть выравнена на границу слова и при необходимости дополнена в конце нулевым байтом до целого числа слов.

Два типа chunk'ов RIFF и LIST могут содержать внутри себя вложенные chunk'и. Весь файл представляет собою единый RIFF-chunk (это одна из причин ограничения размера файла).

Стандартные chunk'и

RIFF

Chunk с ckID = 'RIFF' имеет следующую структуру ckData:

FOURCC FormType тип содержимого

BYTE[] ck содержимое

Наиболее распростанённые типы:

'AVI ' - AVI: содержат видео и аудио информацию.

'WAVE' - WAV: содержит звуковую информацию

'RMID' - RMI: содержит музыку в формате MIDI

Другие типы:

'RDIB' - англ. RIFF Device Independent Bitmap формат хранения изображений

'RMMP' - англ. RIFF Multimedia Movie File

'PAL ' - англ. Palette Format

LIST

Chunk 'LIST' имеет формат, аналогичный RIFF, первые 4 байта содержат ListType (тип вложенного chunk'а), далее до конца чанка следует вложенный chunk. В рамках формата AVI внутри LIST содержатся chunk'и с заголовоком файла, заголовками потоков. Так же chunk IST используется для хранения информации о содержимом.

JUNK и PAD

Для выравнивания блоков данных по размеру сектора на носителе для обеспечения скорости перемотки и доступа существуют два chunk'а: 'JUNK' и 'PAD', которые "ничего не значат", которые пропускаются программами воспроизведения. Изначально предполагалось, что при создании файла эти chunk'и будут просто заполненны нулями, однако некоторые програмы редактирования видео хранят там свою сигнатуру. (Например, так поступает Virtual Dub).

INFO

INFO - специальный ListType для хранения информации о содержимом файла. INFO не влияет на то, как программы работают с файлом, эта информация (большей частью) показывается пользователю.. Список chunk'ов для INFO:

IARL (Archival Location) - место архивного хранения документа (практически не используется)

IART (Artist) - список авторов произведения (стандартный тэг, отображается практически во всех плеерах).

ICMS (Commissioned) - список лиц, предоставивших содержимое файла. (не используется)

ICMT (Comments) - комментарий. (отображается практически по всех плеерах)

ICOP (Copyright) - информация об авторских правах.

ICRD (Creation date) - Дата создания оригинального произведения. Формат YYYY-MM-DD. (редко используется).

ICRP (Cropped) - данные об обрезке произведения. (не используется).

IDIM (Dimensions) - Физические размеры оригинала. (не используется).

IDPI (Dots Per Inch) - DPI оригинала. (не используется)

IENG (Engineer) - фамилии, создававших файл. (не используется).

IGNR (Genre) - жанр. (частично поддерживается)

IKEY (Keywords) - список ключевых слов, относящихся к произведению. (не используется)

ILGT (Lightness) - степень освещённости оригинала (зависит от оборудования оцифровки) (не используется).

IMED (Medium) - тип носителя оригинала (не используется)

INAM (Name) - название произведения. Существуют разногласия о том, следует использовать INAM или ISBJ для сохранения заголовка произведения. (стандартный тэг, поддерживается и часто испольуется)

IPLT (Palette Setting) - количество цветов при оцифровке. (не используется).

IPRD (Product) - заголовок продукта, для которого в оригинале предназначалось произведение. (не используется)

ISBJ (Subject) - описывает содержимое файла. Периодически, наравне с INAM, используется для хранения заголовка. (используется)

ISFT (Software) - ПО, использованное для создания файла. Обычно автоматически заполняется программами по редактированию, но не отображается в списке тэгов. (используется)

ISHP (Sharpness) - необходимый уровень резкости для воссоздания произведения. (не используется)

ISRC (Source) - название организации, предоставившей произведение. (не используется)

ISRF (Source Form) - форма оригинального произведения (бумага/слайд и т. д.) (не используется)

ITCH (Technician) - специалист, производивший оцифровку (не используется)

Стандарты MPEG

Стандарт сжатия MPEG разработан Экспертной группой кинематографии (Moving Picture Experts Group - MPEG). MPEG это стандарт на сжатие звуковых и видео файлов в более удобный для загрузки или пересылки, например через интернет, формат. Существуют разные стандарты MPEG (как их еще иногда называют фазы - phase): MPEG-1, MPEG-2, MPEG-3, MPEG-4, MPEG-7. MPEG состоит из трех частей: Audio , Video, System (объединение и синхронизация двух других).

MPEG1

Стандарт выпущен в 1992 г. По данному стандарту потоки видео и звуковых данных передаются со скоростью 1-3 Мбит в секунду - фактически со скоростью односкоростного CD-ROM проигрывателя - и управляются путем выборки ключевых видео кадров и заполнением только областей, изменяющихся между кадрами. MPEG-1 обеспечивает качество видеоизображения более низкое, чем видео, передаваемое по телевизионным стандартам (сравнимо с качеством VHS видео).

MPEG2

Выпущен в 1995 г. Более 97% цифровых данных, представляющих видео сигнал дублируются, т.е. являются избыточными и могут быть сжаты без ущерба качеству изображения. Алгоритм MPEG-2 анализирует видеоизображение в поисках повторений, называемых избыточностью. В результате процесса удаления избыточности, обеспечивается превосходное видеоизображение в формате MPEG-2 при более низкой скорости передачи данных. По этой причине, современные средства поставки видеопрограмм, такие как цифровые спутниковые системы и DVD, используют именно стандарт MPEG-2.

Параметры изображения: 720 ppl x 576 lpf при 25 fps или 640 х 480 х 30. Стандарт предназначен для каналов связи, обеспечивающих скорость передачи данных 3-10 Мбит/с для обычного телевизионного стандарта и 15-30 Мбит/с для телевидения высокой четкости (ТВЧ). В стандарте обеспечивается совместимость "вперед", т.е. MPEG-2 декодер может декодировать поток данных формата MPEG-1.

Стандарт MPEG-2 также состоит из трех основных частей: системной, видео и звуковой. Системная часть описывает форматы кодирования для мультиплексирования звуковой, видео- и другой информации, рассматривает вопросы комбинирования одного или более потоков данных в один или множество потоков, пригодных для хранения или передачи.

MPEG4

MPEG4 имеет дело не просто с потоками и массивами медиа-данных, а с медиа-объектами (это ключевое понятие стандарта). Объекты могут быть аудио-, видео-, аудиовизуальными, графическими (плоскими и трехмерными), текстовыми. Они могут быть как "естественными" (записанными, отснятыми, отсканированными и т. п.), так и синтетическими (т. е. искусственно сгенерированными). Примерами объектов могут служить неподвижный фон, видеоперсонажи отдельно от фона (на прозрачном фоне), синтезированная на основе текста речь, музыкальные фрагменты, трехмерная модель, которую можно двигать и вращать в кадре, анимированный спрайт. Каждый медиа-объект имеет связанный с ним набор дескрипторов, где и задаются все его свойства, операции, необходимые для декодирования ассоциированных с ним потоковых данных, размещения в сцене, а также поведение и допустимые реакции на воздействия пользователя. Из объектов строятся сцены. Сцена имеет свою систему координат, в соответствии с которой размещаются объекты. Звуковые объекты также могут иметь (и менять во времени) координаты в пространстве сцены, благодаря чему достигаются стерео- и surround эффекты. Объекты могут быть элементарными (primitive) и составными (compound), т. е. представляющими ту или иную композицию элементарных объектов (например, сгенерированный трехмерный телевизор, наложенная на его экран живая видеотрансляция и исходящий из его динамиков звук). Стандарт задает правила кодирования различных объектов, их иерархии и способы композиции при построении сцены, а также методы взаимодействия пользователя с отдельными объектами внутри сцены. Каждый объект имеет свою локальную систему координат - с ее помощью объект управляется в пространстве и во времени. Сцена описывается с помощью иерархической структуры; узлами этой структуры являются объекты, и она динамически перестраивается по мере того, как узлы-объекты добавляются, удаляются или заменяются.

MPEG7

Новый стандарт MPEG7 не является непосредственным продолжением линейки MPEG-предшественников, хотя по предмету стандартизации частично перекликается с ними. MPEG7 должен обеспечивать формализацию и стандартизацию описания различных типов мультимедийной информации (а не ее кодирования), чтобы гарантировать эффективный и быстрый ее поиск. Официально новый стандарт называют Multimedia Content Description Interface - интерфейс описания мультимедийных данных. В нем определен стандартный набор дескрипторов ("описывателей") для различных типов мультимедиа-информации. Здесь также стандартизируется способ определения своих дескрипторов и их взаимосвязи (Description Schemes). Для этих целей в MPEG7 вводится специализированный язык DDL (Description Definition Language - язык описания определений).

Основная цель применения нового стандарта - эффективный поиск мультимедийной информации аналогично тому, как сейчас мы осуществляем поиск текстов по ключевым словам или фразе. Как пример:

Matroska / Матрёшка

Matroska (русский вариант — Матрёшка) — проект, нацеленный на создание открытого гибкого кросс-платформенного (включая аппаратные платформы) стандарта форматов мультимедийных контейнеров и набора инструментов и библиотек для работы с данными в этом формате. Этот проект аудио/видео контейнера не включает в себя форматов сжатия видео и кодеков (таких, как MP3 или JPEG). Это упаковка, которая может содержать большое число потоков аудио, видео и субтитров, позволяя пользователю хранить в одном файле целый фильм и проигрывать его мультимедиа-проигрывателем.

Matroska является открытым проектом (open standard). Это означает, что для персонального использования она абсолютно бесплатна, а техническая спецификация формата битового потока доступна любому, даже компаниям, желающим встроить поддержку формата в свои продукты.

DWF

DWF - единственный формат, поддерживаемый на данный момент для загрузки. Design Web FormatT - это открытый формат файлов, разработанный c целью организации обмена проектными данными (3D модели из САПР и чертежи) для их просмотра, печати и рецензирования. Представляет из себя контейнер (zip архив), содержащий в себе несколько видов данных:


Создать файлы DWF позволяют многие программы от Autodesk: 3Ds Max, AutoCAD, Inventor.
С помощью плагинов:

Для программистов на C++ есть SDK Autodesk DWF Toolkit
Вьюверы для DWF:

В случае с 3D, на сервере DWF файл конвертируется в полигональную модель в виде набора точек в трехмерных координатах, полигонов и их нормалей:
Точки: :[-1.33467,-1.58853,-3.13264,-1.3545,-1.59411,-3.12694]
Координаты нормалей: :[-0.47497,0.875358,-0.0902835,-0.0977853,0.989588,-0.105608]
Индексы точек точек для полигонов: :[0,1]


Знаете ли Вы, что, как и всякая идолопоклонническая религия, релятивизм представляет собой инструмент идеологического подчинения одних людей другим с помощью абсолютно бессовестной манипуляции их психикой для достижения интересов определенных групп людей, стоящих у руля этой воровской машины? Подробнее читайте в FAQ по эфирной физике.

Bourabai Research Institution home page

Bourabai Research - Технологии XXI века Bourabai Research Institution