Форматы мультимедиа намного более сложны чем большинство других форматов файла из-за широкого разнообразия данных, которые они должны сохранить. Такие данные включают текст, данные изображения, аудио и видео данные, машинную мультипликацию, и другие формы двоичных данных, типа Цифрового интерфейса музыкальных инструментов (MIDI) и графические шрифты. Типичные форматы мультимедиа не определяют новые методы для того, чтобы сохранить эти типы данных. Вместо этого, они предлагают способность сохранить данные в одном или более существующих форматов данных.
Например, формат мультимедиа может содержать текст, сохраненный как PostScript или RTF, а не в обычном формате открытого текста ASCII. Растровые данные, могут быть сохранены как BMP или файлы TIFF, а не как необработанные точечные рисунки. Точно так же аудио, видео, и данные анимации могут быть сохранены, используя существующие форматы, поддерживаемые форматом файла мультимедиа.
Формат Windows Media - формат мультимедиа для приложений потоковой передачи, загрузки и воспроизведения, установленных на ПК, приставках и переносных устройствах. Формат Windows Media включает в себя кодеки для аудио и видео Windows Media, дополнительно интегрированную систему управления цифровыми правами (УЦП) и контейнер файлов.
Система управления цифровыми правами, интегрированная в формат Windows Media, предлагает поставщикам и продавцам содержимого гибкий формат для безопасного распределения содержимого с цифровыми правами. Внедрена схема лицензирования.
WMV
Файл Windows Media, который содержит как видео, так и аудио
WMA
Файл Windows Media, который содержит только аудио
WVX
Метафайл, в котором содержится ссылка на файл WMV (Windows Media Video)
WAX
Метафайл, в котором содержится ссылка на файл Windows Media Audio (WMA)
ASF
Структурированный файл ASF, содержащий аудио- и видеосодержимое, сжатое с помощью кодеков сторонних разработчиков
Контейнер файла ASF позволяет хранить следующие элементы в одном файле: аудио, видео с несколькими скоростями передачи данных, метаданные (например, название и автор файла), а также команды индекса и сценария (например, URL-адрес и закрытые подписи). Контейнер файла поддерживает файлы размером до 17 миллионов терабайт.
Чтобы обеспечить связь содержимого с поддерживаемыми проигрывателями, предусмотрено несколько расширений файлов. Используемые расширения файлов должны быть следующими:
WMA для файлов, которые содержат аудио, сжатое с помощью кодека Windows Media Audio или WMV для файлов, которые содержат аудио и видео, сжатые с помощью кодеков Windows Media Audio и Windows Media Video.
Содержимое, сжатое с помощью других кодеков, должно храниться в файле с расширением ASF. Благодаря использованию разных расширений пользователи могут устанавливать несколько проигрывателей в одной системе, некоторые из которых могут воспроизводить только аудио с расширением WMA, а другие проигрыватели - аудио и видео с расширением WMV
ASX
Метафайл, в котором содержится ссылка на структурированный файл ASF
RIFF
RIFF (англ. Resource Interchange File Format) — один из форматов файлов-контейнеров для хранения мультимедиа-данных (видео, аудио). Наиболее известными форматами, использующими RIFF в качестве контейнера, являются: AVI (видео), WAV (аудио), RMI (MIDI-треки). Разработан он был в 1991 году компаниями Microsoft и IBM.
Основной концепцией RIFF-формата является chunk, порция данных с заголовком и сигнатурой, указывающей на содержимое chunk'а.
Формат chunk'а
DWORD DWORD
FOURCC |
Размер |
Данные |
Первое двойное слово заголовка содержит четырехбуквенный код FOURCC, который идентифицирует данные, хранящиеся во фрагменте. FOURCC занимает 4 байта; это размер 32-битного числа, так что иногда FOURCC записывают в виде числа (представления числа в ASCII little-endian).
Например:
FOURCC число (шестнадцатиричное) число (десятичное)
'RIFF' 0x46464952 1179011410
'AVI ' 0x20495641 541677121
'XVID' 0x44495658 1145656920
'idx1' 0x31786469 829973609
Второе двойное слово заголовка - размер области данных в байтах (без учета размера самого заголовка).
Область данных имеет переменную длину, однако она должна быть выравнена на границу слова и при необходимости дополнена в конце нулевым байтом до целого числа слов.
Два типа chunk'ов RIFF и LIST могут содержать внутри себя вложенные chunk'и. Весь файл представляет собою единый RIFF-chunk (это одна из причин ограничения размера файла).
RIFF
Chunk с ckID = 'RIFF' имеет следующую структуру ckData:
FOURCC FormType тип содержимого
BYTE[] ck содержимое
Наиболее распростанённые типы:
'AVI ' - AVI: содержат видео и аудио информацию.
'WAVE' - WAV: содержит звуковую информацию
'RMID' - RMI: содержит музыку в формате MIDI
Другие типы:
'RDIB' - англ. RIFF Device Independent Bitmap формат хранения изображений
'RMMP' - англ. RIFF Multimedia Movie File
'PAL ' - англ. Palette Format
LIST
Chunk 'LIST' имеет формат, аналогичный RIFF, первые 4 байта содержат ListType (тип вложенного chunk'а), далее до конца чанка следует вложенный chunk. В рамках формата AVI внутри LIST содержатся chunk'и с заголовоком файла, заголовками потоков. Так же chunk IST используется для хранения информации о содержимом.
Для выравнивания блоков данных по размеру сектора на носителе для обеспечения скорости перемотки и доступа существуют два chunk'а: 'JUNK' и 'PAD', которые "ничего не значат", которые пропускаются программами воспроизведения. Изначально предполагалось, что при создании файла эти chunk'и будут просто заполненны нулями, однако некоторые програмы редактирования видео хранят там свою сигнатуру. (Например, так поступает Virtual Dub).
INFO - специальный ListType для хранения информации о содержимом файла. INFO не влияет на то, как программы работают с файлом, эта информация (большей частью) показывается пользователю.. Список chunk'ов для INFO:
IARL (Archival Location) - место архивного хранения документа (практически не используется)
IART (Artist) - список авторов произведения (стандартный тэг, отображается практически во всех плеерах).
ICMS (Commissioned) - список лиц, предоставивших содержимое файла. (не используется)
ICMT (Comments) - комментарий. (отображается практически по всех плеерах)
ICOP (Copyright) - информация об авторских правах.
ICRD (Creation date) - Дата создания оригинального произведения. Формат YYYY-MM-DD. (редко используется).
ICRP (Cropped) - данные об обрезке произведения. (не используется).
IDIM (Dimensions) - Физические размеры оригинала. (не используется).
IDPI (Dots Per Inch) - DPI оригинала. (не используется)
IENG (Engineer) - фамилии, создававших файл. (не используется).
IGNR (Genre) - жанр. (частично поддерживается)
IKEY (Keywords) - список ключевых слов, относящихся к произведению. (не используется)
ILGT (Lightness) - степень освещённости оригинала (зависит от оборудования оцифровки) (не используется).
IMED (Medium) - тип носителя оригинала (не используется)
INAM (Name) - название произведения. Существуют разногласия о том, следует использовать INAM или ISBJ для сохранения заголовка произведения. (стандартный тэг, поддерживается и часто испольуется)
IPLT (Palette Setting) - количество цветов при оцифровке. (не используется).
IPRD (Product) - заголовок продукта, для которого в оригинале предназначалось произведение. (не используется)
ISBJ (Subject) - описывает содержимое файла. Периодически, наравне с INAM, используется для хранения заголовка. (используется)
ISFT (Software) - ПО, использованное для создания файла. Обычно автоматически заполняется программами по редактированию, но не отображается в списке тэгов. (используется)
ISHP (Sharpness) - необходимый уровень резкости для воссоздания произведения. (не используется)
ISRC (Source) - название организации, предоставившей произведение. (не используется)
ISRF (Source Form) - форма оригинального произведения (бумага/слайд и т. д.) (не используется)
ITCH (Technician) - специалист, производивший оцифровку (не используется)
Стандарт сжатия MPEG разработан Экспертной группой кинематографии (Moving Picture Experts Group - MPEG). MPEG это стандарт на сжатие звуковых и видео файлов в более удобный для загрузки или пересылки, например через интернет, формат. Существуют разные стандарты MPEG (как их еще иногда называют фазы - phase): MPEG-1, MPEG-2, MPEG-3, MPEG-4, MPEG-7. MPEG состоит из трех частей: Audio , Video, System (объединение и синхронизация двух других).
Стандарт выпущен в 1992 г. По данному стандарту потоки видео и звуковых данных передаются со скоростью 1-3 Мбит в секунду - фактически со скоростью односкоростного CD-ROM проигрывателя - и управляются путем выборки ключевых видео кадров и заполнением только областей, изменяющихся между кадрами. MPEG-1 обеспечивает качество видеоизображения более низкое, чем видео, передаваемое по телевизионным стандартам (сравнимо с качеством VHS видео).
Выпущен в 1995 г. Более 97% цифровых данных, представляющих видео сигнал дублируются, т.е. являются избыточными и могут быть сжаты без ущерба качеству изображения. Алгоритм MPEG-2 анализирует видеоизображение в поисках повторений, называемых избыточностью. В результате процесса удаления избыточности, обеспечивается превосходное видеоизображение в формате MPEG-2 при более низкой скорости передачи данных. По этой причине, современные средства поставки видеопрограмм, такие как цифровые спутниковые системы и DVD, используют именно стандарт MPEG-2.
Параметры изображения: 720 ppl x 576 lpf при 25 fps или 640 х 480 х 30. Стандарт предназначен для каналов связи, обеспечивающих скорость передачи данных 3-10 Мбит/с для обычного телевизионного стандарта и 15-30 Мбит/с для телевидения высокой четкости (ТВЧ). В стандарте обеспечивается совместимость "вперед", т.е. MPEG-2 декодер может декодировать поток данных формата MPEG-1.
Стандарт MPEG-2 также состоит из трех основных частей: системной, видео и звуковой. Системная часть описывает форматы кодирования для мультиплексирования звуковой, видео- и другой информации, рассматривает вопросы комбинирования одного или более потоков данных в один или множество потоков, пригодных для хранения или передачи.
MPEG4 имеет дело не просто с потоками и массивами медиа-данных, а с медиа-объектами (это ключевое понятие стандарта). Объекты могут быть аудио-, видео-, аудиовизуальными, графическими (плоскими и трехмерными), текстовыми. Они могут быть как "естественными" (записанными, отснятыми, отсканированными и т. п.), так и синтетическими (т. е. искусственно сгенерированными). Примерами объектов могут служить неподвижный фон, видеоперсонажи отдельно от фона (на прозрачном фоне), синтезированная на основе текста речь, музыкальные фрагменты, трехмерная модель, которую можно двигать и вращать в кадре, анимированный спрайт. Каждый медиа-объект имеет связанный с ним набор дескрипторов, где и задаются все его свойства, операции, необходимые для декодирования ассоциированных с ним потоковых данных, размещения в сцене, а также поведение и допустимые реакции на воздействия пользователя. Из объектов строятся сцены. Сцена имеет свою систему координат, в соответствии с которой размещаются объекты. Звуковые объекты также могут иметь (и менять во времени) координаты в пространстве сцены, благодаря чему достигаются стерео- и surround эффекты. Объекты могут быть элементарными (primitive) и составными (compound), т. е. представляющими ту или иную композицию элементарных объектов (например, сгенерированный трехмерный телевизор, наложенная на его экран живая видеотрансляция и исходящий из его динамиков звук). Стандарт задает правила кодирования различных объектов, их иерархии и способы композиции при построении сцены, а также методы взаимодействия пользователя с отдельными объектами внутри сцены. Каждый объект имеет свою локальную систему координат - с ее помощью объект управляется в пространстве и во времени. Сцена описывается с помощью иерархической структуры; узлами этой структуры являются объекты, и она динамически перестраивается по мере того, как узлы-объекты добавляются, удаляются или заменяются.
Новый стандарт MPEG7 не является непосредственным продолжением линейки MPEG-предшественников, хотя по предмету стандартизации частично перекликается с ними. MPEG7 должен обеспечивать формализацию и стандартизацию описания различных типов мультимедийной информации (а не ее кодирования), чтобы гарантировать эффективный и быстрый ее поиск. Официально новый стандарт называют Multimedia Content Description Interface - интерфейс описания мультимедийных данных. В нем определен стандартный набор дескрипторов ("описывателей") для различных типов мультимедиа-информации. Здесь также стандартизируется способ определения своих дескрипторов и их взаимосвязи (Description Schemes). Для этих целей в MPEG7 вводится специализированный язык DDL (Description Definition Language - язык описания определений).
Основная цель применения нового стандарта - эффективный поиск мультимедийной информации аналогично тому, как сейчас мы осуществляем поиск текстов по ключевым словам или фразе. Как пример:
Matroska (русский вариант — Матрёшка) — проект, нацеленный на создание открытого гибкого кросс-платформенного (включая аппаратные платформы) стандарта форматов мультимедийных контейнеров и набора инструментов и библиотек для работы с данными в этом формате. Этот проект аудио/видео контейнера не включает в себя форматов сжатия видео и кодеков (таких, как MP3 или JPEG). Это упаковка, которая может содержать большое число потоков аудио, видео и субтитров, позволяя пользователю хранить в одном файле целый фильм и проигрывать его мультимедиа-проигрывателем.
Matroska является открытым проектом (open standard). Это означает, что для персонального использования она абсолютно бесплатна, а техническая спецификация формата битового потока доступна любому, даже компаниям, желающим встроить поддержку формата в свои продукты.
DWF - единственный формат, поддерживаемый на данный момент для загрузки. Design Web FormatT - это открытый формат файлов, разработанный c целью организации обмена проектными данными (3D модели из САПР и чертежи) для их просмотра, печати и рецензирования. Представляет из себя контейнер (zip архив), содержащий в себе несколько видов данных:
1. Электромагнитная волна (в религиозной терминологии релятивизма - "свет") имеет строго постоянную скорость 300 тыс.км/с, абсурдно не отсчитываемую ни от чего. Реально ЭМ-волны имеют разную скорость в веществе (например, ~200 тыс км/с в стекле и ~3 млн. км/с в поверхностных слоях металлов, разную скорость в эфире (см. статью "Температура эфира и красные смещения"), разную скорость для разных частот (см. статью "О скорости ЭМ-волн")
2. В релятивизме "свет" есть мифическое явление само по себе, а не физическая волна, являющаяся волнением определенной физической среды. Релятивистский "свет" - это волнение ничего в ничем. У него нет среды-носителя колебаний.
3. В релятивизме возможны манипуляции со временем (замедление), поэтому там нарушаются основополагающие для любой науки принцип причинности и принцип строгой логичности. В релятивизме при скорости света время останавливается (поэтому в нем абсурдно говорить о частоте фотона). В релятивизме возможны такие насилия над разумом, как утверждение о взаимном превышении возраста близнецов, движущихся с субсветовой скоростью, и прочие издевательства над логикой, присущие любой религии.
4. В гравитационном релятивизме (ОТО) вопреки наблюдаемым фактам утверждается об угловом отклонении ЭМ-волн в пустом пространстве под действием гравитации. Однако астрономам известно, что свет от затменных двойных звезд не подвержен такому отклонению, а те "подтверждающие теорию Эйнштейна факты", которые якобы наблюдались А. Эддингтоном в 1919 году в отношении Солнца, являются фальсификацией. Подробнее читайте в FAQ по эфирной физике.