報告書
平成19年6月21日
報告者:佐藤 毅
計画名:電子書籍プロジェクト
開催日:平成19年6月21日
メンバ:末廣一美(リーダ)、佐藤毅、佐藤祐希、山田雄大
目 的:Webという形で広く普及した書籍レイアウトをさらに拡張することで、情報受け取り側がメディアを選択可能にすることの有効性を明らかにすることを目的とする。
1.はじめに
今回の報告は、1)電子書籍で使われているファイルフォーマットとは何か、2)zipの概要、3)文書・画像・音声・動画に使われているファイルフォーマットの概要、4)ファイルフォーマットの種類、について報告する。
2.報告内容
1)電子書籍で使われているファイルフォーマットとは何か。
ファイルフォーマットはコンピュータ上で利用するファイルの保存形式を指す。コンピュータで扱う文書、音声、画像、動画などのさまざまなメディアのファイルを特定の利用方法やアプリケーションソフトウェアで共通に扱うための形式や規格のこと。通常、すべてのファイルは単なるテキストまたはバイナリファイルであるので、ファイルの内容だけからはそのファイルフォーマットを知ることが困難な場合がある。このため、ファイル名に拡張子をつけて識別したり、ネットワークでの転送時にはMIMEヘッダ等をあわせて送るといった方法がとられる。しかし、拡張子は簡単に、しかも自由に編集できるため、信頼性は極めて低い。そのため、多くのファイルフォーマットは、ファイルの先頭にマジックナンバーと呼ばれる、より確実にファイル形式を識別するための情報を付加する。
2)zipの概要
日本ではLHA (LZH) とシェアが拮抗しているが、世界ではほとんどの圧縮アーカイブがこの形式を使っている。オリジナルのソフトウェアはシェアウェアとして販売されているが、ZIP形式を扱える多くのアプリケーションソフトウェアがフリーソフトとして配布されている。ソースも互換性のある亜種がオープンソースとして一般に公開されているので、事実上フリーの形式と言える。
アップルはMac OS Xへの移行と同時に解凍圧縮に標準対応、マイクロソフトはWindows MeおよびWindows XPに圧縮解凍機能を搭載させ(日本語版OSでは「圧縮フォルダ (ZIP)」という名称の機能)、自動的に日本国内でも使用者が増えている。
3)文書・画像・音声・動画に使われているファイルフォーマットの概要
3-1)プレーンテキスト
レイアウト情報や修飾情報を持たない、純粋に文字のみで構成されるデータ。これをファイルに格納したものは「テキストファイル」と呼ばれる。画像ファイルなどはバイナリデータであるため明らかにプレーンテキストではないが、ワープロ文書やHTMLファイルなども、本文以外に付加情報を持っているため、プレーンテキストではない。プレーンテキストはほとんどのOSやアプリケーションソフトで扱うことができるので、ワープロソフトなどは保存形式の一つとしてプレーンテキストを選択できるようになっている。ただし、ワープロで作成した文書をプレーンテキストで保存すると、字飾りや文字の大きさなどを指定した修飾情報は失われる。
3-2)BMP
マイクロソフトとIBMがWindowsとOS/2にわかれる前のOSを共同で開発していたころに作られた画像ファイル形式。圧縮の方法についても定義されているが、Windowsが標準では無圧縮のファイルを生成するため、他のアプリケーションにおいても、無指定時は、圧縮はされていない場合が多い。ファイル形式の細部の変更が何度か行われており、その結果としてWindowsとOS/2で多少ファイル形式が異なることがある。
3-3)MP3
デジタル化された音声を圧縮する音声ファイルフォーマットのひとつ。コンパクトディスクなどのPCM音声を、通常の鑑賞に堪える範囲で元データの約1/10まで圧縮することができる。
3-4)AVI
Windows標準の動画用ファイルフォーマットで、AVIファイル、AVIコンテナなどと呼ばれている。AVI自体は入れ物でしかなく、任意のコーデックでエンコードされた動画や音声のデータを格納できる。そのため再生には適切なコーデックを用意する必要があり、PCに対する初心者を中心に「AVIファイルが再生できない」「コーデックってなんですか」といったトラブルが発生しやすい。
ファイルフォーマットの種類。
文書、画像、音声、動画で使われているファイルフォーマットの種類を表ごとにまとめた。
表1 テキスト、ハイパーテキスト、ドキュメント
プレーンテキスト
RTF (Rich Text Format)
HTML (HyperText Markup Language)
XHTML (Extensible HyperText Markup Language)
MHTML (MIME Encapsulation of Aggregate HTML Documents)
ODF (OpenDocument Format)
PDF (Portable Document Format)
DjVu
XML (Extensible Markup Language)
XSL - XSLT (Extensible Stylesheet Language / XSL Transformations)
RDF (Resource Description Framework)
RSS (RDF Site Summary / Rich Site Summary / Really Simple Syndication)
SGML (Standard Generalized Markup Language)
CSS (Cascading Style Sheets)
Comma-Separated Values (CSV, Comma Separated Values)
Adobe Photoshop (PSD)
Adobe Illustrator (AI)
PostScript (PS)
BMP (Microsoft Windows Bitmap Image)
DPX (Digital Picture Exchange)
FlashPix
GIF (Graphics Interchange Format)
HD Photo
JPEG (Joint Photographic Experts Group)
JPEG 2000
MAG (Maki chan Graphic Loader 2)
OpenEXR
PICT (QuickDraw Picture)
PNG (Portable Network Graphics)
RAW画像
DNG (Digital Negative)
TGA (Truevision Graphics Adapter)
TIFF (Tagged Image File Format)
SVG (Scalable Vector Graphics)
WMF (Windows Metafile)
MP3 (MPEG-1 Audio Layer-3)
mp3PRO
AAC (Advanced Audio Coding)
ALAC (Apple Lossless Audio Codec)
WAV (RIFF Waveform Audio Format)
WMA (Windows Media Audio)
AIFF (Audio Interchange File Format)
AU
Ogg Vorbis
RealAudio
FLAC (Free Lossless Audio Codec)
SMF (Standard
EUP (EUPHONY) - FM TOWNS標準の楽曲フォーマット
MML (Music Macro Language)
SMAF (Synthetic music Mobile Application Format)
AVI (Audio Video Interleave)
ASF (Advanced Systems Format)
FLV (Flash Video)
OGM (Ogg Media)
OGG (Ogg file)
MPEG (Moving Picture Experts Group)
MPEG-1
MPEG-2
MPEG-4
MP4 (MPEG-4 Part 14)
MOV (QuickTime Movie)
RealVideo
VG2
[参考文献]
[1]http://ja.wikipedia.org/wiki/%E3%83%95%E3%82%A1%E3%82%A4%E3%83%AB%E3%83%95%E3%82%A9%E3%83%BC%E3%83%9E%E3%83%83%E3%83%88#.E9.9F.B3.E5.A3.B0
[2]http://wiki.osask.jp/?%A5%D5%A5%A1%A5%A4%A5%EB%A5%D5%A5%A9%A1%BC%A5%DE%A5%C3%A5%C8%BB%F1%CE%C1
[3]http://www.asahi-net.or.jp/~ki4s-nkmr/file-format.html