拡張子とは??よく使われる拡張子まとめ

拡張子

こんばんは、黒猫です。

今日は仕事で知らない拡張子がたくさん出てきたので、それについてまとめたいと思います。

拡張子とは??

拡張子とは、ファイルの種類を識別するためにファイルの最後に付けられる文字列のことを指します。microsoftのwordで文書を保存すると、.docxというのが名前の後ろにつきますよね?このことを拡張子と言います。

この拡張子は何にに用いられるかというと、
パソコンや人がファイルの種類を認識するために必要
となります。

例えば、wordファイルを送ってと言われると拡張子は.docxで良いですが、
pdfファイルを送ってと言われると拡張子を.pdfに変換する必要があります。

このようにファイルを送受信するためには適切な拡張子に変換しなければいけません。

よく使われる代表的な拡張子には、以下のようなものがあります。

  • 文書やデータでよく用いられる拡張子(.txt, .csv, .tsv, pdf)
  • 画像でよく用いられる拡張子(.png, .jpeg, .gif, bmp)
  • 動画や音楽でよく用いられる拡張子(.mp3, .mp4)
  • ソフトのデータ利用でよく用いられる拡張子(.json, .xml)

以下では、これらの拡張子について説明していきます。

文書やデータでよく用いられる拡張子(.txt, .csv, .tsv, .pdf)

.txt拡張子

簡単に説明すると、「テキストファイル」につく拡張子です。そのまんまですね笑
テキストファイルは中身がテキストデータ(文字列で構成)のみで構成されているファイルのことを指します。
windowsでいうと、メモ帳でテキストを入力して保存するとデフォルトでこの拡張子になっていますよね。
なので、.txtはテキストファイルについている拡張子と思っていただけたらよいです。

.csv拡張子

.csvは「Comma-Separated Values」の頭文字をとってつけられた拡張子です。
つまり、カンマ区切りで文字を分割したテキストファイルになります。

このファイル形式の利点としては、
他のアプリでデータを読み込む時にカンマ区切りで出力できる
という点になります。

例えば、microsoftのExcelを用いてこのデータを開くと列がカンマで区切られて
それぞれのセルに格納されます。

自作のソフトでデータをカンマ区切りで取得して、Excelでデータを解析するといった
使い方が一般的かと思います。

.tsv拡張子

.tsvは「Tab-Separated Values」の頭文字をとってつけられた拡張子です。

つまり、タブ区切りで文字を分割したテキストファイルになります。

このファイル形式の利点としては、先ほどの.csv拡張子と同様で
他のアプリでデータを読み込む時にタブ区切りで出力できる
という点になります。

使い方は.csv拡張子とほぼ一緒なので割愛します。

.pdf拡張子

.pdfは「Portable Document Format」の頭文字をとってつけられた拡張子です。
こちらはAdobeが開発、提唱する電子上の文書に関するフォーマットになります。

特徴としては、

  • 文書や画像をそのままの表示でpdf化可能
  • 電子署名も可能で、紙への出力が不要
  • OSに依存せずに表示が可能
  • 文書中にコメントやハイライトの挿入が可能

などが挙げられます。
使用環境に依存しないのでwindowsPCやMacPCで同じ文書を共有したいときに使用可能です。

画像でよく用いられる拡張子(.png, .jpeg, .gif, bmp)

.png拡張子

.pngは「Portable Network Graphics」の頭文字をとってつけられた拡張子です。
特徴としては、

  • フルカラー(約1670万色)を扱うことができる
  • 可逆な圧縮画像であるため、画質が劣化しない
  • データ容量が大きくなってしまう

といったものがあります。
一番の特徴は可逆な圧縮画像であるということですね。
可逆な圧縮とは、
元画像の情報を失うことなく圧縮をすること
です。

簡単な例で言いますと、「aaaaaaa」というテキストデータが保存されているファイルが
あるとします。半角を1バイトとして換算すると、7バイトのデータであることがわかります。
これを圧縮すると「a7」と表現することが可能です。aが7つ並んでいるから「a7」となります。
この表現だと2バイトでデータ量が済むことがわかります。この操作が圧縮です。

逆に圧縮した「a7」を元の「aaaaaaa」に戻す時は、aが7つ並んでいるという情報から元に
戻すことができます。こういった変換を可逆な圧縮と言います。

.jpeg拡張子

.jpegは「Joint Photographic Experts Group」の頭文字をとってつけられた拡張子です。
特徴としては、

  • フルカラー(約1670万色)を扱うことができる
  • 不可逆な圧縮画像であるため、画質が劣化してしまう
  • カメラでの保存形式はほとんどがこの形式

といった特徴があります。
特徴としては、.png拡張子と違い、不可逆な圧縮画像であるという点があります。
不可逆な圧縮とは、
元画像の情報を失って圧縮をすること
です。

こちらも簡単な例で説明しましょう。
「aaaaaba」というテキストデータが保存されているファイルがあります。先ほどと同様に7バイト
のデータとなります。不可逆な(.jpeg形式)圧縮を行うと、「a7」という表現ができます。
先ほどと同様な結果となりましたが、元データが異なるため、元データに戻すことができません。
つまり、情報を失っている(画像が劣化している)ことがわかります。
これは圧縮重視の考え方で、データ容量をより軽くしようとするために起こるものです。
輪郭がはっきりしたイラストやアイコンに使用すると、色がぼやける可能性があります。

.gif拡張子

.gifは「Graphics Interchange Format」の頭文字をとってつけられた拡張子です。
特徴としては、

  • 最大で256色(8bit)まで使用可能
  • 透明色の指定が可能
  • 動画(アニメーション)を保存することができる

といった特徴があります。
一番の特徴は、アニメーションを保存することができるという点です。
コマ画像をパラパラマンガの要領で表示することで実現しています。

256色しか使用できないので、ロゴやアイコンなど、単色のベタ塗り面を多く含む
画像に適しています。

.bmp拡張子

.bmpは「Bitmap」を省略して書かれた拡張子です。
特徴としては、

  • 圧縮しないので容量が大きい(画質が劣化しない)
  • Windowsの標準画像フォーマット

といった特徴があります。
Windowsのペイントで画像編集すると保存形式が.bmpになりますよね。あれです。
この拡張子はかなり昔から使われてきたもので歴史が深い拡張子となります。
現在では他の拡張子がかなり出てきているので、あまり使われないようです。

動画や音楽でよく用いられる拡張子(.mp3, .mp4)

.mp3拡張子

.mp3拡張子は、「MPEG Audio Layer-3」からつけられた名称です。
音声圧縮方式の規格の一つで、主に音楽音声の圧縮に用いられています。

音楽の圧縮と言われると、かなり音質が落ちるんじゃないかと心配になりますが、
音楽でいう圧縮は、人間に聞こえない周波数帯の音を削るということになります。
人間は大体20000Hzくらいまでの音しか聞き取れないので、30000Hz以降の音は
削ってしまおう!!というのが音楽の圧縮となります。
この圧縮方式では、聞き取れない音を削ってしまうので、不可逆変換になります。

標準的なビットレートである128kbps(一秒間に128kビット)で変換すると、一分間が
約1MBになります。これは原音のだいたい10分の1のサイズになります。
この拡張子でCD(約650MB)に曲を入れると、650分の音楽を入れることができます。
最近では、ハイレゾと呼ばれる高音質の音源で音楽を聴く人も増えてきてますが、そのときに
用いられている拡張子は.flacというものになります。気になる人は調べてください。

.mp4拡張子

.mp4拡張子は、「ISO/IEC 14496-14:2003」というのが正式名称です。
MPEG-4形式の圧縮動画データを格納するファイル形式の一つで静止画像や字幕はもちろん、
MPEGによって定義されたデジタル音声と動画を一つのファイルに保存することができる
コンテナ形式のファイルになります。
イメージとしては、一つの箱に音声データも文字データも動画データも全部格納することが
できる拡張子だと考えてくれれば良いです。
youtubeやニコニコ動画で用いられているような一般的な拡張子と思っていただけたら良いです。

ソフトのデータ利用でよく用いられる拡張子(.json, .xml)

.json拡張子

.json拡張子は、「JavaScript Object Notation」の頭文字をとってつけられた拡張子です。
テキストベースのデータフォーマットで、名前の通り、JavaScriptのオブジェクト表記構造の
サブセットとなっているため、人間が理解しやすいデータフォーマットとなります。
データ構造は「[]」で階層化されており、ぱっと見で見やすいと思います。

{
“name”: “Tanaka”,
“age”: 26
}

一行目が名前「田中」を表し、二行目が年「26」を表します。
JavaScriptだけでなく、Java, PHP, Ruby, Pythonなど、様々な言語間でデータの交換をするとき
に使用されます。こういった形式で書かれたものが.json拡張子となります。

.xml拡張子

.xml拡張子は、「eXtensible Markup Language」の頭文字をとってつけられた拡張子です。
書き方は.html拡張子と同様の書き方ですが、タグには文書の論理構造を記述することができる
ので、内容が理解しやすい形式となっております。

<?xml version=”1.0″ encoding=”Shift_JIS”?>
<?xml-stylesheet type=”text/xsl” href=”testxsl.xsl”?>
<おこづかい帳>
<支出>
<内容>
<日付>1月20日</日付>
<交通費>780</交通費>
<食費>980</食費>
<嗜好品>250</嗜好品>
</内容>
<内容>
<日付>1月21日</日付>
<交通費>950</交通費>
<食費>1200</食費>
<嗜好品>300</嗜好品>
</内容>
<内容>
<日付>1月22日</日付>
<交通費>500</交通費>
<食費>1500</食費>
<嗜好品>250</嗜好品>
</内容>
</支出>
</おこづかい帳>

おこづかい帳の中には三つの内容があり、それぞれの日付で区別されています。
また、その中には交通費、食費、嗜好品の分類があり、それぞれの金額が記載されています。

先ほども述べましたが、.xmlは、.htmlとは異なり、タグを自由に決めることができる特徴が
あります。
タグに応じた構造を自由に決められることで、システム間でのデータ交換時に多大なるメリットが
生じます。
例えば、.csvファイルでデータを保存していた場合、一列目が番号、二列目が商品名….などと
いった構造を予め決めておく必要があります。しかし、システムの改修で間に値段の列を
入れなくてはならない場合にシステムを大幅に編集しなければいけなくなります。
一方、.xmlファイルでデータを保存していた場合、途中で値段の列を入れたくなったとしても、
値段のタグを新たに作成し、データを挿入するだけで改修が済みます。
この使い方が.xml形式ファイルの大きな特徴といっても良いでしょう。

 

 

まだまだ私の知らない拡張子が仕事や私生活の中で出てくると思いますので、
都度、更新していければと思います。

最後まで読んでいただきありがとうございました。

コメント

%d人のブロガーが「いいね」をつけました。
タイトルとURLをコピーしました