MIDIMIDI(ミディ、Musical Instrument Digital Interface)は、電子楽器の演奏データを機器間で転送・共有するための共通規格である[1]。日本のMIDI規格協議会(JMSC、現在の社団法人音楽電子事業協会)と国際団体のMIDI Manufacturers Association (MMA) により策定され1981年に公開された。 概要MIDIは音楽制作の現場で幅広く利用されている。MIDI規格に則って作成されたデータは、DAWをはじめとしたシーケンサーなどで再生・編集することができる。 物理的な送受信回路・インタフェース、通信プロトコル、ファイルフォーマットなど複数の規定からなる。MIDI 1.0の策定完了から38年後の2019年に、Ver.2.0となるMIDI 2.0の策定開始が発表された[1]。2023年からMIDI検定を含む、MIDI 2.0の実用対応が本格化に開始。 MIDIデータは、音声データ(マイクなどで録音した音の波形をサンプリングしたもの)ではなく演奏情報(発音せよ、音の高さは - 、音の大きさは - 、といった楽器や音源へのメッセージ)であり、データサイズが小さく、また音楽の細部を容易に変更することができる。 電子楽器以外では劇場の舞台照明のコントロールなどにも応用されている。また、MIDI規格とパソコンの普及は、ホビーとしての音楽制作(DTM)を一般化した。 当初、MIDI規格は、ハードウェアとソフトウェアの両分野にまたがり策定された。ハードウェアの規格は、インタフェースや送受信回路・端子に関することであり、ソフトウェアの規格は、データフォーマット(機器同士がリアルタイム通信する際の規格であって、MIDIデータを保存流通させるファイルフォーマットとは異なる)に関することである。 その後、MIDIの普及に伴いRP(Recommended Practice、推奨実施例)という拡張規格が策定された。音色配列などを厳密に定めたGMシステムレベル1や、MIDIデータを保存流通させるファイルフォーマット、劇場の舞台照明をコントロールする規格(MIDIショーコントロール)が、このRPに含まれる。 MIDIはJIS(日本産業規格)によって以下のように規格化されている。
ハードウェア規格送信31.25Kbps (±1%) の非同期方式シリアル転送を用いる。 接続MIDI機器(ハードウェア)は5ピンのDINコネクタで接続するのが一般的である。両端に位置する1番ピンと3番ピンは現在の仕様上では使用されず、中央2番ピンはケーブルのシールド用に、4番、5番ピンがデジタル信号のカレントループ伝送に使用される。MIDIケーブルの両端はどちらもオス端子で、シールドされたツイストペアケーブルとして設計される。 コネクタには、MIDI信号を受け取るMIDI IN、MIDI信号を送信するMIDI OUT、受信したMIDI信号をそのまま送信するMIDI THRUの3種類がある。機器パネル側は常にメス端子となる。グラウンドループや障害の連鎖防止のため、MIDI機器同士には電気的絶縁が規定されており、受信側内部では接地線の2番ピンは接続されず、信号はフォトカプラで受信される基本仕様となっている。フォトカプラを経由するたびに信号波形の再現性が下がるため、MIDI THRUを多段直列すると通信エラーが発生することもある。並列に複数のMIDI機器を接続する場合や、信号系統を簡単に切り替えたい時はMIDIパッチベイを用いるが、これを使うことにより多段時の通信エラーも回避できる。 MIDIはバスではない。MIDI IN端子とMIDI OUT端子が別々で用意されていることから判るように、MIDIケーブル間のデータは一方向に送信される。 後述するアクティブセンシング機能で、接続状態が良好か、断線していないかを常に判定しており、アクティブセンシングが途絶えたとき、お互いのMIDI機器はケーブルが抜けたと判定するように作られている。 現代には、MIDI IN、MIDI OUTを使わずRS-232C、USB、IEEE 1394などの規格を使った接続を行う機器も存在している。この場合、MIDIケーブルではなくこれらの規格のケーブル内をMIDI信号が通るため、転送に関して上記の通りではない。 チャンネル2本のMIDIケーブルを用い、お互いの機器のMIDI IN、MIDI OUTをそれぞれつないだ状態を1つの「システム」と捉える。このシステム毎に16のチャンネルが用意される。基本的にひとつのチャンネルにひとつの楽器(1パート)が割り当てられる。 これにより、1本のMIDIケーブルで16チャンネル分のデータを送信もしくは受信させることができる。例えば「1チャンネルのピアノと3チャンネルのギターを鳴らす」といったことである。16チャンネル分のデータは、後述する「チャンネルメッセージ」にて正確に分類され、相手機器の各チャンネルに届く。 それ以上のチャンネルを制御するためにはMIDIケーブルが複数本必要となり、MIDIデータのパート数(=チャンネル数)によっては、複数のMIDI音源を用意する必要もでてくる。 データフォーマットMIDIメッセージMIDI規格上のデータの送受信は、すべてMIDIメッセージで行われる。MIDIメッセージは、複数のバイト(8ビット)で構成されている。「電子楽器の鍵盤を弾いたことで音が出る」という一連の流れもMIDIメッセージで制御されている。バイト単位で処理していくため、文言上では16進数を用い、数の後にHを付ける。 MIDIメッセージを効率よく送信するために、MIDIメッセージに使用されるバイトは「ステータスバイト」か「データバイト」の大きく2種類に分けられる。ステータスバイトとはMSB (Most Significant Bit)が「1」、すなわち80H - FFHまでの128個のバイトを指し、データバイトとはMSBが「0」、すなわち00H - 7FHまでの128個のバイトを指す。 MIDIメッセージは複数のバイトで構成されていると前述したが、これらの先頭は常にステータスバイトで始まり、ステータスバイトの後に任意の個数のデータバイトが続く。ステータスバイトでは、ノートオンやコントロールチェンジ、システムエクスクルーシブなどを定義する。データバイトは、ステータスバイトで定義したものについて、その内容や数値を指定するのに使用する。 ステータスバイトが80H - FFHのうち何であるかによって、「チャンネルメッセージ」、「システムメッセージ」に分かれる。 チャンネルメッセージチャンネルメッセージとは、特にチャンネルを指定して送信するMIDIメッセージのことである。チャンネルメッセージのステータスバイトは80H - EFHである。ここからさらに「チャンネルボイスメッセージ」、「チャンネルモードメッセージ」と分類される。 チャンネルボイスメッセージチャンネルボイスメッセージとは、音を鳴らす、止める、音色を変える、ピッチを変えるといった、音源の演奏に必要な情報に関する定義のことである。最大2つのデータバイトが続くことで、その内容・数値を決定する。 ステータスバイトの下位4ビットがMIDIチャンネル番号-1(0(0H)Hはチャンネル1、15(FH)はチャンネル16)を表している。 データバイトにて指定するノートナンバーとは、最も低い音を0、最も高い音を127と割り当てた音の高さのことであり、半音刻みとなっている。中央ハにはノートナンバー60が割り当てられ、88鍵盤のピアノで出せる音域(A0 - C8の7オクターブと短3度)はノートナンバー21 - 108と割り当てられるので、MIDIではそれよりさらに広い音域(C-1 - G9の10オクターブと完全5度)をカバーできる。また、ベロシティとは音の強さ(楽器で例えれば各弦や各鍵を弾く速さによって変化する音の強弱(強弱法))のことである。1 - 127までありmp(メゾピアノ)が64となり、127が最も強く、1が最も弱く、数値が0の場合は発音の終了(楽器で例えれば離鍵など)を表す[2]。 なお、以下の説明では、これら0 - 127までの数字を、16進数で表記する。また、nはチャンネル番号を表わす。
ステータスバイト部のnには0H - FHが代入され、これは1チャンネル - 16チャンネルを表す。「90H 3CH 40H」というMIDIメッセージがあったとすると、これは「ノートオン、1チャンネル。3CH=60なので中央ハを鳴らす。40H=64なのでmpで鳴らす」という命令である。 チャンネルモードメッセージチャンネルモードメッセージとは、ある楽器は和音が出せるのか、16チャンネルは区別するのかしないのか、といったことを設定するための定義のことである。BnHで始まるがコントロールチェンジには含まれず、BnHのあとに78H - 7FHが続くと、チャンネルモードメッセージのいずれかと判断される。多くの場合、第2データバイトには00Hがダミーとして送信され、受信側も無視する。ステータスバイト部のnには0H - FHが代入され、これは1チャンネル - 16チャンネルを表す。
システムメッセージシステムメッセージとは、チャンネルに関係なくMIDIシステム全体に対する命令を行うMIDIメッセージである。システムメッセージのステータスバイトはF0H - FFHである。機能ごとに「システムエクスクルーシブメッセージ」、「システムコモンメッセージ」、「システムリアルタイムメッセージ」の分類される。 システムエクスクルーシブメッセージ→詳細は「システムエクスクルーシブメッセージ」を参照
システムエクスクルーシブメッセージ(Sys-Ex、またはSysExと略記し、シスイーエックスと読む場合もある)は、MIDI機器のより細かい設定を行ったり、音色データやサンプリングデータを送受信するなど、各メーカーのMIDI機器の固有のデータのやりとりに使用できるシステムメッセージである。ステータスバイトF0Hで始まる。 MIDIメッセージは大抵2バイト程度のデータバイトで成り立つが、SysExはMIDIメッセージ中、唯一データバイト長が指定されていない。可変長のため、最後にシステムコモンメッセージとして定義されているF7H エンドオブエクスクルーシブ (EOX) を送信することでSysExの終了を表現する。 システムコモンメッセージシステムコモンメッセージは、主にシステムリアルタイムメッセージと併用され、MIDIシーケンサーなどの同期に使用される。ステータスバイト以下にデータバイトが続くものが多い。
システムリアルタイムメッセージシステムリアルタイムメッセージは、MIDIシーケンサーなどの同期、MIDIタイミングクロックに使用される。ステータスバイト以下にデータバイトが続かず、単独の1バイトのみで機能する。リアルタイムに送信される必要があるため、最優先で送信される。
サンプルダンプサンプルダンプとは、システムエクスクルーシブメッセージを使用してサンプラーとMIDI機器間でサンプリングデータを通信する規格である。サンプルダンプに関するフォーマットをサンプルダンプスタンダード (SDS) という。MMAが1987年に提案した規格で、MMA-0003として定義されている。 ただし、前述の通りMIDIの通信速度は31.25Kbpsと、データ転送用途としては非常に遅い上、現代にはUSBやIEEE 1394などの高速シリアルバスも普及しているため、一部の学習・研究用途を除き使われることは無くなった。 RPRP (Recommended Practice) とは、MIDI規格策定後、利便性を高めるための推奨実施例として拡張された規格である。現在すでに複数の拡張規格がAMEIとMMAにより承認されており、いずれも共通規格としてMIDI規格に組み込まれている。 スタンダードMIDIファイル→詳細は「スタンダードMIDIファイル」を参照
スタンダードMIDIファイル(SMF)とは、MIDI機器やMIDIメッセージを用いる演奏に関するデータの保存形式であり、メーカー毎のソフトやハードに関係なく使用できる共通のファイルフォーマットである。拡張子は.mid。いわゆる「MIDIデータ」は演奏形式である前述した「MIDIデータフォーマット」の略称であるが、このスタンダードMIDIファイルを指すべく拡大使用される場合がある。 Opcode社により独自規格として提案されたが、1991年7月にAMEIとMMAによりRPの第1号(RP-001)に追認された。 GMGMシステムレベル1、通称GM (General MIDI) とは、それまで各メーカー毎に異なっていた音色配列を統一することを目的として策定されたRPである。1991年に、RP-003にて定義されている。音色配列の他、最低同時発音数や音色数、コントロールチェンジの効き具合といったことも指定されている。 さらに、従来のGMでは時代の進化に伴い補いきれなくなってきた部分を補完するため、GMシステムレベル2 (GM2) が上位規格として拡張された。GMとは完全な上位互換性をもつ。 のちに、主に携帯電話の着信メロディの制作用途として、General MIDI Lite (GML) も上位規格として拡張された。 DLSDLS (Downloadable Sounds) は、SMFデータをサウンドカードなどの音源機器に転送して再生するために策定されたRPである。1997年に、RP-016にて定義されている。再生する音源が異なると、作者の意図しない音色で再生されてしまうSMFとは異なり、DLS対応機器ならほとんど同じ音での再生を行なうことが可能となる。拡張子は.dls。 のちに、上位規格であるDLSレベル2.1や、携帯電話向けのMobile DLSが拡張された。
XMFXMF (eXtensible Music Format) は、MMAによって提案された新しい音楽ファイルフォーマットである。SMFや、音声ファイルであるWAVなどが一つのファイルとして格納できるようになっている。 複数回改稿されており、それぞれのバージョン毎にRPとして承認されている。
また、複数の用途に向けて、複数のタイプが定義、検討されている。
XMFに関する拡張規格も用意されている。 MIDIショーコントロールMIDIショーコントロール (MIDI Show Control, MSC) とは、照明や映像機器など、ショーの演出をコントロールする目的で策定されたRPである。1991年にRP-002、のちにRP-014にて定義されている。 MIDIタイムコードMIDIタイムコード (MIDI Time Code, MTC) は、同期システムを組むことを目的として策定されたRPである。1987年に、RP-004にて定義されている。 MIDI規格策定時に、同時に策定されたMIDIタイミングクロックは絶対時間を持たなかったが、SMPTEの普及につれMIDI上でも絶対時間を持ったクロックが必要となってきたことが、MTC策定の背景である。 MIDI策定団体であるMMAが中心に提案したため、RPのほかにMMA-0001としても定義されている。 記譜情報記譜情報はMIDIデータ(MIDIメッセージの集合)を楽譜上に音符として表示するために策定されたRPである。RP-005、RP-006にて定義されている。 ファイルダンプファイルダンプとは、MIDIケーブルを使ってSMFデータを転送するために策定されたRPである。RP-009にて定義されている。 MIDIマシンコントロールMIDIマシンコントロールとは、システムエクスクルーシブメッセージを用いてMTRやVTRを制御するために策定されたRPである。1992年に、RP-013にて定義されている。 SMF with LyricsSMF with Lyrics (SMF Language and Display extensions) とは、SMFのメタイベントとして用意されている歌詞格納機能を拡張したRPである。1999年に、RP-026にて定義されている。 メタイベントと違い、表示を目的としており、曲タイトル、作曲者名、作詞者名、歌詞やふりがなを格納できる。カラオケの歌詞表示や楽譜上の歌詞表記などの用途を想定されている。また、日本語 (Shift JIS) も使用できる。 MIDI Media Adaptation Layer for IEEE-1394MIDI Media Adaptation Layer for IEEE-1394は、MIDIインタフェースなどのMIDI機器をIEEE 1394を用いて接続することに関するRPである。2000年に、RP-027にて定義されている。 SP-MIDISP-MIDI (Scalable Polyphony MIDI) は、あらゆる音源で最適なデータを再生するために策定されたRPである。2002年に、RP-034、RP-035にて定義されている。 例えば、通常だと24ボイス(パート数)を持つ音源用に作られたデータを16ボイスの音源で再生すると、8ボイス分は無視されてしまう。このままではデータ制作者の意図した再生ができないため、従来なら24ボイス用、16ボイス用と複数のデータを用意する必要が有った。このSP-MIDIの規格に従うと、ひとつのデータに前もって複数環境分の情報を収録できるので、少ない工数で、あらゆる音源で問題なく再生が出来るようになる。この技術は主に携帯電話向けに使用される。 MIDI XMLMIDI XML ("MIDI Names, Device Types, & Events in XML") は、SMFをXMLで記述することを目的として策定されたRPである。2003年に、RP-038にて定義されている。 その他の規格RPとして承認されていないが、各メーカーが独自に打ち出した規格も存在する。中には、比較的一般的となった規格も存在する。ただしメーカーに左右されるため、メーカーを越えた互換性は無い場合が多い。 なお、現在はこれ以上の音色配列などに関する規格の複雑化を防ぐため、AMEI、MMA共にGM2に一本化することを求めており、また、GS・XGはお互い規格をオープンにして相互にサポートすべきとしている[3]。しかし、実際にはローランド製、ヤマハ製の製品であってもGS・XG自体をサポートしない製品が増えてきたことも事実である。 同じ楽譜で演奏をしても、演奏者や楽器が異なると音が違って聴こえるように、使用する音源を変えれば出音は違ってくる。そのため、例えばインターネット上で配布されているMIDIデータをデータ制作者の意図した通りに演奏するためには、制作者が使ったものと同じ、音色設定を完全に一致させた音源が必要になる。たとえGS対応と謳っていてもGS対応音源なら何でもいいというわけではなく、どの音源モジュールを使うかによって音は異なる。 GSフォーマットGSフォーマットは、1991年にローランドが提唱、策定した音色配列などに関する独自規格。RP-003であるGMを拡張して作られたと思われがちだが、こちらが先行している。GMは、GSから他社と共有できる部分を抜粋し標準化したものである。 GSに対応した音源には、SC-55やSC-88Proなどのローランド・SCシリーズが有名。 XGフォーマットXGフォーマットは、1994年にヤマハが提唱、策定した音色配列などに関する独自規格。ヤマハ製の音源モジュールやシンセサイザーの互換性を持たせるためにGMを拡張する形で作られた。 XGに対応した音源には、MU80やMU500などのヤマハ・MUシリーズが有名。 MIDI 2.0
用途と機器本項ではMIDI規格が使われる用途と、MIDI規格を使用するハードウェア(機器)、ソフトウェアについて解説する。なお、箇条書きにしているハードウェアやソフトウェアは一例である。 音楽制作総合的な音楽制作用途は、MIDIの代表的な使用例である。パソコンとソフトウェア音源さえあれば、大がかりな設備投資をする必要無くDTMを楽しめるといったことで、90年代から一般の趣味としても普及し出した。 現代は、オーディオ編集とMIDIデータ編集を同時に行える統合環境DAWが業務向けを中心に普及している。
かつては、ハードウェア音源の代わりに、PCM音源等の音源データをソフトウェア向けに加工し、パソコン上のサウンドボードでMIDIファイルの再生を可能にしたソフトウェアMIDI音源も開発された。しかしながら、同時発音数や音質がCPUの性能に依存するなど、ソフトウェアMIDI音源発売当初はリアルタイム演奏には不向きであった。 現在は、一般のパソコンがソフトウェア音源を処理するのに十分な性能を持ったことや、再生時に音源が不要なMP3等の圧縮音声ファイルフォーマットの普及により、一般ユーザーではDTM愛好家以外のハードウェアベースのMIDI音源の使用は著しく減少している。 録音・MA録音やMA (Multi Audio) でもMIDIは使用される。演奏情報の送受信ではなく、システムメッセージを中心とした同期処理が行われている。
カラオケカラオケ機器は、MIDIデータを再生する機能が備わっている。各カラオケ店舗では、インターネット回線を通じて最新曲のMIDIデータを受信する仕組みになっており、通信カラオケと呼ばれるのはこのためである。ブロードバンドインターネット接続が普及する以前は、現在のように大量の音声データをインターネットで送受信するのは困難であったが、MIDIデータであれば、当時の低速な回線でも十分に送受信可能であった。 なお、カラオケ用MIDIデータはカラオケデータ制作専門のプログラマなどが、ソフトシーケンサーなどを用いて制作し、通信カラオケ配信会社に卸す仕組みとなっている。 モバイル機器・着信メロディスマートフォンの登場以前、携帯電話の着信メロディにおいてMIDI規格が利用されていた。携帯電話内のデータを、携帯電話内に搭載された音源が処理し音を鳴らしている。携帯電話向けのRPも複数拡張された。 舞台照明・演出1991年にRP-002としてMIDIショーコントロールが定義された。これにより、MIDIで舞台装置、照明、演出効果などが制御できるようになった。
音声合成2009年頃、音声をフーリエ解析し周波数ごとに分離して正弦波にし、それをMIDIで再生することで音声を擬似的に再現する技術が発明された。 その他鉄道のプラットホームで流れる発車メロディや、学校・会社で流れるチャイムを再生するタイマーなどでもMIDI規格が応用されることがある。 MIDI検定→詳細は「MIDI検定」を参照
MIDIの基礎知識や、業務レベルの細かい知識などを問うMIDI検定が1999年より実施された。現在4,3,2,1級の4階級が用意されており、2級には2級筆記試験と2級実技試験の2段階が用意されている。 3,2級検定試験は年1回の実施、MIDI4級検定試験は各公認講師・指定校による随時開催となっている。 MIDI検定開始から11年間、1級試験は実施されず2級実技試験が最高級とされていたが、2010年1月15日より、1級試験が新設された。 年表
出典
参考文献
関連項目
外部リンク |