ＳＨオルゴール・原理

基本的な原理

　Ｈ８オルゴール同様、かなり短い周期で割り込みをかけ、発振器をエミュレートします。Ｈ８版は32.000KHzでしたが、ＣＰＵクロックとのかねあいで32.768KHzにしました。
　Ｈ８版は16MHz÷32KHz=500で、割り込みオーバーヘッドなども考えると４００クロック程度で発振器の処理をしなければいけませんでした。Ｈ８／３００Ｈは１命令あたりのクロック数が２～２０クロックも必要なことを考えると、１回の割り込み処理の中で波形演算処理に使える命令数は極めて少なく、同時発音数は４音、波形は１種類固定でエンベロープはただ単純に減衰するだけ、というレベルの物しかできませんでした。

　今回のＳＨ７０４６はクロック49.152MHzなので、49.152MHz÷32.768KHz=1500で、発振器のエミュレーションに千数百クロックも余裕で使えます。また、ほとんどの命令が１クロックで実行できるということもあり、、実質的な処理能力は１０倍以上になると思われます。

　出力はアナログ値になるのですが、ＳＨ７０４６にはＤ／Ａコンバータがないので、Ｈ８／３６６４版と同様にＰＷＭで出力し、ローパスフィルタでアナログ電圧にします。ＰＷＭ周期は７５０ペリフェラルクロック（ＣＰＵクロック１５００個ぶん）で32.768KHz（つまりオシレータエミュレーション割り込みと同じ周期）です。波形の最大振幅は５１２とし、あえて１００％変調はかけていません。これは、オペアンプの電源を５Ｖ単電源で使っているため、手軽に入手できる安いオペアンプだと０Ｖ付近と５Ｖ付近の入力信号を正しく扱えないためです。

発振器エミュレーション割り込み

　OSCINTという割り込みルーチンで発振器をエミューレートします。いわゆる「分周型」ではなく「オーバーフロー型」です（Ｈ８版からずっとそうですが）。割り込みがかかるたびに「周波数アキュムレータ」に「周波数」を加算します。
　割り込みは32768Hzの周期でかかり、周波数アキュムレータは１６ビット（すなわち値は0～65535）なので、たとえば「周波数」に１を設定していれば、周波数アキュムレータは２秒周期、すなわち0.5Hzでオーバーフローします。「周波数」に２を設定すれば1Hzでオーバーフローします。440を設定すれば、220Hzでオーバーフローします。このように、「周波数」に実際鳴らしたい音の周波数の２倍の値を設定すれば、希望の周波数が得られます。
　周波数アキュムレータを１５ビットにすれば、「周波数」の設定値が実際の周波数と一致してわかりやすかったのですが、低音域での周波数精度が悪くなるので１ビット増やし、あえて周波数の２倍の値を設定するようにしました。
　任意の波形を出力するには、周波数アキュムレータの適当な上位何ビットかをそのまま波形メモリのアドレスとします。今回は７ビットをアドレスとしました。つまり、一周期ぶんの波形は１２８バイトで表すことになります。
　そうやって得た波形データを、音量まで計算して８パートぶんの波形を重ね合わせるのにＭＡＣ（積和演算器）を使っています。Ｈ８は個人では入手が難しい上級チップにしかＭＡＣが乗っていないのに、ＳＨはすべての機種にＭＡＣが乗っているからありがたいです。

　Ｈ８版でやっていたディレイはとりあえずつけていません。Ｈ８版のディレイは、確かに音に余韻がつくのですが、せっかくステレオなのにもかかわらず音の定位がぼやけてしまっていました。ＳＨ版もいずれステレオ化してディレイ等のエフェクトをかけようと思っていますが、そのためには私自身がもっと音場処理などの基礎を勉強する必要がありそうです。

エンベロープ割り込み

　ENVINTという割り込みルーチンでエンベロープの処理をしています。Ｈ８版ではただ固定のレートで減衰するだけでしたが、ＳＨ版はシンセサイザーなどでよく使われるＡＤＳＲでエンベロープパターンの形状を設定できます。

　エンベロープパターンはアタック（Ａ）、ディケイ（Ｄ）、サスティン（Ｓ）、リリース（Ｒ）の４つの期間から構成されます。
　
　アタック（Ａ）は、音の鳴り始めから最大音量に達するまでの期間です。今回のオルゴールでは音量は直線的に変化するようにしました。
　ディケイ（Ｄ）は、音量が最大になってからサスティンレベルに落ちるまでの期間です。音量は直線的に変化します。
　サスティン（Ｓ）は、サスティンレベルに達してから、発音停止するまでの期間です。音量は指数関数的に減衰します（減衰しないことも可能）。
　リリース（Ｒ）は、発音停止後の余韻です。音量は指数関数的に減衰します。
　なお、アタック、ディケイ、サスティンのいずれの期間でも、指定の音長が終了するなどして発音停止した場合、即リリースに移行します。

　ＴＯＮＥ文で指定するエンベロープパラメータは８ビットですが、エンベロープ割り込み内では精度を保つために１６ビットで処理しています。（厳密に言うと、符号付き／符号無しにかかわるちょっと面倒くさい処理を安易に回避するため実質有効なのは１５ビットにしていますが）

音楽シーケンサ割り込み

　MUSINTという割り込みルーチンでＭＭＬの解釈・実行を行っています。この手のプログラムは大抵ＭＭＬそのものではなく、何らかの中間コードに変換してから演奏するのが一般的ですが、このＳＨオルゴールではＭＭＬのまま演奏しています。ＭＭＬも中間コードも同じ音楽情報を表しているはずなのに、わざわざ変換するのは２度手間と思えますし、貴重な内蔵ＲＡＭに、わざわざ中間コードバッファなどを確保するのはもったいないと思ったので。

　多くの場合中間コードに変換するのは、人間にわかりやすいＭＭＬより、機械に理解しやすい中間コードの方がテンポ、音長に合わせて正確なタイミングで発音するような、時間にシビアな処理を実現しやすいからだと思います。
　それはＣＰＵパワーが低い８ビットマイコン時代にはきわめて効果的な手法でしたが、ＳＨクラスになると中間言語でないＭＭＬのままでも余裕で実行できます。

　ＭＭＬの解析・実行処理についてはソースを見てください。ＭＭＬの文字を読んで様々な処理に分岐しているだけの典型的な「インタプリタ」です。煩雑な割にそれほど高度なことをしているわけではありません。（実は、MUSINTの中のコードは出来が悪いです。いわゆる「力技」でゴリゴリ書きました。正直、恥ずかしいのであんまり見てほしくないです(^^;;;）

ＰＬＡＹ文

　ＭＭＬの解釈実行は割り込みが行いますので、ＰＬＡＹ文は演奏ポインタキューが空いているかどうか調べ、空いていればＰＬＡＹ文中の各文字列のポインタをキューにおいているだけです。

　ＰＬＡＹ文の実行時間の長さは、そのＰＬＡＹ文のパートの中で一番長いパートに合わされます。したがって、各ＰＬＡＹ文の頭で必ず音符は揃います。たとえば、

10 PLAY "C1","E2" 20 PLAY "D2","F1"

を実行した場合、２０番の"F1"は１０番の"C1"が鳴っている最中に鳴りだすのではなく、２０番の"D2"と揃って鳴り始めます。

　文単位の区切りを意識せずパートごとにきっちり長さを詰めて、上の例で"C1"が鳴っている最中に"F1"が鳴りだすような仕様にすることも考えたですが、私としてはＰＬＡＹ文の頭で必ず揃うほうがわかりやすい（というか、ＭＳＸ－ＢＡＳＩＣでそれに慣れてしまった）のでこういう仕様にしています。