语言
我现在正在想一段旋律。为交流这段旋律我能怎么做呢?如果你坐我旁边我可以唱给你听。不仅因为你认识音,而且你还很可能立马回忆起1960情节喜剧中的角色。但因为你不在这里,我将不得不选择其他的语言。如下:
00111100, 00111110, 00111111, 00111100 01000010
不明白? 那这个呢:
0000003C, 0000003E, 0000003F, 0000003C, 00000042
或者
60, 62, 63, 60, 66
或者这个: 261.62, 293.66, 311.13, 261.62, 370; 或 C4, D4, Eb4, C4, F#4
仍然不太确定? 那这个怎么样:

几乎没人认识第一种(二进制)。仅有少量的有过音乐培训背景的程序员懂得接下来的两个(十六进制,和MIDI),钢琴调音师知道261.6,绝大多数受过教育的音乐家知道音高类方法(C4)或中音谱号,绝大多数业余音乐人知道高音谱号,然后所有人,可能甚至在房间里漫游的其他物种,懂得唱歌的音。
一种高阶的语言具备更大的广泛性,低阶的广泛性更小。在电脑语言中,低阶意味着计算机懂、但人类很难懂的语言。即二进制数字的情况。高阶语言更易于被人类使用。即目前和十进数一样的编程语言。音乐科技依赖语言。如果你懂得更多低阶语言,你的作品将变得更好。同时你并不需要依二进制交流音乐,或者来回地进行转换,你会偶尔看到十六进制,常使用MIDI和频率,因此你应当懂得那些。
十六进制,MIDI数字
基于10,我们使用10个符号表明数量;0到9。在用光所有符号后,我们具备这个开启一个新列并循环第一列的更聪明的系统。车轮滚动带动里程表是一个对此很好的例证。当最右边的轮子滚到9,然后又再次归0。它左边的轮子向前滚动一格,从0到1,表明第一个轮子已经完全的转了一周一次。每列代表总数。在十进制系统内,每个轮子有十个符号,因此第二个轮子上的5意味着第一个轮子转了5次,因此是5个十的集合。数字562代表5个100,6个10,和2个1。(我们均直观的得到这个,但反复细致的重申这个方法将引导我们到十六进制数字。)
二进制数字使用同样的系统,但仅有两个符号:0和1。从右边数第三列的1代表右起第一、二列已经走了一次。由于我们仅使用两个符号,第一列代表1们,第二列2们,第三列8们,等等。因此数字1101意味着8们的一个,4们的一个,0个2们,和一个1(十进制为:13)。
十六进制基于16,因此需要使用16个符号。可视化一个相似的里程表但替代每个轮子上的0到9的是0, 1, 2, 3, 4, 5, 6, 7, 8, 9, A, B, C, D, E, 和 F。进程和动作是一致的。因此里程表会旋转每个轮子但超过9,一直到F。在这种情况下,如果右边第二个轮子是5,即第一个轮子完全滚动了5次。但第一个轮子不包含10个项目,而是16,因此5意味着5个16。第三列代表256的组,第四列,4096,等等。为什么存在十六进制?你可以用更少的符号表示更高的数字。与十六进制E63F1等同的十进制是943089。另外的原因是,计算机在本质上每只手有8个手指,因此它们学着基于16计算而不是10(不是开玩笑)。你可能永远不需要将十六进制转换到十进制,但你应该知道如何计数。跟随8A6EF的应是8A6F0,然后是8A6F1,8A6F2,等等。一直到8A6F9,8A6FA, 8A6FB, 8A6FC, 8A6FD, 8A6FE, 8A6FF, 然后是 8A700。
MIDI是我在上例中使用的另一系统。你将很经常的与MIDI数遭遇,但它们更容易懂:每半步(half step)是一个数字,因此每个八度有12个数字。音乐家使用的最低音是C-1,它的MIDI数为0。数字12 = C0, 24 = C1, 36 = C2, 48 = C3, 60 = C4(钢琴上的中央C,记住它),等等。A 440高于中央C,因此它是69。
音程是同样的:每个数字半步。0是同度,2是一整步,4是一个三分之一,7是一个五分之一,等等。如果你没有接受过音乐训练,那么这个系统实际上比大、小调,增、减和弦系统要简单。
我们稍后会讲频率。
文件格式
欲在数字领域交流,要求你懂得音频文件格式,这也是语言的一类,同样分高、低阶。每种都适用于不同的情况。以下是我常用的文件格式:MIDI, NIFF, XML, JPG, PDF, AIFF, WAV, SDII, 和 MP3。
MIDI:80年代流行标准
首先是MIDI,这是乐器数字接口(Musical Instrument Digital Interface)的英文缩写。这是80年代合成器厂商一致同意的标准。它允许两个音乐组件或程序彼此沟通。
MIDI有四个不足:1)MIDI不是声音。它仅是演奏声音的向导:开始,结束时间,音量,乐器和通道,等等。真正的声音,是由接收到命令的合成器生成的。MIDI类似于钢琴卷帘窗:如果没有钢琴的话,它就是废物。2)MIDI文件不包含文件信息。没有音调符号、拍子记号、权衡分切(measure division),或者五线谱。3)MIDI文档以一个非常低阶、模糊的语言写就。你无法在任何文本程序内打开它和搞清数据的意思。读写MIDI文件仅仅是资深程序员的任务。4)它将很快被替代掉。
当然,MIDI也有很多优点。1)它的编辑简单。因为它并非实际的声音,而是创造声音的向导,单独音符的长度、音头时间、释放,或音高可被调整。2)它允许灵活的配器。一轨单独的MIDI可以在一次录音内用大号演绎,下一次用低音提琴演绎。3)它被广泛接受。4)文件大小。因为几乎所有后90年代的电子设备懂得MIDI并且实际的声音是在本地机器上生成,这个网络无需传输实际的音频,因此这是网站、邮件附件和游戏的一个绝佳选择。
NIFF
NIFF代表乐谱文件交换格式(Notation Interchange File Format),它被作为一个标准的乐谱程序交换而开发。
和MIDI一样,NIFF不包含声音。因此它仅对于记谱有用。它可以被导入和编辑,并常可以被转化为MIDI。
XML
XML是一个音乐扩展标记语言(Music Extensible Markup Language),与HTML类似。这是继NIFF后的第二次尝试,用以使音乐乐谱标准化并接受更广泛的支持。它具备NIFF的所有优缺点:它没声音,它没任何回放向导,但它包含调、谱号、节拍记号等信息。比NIFF好的一点是,它基于文本。他是目前比NIFF更普遍的一个标准。
文本转换器
有少量的文本到NIFF、文本到MIDI、文本到XML的转换器。
JPG和PDF
JPG和PDF是可靠的、被普遍接受的的图片和便携式打印文档的标准。它们没有声音,没有回放信息,并无法被编辑(按音乐的方式)。但它们是与其他音乐家交流非常好的方式。
截屏
(ww注:常识,略过)
AIFF,SDII,WAV
这三种均为数字音频格式。它们包含真实的声音,但这也是它们包含的全部。它们没有音符值、持续时间、和弦、理论、乐谱或乐器分配的任何信息。
数字音频对于程序来说,非常容易编码和解码。它仅是一串数字流。wave文档(.wav)是IBM的标准。绝大多数Macintosh程序可操作wave文档。SDII代表音乐设计者II(Sound Designer II),这是由DigiDesign公司,即ProTools的生产商,开发的先驱数字音频编辑器。数字音频最可靠和可交换的标准是AIFF,或者说音频交换文件格式(Audio Interchange File Format)。
这些格式的缺点是你无法改变编排,你无法编辑和弦中的单音,你无法摘取一轨或变调。无论如何,它们是CD的标准格式。以上任何格式都可以刻录为CD并在CD播放器上播放。
其他压缩格式将会很快替代CD,但CD也有可能存活下来,因为它基于我们听觉的能力。就算MP3很棒,但所有的录音棚都将以AIFF创建母带。
MP3和其他压缩格式
MP3与AIFF、WAV,或SDII一样(只有声音,无法改变配器,没有乐谱信息),仅有一个关键不同:它们不是CD的标准。MP3文件,刻到CD上,无法在CD播放机上回放。它们只能在MP3播放器里播放。
文件大小
(ww注:省略。这个没必要再教你了吧?)
MIDI,音乐记谱,光学字符识别(Optical Character Recognition)软件
MIDI编辑器很普遍,各种主流的DAW里边都有。我们在后边讨论它们。
在我提供记谱程序前的一个注解:它们都很复杂很难学,因为音乐记谱是复杂的。一个好的文字处理软件也复杂,然而它仅需代表线性组件。一个好的记谱程序有若干维度:垂直部分,水平标记……基于各种复杂之上,我们期望一个可以为我们回放音乐的记谱程序(这比让一个文本编辑器发音更复杂)。
我常被问到,是否有当你在钢琴上演奏时能准确记谱的程序。目前为止没有。一个原因是变数很多。如果,比如说,你围绕中央C演奏了一系列四分音符,大概每秒一个,程序如何知道它们应该是高音,低音,中音,移动G或F(它们的确存在),节奏谱号?它是什么调?什么节奏型?因此没有,没有魔弹(magic bullet)。
Finale一直作为绝大多数大学的标准。用户常被认为是忠诚的但他们常鄙视它深奥复杂的界面。我印象中,它是工程师,而不是音乐家设计的。当我第一次研究它的可能性时,我迅速离开了Finale,因为我找到了更好的替代。其他的阻碍是价格,贫乏的用户支持,专有文件格式(以及对NIFF或XML的勉强支持)。
Finale生产了免费缩水版的NotePad。这是对于分配、文本范例和快速音符(quick note)很好的选择。
Sebelius更易使用,然仍有一个学习曲线,也很贵,专有。它将是我的第二选择。
Logic伴随它的音序器和DAW包含一个记谱组件。我承认他们试图将之作为一个“完整的”音乐包,常有的事,他们会显得有点单薄。每个月,我们都会对它的深奥he1,好吧,“逻辑”,留下深刻印象,但记谱功能(我做了四个项目)却是古怪的,不一致的,以及出乎预料的。
我的首选是Lime:一个在个人电脑或MIDI存在前开发的程序。它廉价,有很长的试用期,更易学习和使用(由音乐家设计),具备微分音支持、钢琴记谱法,并支持NIFF和XML等不寻常的特色。我曾用它做极复杂的工作。
另一个我提及Lime的原因是,它属于一个正在增长的业余爱好软件类别:包裹被几个个人在他们的业余时间开发。他们也许缺乏专业的程度,但他们用用户支持、价格、特色以及真人邮件支持弥补了这点。另外类似的软件有:Amadeus ii, Audio Companion, LameBrain, Transcribe!, Amazing Slow Downer等等。
光学字符辨识(OCR)
OCR是将一个音乐打印件的扫描件翻译成NIFF、XML,或一个专有格式(比如Finale的情况)的过程。那个文件之后可以被编辑,就像数据是手写输入的一样。文本OCR达到了可用的标准,但依我看,音乐OCR就不同了。复杂的音乐,尤其是多声部手稿,很难被准确辨识。足够多的错误足够你重新手心输入一遍。但我仍充满希望。
我使用过的最精确和可用的包裹是由SharpEye所开发的。