将音频信号转换为MP3的应用程序外文翻译资料

 2022-05-23 20:55:17

英语原文共 5 页,剩余内容已隐藏,支付完成后下载完整资料


将音频信号转换为MP3的应用程序

Ondrej Krejcar,Lukas Cernohorsky

捷克俄斯特拉发-俄布拉瓦斯俄斯特拉发VSB理工大学电子工程与计算机科学系测量与控制系,ondrej.krejcar@remoteworld.net,lukas.cernohorsky@vsb.cz

信息技术系,捷克赫拉德茨克拉洛韦赫拉德茨克拉洛韦大学信息与管理学院, ondrej.krejcar@asjournal.eu

摘要:该项目将创建一个应用程序,将来自计算机麦克风的音频信号转换为记录格式MP3。应用程序旨在将音频录制文件以基于MPEG算法(Motion Picture Experts Group,运动图像专家组)的音频文件压缩的有损压缩格式进行录制和保存。虽然保持相对较高的质量,但它可以将CD质量的音频文件的大小减少到十分之一左右,但对于语音而言,它会导致更糟糕的结果。这个应用程序的优点是能够设置频率范围(采样)并设置流的宽度,这表示比特的数量,通过该比特记录第二个记录。该应用程序使用Microsoft Visual Studio 2008以C#语言编写。

关键词:MP3,MPEG,频率,比特率,联合立体声

  1. 介绍

捕获声音大部分是由电容式麦克风制成,这些电容式麦克风通过使用由电容变化引起的电压变化进行操作。导电膜由于噪声而变形,这导致麦克风的容量改变。这产生了一个电信号,它由不同频率和幅度的纯正弦波组成。计算机以数字方式处理声音,因为根据计算技术的定义,它的模拟记录是不可能的。这意味着有必要将声波转换为描述振幅瞬时值的数字序列或信号特性的导数。在所谓的香农采样定理下,如果采样频率至少比信号中包含的最高频率大两倍,则任何周期信号都可以数字化而不丢失信息。对于忠实的声音再现采样频率大约40kHz,因此就足够了。对于低质量和高效率的记录声卡,可以使用基频的几分之一,尤其是在一半(22050kHz)和四分之一(11025kHz)的情况下。采样频率的数字记录质量决定了记录模拟信号的准确性。在数字音频录制中,关于A/D转换器输出位数的精确度,最为有效。样本的层数称为分辨率。对于8位记录,我们区分256个值,即16位65536值[1]。

MP3是一种音频信号符号。它的大小取决于记录比特率(比特率)的长度和宽度。比特率越高,质量越好,压缩率越低,文件越大。今天,128-192kbps(千比特每秒)范围内的比特率最常使用。 从160kbps的记录几乎没有区别于原来的。未压缩的格式(如标准音频CD)对计算机处理来说不切实际,因为CD质量录制的每一分钟大约需要10MB(兆字节)。转移到MP3可以减少这个大小(质量损失最小)约10倍。一分钟信号约为1MB(128kbps比特率)[2][3]。MP3编码算法在一些基本程序中非常高效。然而,最重要的是,记录仍然是人类听力敏感模型(感知模型)的变化。编码器从原始信号频率中删除,这被模型评估为不必要的-正常人耳没有注意到有东西丢失。数学模型模拟人类听力的敏感性,定义了它的弱点和不完善之处,因此您可以确定哪些部分可以被移除。另一种程序称为联合立体声。立体声记录的两个通道通常是相同的信号,联合立体声减少了这种多余的信息。一些编码器支持“可变比特率”,其中音乐的安静段落以低比特率记录,而动态对比度则以高比特率记录[4]。

该应用程序是使用Microsoft开发环境中的编程语言C#编写的。此环境可用于开发控制台应用程序和GUI应用程序,以及Windows窗体应用程序,Web应用程序,站点和服务,作为Microsoft Windows平台,Windows Mobile,Windows CE,NET Compact Framework和Microsoft Silverlight[5]中的本机代码和托管代码。

  1. 新解决方案

因此,为了能够测试我们创建的MP3-如果他们正在工作,该应用程序已扩展到MP3播放器。因此,整体概念创建如下:启动应用程序后,我们可以设置我们的Mp3的参数。首先,您选择将检索音频信号的设备。我们使用默认的Windows录音设备。下一步是选择采样频率和mp3流的宽度(比特率)。您也可以选择或创建一个新的MP3文件来保存重播。

应用程序使用原始PCM格式的声卡使用MDX(Managed DirectX 1.1)捕获声音。PCM格式简单,采样值序列完整。样本可以是8位(0.255)或16位(-32768..32767)。采样可以是8位(0..255)或16位(-32768..32767)。立体声是一系列样本(左,右,左,右)。立体声是一系列样本(左,右,左,右)。PCM是用于流式传输原始数据的合适格式。PCM是原始数据传输的正确格式。原始PCM是一种基本生产Mp3SoundCapture组件。如果您将此流格式化为WAV文件,您将无法播放WAV文件,并且必须另外包含header.WAV和RIFF(RIFF)格式。需要原始PCM数据:以RIFF头为前缀,除了哪些格式ook信息包含有关文件中PCM数据总长度的信息。第三种分量输出是Mp3SoundCapture MP3.Typ Mp3SoundCapture输出组件可以是MP3。比特率(kbit/s)和决定MP3音质的参数。波特率(kbit/s)是决定MP3音质的参数。除此之外,音质取决于被压缩的PCM数据的格式。并非每个参数的比特率和采样频率组合都是允许的。

在我们的应用程序中,您必须添加一个引用:Istrib.Sound.Mp3.dll lame_enc.dll。其次提到的是创建MP3格式的编码器之王,它被称为LAME。弗劳恩霍夫原创不仅在质量上也在可配置性方面超越-音乐爱好者完全可以满足他的需求。可变比特率(比特率),联合立体声和复杂的配置文件负责质量和压缩率之间的相应比例。针对LAME后面的frauenhofer编码器,整个开发者社区站在这里,不断改进,每隔几周就会定期推出基于优化心理声学模型的新版本。真正好的LAME版本是3.91。它允许使用配置文件进行编码(预设),它使用编码器的技能,主要用于可变比特率。通过它,用户可以通过例如“alt-preset standard”设置创建高质量的MP3文件,但该文件不会比以128kbps编码的相同记录大很多。此方法将编码器比特率保存到安静的地方,并将其添加到复杂的段落中。但它离开了LAME MP3编码器,这意味着在像64 kbps这样的低比特率下,它无情地切断高频并扭曲声音。但它以128 Kbps的速度收集了原始信息。在那里,听众必须全部区分LAME的原始和输出[12],[13]。

  1. 解决方案措施

正如我们已经提到的,该应用程序是用C#编写的,使用Microsoft Visual Studio 2008连接到。NET Framework 3.5。当项目启动时使用Windows Forms应用程序。我们使用现在的表单作为用户和程序之间的接口的骨架。

图1 示例测试程序

对于界面元素的描述,我们使用斜体来表示程序中组件的名称,方括号中的[“text”]用作用户的名称。要创建工具箱的界面3次插入ComboBox,请参阅进一步的说明。DevicesCmb[“选择设备”]选择将“绘制”音频信号的设备。FormatsCmb[“采样频率”]设置采样频率。BitRateCmb[“宽度流MP3”]设置流的宽度(比特率)。另一个组件是复选框。命名此(normalizeChk)[“标准化”]后,保持恒定音量的功能可用。

该应用程序由MP3播放器创建,其组件可在随后进行描述。Button1[“Open MP3”]打开我们想要播放的MP3。Button3[“PLAY”]启动选定的MP3。按钮4[PAUSE],可以在录制过程中随时暂停播放歌曲,并使用Button3或Button4,我们可以从这一点再次启动它。然后是Button2[STOP],这一首歌完全停止。最后一个组件称为ProgressBar,称为ProgressBar1。该组件负责显示MP3播放的长度。MP3录音处理和MP3格式存储的主要组件由Mp3Sound Capture组件处理。

在按钮StartBtn[“Start Recording”]开始后,我们看到一个使用Capture Mp3Sound的演示,我们选择我们将要使用的设备,在那里进行规范化,不管CheckBox是否被标记。输出设置为具有选定比特率的MP3,并写入文件*中MP3。按[[打开MP3]]按钮后,我们打开对话框,如果我们成功,我们直接打开带有音乐的文件。我们只过滤*类型的文件MP3。使用变量zrovnaNecoHraje,我们保留关于是否正在播放歌曲的信息,以便我们可以立即开始新歌曲。如果它已经加载了mojehudba,我们必须首先从内存中释放一首旧歌。我们停止music-mojeHudba.Stop...mojeHudba.Dispose将最终从内存中释放加载的歌曲。mojeHudba=null启动变态。加载新文件后,我们设置ProgressBar的总长度并立即重置。如果在加载之前已经播放了,我们立即运行。

  1. 开发应用程序的测试

本章的目的是测试我们应用程序的解决方案并描述研究结果。为了测试移除笔记本电脑内置麦克风的音频信号,使用了HP EliteBook 4515s,驱动程序IDT High Definition Audio CODEC。录音是朗读单词,总是大约30秒的同一篇文章。结果记录的主观质量特别受到关闭标准化的影响,而在负面意义上则受到影响。数量显着减少。归一化方法非常适用于记录的恒定量统一。

我们改变的另一个参数是频率范围。这一步的录制质量没有改变,但必须注意的是,我们不使用高质量的设备来录制声音,所以我们不能指望每首歌都以这种方式存在重大差异。采样率(采样频率)-让您有机会改变音频数据的采样频率以匹配编码器形成的数据质量。如果我们想要保持即将到来的CD的质量,就必须保持44.1kHz采样。通过降低采样率可以获得较小的文件,但也会降低输出质量。低比特率的一些编码器会自动分配较低的采样频率。

表1:各种记录时间的样本测试总结

记录的持续时间(s)

正常化

采样(kHz)

比特率(kbit)

文件大小(kB)

32

44.1

128

501

31

44.1

128

500

34

22.05

128

540

30

22.05

32

124

比特率参数在结果记录文件的大小上已经有相当大的差别。这是在采样率=20.05kHz时相对相等长度的记录。128kbit比特率的记录几乎比32kbit比特率高3倍。比特率是影响MP3文件最终音质的基本参数。一般来说,数据率越高,文件质量越高,但也更大。通常认为接近CD质量的值是128kbps的数据速率。这个值对应于1:12的压缩比,并且大部分文件,我们在例如因特网中遇到,都是这样压缩的。更改此值取决于每个处理创建和聆听的人的个人需求的MP3。如果失真在128kbps,我们使用更高的值(160,192kbps),并且听众仍然感到不适。典型的例子是古典音乐的录音。在256kbps时,没有人知道与原始记录的差别,但压缩比并不方便。如果是较低质量的录音,或者要求较低(说出的单词),我们可以使用较低的比特率并节省磁盘空间。编码器支持不同范围内的数据流(8-256,分别高达320 kbps)。比特率的总值等于所有通道的比特率之和[14],[15]。

表2:各种来源的压缩率摘要

气质

频带宽度(kHz)

采样率(Hz)

调制

比特率(kbit)

压缩率/ CD

电话

2.5

11.025

单声道

8

96 : 1

FM收音机

11

22.025

立体声

56 - 64

26 -24 : 1

光盘

16

44.100

立体声

lt;

全文共7582字,剩余内容已隐藏,支付完成后下载完整资料


资料编号:[11928],资料为PDF文档或Word文档,PDF文档可免费转换为Word

原文和译文剩余内容已隐藏,您需要先支付 30元 才能查看原文和译文全部内容!立即支付

以上是毕业论文外文翻译,课题毕业论文、任务书、文献综述、开题报告、程序设计、图纸设计等资料可联系客服协助查找。