傅里叶变换的理解 傅里叶变换有什么用

傅里叶变换的理解 傅里叶变换有什么用

傅里叶变换:数字音频播放器MP3、图片压缩JPEG和苹果智能语音助手Siri背后的数学

九年前,在学校的物理数学课的课堂上,我的老师为我们讲授了一种新方法,至今仍印象深刻。毫不夸张地说,数学理论发现迄今最广泛的应用就是这一方法了,其涵盖的领域包括:量子物理、射电天文学、MP3和图像压缩、X-射线晶体学、语音识别、PET 或医学扫描。

这种数学方法是什么呢?它就是傅里叶变换,因 18 世纪的法国物理学家、数学家约瑟夫·傅立叶(JosephFourier)而得名。这种方法甚至被詹姆斯·沃森和弗朗西斯·克里克用来解码由罗莎琳德·富兰克林通过X射线得到的 DNA双螺旋结构。(克里克是傅里叶变换的专家,他写过一篇名为《傅里叶变换在观鸟者中的应用》的趣文,来向名为沃森的观鸟爱好者解释这一数学概念。)

无论你在听 MP3 格式的歌曲,还是在网页上浏览图片,或者向 SIRI提问,甚至打开收音机时,你都可能在日常生活中应用了某种傅里叶变换。顺便说一下,傅里叶并不是一个研究领域狭隘的人,在研究理论物理和数学之外,他还是第一个发现温室效应的人。

那么,什么是傅里叶理论呢,为什么他的这个理论如此有用?

想想你在钢琴键盘上敲响一个音符。当你按下琴键的时候,钢琴中有一个小锤来来回回地敲击一根琴弦(对于音准 do 大约是每秒 440次)。随着琴弦振动,它周围的空气分子也来回震动,从而创造了一波震动的空气分子,我们称之为声。如果你能看空气中进行的这种有规律的舞蹈,你会发现一系列平稳,起伏的,无休止的重复。这就是所谓的正弦波曲线,或正弦波。在此特别说明一下,在钢琴的例子中,在实际演奏中肯能会产生不止一条正弦波,钢琴音色的丰富性正是来源于在主要正弦波之外的那些轻柔的泛音。钢琴的音符可以大致模仿一条正弦波,但是对于单一的正弦波声音来说,音叉发出的声音是一个更加贴切的例子。

现在,让我们暂时放下单独一个音符,而考虑由三个按键同时发出的和弦声。和弦结果的声波并不漂亮——它看起来杂乱无章。但是,在这混乱的背后有一个简单的模型。毕竟,和弦只是三个音符的相互融合与碰撞,因此这样混乱的声波,实际上只是三种音符(正弦曲线)的和而已。

傅里叶认为这不仅仅音乐和弦的特殊属性,而可以推广应用到一切重复的波形中,无论这个波形是方形、圆形、波浪形,以及其他形状。傅里叶变换像是一种数学棱镜:你输入一个波形并且将这种波形分解为不同成分,这些正弦曲线会相互叠加而形成新的重构波形。

  如果这听起来有些抽象的话,有一些可视化的方式来使得傅里叶的方法更加直观。第一种可视化方法是巴西的物理学学生卢卡斯(Lucas V.Barbosa)提出的,他将业余时间无偿用于为维基百科制作关于数学和科学的动画,在维基百科上他被称为“LucasVB”。现在让我们来看看输入一个方形波,经过傅里叶变换后,看看它会输出怎样的波形。


在这些图形中(点击这里可查看GIF动态图),红色的方形波被分离为单纯波形的集合(蓝色的正弦曲线)。将这些蓝色波形认为是红色波形的数学成分列表。在这个比喻中,傅里叶变换就像是一种药方——他准确地告诉你要重建原始波形,每一种简单波形你要使用多少。动画中的垂直蓝色线,是每种波形数量的直观表示。

另一种可视化方法是由剑桥大学的博士生马修·亨德森( Matthew Henderson orMatthen)提供的,他对于创建数学动画模型非常有兴趣。他用圆形而不是正弦曲线来解释傅里叶变换。这种方法包含了一组不同大小的源,每个圆的圆心都在一个更大的圆的边缘上。然后,这些圆开始转动,大圆在小圆的周围摆动,小圆的运动速度大于大圆。如果你追踪最小圆上一个点的运动轨迹,如下面的动画和截图所示,你可以重建任意形状的波形。傅里叶变换再一次告诉你波形是怎样产生的:以怎样的速度去移动哪些圆。

如果你用过呼吸量测绘仪,那么通过层叠的齿轮来描述复杂模型的想法你可能很熟悉。LucasVB在同一个动画上制作了互动的版本,使得你可以随意改变圆圈的大小。

  总的来说,傅里叶变换可以告诉你在一个整体的波形中每一个单独的“音符”(正弦曲线或是圆圈)所占的比例。这也是傅里叶变换非常有用的原因。想象一下,你通过电话想让你的朋友画出近似方形的波形。复杂的方式是读出一长串的数字,每个数字表示了相应时间点上波形的高度。有了这些数字,你的朋友可以耐心地绘制出原始波形。这就是原始的音频格式比如WAV的基本原理。但是,如果你的朋友知道傅里叶变换,那么完成这个工作就显得简单了:你只要告诉他少量数字——上图中提到的不同的圆的尺寸。你的朋友就可以用这些圆来重建原始波形。

这不仅仅是数学小伎俩。

傅里叶变换出现在几乎所有存在波形的地方。无处不在的 MP3 格式使用一种变形的傅里叶变换来达到相比之前的WAV(读作“wave”)更大的压缩率。对于每个音频片段,傅里叶变换将音频波形分解为它的成分音符并且保存下来,从而代替存储原始波形。傅里叶变换还可以告诉你在一首歌中每个音符所占的比例,你可以知道哪些音符是这首歌的基本元素。音调很高的音符并不重要(我们的耳朵几乎不能听见),因此,MP3格式放弃保存这些音符,从而取得了更高的数据压缩率。这正是高保真音响爱好者不喜欢 MP3格式的原因——它不是一种无损的音频格式,高保真爱好者表示他们可以听出其中的差别。

这也是智能手机的应用程序 Shazam怎样识别一首歌的原理。它将音乐分割成块,利用傅里叶变换算出每一块中的音符成分。然后它搜索数据库,来寻找这样的“音符指纹”与他们已有文件中的一首歌相匹配。语音识别同样使用“傅里叶——指纹”的思想,将你的声音与已知单词列表进行比较。

图像处理上利用傅里叶变换已经有了较成熟的技术。有一个极好的视频来说明你怎么利用圆圈来绘制辛普森的脸。在线百科全书 WolframAlpha 采用了相似的理念来绘制名人头像。听起来,这似乎可以被用于一个恶搞的鸡尾酒会,但是,这种方法已经被广泛应用于产生图像压缩的JPEG 文件。在以前的微软绘图中,图像是用位图(BMP)存放的,这种文件包含了一长串的数字,代表对每个像素点的颜色编码。JPEG格式就相当于图像格式中的 MP3 格式。建立一个 JPEG文件,你首先将图片分割为很小的块,每块都是8乘8像素。对于每个像素块,你可以用与重建辛普森的脸相同的画圆的办法来重建局部图像。正如MP3 放弃保存高音一样,JPEG不保存极小的圆。这样做的结果是:牺牲了小部分的画面质量,来取得文件大小的巨大压缩。这样的理念,使得我们都喜欢的可视化网络世界成为可能;同时最终让我们得到了GIF 格式。

在科学研究中,傅里叶变换又有何应用呢?

我在推特上邀请科学家们来描述他们在工作中是怎样应用傅里叶的思想的。他们的回复使我惊讶。做出回复的科学家表示,他们正在利用傅里叶变换研究不同的潜水器结构与水流的相互作用;试图预测即将到来的地震;识别距离遥远的星系的组成部分;寻找热量大爆炸残余物中的新物理成分;从x射线衍射模式揭示蛋白质的结构;为美国宇航局分析数字信号;研究乐器的声学原理;改进水循环的模型;寻找脉冲星(自转的中子星),以及用核磁共振研究分子结构,等等,等等。另外一个非常有趣的例子是,傅里叶变换已经被用于通过破译油画中的化学物质,来识别假冒的杰克逊·波洛克绘画。

太感叹了:这仅仅是一个相当传统的数学小技巧!

  

爱华网本文地址 » http://www.aihuau.com/a/25101011/58277.html

更多阅读

橘子皮有什么用 玉米须的功效与作用

橘子皮有什么用——简介橘子是很美味的水果,甜中微微有些酸,而且水分很足,是大家都很喜欢的水果之一。吃完橘子以后的橘皮不要直接扔掉,留着可是有用处的哦。橘子皮有什么用——方法/步骤橘子皮有什么用

dnf智力有什么用? dnf智力是加什么的

dnf智力有什么用?1、智力越高,魔攻越高,到后期一点智力可以换2.5左右的魔攻2、直接影响一些技能的伤害,像鬼泣觉醒只与智力有关。3、智力对与物功型,例如大枪,红眼是没用的 对于魔功的,智力越高伤

yy会员有什么用 yy紫钻和yy会员的区别

yy会员有什么用——简介 yy会员有什么用,YY会员分为YY会员和频道会员,对于频道会员呢,只是一个标准,意味着你是哪个频道的会员,挂在频道里会有一个会员贡献,没有什么用。而YY会员是YY官方推出的一个身份认证,还是有不少用处的,下面我就来介

驱动精灵怎么用 驱动精灵有什么用 驱动精灵是干什么用的

驱动精灵怎么用 驱动精灵有什么用——简介驱动精灵就是为电脑安装驱动的一个工具,比如网卡驱动,音频驱动等等。这样如果你的电脑因为驱动问题没有声音了或者其他问题,可以下载这个软件进行安装。当然现在这个软件也有垃圾清理,软件管理

我的世界红石有什么用 我的世界红石大炮

我的世界红石有什么用——简介在我的世界游戏中有一项红石系统。通过红石我们可以做出千变万化的装置和控制系统,比如红石大炮、红石陷阱等等。下面就来介绍一下红石相关的几个方面,包括:1、如何获得红石?2、红石系统介绍。3、红石能

声明:《傅里叶变换的理解 傅里叶变换有什么用》为网友阿怂君分享!如侵犯到您的合法权益请联系我们删除