پروژه نهایی مقطع کارشناسی.
تبدیل فوریه
1-1 -تبدیل فوریه :
بدست آوردن طیف فرکانسی موج صوتی در گوش بصورت مکانیکی صورت می گیرد. در ریاضیات با استفاده از تبدیلهای فوریه و در کامپیوتر با استفاده از FFT ( Fast Fourier Transform) این امر صورت میگیرد.
ساختار صوت :
صوت ارتعاشی است که در هوا منتشر می شود. ( یا در محیط های فیزیکی دیگر به جز خلا ) اغلب صداها در طبیعت طیف فرکانسی مشخصی ندارند و اطلاعات مفید کمی را شامل می شوند . صداهای با طیف فرکانسی مشخص محتوی اطلاعات بیشتری هستند . برای شناخت اهمیت فرکانس در صدا باید در مورد نحوه تولید ودریافت صوت بررسی صورت گیرد. بسیاری از اشیا در زمان نوسان ، امواج صوتی تولید
می کنند . وقتی صحبت می کنیم یا آواز می خوانیم تارهای صوتی به ارتعاش در می آیند و صدا در گلو دهان و بینی نوسان می کند. آنچه مهم است این است که تکرار حرکت یک شکل موج باعث تشخیص صوت از نویز می شود . هر صوت فرازو فرودی دارد . بوسیله فرکانس مشخص می شود که شکل موج به چه صورت تکرار می شود .
روشی که گوش فرکانسهای مختلف را تفکیک می کند جالب توجه است . مبنای آن بر اصل تشدید ( رزونانس ) استوار است . ضربه یک جسم با فرکانس خاص را به ارتفاش وا می دارد. همچنین آن جسم با موج صوتی با فرکانس مشابه شروع به نوسان می کند . به عنوان مثال اگر به یک لیوان شیشه ای ضربه وارد کنیم صدایی از آن متصاعد می شود . اگر سعی کنیم همان صدا را تولید کنیم و لیوان را در معرض آن قرار دهیم لیوان شروع به ارتعاش می کند . مولکولهای هوا که توسط ارتعاشات صوتی مرتعش شده اند سطح لیوان را دچار فشار و کشش می کنند . هنگامی که این کشش وفشارهای کوچک منطبق با فرکانس طبیعی لیوان باشند می توانند لیوان را تحریک به نوسان کنند.
در گوش تشدید در داخلی ترین بخش گوش که حلزون گوش نامیده می شود اتفاق میافتد . قسمتهای مختلف این بخش حلزونی شکل با فرکانسهای مختلف نوسان می کنند. وقتی یک قسمت خاص از حلزون گوش شروع به تشدید می کند گیرنده های عصبی که در آنجا قرار دارند سیگنال را دریافت می کنند و آنرا به مغز می فرستند .
اغلب صداها به یکباره در مناطق مختلف حلزون گوش تشدید ایجاد میکنند که این صداها بصورت مختلط شنیده می شود.
1-2 -نمونه گیری صدا :
امروزه اغلب صدا بصورت دیجیتالی ذخیره میشود . ابتدا میکروفن صوت را به جریانهای الکتریکی تبدیل می کند. نوسان متوالی فشار هوا به نوسان متوالی ولتاژ در یک مدار الکتریکی تبدیل می شود . این تغییرات سریع ولتاژ در یک مبدل آنالوگ به دیجیتال به یک سری از اعداد تبدیل می شود. عملکرد مبدل ADC شبیه یک ولتمتر دیجیتال است که تعداد زیادی اندازه گیری در ثانیه انجام میدهد . هر یک از نتایج اندازه گیری بصورت یک عدد ذخیره میشود . این اعداد نمونه یا سمپل نامیده می شوند . تبدیل کامل یک صدا به یک سری از اعداد ، نمونه گیری (Sampling) نامیده می شود . کارت صدا در کامپیوتر در واقع یک مبدل دیجیتال کننده است که جریانی از سمپل ها را تولید می کند که بوسیله نرم افزار سیستم می تواند مورد استفاده قرار گیرد .
مثال :
به عنوان نمونه وضعیت ضبط موسیقی در یک CD را مورد بررسی قرار میدهیم . موسیقی بصورت 44100 سمپل در ثانیه ضبط می شود که هر نمونه بصورت 16 بیت ذخیره می شوند . در ضبط استریو این میزان دو برابر می شود.
به بیان دیگر برای ضبط موسیقی بصورت استریو برای یک ساعت به635,000,000 بایت فضا نیاز است .
1-3 -بردارها و موج ضربه ای :
صدا در کامپیوتر در بافرهای حاوی سمپل ذخیره می شود . یک سری از اعداد صحیح که هر یک متناظر با دامنه صدا در یک لحظه مجزا است .
یک بردار را می توان بصورت آرایه ای از اعداد نمایش داد .
1-3-1 -آنالیز بردار ضربه :
یک بافر را که حاوی سمپل های یک صوت است در نظر بگیرید . اگر بافرشامل n نمونه باشد می توان آنرا بصورت یک بردار n بعدی نمایش داد. هر نمونه معرف یک مختصات در فضای n بعدی است .
در صورتیکه تنها بافرهای با سه سمپل را در نظر بگیریم سمپل ها ، مختصات X ،Y و Z یک بردار سه بعدی می شوند . به طور معمول صدها سمپل در یک بافر داریم . همچنین تصور یک فضای n بعدی که یک بردار را تشکیل داده اند مشکل است . از نظر ریاضی با محاسبه مجدد مختصات بردار سمپل ها که از بردارهای مبنا مخنلف در فضای n – بعدی استفاده میکنند تبدیل موج ضربه ای بدست می آید که نتیجه بصورت n شماره خواهد بود .
1-3-2- تبدیل موج ضربه ای 8 – نقطه ای :
در صورتیکه یک بافر با 8 سمپل در نظر گرفته شود که سمپل ها پی در پی در آن قرار دارند برای رسم بافر بصورت یک بردار n – بعدی سمپل ها بصورت 8 بخش عمودی یکی پس از دیگری نشان داده می شوند.
n بردار مبنا که معرف سمپل ها هستند می توانند در روش مشابهی نشان داده شوند . روشی که اغلب در آنالیز موج ضربه ای بکار می رود مبنای Haar است .
این مبناهای خاص عمود بر محور هستند . ضرب داخلی هر جفت از آنها صفر و ضرب داخلی هر یک در خودش مساوی یک است . برای مثال آخرین بردار مبنا در تصویر فوق مشخصات زیر را دارا می باشد :
i8 = (0, 0, 0, 0, 0, 0, a, -a), a = 1/√2
(i8*i8) = 02 + 02 + 02 + 02 + 02 + 02 + a2 + a2 = 2 * a2 = 1
از ضرب داخلی بردار اختیاری V به مختصاتv = (v1, v2, v3, v4, v5, v6, v7, v8)با n امین بردار مبنا ، ضریب موج ضربه ای هشتم موج V را حساب می کنیم :
w8 = (v * i8) = (v7 - v8)/√2
این ضرب تفاوت بین هفتمین و هشتمین ضریب بردار که معرف تفاوت سمپل ها در بافر محتوی سمپل ها هستند را نشان می دهد . اگر تغییرات سیگنال آهسته باشد این اختلاف خیلی کوچک خواهد بود .
با توجه به تصاویر بردارهای مبنا می توان ضرایب موج ضربه ای اول را بدست آورد . ( ضرب داخلی V با in ) ضریب اول میانگین دامنه سیگنال و ضریب دوم اختلاف بین نیمه نخست سیگنال و نیمه دوم آن را بیان می کند . به این ترتیب تصویر کلی سیگنال بدست می آید .
یک سری از ضرایب موج ضربه ایw1, w2, ... w8 تبدیل موج ضربه ای سیگنال V نامیده می شود. چون بافرهای با 8 سمپل مد نظر است آنرا تبدیل موج ضربه ای 8 نقطه ای می نامیم . برای بدست آوردن سیگنالی که ضرایب موج ضربه ای آن داده شده است بردارهای مبنا را در ضرایب آنها ضرب کرده و با هم جمع میشود.