![]()
Главная Обратная связь Дисциплины:
Архитектура (936) ![]()
|
Основні характеристики звуку
Основні властивості звуку Звук – це хвильові коливання густини середовища, коливання густини повітря. Звукові хвилі при допомозі мікрофона перетворюються в аналоговий змінний електричний сигнал. Для забезпечення масовості роботи із звуковим сигналом в комп’ютері, його потрібно перевести в цифрову форму, для чого використовується АЦП. Точність передачі (запису) звуку на комп’ютер, яка пов’язана із якістю перетворення звуку на АЦП, залежить від частоти дискретизації – кількості вимірів за сек. Частотний діапазон звукових хвиль, який може сприйматися вухом людини, лежить в межах 20 Гц – 20 000 Гц. Звідси виходить, що f дискретизації повинна бути більшою 20 тис. вимірювань за сек. Для якісного звучання зазвичай використовуються частоти дискретизації 44.1 чи 48 КГц. При цьому рахується, що такою частотою досягається CD – звучання. Але іноді деякі мультимедійні – продукти з метою економії дискового простору застосовують менші частоти: 32,22 і навіть 11 КГц. Найкращі аудіоформати використовують частоту дискретизації 96 КГц. Для характеристики точності вимірювань введено поняття розрядності дискретизації– кількість бітів, а натомість і пам’яті, що відводиться під 1 результат вимірювання. Іноді використовують розрядність дискретизації у 8 бітів, але такої точності, зазвичай, недостатньо. У більшості випадків використовується розрядність у 16 бітів, які дозволяють закодувати 216=65 536 значеньамплітуди. Де-факто, стандартом є частота дискретизації 44.1 КГц та розрядності дискретизації 16 бітів.
частота запису кількість каналів
Підрахуємо скільки пам’яті займає 1 хв. звуку з використанням залежності (4.1): Приклади: Монозапис: 44 100*2*60=5 292 000 байтів Стереозапис: 44 100*2*60*2=10 584 000 байтів Тобто, 1 хв. стандартного стереозвуку вимагає нажаль >10 MБ.
Це без стиснення (саме в такому виді звукова інформація зберігається в аудіо форматі WAV)... Зараз застосовуються аудіоформати, які можуть зберігати звук у стиснутому стані без втрати якості (стиснення в 10÷14р.). Основна ідея, що лежить в основі всіх алгоритмів звукового стиснення, - нехтування деталями, які лежать за межами чутності вуха людини: 1) Людське вухо практично не чує звуків, що знаходяться у тому ж частотному діапазоні, що і значно гучніший звук. (якщо поряд з вами буде паровоз, то ви навряд чи почуєте, як тікає ваш годинник). Цей ефект називається маскуючим ефектом і змінюється в залежності від частоти і гучності звуку); 2) Досить широко застосовується методика зменшення звукового файлу за рахунок зменшення розрядності дискретизації, допускаючи, що певних деталей слухах все рівно не почує чи для даної конкретної задачі допустиме зменшена якість звучання. Цей спосіб застосовується у залежності від виду звукового сигналу (може для нього і 8 бітів достатньо) і від того, для чого він призначений. 3) Більшість сучасних аудіоформатів здійснюється поділ частотної смуги на декілька під смуг, у кожній із яких виділяється найбільш гучне звучання частоти і враховується для неї ефект маскування. Деякі аудіоформати враховують вплив ефекту маскування сусідніх смуг, тобто дуже гучний звук на одній із них може вплинути на кодування звукового сигналу сусідніх підсмуг. Всі аудіоформати, що стискають звуковий сигнал, враховують сприйняття звуку людиною, тому: *із звукового потоку вилучаються звуки , які завідомо не сприймаються вухом людини; *із більшою ретельністю та точністю кодуються звукові частоти, на які людина звертає свою основну увагу (діапазон 1000÷4000 Гц). Ці частоти кодуються із зменшеною якістю. *крім того, враховується, що людина може визначати напрям звуку менше середньої f, інші звуки сприймаються людиною як фонові. У зв’язку з цим часто використовується механізм суміщеного стерео, в рамках якого середні f кодуються в стереосигнал, а фонові – в моносигнал.
Основні характеристики звуку До основних властивостей звуку відносять амплітуду та спектральний склад звукового коливання, а також їх зміна в часі. Амплітуда (amplitude) визначає максимальну інтенсивність коливань - голосність (volume) або силу звуку. На осцилограмі амплітуда представляється розмахом сигналу - найбільшим та найменшим відносно середнього рівня звучання. Спектральний склад визначає забарвлення або тембр звуку. Довільне періодичне коливання обертонами, гармоніки нумеруються, починаючи з основного тона (перша гармоніка), а обертони - з першої кратної складової (перший обертон - друга гармоніка, і т.д.). В зв’язку з особливостями слухового сприйняття висота звуку визначається більше за його спектральним складом, ніж за його основним тоном. Наприклад, суб’єктивна висота більшості спектрально багатих низькочастотних звуків практично не міняється навіть при повному видаленні з них основного тону, який в слуховому апараті відновлюється за різнисними частотами перших обертонів. Зміна амплітуди в часі називається амплітудною огинаючою (envelope) звуку - на амплітудному графіку вона ніби огинає графік коливання, а графік виходить ніби вписаним в огинаючу. Довільний природній звук має огинаючу приблизно такого вигляду:
Рис.4.1. Огинаюча природнього звуку. Цифрами позначені фази розвитку звуку, прийняті в акустиці: 1. - атака (attack) - початкова фаза, підйом, 2. - зупинка (hold) - коротка стабілізація після підйому, 3. - спад (decay) - фаза переходу звуку у встановлений стан, 4. - утримання (sustain) - фаза підтримки, 5. - затухання (release) - післязвучання. Фаза підтримки має місце лише в тому випадку, якщо вплив, що викликав появу звуку, залишиться постійним на протязі деякого часу (наприклад, рух пили по металу або потік повітря в духовому інструменті). Аналогічно, існує поняття спектральної огинаючої - тривимірний графік зміни спектру (і, відповідно, тембру) в часі. Крім періодичних коливань - тонів - розглядаються також неперіодичні коливання - шуми. Для шума зарактерно більш-менш рівномірний розподіл інтенсивності по спектру, без явно виражених піків або спадів. Основні види шуму: білий і рожевий та коричневий. Білий шум має рівномірну спектральну густину і в чистому вигляді в природніх звуках не зустрічається, однак часто зустрічається в електронних приладах. Густина рожевого шуму спадає з ростом частоти (1/f) - це характеристика шуму дощу, прибою, вітру та інших неяскраво виражених природніх шумів. Деколи розглядається також коричневий шум із густиною 1/f2, що швидко спадає з ростом частоти, близький до звуків ударного походження (грім, обвал). 4.7 Методи обробки звуку 1. Монтаж. Полягає у вирізанні із запису одних ділянок, вставці інших, їх заміні, розмноженні 2. Амплітудні перетворення. Виконуються за допомогою різних дій над амплітудою сигналу, Амплітудні перетворення виконуються послідовно з окремими самплами, тому вони прості в реалізації і не вимагають великого об’єму обчислень. 3. Частотні (спектральні) перетворення. Виконуються над частотними складовими звуку. Для реалізації частотних перетворень звичайно застосовується спектральне розкладання за молодших моделях 486 процесорів розвертати в реальному часі спектр сигналу середньої 4. Фазові перетворення. Зводяться в основному до постійного зсуву фази сигналу або її 5. Часові перетворення. Полягають в додаванні до основного сигналу його копій, зсунутих в 6. Формантні перетворення. Є частковим випадком частотних і оперують з формантами -
Формати звукових файлів § WAVE (.wav) - найширше розповсюджений звуковий формат. Використовується в Windows для зберігання звукових файлів. В його основі лежить формат RIFF (Resource § AU (.au, .snd) - формат звукових файлів, що використовується на робочих станціях фірми § MPEG-3 (.mp3) –на сьогоднішній час самий популярний формат збереження оцифрованого звуку МР-3 використовує приблизно у 10 разів менше дискового простору при збереженні звуку відповідної якості, ніж файл у форматі WAV.
![]() |